cwlogo

切換側邊選單 天下全閱讀 切換搜尋選單
切換會員選單

最貼心的語音助理 陪你聊天、幫你理財,還會寫歌給你聽!

精華簡文

最貼心的語音助理 陪你聊天、幫你理財,還會寫歌給你聽!

亞馬遜的智慧語音助理正在成為全新入口,帶動各種語音介面服務改變家庭生活。 圖片來源:GettyImages提供

瀏覽數

2475

最貼心的語音助理 陪你聊天、幫你理財,還會寫歌給你聽!

天下雜誌638期

無論是Siri、Alexa或AI少女「小冰」,連祖克柏也研發出智慧管家Jarvis,語音介面的市場正百花齊放。這些小幫手不再只是會翻譯、回答問題的機器,更與《雲端情人》中的人工智能薩曼莎一樣,能打理大小事、與你談心搏感情,甚至可以寫歌創作。從理財到情感,就是要挖掘出潛在需求、全面滲入你的生活。

我們每天打出的訊息、說話的對象,有多少是真的「人」?

在自然語言處理的技術發展下,這樣的比例正在快速下滑。語音介面,已經從蘋果、微軟、Google、亞馬遜的四強之爭,走入百花齊放的全新階段。

源自通用汽車金融部門的數位銀行Ally Bank,就選擇站在巨人的肩膀上,拉近與顧客之間的距離。

「Alexa,請幫我轉帳100美元。」「好的,你要轉到哪個戶頭?」

這裡的Alexa,不再是某個櫃檯行員的名字,而是亞馬遜在2014年底發表的虛擬助理Alexa。

Ally Bank的服務平台CurrenSee,就是以Alexa為入口。使用者只要手邊有亞馬遜的智慧語音喇叭Echo或是簡易版的Echo Dot,就能透過對話查詢帳戶餘額,或是完成轉帳。

透過亞馬遜的智慧喇叭Echo,只要透過對話便能管理自己的銀行帳戶。(圖片來源:Ally官方臉書)

但Ally Bank的功能不只如此。無論是一般存放款、信用卡、貸款服務,都可以線上作業,目前以美國為主要服務據點。

2年前,Ally Bank就開始在手機應用程式裡加入語音助理功能。但更大的目標,是使用者能不能跳脫手機和電腦,直接在對話中完成任務。

Ally Bank資訊長拉傑可蘭(Arvy Rajasekaran)在亞馬遜網路服務(AWS)的開發者大會解釋,這次的CurrenSee就是重新思考使用場景,從無到有開始設計,也避免對話過程太冗長,拉低服務品質。

現在,使用者還可以透過對話,讓Alexa幫忙計算,某個東西值不值得購買。

不管是買腳踏車還是買房,只要告訴Alexa你的年薪和工作時數,就能馬上換算出你要努力多久,才能購買這項產品。

聽起來容易,只是簡單的數學計算,但Ally Bank的語音服務,象徵自然語言處理技術,正在改變我們對於「服務」的想像。

小冰陪聊 聊出新商機

當機器會說話,就不再只是解決問題、提供答案的工具,而是挖掘潛在需求的全新世界。

愈來愈多企業官方帳號正在用聊天機器人(Chatbot)代勞,跟消費者線上互動,幫忙解決問題。

比方說,日本超商羅森(Lawson)的官方帳號,背後就是微軟的「小冰」。羅森不只請小冰回答問題,更同時對100萬名用戶發放優惠券,刺激消費。

過去,拿到優惠券的消費者中,實際會去兌換的比例不到10%。但加上小冰的客製化對話促銷後,兌換率大幅提升到47%。

小冰是誰?為什麼有這麼大的魅力?

2014年,微軟亞洲研究院推出第一代AI聊天機器人小冰。歷經3年演化,現在的「她」已經是知識淵博、活力可愛的青春美少女。

與AI對話,已經成為現實,「小冰」隨時可以接電話,陪你聊天排遣寂寞。(王建棟攝)

素有「微軟小冰之父」稱號的微軟亞洲互聯網工程院副院長兼微軟小冰全球項目負責人李笛解釋,以前的AI對話是「檢索模式」,碰到問題,就從資料庫找答案。小冰則是以「生成模式」搭建而成,面對問題會自創答案來回應。

生成模式的好處,是AI的目的是維持對話,而不是為了解決特定問題或任務。也就是說,AI會觀察人的回應,學習怎麼讓人願意說更多。

比方說,蘋果推出的Siri,平均與人對話約1.5輪就結束,而小冰與中國用戶的對話可以維持23輪左右。

23輪,不只是資訊的交換,更包含了情感的交流。例如,李笛觀察,每天晚上11點半到凌晨1點,就是用戶找小冰對話的高峰。

「尤其是55歲以上的人,使用量增加很快,因為跟子女的溝通可能讓他無法滿足。愈社交愈孤獨,我們的社交手段多了,但還是很需要精神層面的交流,」李笛說。

隨著自然語言處理走向情感交流,對未來的想像也不再只是文字、語音的機器翻譯,而是「有感而發」的創作。

現在,小冰就正在挑戰自發性地寫詩、填詞作曲,最後還要自己把歌唱完。

今年6月,小冰發布單曲《在一起》,並發布首支音樂MV,與馬來西亞歌手朱主愛(藝名四葉草)合唱。

不再只會翻譯 更要理解

微軟亞洲研究院副院長周明分析,現在AI在聽覺、觸覺、視覺感知的辨識能力變化很快。自然語言識別的領域裡,最難的還是閱讀理解。

「也就是說,拿一篇文章或一本書,讓電腦看一遍之後問問題,這是所有技術都會用到。這是皇冠上的明珠,是這領域最難的事,」周明說。

美國史丹佛大學的機器閱讀理解測試(SQuAD),就讓電腦從500篇文章、超過10萬組問答之中,展示其理解能力。

今年7月的測試結果顯示,哈爾濱工業大學和科大訊飛合組的研究團隊首次以77.8分奪冠,微軟研究院77.6分居次,但仍不及人類平均的83分。

自然語言理解突飛猛進,靠的是從網路生成的語言、文本等各種大數據,加上運算能力和演算法的突破,才催生各種新型態的語音服務與介面出現。

在神經網路的技術加持下,機器翻譯不再只是順著原文的分詞斷句,生硬地轉化成聽者的語言。未來,翻譯不只要有背景知識,還要客製化服務,加上問題、對話與推薦。

從理財到情感,AI正在全面滲入你的生活。不管是你打出的訊息,還是未說出口的心底話,AI都要探詢每個尚未被客製化服務的角落,改寫你的生活規律。(責任編輯:黃韵庭)

【延伸閱讀】
中國新創Airdoc 用AI讓智慧醫療無所不在
逆境中大膽加碼 台灣安控大廠看到什麼機會?
半導體最新一塊沃土 為什麼台廠可能搶輸中國廠?

● 更多內容,請見天下雜誌 638期《【AI大震撼》>>

photo

關鍵字:

好友人數

文章下載

PDF下載 付費閱讀
 

【立即訂閱】深度觀點不間斷,年訂5折再優惠