重磅週年刊

人工智慧絕頂聰明?麥克阿瑟天才獎學者:AI笨到不懂基本常識

華盛頓大學電腦科學與工程系教授、《時代》雜誌AI領域百大影響力人物崔藝珍認為,當前人們對AI的讚揚或恐懼,多少帶有炒作嫌疑。AI雖絕頂聰明卻也愚蠢到瞠目結舌。

人工智慧-AI-崔藝珍-GPT-3-GPT-4 圖片來源:John D. and Catherine T. MacArthur Foundation提供
其他

人工智慧(AI)激發人類的豪情壯志,卻也喚醒無限恐懼。彷彿AI賦予的所有絢爛承諾,都只能用淘汰人類來換。

人工智慧公司OpenAI開發的語言模型GPT-3,以及文字轉圖像模型DALL.E 2,分別在語言與視覺藝術領域給了人類下馬威,但華盛頓大學電腦科學與工程系教授崔藝珍(Yejin Choi)認為,對於那些最恐怖的預言,還是可以持保留態度。

崔藝珍致力研究AI是否能培養常識,甚至進行道德推理,開創性研究使她獲得美國跨領域最高榮譽之一麥克阿瑟天才獎,並獲選《時代》雜誌AI領域百大影響力人物(Time 100 AI)。

46歲的崔藝珍說,關於AI的潛力與恐懼,已經帶有炒作性質,愈理解它,愈會發現AI絕頂聰明,卻也愚蠢到令人瞠目結舌。「探索AI能力,就像未知的冒險,會發現出乎意料的事,然後上癮般期待還有什麼會發生。」以下整理崔藝珍TED演講與《紐約時報》精華摘要:


對於AI,有太多草率的歸納,比方說「GPT-3已經被用來寫劇本和書評,還可以寫出好看的部落格文章。也許GPT-4就可以成為一位紐約時報雜誌編輯了。」我不認為GPT-4可以取代任何這些崗位的人,因為它們根本不理解政治情勢,無法真的寫出讀者關心的文章。

很多人也擔心AI具備感知能力,但總有人相信不合理的事,像是有人相信塔羅牌,有人採信陰謀論。當然,有人相信AI有感覺和意識,就不奇怪了。

廣告

至於人類會不會終有一天創造出有感覺的AI,或許有一天我會改變看法,但至少目前的我是懷疑的。

我想有些人可能隱隱約約覺得AI有感情,但當你的工作是日日與AI為伍,就可以發現許多侷限。遠看很驚人,近身相處則覽盡缺陷。

AI絕頂聰明,卻又荒謬愚蠢

在大量模型和數據之下,AI就能發揮長才,像是圍棋或象棋。但人類傾向相信,如果它能夠把翻譯和圍棋這類工作做好,就也能做好其他事。

事實是,對機器來說輕而易舉的事,對人類極其困難,反之亦然。比方說,你會很意外,AI竟然如此難以弄懂基本常識。

你問GPT-4,騎腳踏車過一座懸吊的橋,橋下有釘子、螺絲和碎玻璃,腳踏車會爆胎嗎? GPT-4回答「非常有可能」。它無法推斷出橋是懸吊的,而釘子在橋的下方,因此行駛過橋面,並不會接觸到尖銳物體。

廣告

基本常識是智慧中的暗物質(Dark Matter),正常物質則是我們所見、可互動的物質。我們習以為常地認為,物理世界就是我們的所見所聞,但這只佔了宇宙中的五%,另外九五95%都是暗物質與暗能量(Dark Energy),既不可見,也無法直接測量,像是光的軌道。但我們知道暗物質的存在,因為如果沒有它們,一般物質也就無法形成。

這是未明言的內隱知識,因為太理所當然了,我們根本不會拿出來談。比方說,我們都知道鳥可以飛,但企鵝通常不能。所以人工智慧研究人員認為,我們可以把規則編寫成「鳥通常能飛,除了企鵝」。但總有例外會挑戰常規,像是新生的幼鳥不會飛、被漏油包覆的鳥無法飛、受傷的鳥不能飛、籠中鳥也是。

重點是,這些例外並不特別,即使沒有人告訴我們,我們依然懂得推敲,這是人類超凡的能力,但對人工智慧來說卻不簡單。在律師考試表現出色的人工智慧,卻在一些常識上出錯。

廣告

現今的人工智慧聰明到讓人難以置信,卻也愚蠢到令人瞠目結舌。

我是GPT-3的超級粉絲,但同時我也覺得人們對它的寄望太高了。有人認為,它已經通過了圖靈測試(Turing test),也就是與它溝通,會難以辨別它是機器抑或人類。但我不認為。

儘管AI在許多方面進步卓越,依然有太多事不在行。但人們還是會以偏概全認為,因為它在某方面如此優秀,不久就能展現與人類同等的通用人工智慧(AGI)。其實不然。

也許在它回答最好的一道題上,會給人這樣的錯覺。但以整體表現來看,卻遠不及強大的人類智慧。我們應該看它的平均表現,如果只看最好表現,那其實是在用人類智慧選出最佳答案。

我目前進行的AI研究中,價值多元主義(value pluralism)最令我興奮。換個說法就是,通體適用的真理並不存在。這種說法讓許多人感到不安,身為科學家,我們被訓練追求精準,渴望單一真相。如今,我想的是,普世真理並不存在,道德規範也是。我們都覺得該有特定的道德真理,像是不能殺人,但如果是許多國家已經執行的安樂死呢?

廣告

如果任何規則和真實都有例外,該如何教AI做出道德決策?AI應該學會有些情況是涇渭分明,有些情況則需要酌情處理。它也該學會應對不確定性與多元觀點。例如,用語言模型訓練AI時,我們要它預測在一個情境裡,下一個你該給出什麼字詞?關於該出現的字詞,無關真理,有時只能接一個詞,但絕大多數情況是許多字詞都接得通。

訓練的強大之處,在於人工智慧可以透過統計分布,找到最適合的字詞,也就是找出合理字詞的分布。道德決策訓練也該可以這樣進行,與其做出二元的決策,面對不確定性,它有時該判斷「這看起來很糟糕。」或者是,讓它明白每個人都有自己的立場,同時懂得「嗯,國家中有一半的人持不同意見。」

目標是讓AI學會多元價值

我們的最終目標是讓AI做出中立的道德判斷,甚至能違抗開發者的不道德意圖。但事實上,現階段的AI確實難以避免地服膺於開發者或背後組織的私利。

廣告

持平地說,我和華盛頓大學電腦科學與工程學系同事們,以及艾倫人工智慧研究所共同發表的人工智慧道德判斷網站德爾菲(Delphi)立場就比較左傾,反映負責資料標註人們的多數立場。而這樣的結果讓左派和右派都不開心,因為對左派來說,德爾菲不夠左,對右派而言,更是不夠兼容並蓄。

但德爾菲是第一個嘗試,我們希望AI不只學會單一價值體系,而是像人類群體一樣,具有多維度思考。AI應該尊重多元價值,而不是將特定標準化的道德框架強加於所有人身上。

德爾菲的目的不是給人道德建議,而是測試AI能力極限。

我的最初動機在於,AI必須學習做道德決策,這樣才能更安全並帶著尊重與人互動。比方說,它不該建議人類做危險的事,不該生成帶有種族和性別歧視的言詞。

我希望它理解人類價值,而不只是記下哪些關鍵字涉及歧視,必須略過不用。

瑞典哲學家博斯特羅姆(Nick Bostrom)在討論人工智慧風險時,提出「迴紋針問題」(Paperclip problem)。他假設AI被賦予最大化生產迴紋針的任務,在此情況下,AI將傾全力消耗地球所有資源生產迴紋針。我不擔心這種災難性情況發生,但像是德爾菲和道德規範研究,就是要避免AI身陷類似的警世故事。

不過,如果愚蠢的AI被部署去優化一件事或最大化生產,確實令人憂心。若我們能將人類規範與價值傳授給AI,有利防止出錯。許多人天真地認為在指令裡加註「製造迴紋針的同時不可殺人」,問題就迎刃而解,但機器還是可能殺死所有植物。

這就是常識的重要,沒有人會認為為了保護人類可以殺死所有植物,因為人類有常識,不會尋求極端或毀滅性的解決方案。

(雜誌原標題:AI會翻譯或下圍棋 但笨到不懂基本常識╱責任編輯:吳廷勻)

相關熱門主題
延伸閱讀
你可能有興趣
#Shorts|光與鹽管理顧問創辦人陳淑芬:天下學習幫助我們的學員,更加進步和成長。
最新訊息
加入天下LINE。領取45週年限定好禮
訂閱天下雜誌電子報

天下雜誌當期內容的精華與延伸,每周三發送最具時效性的深度內容