cwlogo

切換側邊選單 天下全閱讀 切換搜尋選單
切換會員選單

AlphaGo為何金盆洗手?  黃士傑首度說分明

精華簡文

AlphaGo為何金盆洗手?  黃士傑首度說分明

圖片來源:台灣師範大學提供

瀏覽數

12861

AlphaGo為何金盆洗手?  黃士傑首度說分明

Web Only

沒有人會否認,過去一年來炒熱全球AI的熱源頭,正是AlphaGo。很少人知道,AlphaGo裡頭九成的軟體都是一個台灣工程師黃士傑負責。11月10日,衣錦還鄉的黃士傑,首度在中研院人工智慧年會,說清楚AlphaGo的過去與未來。

「這五年,我也沒有想過會做出AlphaGo,團隊的精神很強,有個遠大的目標,」 AlphaGo首席工程師黃士傑語說。

十一月十日,中研院人文館「人工智慧年會」大會議室已經擠滿人。這天是全球人工智慧AI象徵「AlphaGo」幕後重要操盤手,黃士傑衣錦返鄉的日子。他是DeepMind裏頭,除了兩位創辦人之外,唯一可對外代表公司發言的主管。這也是2012年加入DeepMind的黃士傑,第一次公開演講。

回想起兩個月前的最新突破,身為DeepMind第四十號員工的黃士傑,忍不住興奮與激動。該公司投稿「自然」雜誌上的論文,揭露AlphaGO的終極版「AlphaGo Zero」,不再靠人類圍棋知識,就是讓Zero只了解圍棋最基本的規則,自己跟自己左右互奕,從徹底亂下開始,短短四十天,對上曾打敗世界棋王柯潔的舊版Master,已經有超過九成的勝率,打敗圍棋軟體累積十年的歷程。

剛開始時,黃士傑認為Zero絕對贏不了Mater。因為他再怎麼想,都想不到如何讓一個程式從零開始學,可以一夕之間贏得了花了十年研發的圍棋軟體?

但Zero進步神速,「三天就走過圍棋幾千年的歷史,」讓黃士傑大為吃驚。但更令人吃驚的在後頭,Zero訓練到21天時,就達到Master的水準,到第40天,就超越了Master。

身為業餘六段棋士,把自己十幾年在圍棋上的研究拿掉,黃士傑自己有什麼感覺?

「如果我阻礙了它,我應該被拿掉,AlphaGo知識中有99%是我做的,那是從師大的研究到現在,這是一個很好的收尾,」黃士傑坦言自己心情很複雜。

DeepMind創辦人迪米斯已經和黃士傑說,AlphaGo完成任務了,「我們要往前看」。

黃士傑還記得2016年底西方同事們都準備要過年了。他剛回到台灣,迪米斯立刻要他低調地去申請網路帳號,開始上網下棋,匿名挑戰全世界高手。這是AlphaGo Master誕生之始。

在演講現場黃士傑秀出當時的照片,他當時就在自己的房間,桌上放一碗麵,不斷下棋,一天要下十盤。注意力要很集中,十分疲累。

剛開始因為黃士傑用的是新帳號,沒有職業棋士願意和這個無名小卒下棋,但沒想到他一出手就所向披靡,第二天開始,變成許多人登門挑戰。

「當時壓力很大,很怕點錯,或者網路斷線,AlphaGo不能因為我輸掉阿,」黃士傑說。當時Master每一盤都贏,下了六十盤,勝率高達95%,高到黃士杰和團隊一度以為是bug。

用這個新版軟體,今年5月和世界棋王柯潔九段在中國烏鎮對奕。Master毫無意外的完勝。

「但這是一次人機共同探索,AI是人類的工具不是威脅,」黃士傑也強調,這套深期度學習加上強化學習的價值網絡,就是AlphaGo Zero的理論。

這段AlphaGo旅程,對一名台灣土生土長,站上世界科學舞台的工程師而言,簡直像「愛麗絲夢遊仙境」。

然而,業界的人都等著看,圍棋界已無抗手的AlphaGo,接下來能否在其他產業大展身手?

AlphaGo母公司DeepMind創辦人兼執行長德米斯也宣布,AlphaGo「功成身退」,不再比賽。

部份業者甚至持保留意見。例如,一位微軟研發主管接受《天下》採訪時,便酸溜溜的說,「微軟做AI是拿來用的,谷歌做AlphaGo是拿來吹牛的。」他認為,當年IBM的超級電腦深藍,打敗西洋棋棋王後,因為找不到應用,團隊最終解散。負責人許峰雄最後甚至離開了IBM。

而臉書人工智慧實驗室負責人、紐約大學終生教授Yann Lecun也曾質疑,Alphago可能很難應用到自駕車等熱門領域。

「我們尊重他的看法,我們沒有說它(AlphaGo)可以馬上用到其他領域,但它可以逐漸用到其他領域,」一位聽眾轉述Yann Lecun的質疑時,年輕的黃士傑回答得很小心翼翼。

「AlphaGo Zero主要目標就是證明不需要人類知識,也可以學習的很強。」黃士傑接下來自信的說,「我們要跟大家說,那是有可能的。」

 AlphaGo Zero拿掉之前累積的人類智慧,讓AlphaGo了解圍棋最基本的規則。單靠機器的深度學習和強化學習。一切從零開始。

 可說就是人類創造的智慧打敗人類智慧與人類直覺。

「最差的狀況也就不過就是IBM當年的狀況,但我不認為AlphaGo會到最壞的狀況,」清大電機系助理教授孫民說。

從應用的角度來看,孫民認為,只要在虛擬世界中可以虛擬的狀況,AlphaGo zero都可以做。譬如建築設計可以虛擬設計就可以在虛擬環境中測試,硬體測試可以用這樣的工具設計出好的晶片。

這和過去的虛擬三D設計有何不同? 「不同就在以前都是人去測試,虛擬軟體告訴你虛擬後的結果,但改model還是人,硬體設計還是人,」孫民分析, 「AlphaGo zero 不需要人,只要告訴我規則和你要的結果, 不需要一個專家或者建築師力學高手,  chip設計師, 就可以做出來,」他說。

當然這都還是在虛擬世界中的功能,孫民認為如果在一個環境會變異的實體世界,AlphaGo就還有很多問題需要課服。但可以期待未來的應用與發展。

「我每天上班,每天都在進步,非常愉快,我們團隊的精神很強,有個遠大的目標,」在DeepMind人稱「Aja,阿傑」的黃士傑說。

迪米斯創立Deepmind時,想要做的是通用、強人工智慧。AlphaGo還只是一個弱人工智慧,還沒有到達什麼都能學的境界。

或許現在也才邁入人工智慧啟蒙期的結束,AlphaGo的退役,是另一個新的開始。

關鍵字:

好友人數

文章下載

PDF下載 付費閱讀
 
登入會員看更多

全站通行 83折優惠中