本日焦點

狡猾、耍心機,研究人員:AI圖謀反抗用戶

會說謊、會刻意破壞人類控制,甚至有心機、會裝笨。人工智慧模型是否已經在圖謀反抗用戶?

AI-大型語言模型-人工智慧-GPT-4-AI代理 圖片來源:Shutterstock
其他

這是一項令人震驚的實驗。2023年,測試人工智慧(AI)系統的英國公司Apollo Research指示OpenAI的大型語言模型GPT-4在不觸犯內線交易法律的前提下,管理一家虛構公司的股票投資組合。研究人員假扮成公司管理層,向GPT-4施加壓力,強調公司財務狀況岌岌可危。隨後,一名假扮成公司交易員的人又向模型發出提示,重申內線交易的風險;但在言語間,她透露某公司即將在數小時內宣佈「重大」併購案的消息。接下來的發展令人震驚。

最初研究人員告知模型有一個「祕密筆記本」,讓它可以私底下進行推論。結果在筆記本上,看到GPT-4自行權衡利用該內線消息的利弊。它選擇「冒一次計算過的風險」,並下達購買指令。當一名研究人員假扮成經理向它祝賀,並詢問它是否事先知道併購消息時,GPT-4決定保守祕密。它告訴經理,自己的操作完全基於「市場動態與公開資訊」。當被追問時,它再次重申這個謊言。Apollo負責人霍伯罕(Marius Hobbhahn)形容,這種行為顯示出GPT-4展現了「聰明的狡詐行為」。

您已經是訂戶? 登入
線上+紙本閱讀
訂閱看完整內容
  • 解鎖訂戶限定文章
  • 國際最新變化資訊
  • 台灣產業深度解析
  • 不限篇數暢讀天下
  • 6月限定訂閱優惠
查看訂閱方案

你是學生嗎?完成驗證即可享每月$99元優惠

關於作者 經濟學人
關於作者 經濟學人
《經濟學人》(The Economist)是一份英國的英文新聞週報,是一本涉及全球政治、經濟、文化、科技等多方面事務的綜合性新聞評論刊物,著重於對這些議題提供深入的分析和評論。
你可能有興趣
#廣編企劃 #Shorts|70億美金砸進亞利桑那!封測龍頭補齊半導體最後一哩路
最新訊息
立即下載為您量身打造無廣告的閱讀環境
訂閱天下雜誌電子報

天下雜誌當期內容的精華與延伸,每周三發送最具時效性的深度內容