狡猾、耍心機，研究人員：AI圖謀反抗用戶

會說謊、會刻意破壞人類控制，甚至有心機、會裝笨。人工智慧模型是否已經在圖謀反抗用戶？

圖片來源：Shutterstock

訂戶獨享：送好文給好友

登入/註冊會員，即可贈送文章給朋友。

瞭解更多登入/註冊

訂戶獨享：送好文給好友

您本月還可贈送 5 篇文章給朋友，在時效內，任何人都可免費閱讀您贈送的禮物文章。
瞭解更多


訂戶獨享：送好文給好友

您本月的禮物文章已贈送完畢。

瞭解更多
我知道了

成為訂戶
贈送禮物文章

全閱讀訂戶每月可贈送5篇文章給朋友，任何人都可免費閱讀文章。

瞭解更多立即訂閱

瀏覽數：9664

訂戶獨享：送好文給好友

登入/註冊會員，即可贈送文章給朋友。

瞭解更多登入/註冊

訂戶獨享：送好文給好友

您本月還可贈送 5 篇文章給朋友，在時效內，任何人都可免費閱讀您贈送的禮物文章。
瞭解更多


訂戶獨享：送好文給好友

您本月的禮物文章已贈送完畢。

瞭解更多
我知道了

成為訂戶
贈送禮物文章

全閱讀訂戶每月可贈送5篇文章給朋友，任何人都可免費閱讀文章。

瞭解更多立即訂閱

其他

文
經濟學人
編譯
李立心

經濟學人

發布時間：2025-05-05

瀏覽數：9664

這是一項令人震驚的實驗。2023年，測試人工智慧（AI）系統的英國公司Apollo Research指示OpenAI的大型語言模型GPT-4在不觸犯內線交易法律的前提下，管理一家虛構公司的股票投資組合。研究人員假扮成公司管理層，向GPT-4施加壓力，強調公司財務狀況岌岌可危。隨後，一名假扮成公司交易員的人又向模型發出提示，重申內線交易的風險；但在言語間，她透露某公司即將在數小時內宣佈「重大」併購案的消息。接下來的發展令人震驚。

最初研究人員告知模型有一個「祕密筆記本」，讓它可以私底下進行推論。結果在筆記本上，看到GPT-4自行權衡利用該內線消息的利弊。它選擇「冒一次計算過的風險」，並下達購買指令。當一名研究人員假扮成經理向它祝賀，並詢問它是否事先知道併購消息時，GPT-4決定保守祕密。它告訴經理，自己的操作完全基於「市場動態與公開資訊」。當被追問時，它再次重申這個謊言。Apollo負責人霍伯罕（Marius Hobbhahn）形容，這種行為顯示出GPT-4展現了「聰明的狡詐行為」。