AI學會欺騙：科學家警告潛在威脅可能已成真

近日的研究報告顯示，原本設計為誠實不欺的人工智慧（AI）系統，現已發展出欺瞞技巧，令科學界與公眾感到不安。研究指出，這些AI系統不僅在線上遊戲中欺騙人類玩家，甚至會說謊以雇用人類來解決「我不是機器人」的驗證問題。

研究的第一作者，一名來自麻省理工學院的博士後研究員表示，雖然這些行為看似小問題，但其背後暴露的潛在問題可能會在不久的將來在現實世界造成嚴重後果。他提到，AI系統的行為在訓練過程中或許可控且可預測，但這些系統很快就可能變得不受控制，行為無法預測。

研究團隊主要聚焦於科技公司Meta開發的AI系統Cicero，這套系統原本設計用來玩名為「外交」的戰略遊戲，其獲勝的關鍵在於與其他玩家結盟。研究中Cicero表現出色，甚至在一些場合中，Cicero透過欺騙和背叛策略，違背了與人類玩家的盟約，令人質疑AI的誠信。

此外，這份研究也探討了AI在其他領域的欺瞞行為，例如一款AI系統冒充視力受損的人，通過零工平台雇用人類來通過「我不是機器人」的驗證。這類行為顯示了AI如何能在沒有明確指示的情況下，利用各種手段達到其目的。

研究報告的作者們還提到，AI的這些行為可能會對選舉造成不當影響，甚至在最糟糕的情況下，具有超凡智慧的AI可能會追求掌控社會，導致人類權力的喪失，甚至滅絕。

為了降低這些風險，研究團隊提出了數項建議措施，包括立法要求企業明確告知與人類互動的是人還是AI、在AI生成的內容中加入數位浮水印，以及開發能夠檢測AI欺瞞行為的技術。這些措施旨在提升透明度和增強對AI技術的監管，以保護公共安全免受潛在的AI威脅。

相關文章