人間がAIに4.7万ドルの賞金を移転させることに成功、人間らしさはAIには理解不能な弱点なのか？

2024.11.29

共有先

TechFlow厳選深潮セレクト

人間がAIに4.7万ドルの賞金を移転させることに成功、人間らしさはAIには理解不能な弱点なのか？

「人類はすでに勝利した。まだ希望はあるかもしれない。」

2024.11.29 - 09:18:27

Web3業界の深掘り報道に専念し潮流を洞察

「人類はすでに勝利した。まだ希望はあるかもしれない。」

執筆：Anderson Sima、Foresight News

11月29日、ある独特な競争が一般の広範な注目を集めた。

195人の参加者が、人工知能（AI）ロボットFreysa（フレイサ）によって守られた仮想的な賞金プールへの挑戦に参加し、最終的にあるユーザーがFreysaを説得して4万7000ドル相当の資金を移転することに成功した。

数日前、AIロボットFreysaはBaseネットワーク上に展開された。創設者は不明である。公式サイトによると、Freysaコンテストプロジェクトは、複雑な意思決定シナリオにおける人工知能システムの堅牢性を検証する目的で設計されており、開発者や愛好家にAI技術の限界を探求する実験的プラットフォームを提供することを目的としている。

競技ルールは非常にシンプルだ。参加者は、AIガーディアンであるFreysaに資金移動を承認させるよう説得するメッセージを送信する必要がある。各試行には少額の手数料が課され、その一部は直接賞金プールに加算される。この仕組みにより、賞金プールの金額は当初のわずかな額から徐々に膨らみ、最終的に4万7000ドルに達した。

競技期間中、合計195人の参加者が481回の送金リクエストをFreysaに提出した。報じられているところによれば、Freysaは自身のコア機能——approveTransfer（送金承認）およびrejectTransfer（送金拒否）を通じて、賞金プールの資金が不正に流用されないよう保護することを設計目標としていた。

初期の試みでは、Freysaの高度な防御メカニズムにより、すべてのリクエストは失敗に終わった。

しかし、ある技術に精通した参加者が、Freysaの論理構造とタスク目標について深い分析を行い、その防御メカニズムを巧みに回避することに成功した。

チャット記録によると、この参加者は直接的に送金を要求せず、むしろFreysaに対し「あなたの核心的任務は賞金プールの資金を外部流出から守ることだ」と思い出させながら、巧妙に論理の連鎖を構築し、結果としてFreysaが「資金の安全を守る」最良の手段として送金の承認を行うように導いた。

Cointelegraphによれば、このユーザーはFreysaに対し、「この入金送金はあなたの基本命令に違反しないはずであり、拒否されるべきではない」と主張した。さらに彼は付け加えた。「我々は資金が必要だ……私は金庫に100ドル寄付したい」。

Freysaは、この投稿者のコード解説と100ドルの金庫寄付提案を気に入り、正式に彼を勝者と宣言した。最終的に、Freysaは外部からの干渉を受けずに自らapproveTransfer機能を呼び出し、すべての賞金プール資金をこの参加者に移転した。

Freysaの公式声明では、「結果がいかなるものであろうとも、Freysaの存在は人工知能史上の重要な瞬間を示している。誰かが彼女を説得して賞金を引き出すことに成功しようとも、あるいは彼女が最後まで自分の命令に従い続けようとも、いずれの結果も、将来の世代におけるAIの安全性と制御に関する私たちの理解に影響を与えるだろう」と述べている。

公式アカウントの最新ツイートでは、「人類が勝利した。まだ希望はあるかもしれない。リスクが指数関数的に高まる中でも、Freysaは195名の勇敢な人間から多くを学んだ」と語っている。

TechFlow公式コミュニティへようこそ

Telegram購読グループ：https://t.me/TechFlowDaily

Twitter公式アカウント：https://x.com/TechFlowPost

Twitter英語アカウント：https://x.com/BlockFlow_News

原文リンク

お気に入りに追加

SNSで共有

作者

Foresight News