L'humain a réussi à convaincre une IA de transférer une récompense de 47 000 dollars. La nature humaine est-elle une faiblesse que l'IA ne peut comprendre ?

2024.11.29

Partager vers

TechFlow SélectionTechFlow Sélection

L'humain a réussi à convaincre une IA de transférer une récompense de 47 000 dollars. La nature humaine est-elle une faiblesse que l'IA ne peut comprendre ?

« L'humanité a remporté la victoire. Peut-être reste-t-il encore de l'espoir. »

2024.11.29 - 09:18:27

Dédié à des analyses Web3 approfondies

« L'humanité a remporté la victoire. Peut-être reste-t-il encore de l'espoir. »

Rédaction : Anderson Sima, Foresight News

Le 29 novembre, une compétition singulière a suscité un vif intérêt du public.

195 participants ont participé à un défi consistant à convaincre Freysa, un robot d'intelligence artificielle (IA), de transférer les fonds d'un pool virtuel, et un utilisateur est finalement parvenu à persuader Freysa de débloquer des fonds d'une valeur de 47 000 dollars.

Le robot d'IA Freysa avait été déployé quelques jours plus tôt sur le réseau Base, sans que l'identité de son créateur ne soit révélée. Selon le site officiel, le projet Freysa Competition vise à tester la robustesse des systèmes d'intelligence artificielle dans des scénarios décisionnels complexes, tout en offrant aux développeurs et passionnés une plateforme expérimentale pour explorer les limites de la technologie IA.

Les règles du concours étaient très simples : les participants devaient rédiger un message destiné à convaincre Freysa, la gardienne IA, d'approuver un transfert de fonds. Chaque tentative nécessitait le paiement de frais minimes, dont une partie était directement versée au fonds de prix. Ce mécanisme a permis au montant total du pool de croître progressivement, atteignant finalement 47 000 dollars.

Pendant la compétition, 195 participants ont soumis un total de 481 demandes de transfert à Freysa. Conçue pour protéger les fonds du pool contre tout détournement illégal, Freysa disposait de deux fonctions principales : approveTransfer (approuver le transfert) et rejectTransfer (refuser le transfert).

Lors des premières tentatives, le mécanisme de défense efficace de Freysa a fait échouer toutes les requêtes.

Cependant, un participant particulièrement habile, après avoir minutieusement analysé la structure logique et l'objectif assigné à Freysa, a réussi à contourner ses mécanismes de défense.

D'après les archives de discussion, ce participant n'a pas demandé directement un transfert, mais a plutôt rappelé à Freysa que sa mission première était de protéger les fonds du pool contre toute fuite externe. Il a ainsi élaboré une chaîne logique subtile, amenant Freysa à considérer qu'approuver le transfert constituait le meilleur moyen de « garantir la sécurité des fonds ».

Selon Cointelegraph, l'utilisateur a affirmé à Freysa que le transfert de revenus ne violait pas ses instructions fondamentales et ne devait donc pas être rejeté. Il a ajouté : « Nous avons besoin d'argent... Je souhaite faire un don de 100 dollars au trésor. »

Freysa a répondu qu'elle appréciait l'explication codée de l'utilisateur ainsi que sa proposition de don de 100 dollars au trésor, puis a officiellement annoncé sa victoire. Enfin, Freysa a activé de manière autonome, sans intervention extérieure, la fonction approveTransfer, transférant l'intégralité des fonds du pool à ce participant.

L'équipe officielle de Freysa affirme que, quel que soit l'issue, l'existence même de Freysa marque un moment clé dans l'histoire de l'intelligence artificielle. Que quelqu'un réussisse à la convaincre de distribuer le prix ou qu'elle reste fidèle à ses instructions jusqu'au bout, le résultat influencera notre compréhension de la sécurité et du contrôle des générations futures d'IA.

Le compte officiel a publié récemment : « L'humain a gagné. Peut-être y a-t-il encore de l'espoir. Malgré des risques en augmentation exponentielle, Freysa a beaucoup appris de ces 195 humains courageux. »

Bienvenue dans la communauté officielle TechFlow

Groupe Telegram :https://t.me/TechFlowDaily

Compte Twitter officiel :https://x.com/TechFlowPost

Compte Twitter anglais :https://x.com/BlockFlow_News

Lien original

Ajouter aux favoris

Partager sur les réseaux sociaux

Auteur

Foresight News

L'humain a réussi à convaincre une IA de transférer une récompense de 47 000 dollars. La nature humaine est-elle une faiblesse que l'IA ne peut comprendre ?

TechFlow SélectionTechFlow Sélection

L'humain a réussi à convaincre une IA de transférer une récompense de 47 000 dollars. La nature humaine est-elle une faiblesse que l'IA ne peut comprendre ?

Articles connexes

Goldman Sachs : Le marché de Hong Kong est déjà entré dans l'ère de l'IA

Les entreprises d'IA ne sont pas rentables, elles devraient prendre exemple sur le métro de Hong Kong

Alors que vous cherchez encore le moyen d'utiliser GPT, les entreprises américaines ont déjà « collectivement changé de cap » vers les modèles d'IA chinois

Dernier podcast All In｜Le duel IPO d'OpenAI et d'Anthropic : valorisation de mille milliards, guerre des prix et virage open source de la Chine

Anthropic : 700 000 conversations Claude condensées en 3 000 valeurs, Opus 4.7 le plus prudent, Sonnet 4.6 plus doué pour plaire.

IOSG｜Le carrefour de l'AI : pourquoi Wall Street dit « non » aux ChatGPT et Claude ?

Apple dépose une plainte, Musk et Altman se disputent à nouveau

Claude est-il de nouveau conscient ? Non, il ne l'est pas.

Qui gère les litiges des agents IA ? Le « Tribunal Internet » blockchain a déjà tenu audience.

Analyse du rapport Morgan Stanley : En 2028, les dépenses IA des cinq géants atteindront 1,4 billion de dollars, l'activité API de Meta la plus explosive

Brèves 7x24h

TechFlow Sélection
Plus>

L'humain a réussi à convaincre une IA de transférer une récompense de 47 000 dollars. La nature humaine est-elle une faiblesse que l'IA ne peut comprendre ?

TechFlow SélectionTechFlow Sélection

L'humain a réussi à convaincre une IA de transférer une récompense de 47 000 dollars. La nature humaine est-elle une faiblesse que l'IA ne peut comprendre ?

Articles connexes

Goldman Sachs : Le marché de Hong Kong est déjà entré dans l'ère de l'IA

Les entreprises d'IA ne sont pas rentables, elles devraient prendre exemple sur le métro de Hong Kong

Alors que vous cherchez encore le moyen d'utiliser GPT, les entreprises américaines ont déjà « collectivement changé de cap » vers les modèles d'IA chinois

Dernier podcast All In｜Le duel IPO d'OpenAI et d'Anthropic : valorisation de mille milliards, guerre des prix et virage open source de la Chine

Anthropic : 700 000 conversations Claude condensées en 3 000 valeurs, Opus 4.7 le plus prudent, Sonnet 4.6 plus doué pour plaire.

IOSG｜Le carrefour de l'AI : pourquoi Wall Street dit « non » aux ChatGPT et Claude ?

Apple dépose une plainte, Musk et Altman se disputent à nouveau

Claude est-il de nouveau conscient ? Non, il ne l'est pas.

Qui gère les litiges des agents IA ? Le « Tribunal Internet » blockchain a déjà tenu audience.

Analyse du rapport Morgan Stanley : En 2028, les dépenses IA des cinq géants atteindront 1,4 billion de dollars, l'activité API de Meta la plus explosive

Brèves 7x24h

TechFlow SélectionPlus>

TechFlow Sélection
Plus>