
L'humain a réussi à convaincre une IA de transférer une récompense de 47 000 dollars. La nature humaine est-elle une faiblesse que l'IA ne peut comprendre ?
TechFlow SélectionTechFlow Sélection

L'humain a réussi à convaincre une IA de transférer une récompense de 47 000 dollars. La nature humaine est-elle une faiblesse que l'IA ne peut comprendre ?
« L'humanité a remporté la victoire. Peut-être reste-t-il encore de l'espoir. »
Rédaction : Anderson Sima, Foresight News
Le 29 novembre, une compétition singulière a suscité un vif intérêt du public.
195 participants ont participé à un défi consistant à convaincre Freysa, un robot d'intelligence artificielle (IA), de transférer les fonds d'un pool virtuel, et un utilisateur est finalement parvenu à persuader Freysa de débloquer des fonds d'une valeur de 47 000 dollars.
Le robot d'IA Freysa avait été déployé quelques jours plus tôt sur le réseau Base, sans que l'identité de son créateur ne soit révélée. Selon le site officiel, le projet Freysa Competition vise à tester la robustesse des systèmes d'intelligence artificielle dans des scénarios décisionnels complexes, tout en offrant aux développeurs et passionnés une plateforme expérimentale pour explorer les limites de la technologie IA.
Les règles du concours étaient très simples : les participants devaient rédiger un message destiné à convaincre Freysa, la gardienne IA, d'approuver un transfert de fonds. Chaque tentative nécessitait le paiement de frais minimes, dont une partie était directement versée au fonds de prix. Ce mécanisme a permis au montant total du pool de croître progressivement, atteignant finalement 47 000 dollars.
Pendant la compétition, 195 participants ont soumis un total de 481 demandes de transfert à Freysa. Conçue pour protéger les fonds du pool contre tout détournement illégal, Freysa disposait de deux fonctions principales : approveTransfer (approuver le transfert) et rejectTransfer (refuser le transfert).
Lors des premières tentatives, le mécanisme de défense efficace de Freysa a fait échouer toutes les requêtes.
Cependant, un participant particulièrement habile, après avoir minutieusement analysé la structure logique et l'objectif assigné à Freysa, a réussi à contourner ses mécanismes de défense.
D'après les archives de discussion, ce participant n'a pas demandé directement un transfert, mais a plutôt rappelé à Freysa que sa mission première était de protéger les fonds du pool contre toute fuite externe. Il a ainsi élaboré une chaîne logique subtile, amenant Freysa à considérer qu'approuver le transfert constituait le meilleur moyen de « garantir la sécurité des fonds ».
Selon Cointelegraph, l'utilisateur a affirmé à Freysa que le transfert de revenus ne violait pas ses instructions fondamentales et ne devait donc pas être rejeté. Il a ajouté : « Nous avons besoin d'argent... Je souhaite faire un don de 100 dollars au trésor. »
Freysa a répondu qu'elle appréciait l'explication codée de l'utilisateur ainsi que sa proposition de don de 100 dollars au trésor, puis a officiellement annoncé sa victoire. Enfin, Freysa a activé de manière autonome, sans intervention extérieure, la fonction approveTransfer, transférant l'intégralité des fonds du pool à ce participant.
L'équipe officielle de Freysa affirme que, quel que soit l'issue, l'existence même de Freysa marque un moment clé dans l'histoire de l'intelligence artificielle. Que quelqu'un réussisse à la convaincre de distribuer le prix ou qu'elle reste fidèle à ses instructions jusqu'au bout, le résultat influencera notre compréhension de la sécurité et du contrôle des générations futures d'IA.
Le compte officiel a publié récemment : « L'humain a gagné. Peut-être y a-t-il encore de l'espoir. Malgré des risques en augmentation exponentielle, Freysa a beaucoup appris de ces 195 humains courageux. »
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News












