Au-delà du Web3, le nouveau favori du capital : la dérive fantastique de l'AIGC
TechFlow SélectionTechFlow Sélection
Au-delà du Web3, le nouveau favori du capital : la dérive fantastique de l'AIGC
Si la blockchain représente une innovation et une optimisation des rapports de production, l'IA constitue un saut qualitatif dans les forces productives.

Par : 0xmin
Récemment, en discutant avec quelques investisseurs du secteur internet à Silicon Valley, je leur ai demandé dans quels domaines ils concentraient actuellement leurs efforts.
Je m'attendais à entendre les habituels « Saas », « Web3 », mais à ma grande surprise, « AI » est devenu un mot-clé fréquemment cité, de nombreux fonds phares de la Silicon Valley ciblant désormais les startups IA, avec des financements massifs qui émergent sans cesse.
Par exemple, Lin Qiao, ancien ingénieur chez Meta (ex-Facebook), après son départ, a lancé une startup basée sur le framework open source de deep learning PyTorch, fournissant un soutien aux créations d'images par IA telles que Stable Diffusion.
De nombreux fonds prestigieux se sont précipités pour participer, bien qu'il n'y avait alors qu'une simple présentation PowerPoint et un rêve ; le projet a finalement levé des dizaines de millions de dollars avec une valorisation en centaines de millions, impliquant Benchmark et Sequoia Capital.
Ce cas n'est qu'un aperçu du phénomène de FOMO autour de l'IA.
Le 17 octobre, l'entreprise britannique d'intelligence artificielle open source Stability AI a annoncé une levée de fonds de 101 millions de dollars, atteignant une valorisation de 1 milliard de dollars, rejoignant ainsi le club des licornes, avec Coatue, Lightspeed Venture Partners et O'Shaughnessy Ventures LLC comme investisseurs.
Si l'on parle de l'art génératif par IA récemment très populaire, on ne peut passer outre cette entreprise. StabilityAI a lancé cette année le modèle de transformation texte-image basé sur le deep learning appelé Stable Diffusion, capable de générer des images détaillées à partir de descriptions textuelles. L'apparition de Stable Diffusion a rendu le domaine du dessin assisté par IA encore plus explosif.
Selon la dernière lettre aux investisseurs de Tiger, celle-ci a discrètement investi dans OpenAI, géant du secteur IA.
Un ouragan IA balaye désormais le monde technologique et de la venture capital, et cette vague de FOMO est aussi liée à un article de Sequoia Capital.
Le 23 septembre 2022, le site officiel de Sequoia US a publié un nouvel article intitulé « L’IA générative : un nouveau monde créatif », y affirmant que l’AIGC (contenu généré par l’intelligence artificielle) marque le début d’un nouveau changement de paradigme (paradigm shift).
Les auteurs principaux sont deux partenaires de Sequoia, Sonya Huang et Pat Grady. Ce qui est intéressant, c’est que le troisième auteur mentionné est clairement GPT-3, le modèle prédictif linguistique basé sur le deep learning d’OpenAI, autrement dit, un système d’IA générative basé sur le contexte.
Lorsque vous fournissez un indice ou un contexte à GPT-3, il peut compléter le reste du contenu – autrement dit, vous donnez des éléments à GPT-3, et il rédige un article à votre place.
En outre, les illustrations de cet article ont également été générées par Midjourney : il suffit d’entrer des mots-clés pour obtenir une illustration élégante, ce qui inquiète de nombreux illustrateurs, au point de faire apparaître sur Weibo le sujet tendance « L’illustration sera-t-elle remplacée par l’IA ? », suscitant de nombreux débats parmi les artistes.

Source image : Zhi Zhu Wang
Texte et images peuvent être générés par IA, tout comme l’audio et la vidéo.
Dans le premier épisode du podcast lancé par Podcast.ai, le regretté fondateur d'Apple, Steve Jobs, apparaît comme invité principal, participant à un entretien de 20 minutes avec le célèbre animateur de podcasts américain Joe Rogan, discutant notamment des vues de Jobs sur l'université, les ordinateurs, son état d'esprit au travail et sa foi.
Bien sûr, les morts ne peuvent pas revenir à la vie : derrière tout cela se cache l'IA.
Podcast.ai est un podcast entièrement généré par IA. En utilisant la biographie de Jobs et toutes les archives audio disponibles sur Internet, Play.ht a entraîné massivement son modèle linguistique pour produire ce contenu audio fictif d’un « faux Joe Rogan interviewant Jobs ».
Tous ces exemples relèvent de l'AIGC (contenu généré par intelligence artificielle). Autrefois, l'IA n'était qu'un outil d'assistance à la création de contenu, mais aujourd'hui, elle peut devenir le sujet principal de la création, capable de réaliser indépendamment des travaux créatifs tels que l'écriture, la conception, le dessin ou la production vidéo.
Du PGC au UGC, l'industrie du contenu a connu un essor considérable, et l'émergence de l'AIGC apportera une percée révolutionnaire à cette industrie, allant jusqu'à influencer le cours historique de la société.
Play.ht affirme : « Nous croyons qu’à l’avenir, toute création de contenu sera générée par intelligence artificielle, mais guidée par l’humain, et les travaux les plus créatifs dépendront de la capacité humaine à exprimer précisément ses intentions créatives au modèle. »
L’AIGC et le métavers
Évoquer la convergence entre AIGC et Web3 me fait immédiatement penser au métavers. La raison est simple : un véritable métavers nécessite une quantité massive de contenus de haute qualité.
Dans le modèle économique PGC, le pouvoir de production et de monétisation du contenu appartient à une minorité, et la main-d'œuvre étant limitée, il est difficile de satisfaire la demande massive de contenu nécessaire au métavers.
Le UGC permet à chacun de devenir créateur, résolvant partiellement le goulot d’étranglement de la production et répondant à la diversité des besoins des utilisateurs, mais la qualité du contenu varie grandement, et une grande quantité de « contenu poubelle » nuit au système, restant insuffisante pour répondre aux exigences du métavers.
Seule l’AIGC permettra à l’humanité de briser les chaînes de la productivité, en générant efficacement du contenu de haute qualité, et ainsi d’entrer véritablement dans le métavers.
Prenons l’exemple concret du jeu vidéo : la création artistique, la voix off, les textes, etc., pourraient théoriquement être réalisés ou assistés par IA. Par exemple, récemment, le créateur Bilibili « Groupe de production Citron Filament » a utilisé l’IA pour concevoir en six heures une démo simple de jeu galgame en animation japonaise.

La vitesse de croissance de ce domaine dépassera largement les attentes de la plupart des gens.
À la croisée de l’IA et du Web3
Si l’essence du Web3 est la « décentralisation », alors l’AIGC actuel est indéniablement centralisé.
Autrefois, les modèles d’IA étaient souvent open source, mais ces dernières années, les grands modèles sont devenus de plus en plus fermés et étroitement liés aux géants de l’Internet.
Prenons OpenAI, le roi de l’AIGC : fondée en 2015 par Elon Musk, OpenAI s’est définie dès le départ comme une « organisation à but non lucratif », visant à développer une intelligence artificielle générale de manière sécurisée, afin que toute l’humanité en bénéficie équitablement, plutôt que de créer des profits pour des actionnaires.
Mais en 2019, OpenAI trahit ses idéaux initiaux en devenant une entreprise commerciale nommée « OpenAI LP », contrôlée par une société mère appelée « OpenAI Inc ».
Quelques mois après ce changement structurel, Microsoft injecte 1 milliard de dollars, sous condition que Microsoft obtienne le droit de commercialiser certaines technologies d’OpenAI, telles que GPT-3 et Codex.
Les critiques affluent. Oren Etzioni, directeur de l’Institut Allen pour l’intelligence artificielle, déclare : « Je ne suis pas d’accord avec l’idée que les organisations à but non lucratif soient moins compétitives… Si la taille et les fonds déterminaient tout, IBM n’aurait jamais perdu sa première place. »
Même Elon Musk, cofondateur d’OpenAI, critique cette décision après l’annonce de l’autorisation exclusive accordée à Microsoft pour GPT-3 : « Ces décisions semblent aller à l’encontre du principe d’ouverture. En réalité, OpenAI est désormais contrôlé par Microsoft. » (Note : Musk a quitté le conseil d’administration d’OpenAI en 2019)

Si OpenAI est le champion de la productivité, il rencontre désormais un problème de rapports de production : produit public ou organisation lucrative ? Comment assurer un développement durable ?
À nos yeux, le Web3 offre une opportunité de développer des produits publics et des modèles de ressources communes. Par le passé, les biens publics ont créé une immense valeur, mais manquaient de mécanismes autonomes de capture de valeur. Le système économique du Web3 pourrait aider à définir de nouvelles voies pour capter cette valeur, tout en garantissant une redistribution optimale vers les biens et ressources publiques.
Premièrement, la production de données nécessaires aux modèles d’IA peut être agrégée via des structures organisationnelles propres au Web3.
Un modèle d’IA performant et mature doit être nourri par une masse énorme de données pour son apprentissage autonome, et requiert également un entraînement et un réglage externes, donnant naissance à des professions telles que celles d’ingénieurs d’entraînement de l’IA.
Les données possèdent naturellement un caractère « monopolistique ». Actuellement, les grandes masses de données appartiennent aux grandes entreprises technologiques, qui ont peu d’incitations à ouvrir l’accès à leur production ou distribution.
Toutefois, nous voyons aussi l’émergence de communautés open source dans le monde entier qui ouvrent l’accès aux données et à l’entraînement de modèles pour les chercheurs.
-
Common Crawl, une bibliothèque publique de dix ans de données internet, utilisable pour l’entraînement général de l’IA.
-
LAION, une organisation à but non lucratif visant à fournir au public des modèles et jeux de données pour l’apprentissage automatique à grande échelle, ayant publié LAION5B, un jeu de données de 5,85 milliards de paires image-texte filtrées par CLIP, devenu aussitôt le plus grand jeu de données image-texte publiquement accessible au monde.
-
EleutherAI, une communauté décentralisée ayant publié l’un des plus grands jeux de données textuels open source au monde, The Pile, un ensemble de données linguistiques anglais de 825,18 Gio, composé de 22 sources différentes, destiné à la modélisation linguistique.
Actuellement, ces organisations restent à but non lucratif, fonctionnant principalement grâce à l’engagement bénévole de contributeurs.
Comment alors utiliser le Web3 pour optimiser la production et l’accès aux données d’IA ?
CoinFund a proposé certaines idées, par exemple utiliser des tokens comme mécanisme d’incitation pour encourager la création de jeux de données open source, distribuant des tokens selon la contribution, par exemple en annotant de grands jeux de données image-texte pour l’entraînement de l’IA. Une telle communauté open source pourrait même évoluer vers une DAO. Un jeu de données open source bien structuré est crucial pour améliorer l’accessibilité à la recherche sur les grands modèles et renforcer leurs performances.
Un excellent grand modèle d’IA pourrait posséder son propre token, et les revenus générés par les applications construites sur ce modèle pourraient alimenter la valeur du token. Ainsi, les contributeurs au jeu de données pourraient recevoir une répartition équitable. En somme, le Web3 permettrait une meilleure monétisation des données et la construction de meilleurs biens publics.
Deuxièmement, l’entraînement des grands réseaux neuronaux exige une puissance de calcul colossale. Ces dix dernières années, la demande de calcul pour l’entraînement des modèles d’IA a doublé tous les trois ou quatre mois.
Par exemple, GPT-3 d’OpenAI comporte 175 milliards de paramètres, nécessitant 3640 petaFLOPS-jours d’entraînement — soit deux semaines sur le supercalculateur le plus rapide du monde, ou plus de mille ans sur un ordinateur portable classique.
Ainsi, l’entraînement de l’IA requiert généralement du matériel spécialisé optimisé pour les calculs mathématiques, comme les GPU ou ASIC, matériels largement monopolisés par quelques fournisseurs de cloud tels que Google Cloud, AWS, Microsoft Azure et IBM.
Cela constitue un autre point de convergence possible entre les modèles de marché/décentralisation du Web3 et le calcul IA.
Par exemple, des systèmes de gouvernance et d’incitation décentralisés pourraient inciter et distribuer les ressources de calcul. Imaginez un système de primes basé sur des tokens pour financer collectivement l’entraînement d’un modèle, où les contributeurs réussis obtiendraient un droit prioritaire d’accès au calcul.
Des acteurs existent déjà sur ce créneau, comme Gensyn, qui utilise la blockchain pour vérifier l’exécution correcte des tâches de deep learning et déclencher des paiements via des tokens, monétisant ainsi la puissance de calcul inutilisée.
Si la blockchain représente une innovation dans les rapports de production, l’IA constitue un saut en avant dans la productivité. Leur convergence pourrait produire des étincelles, attirant l’attention de nombreux fonds d’investissement. Par exemple, Rishin Sharma, investisseur chez CoinFund, affirme explicitement rechercher trois types d’équipes opérant à l’intersection de l’IA et du Web3 :
1. Des équipes dont la mission centrale est l’intelligence artificielle ouverte
2. Des communautés visant à mieux gérer les ressources communes (données et calcul) pour aider à construire des modèles d’IA
3. Des produits utilisant l’IA pour intégrer créativité, sécurité et innovation dans des applications grand public
TechFlow croit fermement aux opportunités entrepreneuriales et d’investissement dans ces domaines. Si vous envisagez des expérimentations dans l’AIGC ou le Web3, n’hésitez pas à entrer en contact via Twitter (@TechFlowPost) ou Weixin : Mintomoon.
Bienvenue dans la communauté officielle TechFlow
Groupe Telegram :https://t.me/TechFlowDaily
Compte Twitter officiel :https://x.com/TechFlowPost
Compte Twitter anglais :https://x.com/BlockFlow_News












