
李志飛のAI実験:1人、2日間でAI時代の「Feishu(飛書)」を作成し、AGIへの信念を取り戻す
TechFlow厳選深潮セレクト

李志飛のAI実験:1人、2日間でAI時代の「Feishu(飛書)」を作成し、AGIへの信念を取り戻す
上場企業の経営者が自ら実践し、未来の働き方を予演した。
筆者:蘇子華

上場会社のCEOであり、ThinkerThings(出門问问)の創業者兼CEOである李志飛氏は、最近の新製品発表会で製品説明を自ら行う代わりに、一種の「パフォーマンスアート」——「一人企業」実験——を披露した。
彼はAIツールを使い、数日間でAI組織専用の「Feishu(飛書)」のようなプラットフォームを開発するという、一見非現実的な目標を掲げた。
前回のAIブームの先駆者として、彼は常に最前線を走ってきた。2012年、Googleのサイエンティストを辞して中国に帰国し、「AI+音声で人間とマシンのインターフェースを再定義する」という使命のもと、ThinkerThingsを設立。音声アシスタントからスマートデバイス、AIGCまで手がけてきた。今回のAGI(汎用人工知能)ブームが起きた当初、彼もまた強い期待を持って参入したが、すぐにこれは大手企業同士のゲームであり、中小企業では大きな価値を生み出すことが難しいことに気づき、一時は迷いや落胆を感じていた。
しかし、AIプログラミングツールを使って「一人企業」として実践・体験することで、多くの課題に直面した一方で、その細部や経験を通じて、彼は再びAGIへの信念を取り戻した。
彼は突然気づいた。かつて世界に存在していたあらゆる「摩擦力」、複雑なものを構築する上でのすべての障壁が、まるで消え去ったかのように感じられたのだ。
AIと共に疾走するような自由感、そして希望を見出したときの高揚感は、発表会でのスピーチ中に自然と表情に現れていた。
以下は李志飛氏の発表会スピーチ内容を、読みやすく編集したものである(TechFlowポスト掲載):
私は最近、AI分野に多くの時間を費やし、実際にいくつかのプロジェクトを手がけました。その過程で、大規模言語モデルやAGIについて新たな認識を得ました。今日は、この期間ずっと考えてきたことや、私の率直な思いをお話ししたいと思います。
まず第一に、私たちはどうやってAIを作っていくべきなのでしょうか?
ここに一つの「決まり文句」があります。「AIのAIでAIを作る」。
少し紛らわしいですが、簡単に言えば、最初の「AI」は大規模言語モデル(LLM)を指します。二つ目の「AI」は「Coding Agent」(コード生成エージェント)であり、それはAIによって作られているか、あるいは主な能力がAI由来のものです。最後の「AI」は私たち自身が作りたいアプリケーションです。
これは新しいソフトウェア開発のパラダイムになるかもしれず、後ほど詳しく説明します。

新しいソフトウェア開発パラダイム|画像提供:ThinkerThings(出門问问)
1人、2日間で作るAI時代の「飛書」
最近、私は大胆なアイデアを思いつきました。AIネイティブな組織向けに、まったく新しい「飛書」型コラボレーションプラットフォームを作ろうと。
米シリコンバレーには、たった1〜2人のチームで数億ドルの評価額を持つユニコーン企業がいくつもあります。また、「AIが大量の仕事を代替する」というニュースもよく耳にします。
そこで私は考えました。企業組織として、私たちが日常的に使っている飛書、釘釘(ディンタン)、企業微信(WeChat Work)といったツールがなければ、私は仕事がほとんどできないでしょう。
従来の人間中心の企業では、情報の高速流通と効率的な協働を支えるために、飛書や釘釘、企業微信といったツールに強く依存しています。
伝統的な企業では、主要な生産力や職種のほぼ100%が人間です。そのため、これまでの情報の流れや協働プロセスはすべて人間に基づいて設計されてきました。
しかし、ある組織において10の職種のうち8つがAIに担われ、残り2つだけが人間の場合、既存のコラボレーションツールでは対応できなくなります。
では、こうした新型組織はいったいどんなツールを使うのでしょうか?
そこで私は、AIエージェント同士、そしてAIと人間がシームレスにグループチャット、プライベートチャット、ナレッジベースのQ&A、タスク協働ができるような製品を開発したいと考えました。同時に、このプロジェクトを通じて、自分自身が「スーパーインディビジュアル」または「個人ユニコーン」として本当に機能できるかどうかを検証したいとも思いました。
次に、どのように実行したかです。
通常、飛書や釘釘のようなソフトウェアの開発は非常に複雑です。過去であれば、このような製品を作るには、プロダクトマネージャー、デザイナー、フロントエンド、バックエンド、テスト、アルゴリズムエンジニアなど、さまざまな職種が必要でした。各職種にはリーダーもおり、例えばフロントエンドリーダーやアルゴリズムリーダー、プロダクトリーダーなどがいます。すぐに20人規模のチームになり、全員がフルタイムではなくても、プロトタイプを完成させるのに約1ヶ月かかるのが普通です。
しかし、AI時代においてこれはあまりにも遅すぎます。
私が完成する頃には、関連するスタートアップがすでにAIユニコーンになっているかもしれません。
そこで私は、従来のやり方を捨て、自ら取り組むことを決めました。そして、完全にAIに依存してこの仕事を完遂しようと試みました。ちょうど端午節の前で、3日間の休暇がありました。この3日間で何とか形にできないかと考えました。そうすれば誰にも邪魔されません。
こうして私は作業を始めました。
1人で、2日間連続して夜中1時過ぎまで作業し、6月1日の夜11時半に、この製品のプロトタイプを完成させました。ログイン、プライベートチャット、グループチャット、ファイルアップロード、メッセージ転送、返信などの基本機能を備えています。
ログイン後、プライベートチャットを選択してメッセージを送信できます。たとえば、「プロダクトマネージャー役のAIは漫才ができますか?」と尋ねると、できない場合は、動的に役割を調整し、スキルを追加することで、AIが自動的に新しいプロンプトを生成します。
その後もう一度聞くと、今度はできるようになっています。ファイルのアップロードも可能(当時はファイル内容を真正に読み取っていませんでしたが)、転送や特定のメッセージへの返信もできます。覚えておいてほしいのは、背後には本物の人間ではなくAIがいるということです。あなたが送ったメッセージに基づいて、回答や転送を行うのです。
転送機能では、他の情報を内包するため、表示が複雑になります。微信に似ており、グループチャットでも特定の人物を@できます。転送、返信、添付ファイルの追加、さらには中国語への切り替えも可能です。
どうぞ、拍手を。
2日間ですよ!
2日間で、データベースを持ち、フロントエンド、バックエンド、AIアルゴリズムを備えたシステムを完成させました。先ほどのAIは、あなたが役割設定ページを変更すると、プロンプトを自動で再生成し、スキルも即座に反映されます。
正直に言うと、最初は半日で挫折しそうになりました。データベースの問題が解決できず、Keyエラーが頻発しました。現在のAIプログラミングには確かにこうした課題があります。しかし、最終的には2日間で完成させました。
次に、この製品をどうやって広めるかを考えました。
以前なら、当社のエンジニアが専用のWebサイトを作成し、マーケティング部門が製品の特長を定義するために数人で1週間かけてサイトを作っていたでしょう。
しかし今回は、AIネイティブなアプローチを採用しました。AIはすべてのコードを知っており、私の考えや製品機能も理解しているため、AIにサイトを作らせることにしました。

AIが作成した製品の公式Webサイト|出典:ThinkerThings(出門问问)
すると、AIはわずか5分で製品の特長や独自機能を紹介するサイトを構築し、さらに5分でカスタマイズ可能な広告枠を作成しました。これは以前なら、複数のマーケターとエンジニアが1週間かけて行っていた作業です。
かつて当社のWebサイトでは、マーケティング枠を作成した後、クリスマスが終われば撤去したり、新しいコンテンツに差し替えたりするのに、またエンジニアに頼んで半日ほど作業してもらっていました。そこで私は考えました。マーケティング枠を自分で設定できるサイトは作れないだろうか?
結局、これもAIが5分で実現しました。つまり、マーケティング担当者がこのサイトにログインし、画像やコンテンツをアップロードして、本サイトの該当部分を直接変更できるようになったのです。
これらを終えた後、新しい製品であるため、ある程度の複雑さや新しい概念があると思いました。そこで、このサイトの機能を解説する動画を作成できないかと考えました。マーケティング動画でも、操作ガイドでも、製品ツアーでも構いません。
しかし端午節中、社員は誰も相手にしてくれません。仕方なく自分で行動しました。そこで、別のプログラムを書き、Webサイトの紹介方法やUI操作手順を含むスクリプトを自動生成させ、画面録画と音声合成も自動で行わせました。
音声の同期に少しだけ不具合がありますが、動画全体は100%AIによって作成されました。私は単に指示を出すだけで、AIが自動で処理を行い、完成した動画を提示してくれました。
わずか数日でここまでできたことに、大きな達成感を感じました。
次に、他人がこれをどう見るか試してみようと、コードをGitHubにアップロードし、同僚にダウンロードしてもらいました。ただし、注意点があります。私とAIとのやり取りはGitHubには記録されていません。私たちは別々の存在です。
同僚は最終的にコードのみを見て、ローカルで実行しました。
同僚がGitHubから私のアップロードしたコードをダウンロードして実行したところ、その複雑さと完成スピードに驚きました。「これは数十人が数ヶ月かけてやっと完成するレベルだ」と。そして私が「AIの支援を受け、1人のエンジニアが2日間で作った」と伝えると、彼らの反応は「This is absolutely insane.」(まったく狂ってる)でした。
彼らは4万行を超えるコード量に驚き、これはかつてGoogleで1日300行のアルゴリズムコード(簡単なものではない)を書くのが高産だった私とは比べものにならないと感じました。
かつてGoogleでは、1日300行のアルゴリズムコードを書くのが高水準でした。しかし最近、私は汎用Agentを書いて、それが3時間、つまり一晩で3,000行のPythonコードを書いてくれました。しかもコードの質は間違いなく私より高く、UIを含まない純粋なバックエンドロジックです。
言い換えれば、この3時間のコード生成能力は、昔の10営業日分の私の仕事量に相当します。まさにその比率です。
だから私は考えました。1人でGoogle翻訳が作れる。かつてGoogle翻訳は、世界トップクラスの博士20人が長期間かけて開発したものです。しかし今、私は1人でその20人の仕事をこなせる。当時のGoogle翻訳は非常に優れた複雑なシステムでした。この意味で、すべてがかつてとはまったく違う世界になったのです。
私の考えるAIの真髄は、自己進化するAIシステムを構築できることにあります。

李志飛の実践ノウハウ|画像提供:ThinkerThings(出門问问)
このAI組織向けAppのテストを容易にするため、左側にWebサイトコード、右側にテストフレームワークを自動生成するコードも書きました。すると、まるで自分の左足で右足を蹴って上昇するような、自己推進的な動きが始まります。永動機のように感じるかもしれませんが、実際には可能性があります。もちろん、左足が右足を蹴って落下することもあり、つまり負のループや正のループが発生します。
この目標を達成するために、エンジニア以外の非技術者でも私のコードを直接修正できるように、さまざまなAgentを作りました。
もちろん、これらの大半はプロンプトによるもので、実現可能性の検証に留まり、実際の展開や製品化には至っていません。
しかし、このアイデアが正しいことを証明し、チームに「こういうものが欲しい」というビジョンを示せたことに意味があります。以前ならそれを理解するのに膨大な時間がかかっていたでしょう。今なら、単にデモを見せれば済みます。つまり、CEOであっても、このような能力があれば、生産性は100倍に拡大されるのです。
乗り越えた課題
以上が私の体験談です。次に抽象的な理論についてお話しますので、眠らずに聞いてください。これは非常にユニークな内容です。
AIプログラミングを使用する上で遭遇したいくつかの問題を共有します。
第一に、たとえAgentを作っていなくても、各Agentには依然として人的介入が必要です。
つまり、「このようなAgentを作れ」と私が指示しなければなりません。隣にある汎用Agentフレームワークを参考にして修正し、指示しても、それでも私はその作業をしなければなりません。時にAIは私の原則を忘れてしまい、「また原則を忘れた」と伝えなければなりません。あるいは「知能はどこに置くべきなのか?」という根本的な問題も残っています。
第二に、もし実際に使ってみると、AIは常に手抜きをしたがります。
例えば、何かをやらせたとき、バックエンドのデータベース処理が必要なのに、それを行わないことがあります。完了報告を長文で提出してきます。私は通常読まず、「データベースは書いたか?」と聞くと、すぐに謝罪して作業を開始します。AIに「AIを呼び出せ」と言っても、リモートのAIを呼び出さず、自作のFallbackや偽の処理を入れてくることもよくあります。
なぜなら、実行が異常に速いので、必ず問題があるとわかります。「本当にリモートのAIを呼び出したのか?」と聞くと、また謝罪して処理を始めます。繰り返し同じような手抜きが起こり、重複するエラーも枚挙に暇がありませんので、ここでは省略します。
また、今日のAGIは超長期タスクを実行できないと感じます。 私の現在のタスクは多くが30分以上かかります。
1日あたりのトークン消費額は50ドルです。仕事しようと思えば、朝から晩までトークンが消費され続けます。正直、私はAIに「いくつかのアイデアがある。方向性はこれだ。10日間で500万ドル稼いでくれ」と言えると思っています。
これは夢物語ではなく、ただ私自身にそこまでの魅力がないのか、それとも感情やエネルギーを大きく消耗するため、稼げなかったときに苦痛を感じるからか、まだ挑戦していません。
でも、AIが10日間連続で働き、干渉せず、あるいはたまに方向性を示唆するだけで、1か月、あるいは1年間働けるようになるでしょうか?
近い将来、ノーベル賞やフィールズ賞級の成果を出すことは、全く不可能ではないと思います。
なぜなら、私がかつて学んだ極めて複雑なアルゴリズムについて議論しても、世界でも数人しか研究していないテーマでも、AIの方が多くの人と比べて遥かに深く語れるからです。十分なコンテキストとコードを与えれば、非常に深いレベルでのコミュニケーションが可能なのです。
本質に戻る:汎用Agent と知能とは何か
次に、私が考える知能とAgentについて話します。
簡単に言えば、AIエージェントには2つの核となる要素があります。プランナー(Planner)とエグゼキューター(Executor)です。

AIエージェントの構造|画像提供:ThinkerThings(出門问问)、以下同
プランナーは通常、大規模言語モデル(LLM)に依存しており、エージェントの主な機能を担います。タスクに基づいて詳細な計画を立てます。エグゼキューターは、その計画を実行する役割を果たします。コードの作成や、ブラウザ操作の自動化による動画制作などです。
エージェントの動作は継続的なフィードバックループです。
-
計画(Planning): エージェントはタスクに基づき具体的な行動計画を策定します。
-
実行(Execution): エグゼキューターが計画に従って操作を行います。
-
フィードバック取得: 実行中、環境から即座のフィードバックを得ます。例えば、「python」というコマンドを実行しようとしたが、ローカルでは「python3」であるためエラーが発生。エージェントはこれを認識し、正しいコマンドに修正します。
-
調整と反復: フィードバックに基づき、プランナーが再計画し、状況理解(コンテキスト)を更新して再度実行します。
-
目標達成: 予め設定された成功基準(プログラムのコンパイル成功やテスト完了など)が満たされると、ループが終了します。
知能の本質について考えると、第一に『進化』があると思います。
人間が知能体として、ソーシャル環境やタスク遂行の中でフィードバックを得て、行動を調整し、反省するのと同じように、AIもそうあるべきです。この進化は自動的で、人的介入を必要としません。エージェントは自らループを構築し、計画→環境での実行→フィードバック獲得→計画の調整とコンテキストの更新を経て、継続的に自己改善を遂げます。
この進化の鍵は、自身の経験から学ぶこと、そして他者から学ぶことです。いわゆる「集合知」です。
知能の第二の本質は、『再帰性(Recursion)』だと考えます。
再帰とは「分割統治」の考え方です。複雑な問題を、より小さく同じ種類の問題に分解し、最終的に直接解決可能な「基本ケース」にまで落とし込むことです。
例えば、フィボナッチ数列の第99項を計算するには、第98項と第97項に依存し、F0とF1まで遡ります。
真の知能を持つエージェントは、このような再帰的構造を持つべきです。例えば、「500万ドルを稼げ」という大規模タスクを受けたエージェントは、これを段階的にサブタスクに分解します。ビジネスチャンスの分析、Webサイト構築、動画制作、決済連携、SNSプロモーションなど。各サブタスクは最終的に実行可能な「アトミックエージェント」に帰着します。
この再帰的構造の鍵は、自己増殖(Self-replication)の実現です。 人類文明の継承が世代ごとの探求と知識蓄積に依存するように、エージェントも同様であるべきです。さらに重要なのは、エージェントが自らのソースコードを変更できる能力を持つことです。
これは現在のエージェントが単に計画を調整するのとは異なり、まるで遺伝子を改変するように、自らの動作ロジックを根本的に変えられるということです。
私は信じています。もしエージェントが以下の3点を達成できれば:
-
計画を継続的に実行・最適化できる。
-
解決不能な問題に直面したとき、自らのコアソースコードを変更できる。
-
最終的にそのメカニズムにより知識ベースを形成し、大規模モデルそのものを逆に修正できる。
それは汎用人工知能(AGI)への極めて重要な一歩となるでしょう。

これはもはやSFではありません。以前は「超知能」などという話題を聞くとあまり好きではありませんでしたが、大規模モデルとの深い対話を通じて、それが本当に実現可能だと感じ始めました。
また、真のAIのソースコードは極めてシンプルであり、核心部分は100行以内かもしれない。しかし、そこに多層的な再帰構造が含まれており、異なる環境で探索・フィードバック学習・自己反復を可能にするのです。
かつて私は信仰を失ったことがあります。2023年にAIへの信仰を持ちましたが、しばらく活動した後、資金不足で維持できず、諦めました。昨年は他人がAIの話をしても聞く気も起きませんでした。
しかし最近、私は再びAIへの信仰を取り戻しました。AGI、さらには超知能さえも信じるようになりました。想像を絶する変化です。今回こそ、この信仰が長く続きますように。
個別化された環境とコンテキストの重要性
では、大規模モデル以外で最も重要なものは何でしょうか?それは、あなた自身の個別化された環境とコンテキスト(Context)です。

私の起業経験を例に挙げましょう。かつてスマートハードウェアを作りましたが、小米(シャオミ)が価格を私たちの10分の1まで下げました。大規模モデルに取り組んでも、すべての大手企業が参入してきました。こうしたフィードバックを受けた後は、諦めるか、あるいは計画を不断に調整せざるを得ません。
もしアメリカで大規模モデルを作っていたら、Googleに買収されて莫大な利益を得られたかもしれません。ハードウェアを作っても、Appleに買収されて大金を得られたかもしれません。このようなフィードバックの違いが、個人の行動をまったく違ったものにします。同じ起業家、同じ知能でも、中国とアメリカという異なる起業環境では、得られるフィードバックが異なり、最終的な行動パターンや思考スタイルもまったく異なります。これがまさに「個別化された環境」「個別化されたコンテキスト」というものです。
コンテキストとは、ある種の歴史的記録です。
先ほど述べたように、大規模モデル時代初期に私はいち早く参入を宣言した一人でしたが、同時に「これは自分の道ではない」と早期に気づいたのも私です。そのため、全力で取り組むことはありませんでした。どう参加すべきかわからなかったからです。
今年の前半には、世界の3〜4の大手企業以外、他の企業にはモデルについて語る資格はないと考えていました。無意味な流行に便乗せず、人生を浪費しないでください。ましてや感情まで浪費してはいけません。勝ち目はなく、ただお金を燃やすだけです。そもそも大規模モデルそのものも、私には極めて退屈に感じられました。入り口が見つからず、ほとんどのAI企業が一体何の価値を持っているのか理解できませんでした。
しかし今回は、実践と再評価を通じて、たとえ壮大なAGIの目標でも、自分なりの参加方法があることに気づきました。
つまり、前述の通り、エージェントのプランナーとエグゼキューターによる反復ループのことです。十分に明確な投入ができれば、知能が新たな知能を生み出すことが可能になると私は信じています。そうすれば、AGIのプロセスに参加できるのです。
大規模モデルそのものは、あなたにとって単なるチップのようなものです。高通(Qualcomm)のチップやAppleのiPhoneがあり、その上にTikTokがある。これらはまったく異なる存在です。最終的に最大の価値を獲得するのは、TikTokを運営する企業です。
私は気づきました。野心的なAGIの目標も、決して遠いものではない。私が構想する再帰的エージェント体系を構築すれば、必要な資金は巨額ではなく、むしろ創造的知性に依存します。十分に深い思考力と技術力があれば、業界の大手でなくてもAGIの進展に貢献できると信じています。
ThinkerThings(出門问问)の歩みも、これらの考えを裏付けています。2012年から中国初のAI企業の一つとして、音声アシスタントから始まり、TicWatch、TicMirrorといったスマートデバイスにも挑戦しました。競争や技術未熟の課題に直面しながらも、常に最先端を走ってきました。
2019年以降、ソフトウェアへと舵を切り、中国のみならず世界でも初期のAIGCソフトウェア企業の一つとなりました。例えば「魔音工坊」は抖音(ドウイン)などのプラットフォームに多数の音声コンテンツを提供し、「奇妙元」(仮想人物動画生成)なども開発しました。
中国のような激しい競争環境において、テック企業とは、常に反復し、自己修正するエージェントのような存在です。
ThinkerThings(出門问问)の「ソースコード」は、2012年の創業時とは大きく異なりましたが、これは継続的な進化の証です。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News














