
AIが人材評価をまもなく主導する――対話AI採用プラットフォームMercor創業者
TechFlow厳選深潮セレクト

AIが人材評価をまもなく主導する――対話AI採用プラットフォームMercor創業者
人間はより多くの場合、「販売促進」の環節に参加する。
筆者:MD
制作:明るいカンパニー

最近、米国赤点ベンチャーズのパートナーであるJacob Effron(中央)、Patrick Achase(左)は、ポッドキャスト「非監督学習」にてAI採用プラットフォームMercorの創業者兼CEO Brendan Foody(右)と対談を行った。Mercorのコア事業であるAIを活用した採用の変化に加え、AIと人間が今後職場でどのような関係を築いていくかについても議論された。
Mercorは、Brendan Foodyを含む3人の21歳のThiel Fellowが2023年に設立した。今年2月、同社は1億ドルのシリーズBラウンドを完了し、評価額は20億ドルとなった。この資金調達はFelicisが主導し、Benchmark、General Catalyst、DST Globalなどが参加した。Mercorは、AI技術を用いて履歴書のスクリーニング、候補者のマッチング、AI面接、給与管理を自動化し、採用効率を高めるとともに人的バイアスを減らすことを目指している。
インタビューの中でFoodyは、現在Mercorは事実上、AIモデルの評価およびデータアノテーションの領域にも進出していると述べた。AIモデルの能力が向上するにつれて、多くの複雑な問題はモデル自体や常識では検証できなくなっており、そのため開発者は専門分野の知識を持つ有能な人材の支援を必要としている。しかし、こうした仕事は長期的な職ではなく、「エキスパートネットワーク」と似ており、自社プラットフォームを通じて多数のAI研究所に該当分野の人材を紹介することは「自然な流れだ」とFoodyは指摘する。「データアノテーション市場は、大規模かつ低コストのクラウドソーシングから、高品質で専門性の高いアノテーションへと移行しつつある」と彼は語った。
一方、同社のコア事業である「AI採用」において、Foodyは「テキストによる人材評価については、AIはすでに人間と同等、あるいはそれ以上に近づいている」と考えている。特に履歴書のスクリーニングや面接内容のテキスト分析などでは顕著だが、マルチモーダルタスク(感情や雰囲気の判断など)ではまだAIに限界があるという。
Foodyはまた、以下の見解を示した。将来、採用や人材評価はますます豊かなコンテキストデータに依存していくため、フィードバックメカニズムとデータ入力の完全性がモデルの評価精度に直接影響を与える。例えば、投資家を雇う場合、その人がポッドキャストで発言した内容や日常の会議記録などのデータをモデルに入力してコンテキストを形成すれば、候補者の認知能力、スキル、求職傾向をより正確に判断できるだろう。従来の採用プロセスではこうしたデータは無視されがちだったか、大量の手間を要したが、AIであればコストも低く、効率的である。
このように、AIと人間の役割分担は次第に、「AIが人材評価の主導権を握り、効率性と正確性を高める」一方で、「人間は『売り込み』のフェーズに集中し、職場の雰囲気やインセンティブなどを伝え、候補者の体験を向上させる」という形になる可能性がある。
「将来、人間は繰り返し同じタスクを行うのではなく、モデルがまだできないことを学べるようにするための評価基準を作ることに注力するようになる」とBrendan Foodyは語った。
以下は「明るいカンパニー」によるインタビュー本文の抄訳(編集あり):
Jacob:Brendan Foody氏はMercorの共同創業者兼CEOであり、AIネイティブ型の労働市場向けインフラを構築する企業のリーダーです。Mercorのプラットフォームは、データアノテーション、人材スクリーニング、パフォーマンス予測、そして人間およびAI候補者の評価に使われています。これは非常に興味深い企業であり、採用評価と基礎モデル改善の交差点に位置しています。
Foody氏のチームは最近1億ドルを調達し、最先端のAI企業と協力しています。今日の対話では、将来の人間の労働における役割を含め、多くの興味深いトピックを取り上げます。どの種類のデータアノテーションがモデル改善に最も重要か、Mercorの急成長とその背後にある意思決定、AIが採用プロセスのどこで有効で、どこで不十分なのかについても話し合います。非常に面白い対話になるはずです。Brendan Foodyさん、ポッドキャストへの参加ありがとうございます。
Brendan:ご招待いただきありがとうございます。私はあなたの熱心なファンです。とても嬉しく思います。
Jacob:お越しいただけて嬉しいです。まず大枠から始めましょう。聴衆の皆さんに向けて、現時点でAIによる人材評価はどこまで進んでいるのか、何がうまくいっていて、何がまだうまくいかないのか、今の進捗状況を整理していただけますか?
Brendan:その進化ぶりには驚いています。人間がテキストを通じて評価できるものであれば、モデルはほぼ人間を超えつつあります。面接の文字起こし、書面評価、履歴書の情報などすべてにおいてそうです。実はこの技術は経済全体で広く普及しているわけではなく、大きな空白地帯があります。そこが私たちが開拓・構築したいと考えている部分でもあります。
Jacob:GPT-4以前は不可能だったことが、ここ半年で可能になったようなことはありますか?
Brendan:はい。GPT-4リリース時、我々は最初のAI面接官のプロトタイプを作りましたが、まったく機能しませんでした。モデルは数問ごとに幻覚を起こしたり、さまざまな問題がありました。しかし、その後の進歩は本当に順調でした。推論モデルの登場により、知識量が飛躍的に増し、膨大なコンテキストを処理し、重点を見極め、焦点を絞る能力が大幅に強化されました。
ただし、マルチモーダルタスクではまだ弱いままです。これまで研究室がこの分野にあまり注力しておらず、強化学習での取り組みも難しいためです。しかし、この分野の進展も楽しみにしています。
Jacob:あなたが最も期待しているモデルのマイルストーンは何ですか?
Brendan:人間が得意なこと、例えば「雰囲気(Vibe)」の判断――「この人と一緒に働きたいか」「この人は情熱を持っているか、誠実か」――これらはモデルには極めて難しい。最優秀の人間にとっても難しいのに、ましてやモデルにはなおさらです。この分野のブレイクスルーを強く期待しており、そのための評価ツールを開発中です。しかし、モデルの推論チェーンを読むたびに、私たちの評価設計担当の研究員よりもずっと合理的だと感じます。
モデルの進化は非常に速く、コード分野での成果は誰もが目にしていますが、実際にはまだ始まったばかりで、他の多くの分野も驚異的なスピードで進展しています。
Jacob:あなた方は人間の評価設計に力を入れていますが、最近はAI従業員、つまりAIエージェントに業務を任せようとする動きもあります。これに関しても関与していますか?
Brendan:もちろんです。簡単に会社の背景を説明すると、世界中に才能があるにもかかわらず機会を得られない人が多いことに気づき、それが起業のきっかけでした。理由は労働市場が極度に分散しているためです。例えば、リモートワークの候補者は少数の職種しか応募せず、サンフランシスコの企業は手動でマッチング問題を解決しようとするため、ごく一部の候補者しか考慮しないのです。大規模言語モデルを活用することで、このマッチング問題を解決し、グローバルな統一労働市場を構築できます。すべての候補者が応募でき、すべての企業が雇用できる。しかし、その後、新しい知識労働職の出現とともに、人力、特に大規模モデルを評価する人材に対する需要が爆発的に増加しました。そこで現在、トップクラスのAI研究所にさまざまな専門家を紹介しています。これらの研究所は私たちの技術を活用しており、専門家の評価だけでなく、モデルやあなたが言及したAIエージェントの評価にも使用しています。
Patrick:聴衆の皆さんは、Mercorが候補者のスクリーニングや履歴書処理にAIを活用していることをご存知でしょう。具体的なAIユースケースや、現在使用している技術スタックについて教えていただけますか?
Brendan:良い方法は、人間が手動で行っているすべての作業に対して評価基準を設け、それを自動化できるかどうかを見ることです。たとえば、人がどのように履歴書を読み、面接を行い、順位付けをして採用を決めるか。すべてのプロセスを自動化します。履歴書解析の正確性、各項目のスコアリング、面接質問の適切さ、面接評価の信頼性などを評価し、すべてモデルのコンテキストに入力します。推薦状などの追加データも統合し、最終的に採用予測を行います。
Patrick:主に市販のモデルを使用し、評価とコンテキスト設計を自社で行っているのですか?
Brendan:はい。基本的なタスクでは多くの市販モデルを使いますが、最も難しい最終候補者評価では、後続トレーニング(post-training)を行っています。顧客のデータから学びます。たとえば、どの人が優れたパフォーマンスを見せたか、その理由は何か、といった信号から学習し、将来的な採用予測の精度を高めます。
Patrick:人間が気づかなかったが、AIが発見した意外な信号はありましたか?
Brendan:いくつかあります。AIの重要な利点の一つは、候補者の細部まで深く分析し、人間が見逃しがちな小さな信号を捉えることができる点です。人間は「雰囲気判断」で早々に結論を出してしまいがちですが、AIはそうではありません。たとえば、履歴書に「仕事とは無関係に、純粋な興味から特定の分野に没頭していた」という記述があれば、それは強い信号になります。あるいは、ターゲット国の留学経験があれば、コミュニケーションが円滑でチーム環境に適している可能性が高いなど、プロジェクトやクライアントによって異なる微細なサインがあります。
Patrick:人間にしかできないと思うことはありますか?先ほどマルチモーダルタスクに触れましたが、AIと人間の面接官の協働についてどう考えますか?将来的にすべてAI評価になるでしょうか?
Brendan:簡単に言えば、採用プロセスは「評価」と「売り込み」に分けられます。評価フェーズはすぐに非常に強力になり、AIの推薦が明らかに正確であることに人々は気づき、結果を信じるようになります。一方、人間は引き続き「売り込み」フェーズで重要な役割を果たします。たとえば、候補者にチームや職務内容、雰囲気を伝えることです。AIにより、採用担当やHRは本当に欲しい候補者にのみ集中でき、不適切な候補者との面接に時間を浪費しなくて済むようになります。これにより、候補者に職務、チーム、魅力ポイントをより良く伝えることができます。
Patrick:人々が「スコアを上げるために意図的に評価信号に迎合する」ようになるのでは?たとえば「皆がターゲット国に留学していた」と主張するようなことはありますか?
Jacob:みんなターゲット国に留学していたって言うんだ。
Patrick:はい、たとえば「採用先の国に留学していた」と主張する人が増えますよね。
Brendan:はい、そのため私たちはときどき信号を秘匿する必要があります。大手採用プロセスと同じように、こうしたことは頻繁に起きています。重要なのは、評価が十分にダイナミックであることを保つことで、たとえば問題を頻繁に変えたり、候補者の背景に基づいた深掘りの質問をすることです。モデルが面接のために大量の準備ができるようになった今、人材評価の深さと広がりはかつてないレベルに達しています。
たとえば、私が初めて幹部候補者を面接するときは、LinkedInを数分見てメモを取る程度ですが、その人が出演したポッドキャストを聴き、ブログや論文を読み、それらに基づいて質問すれば、深さと詳細は全く異なります。
Jacob:候補者のパフォーマンスを予測するモデルは非常に優れていますが、このプロセスには説明可能性が必要ですか?それともブラックボックスのままでよいですか?
Brendan:説明可能性は重要だと思います。理由は二つあります。第一に、顧客がモデルの結論を理解し、信頼を築けるようにするため。第二に、モデルが正しい理由に基づいて人を選んでいるかを確認するためです。だから説明可能性には大きな価値があります。
しかし、最終的な経済形態はAPI型になると思います。人々は仕事を完遂するために、または一定の人間関与を必要として、単に「この人物が務まる確信度」さえあればよく、人間の中継者の役割は大きく減少します。
Jacob:それはその目標への信頼のマイルストーンですね。とても納得できます。現在、データアノテーションには明確なフィードバックループがあります(例:複数人が同じデータをアノテート)。これをより曖昧な人間の仕事に適用する難しさはどう考えますか?たとえば、15年待たないとフィードバックが得られないかもしれません。
Patrick:VC(笑)。
Brendan:私の見解はこうです。100人が同じ仕事をしていれば、順位付けは簡単です。しかし、100人がそれぞれ違う仕事をしていれば、たとえば起業家のように、一人ひとりの仕事が大きく異なれば、共通点を見つけにくくなり、どの行動や情報が結果に関連するかを判断するのは非常に困難です。変数が多すぎるからです。したがって、大規模で均質な職種、たとえば20人の営業担当を募集する場合は、モデルが信号を学習して最適化できます。しかし、Thiel Fellowsのような複雑な人材を評価する場合、これははるかに難しく、モデルの推論能力に大きく依存します。
Jacob:具体的にはどのような課題がありますか?
Brendan:主な課題は、多くの情報がモデルのコンテキストに入っていないため、モデルが学習できないことです。人々もしばしば情報を補足し忘れます。たとえば、友人が「あの会社の製品はすごくいい」と言っていたという情報も、モデルにインプットされていません。推薦状や人間同士のやりとりの詳細をすべてインプットすることが、最大の課題です。しかし、必要なデータをモデルのコンテキストに入力できれば、大部分の問題は解決できることがわかりました。
Jacob:将来、私たち全員がスマートグラスをかけて常に録音し、情報をモデルに流し込むようになるかもしれませんね。
Brendan:そうですね。
Jacob:橋渡しファンド(Bridgewater Associates)のようなレベルになりますか?
Brendan:なるかもしれません。しかし、多くの企業は法的・コンプライアンス上の理由から、そのようなやり方を拒否するでしょう。それでも、モデルがより良いコンテキストを得られるプロセスが生まれると考えます。たとえば、AIが退職面談を行い、マネージャーやチームメンバーにインタビューして詳細を収集するのです。人々の頭の中にはたくさんの詳細情報があります。それらをモデルにインプットするだけで、人間を超える予測が可能になります。
Patrick:最近、多くの起業家や個人がAIを会議に参加させ、多くの会議や交流が録音され、AIの学習に使われるようになっています。非常に興味深いことです。
Jacob:自分の会議の文字起こしをAIに渡して、スコアやランキングをつけてもらうこともできますね。
Patrick:ははは!
Jacob:ただし、僕がトップにいることが条件だよ。
Patrick:現在のデータアノテーション市場についてどう考えますか?ScaleAIは圧倒的に先行しているように見えますが、新たなプレイヤーも多数登場しています。この競争構造をどう見ますか?
Brendan:多くの人が、データアノテーションと評価市場の重要な変化を理解していません。市場は2年前とはまったく異なります。以前はモデルが十分に優れておらず、簡単に混乱し、頻繁に誤りました。そのため、高校生や大学生がクラウドソーシングで大規模なデータ収集(SFT、RHFなど)を行うことができました。
しかし、モデルが強くなるにつれ、クラウドソーシング方式は機能しなくなりました。なぜなら、高品質な人材が研究者と直接協力し、モデルがなぜうまくいったか、なぜ失敗したかを理解し、現実世界の自動化課題を反映した複雑なデータを設計する必要があるからです。私たちのプラットフォームは、こうした高品質人材を迅速に調達できるため、急速に成長し、大規模研究所と協力しています。このトレンドは続くでしょう。依然として大規模クラウドソーシングに固執する企業は困難に直面し、新規参入企業は高品質人材に焦点を当て、市場シェアを獲得し続けるでしょう。
Patrick:データアノテーションプロセスにおいて、将来的にも人間の関与は必要でしょうか?モデルがますます強くなり、小規模モデルのトレーニングさえ可能になると、将来の進化はどうなると思いますか?
Brendan:私の見解は、経済の中で人間ができてモデルがまだできないことが存在する限り、モデルが学ぶために環境を創造または模倣する必要があります。数学やコードなど、データ量が少なく検証が容易な分野はすぐに克服され、モデルが解決できます。しかし、優れた起業家を評価するなど、本質的にオープンエンドな知識労働の多くは、何が「良い」かを検証するのが難しく、人間の理解をモデルに注入する必要があります。そのため、人間データ(human data)と評価市場は桁違いに成長すると予想しています。
Jacob:私の理解が正しければ、当初の「裁定(アービトラージ)ポイント」と会社の着想は、世界中に優れたプログラマーがいるが、彼らが特定の仕事の機会を得られないという問題にあり、これはプログラミングデータにとって極めて重要でした。その後、他の分野に拡大しました。プログラミング自体は、強化学習と評価の理想的なユースケースですが、より曖昧な領域に進出し、関連人材を採用する際に、何を変更・改善する必要がありましたか?
Brendan:人間が手動で行うヒューリスティック(経験則)を参考にするのは非常に有効です。たとえば、コンサルタントの仕事を自動化したい場合、どうやってコンサルタントを評価しますか?関連するケーススタディを与えます。
Jacob:あなたのチームはおそらくプログラマーの評価に長けているでしょうが、医師をプラットフォームに参加させる場合、医師を評価するためのヒューリスティックをどうやって知るのですか?
Brendan:非常に良い質問です。機械学習チームの能力範囲を超える分野に入る場合、専門家が必要になります。医師の評価基準を設計するために医師の助けが必要です。他の分野も同様です。これは研究者自身が直面する課題でもあります。高校の物理問題ならどちらの答えが正しいか判断しやすいですが、博士レベルの化学問題になると、関連する学位を持たない研究者は理解・改善が困難です。これが、先ほどご質問いただいた評価の大きな変化の一つです。人材評価も研究者がモデルを評価する場合も、専門家と協力してモデルを進化させる、より協働的なプロセスへと変わっていくのです。
Jacob:短期間のデータアノテーション契約という仕事は、当初の市場への入り口として完璧だったと聞いたことがあります。需要は非常に大きかった。エンドツーエンドの労働市場への楔(楔)でした。会社がこのビジョンを実現するための道筋や段階的な目標について教えていただけますか?
Brendan:私は「秘密の大計画」と題する文書を書いています。私の見解は、市場にはネットワーク効果が強く、護城河がある一方で、構築も困難であるということです。そのため、現在は巨大な需要を掴み、ネットワーク効果を拡大し、市場を発展させることに集中しています。
同時に、多くの大手テック企業が大量の契約社員(データサイエンティスト、ソフトウェアエンジニアなど)を必要としていることも認識しています。これらは直接的には人間データとは関係ありませんが、本質的な需要は似ており、より伝統的な市場です。以前はエーセンティ、デロイトなどと競合していました。これを第二の重点とし、その後フルタイム採用へと拡大します。実際、私たちの初期業務は友人や自分自身のための契約社員の紹介でしたが、多くの人が後に正社員になりました。
したがって、これらのビジネスは連続しており、共通点が多いです。すべての企業は、より多くの候補者、より速い採用速度、より高い適任性の確信を求めています。これらの指標を継続的に測定・向上させれば、企業の発展の各段階に対応できます。
Jacob:人間データ分野への転換を決意した瞬間はありましたか?その機会が明らかに見えたのはいつですか?
Brendan:はい、大学時代に出会いました。会社の背景は、私とパートナーが14歳の高校時代に出会い、18歳で一緒に起業したことです。彼らは多くの大会で勝ち続け、私はそこまでの実績はありませんでしたが、ずっと起業活動をしていました。その後、インドで国際人材の採用を始め、IIT Code Clubと提携しました。多くの賢い人が仕事を見つけられず、彼らをプロジェクトに雇えば、友人たちもお金を払って採用支援を依頼してくれました。こうして少額のサービス料を得て、会社の売上は100万ドルに達し、給与を支払った後も8万ドルの利益を出しました。
私は誇りに思っていましたが、両親は満足しませんでした。資金調達をするまで満足しませんでした。話を戻すと、2023年8月、ある顧客がx.aiの共同創業者を紹介してくれました。当時彼らはまだテスラのオフィスにいました。彼は『Mercorにはインドの超優秀なエンジニアがいて、数学とプログラミングに長けている』と言いました。翌日、x.aiの創業者が私たちと電話し、非常に興奮していました。2日後にはテスラのオフィスに訪れ、Elon以外のx.aiのほぼ全創業チームと会いました。Elonとの会議の直前のことでした。私たちはまだ大学在学中だったので、まさに信じられない出来事でした。なぜ彼らが私たちの製品をそんなに欲しがるのか、私たちは不思議でなりませんでした。市場の変化が速すぎて、誰も気づいていなかったのです。今は規模が大きくなり、重要な市場シェアを占めるようになったので、こうして公に語れるようになりました。しかし、当時はまだ人間データを使う準備ができていませんでした。約6か月後、先端研究所と協力し、事業を拡大しました。
Jacob:波の到来を感じたのですね。
Brendan:はい。多くの起業家がPMF(プロダクトマーケットフィット)を探しすぎると感じます。むしろ市場の信号を観察し、金脈があるところを掘るべきです。最初の販売が難しければ、スケールアップはさらに難しくなります。最も深刻な課題を持ち、解決に何でも払う意思のある顧客を見つけ、全力を尽くすべきです。
Jacob:現在ではプログラミングを超えており、医師の例を考えると、優れた医師を評価する基準は最終的にモデル企業がモデル訓練に使い、医師の推論プロセスが正しいかを判断するようになります。顧客と協力する中で、具体的に何をしているのでしょうか?
Brendan:人間が現在AIよりも優れている重要な点は、継続的に学び成長できる能力です。私たちはこうした代理信号を探します。たとえば、候補者が正しい質問をし、正しい思考パターンを持ち、高パフォーマンス環境での経験があるかどうか。これらはモデルのバグを発見し、モデル能力を高めるのに役立ちます。
Jacob:あなた方は自社製品を実際に使っていますか?具体的に採用にどう活用していますか?
Brendan:もちろん、幹部職以外はすべて自社製品を使っています。幹部職も求人を掲載していますが、面接は私が行うことが多いです。主に売り込みのためであり、スクリーニングのためではありません。私たちのAI面接は非常に効果的で、多くの場合、最も予測力の高い信号となっています。多くの人が採用プロセスにおける「雰囲気判断」のバイアスを過小評価しています。人は自分は正確に判断できると思いがちです。
Jacob:採用は最も古い「雰囲気」産業ですね。
Patrick:VCにはそんな偏見はありませんよ(笑)。
Brendan:ですから、業績データに基づいて意思決定を行うべきです。たとえば、戦略プロジェクト責任者を採用する場合、以前は人間がケース分析を行っていましたが、現在はすべてAI面接に切り替え、最終的な正社員化率も上がりました。AI面接は比較をより客観的・標準化し、面接官ごとのバラつきをなくします。
Patrick:評価プロセスでは、自社用に人材を調達する場合、市場の人を使いますか?内部で行うことは多いですか?
Brendan:自社の評価プロセスでも市場の人を使います。顧客のプロセスと同様です。もちろん、研究者はモデルのエラー原因を分析し、エラー分類を洗練し、後続トレーニングデータを最適化する必要があります。プロセスも人材も同じです。
Jacob:情熱などの特性を判断するためのマルチモーダル能力について、将来的にビデオや音声に関してどのような取り組みをしていますか?
Brendan:強化学習(RL)がビデオ理解能力の向上に与える影響をよく考えます。RLは探索問題に強く、ビデオは情報量が膨大なので、モデルにとっては処理が困難です。マルチモーダルコンテキスト内で重要な信号(候補者が興奮しているか、不正行為をしているかなど)を見つける方法を考えなければなりません。モデルがこれらの信号に注目するように、適切なデータを創出する必要があります。先端研究所も基盤能力の向上に取り組んでいます。
Jacob:あなたが言うように、わずか数年の間にアノテーション市場は大きく変わりました。2年後はどうなると思いますか?このビジネスは残っていますか?それとも専門家だけになりますか?
Brendan:非常に重要な分野になると確信しています。私たちの起業の原点は、労働力を集約し、より効率的な配置を実現することでした。鍵は、5年、10年後の人類が経済の中でどのような役割を果たすかを判断することです。
私が見るトレンドは、将来、人間は繰り返し同じタスクを行うのではなく、モデルがまだできないことを学べるようにするための評価基準を作ることに注力するということです。そのため、知識労働が評価基準作成へと移行することを強く支持します。形式はよりダイナミックになり、AI面接官と対話しながら問題を解決するような形になるかもしれません。これは経済の重要な構成部分ですが、ほとんどの人はまだ気づいていません。なぜなら、人々はこれをSFTやRHF市場と混同しているからです。しかし、これらのデータの価値は低下しており、予算も削減されています。
Patrick:将来、どのようなスキルを身につけるべきだと思いますか?学生に学ぶべきことを勧めるなら、何と言いますか?
Brendan:私は必ず「急速な学習能力」の追求を勧めます。変化が速すぎるからです。多くの分野で、人々はモデルが長期間できないと思っていたことが、すぐに突破されます。AIと積極的に協力すべきです。私たちのプラットフォーム利用者の中には、一日中モデルと向き合い、モデルが何ができず、何が欠けているかを考えるのが好きな人もいます。こうした経験は、実際の業務でどの工程にAIを使えば効率的かを判断するのに役立ちます。できるだけ多くのモデルを使い、その分野での長所と短所に精通することが非常に役立ちます。しかし、必ずしもソフトウェアエンジニアになるべきだとは言えません。
Jacob:とても興味深い。将来、私たちはモデルのトレーニングに多くの時間を費やすかもしれません。ハードスキルには正誤がありますが、主観的な分野はほとんど無限です。将来的には、自分専用のモデルに雇われてお金を稼ぐこともできるかもしれません。
Brendan:まったく同意します。また、需要の弾力性が高い分野に注目することも勧めます。たとえばソフトウェア開発では、経済の中で100倍、1000倍の需要があります。1000個の新しいWebアプリがなくても、大量の機能改善、ソートアルゴリズムの最適化などがあります。一方、会計士などは需要が固定されています。したがって、需要が大幅に伸び、総生産性を高められる分野を目指すべきです。それがより安全です。
Patrick:ごもっともです。最近、ある起業家と話していて、『みんながソフトウェアエンジニアは不要になると言うけど、実際にはもっと多くのエンジニアが必要なんだ』と言っていました。
Brendan:私もとてもワクワクしています。もし私たちのソフトウェアエンジニアの生産性が10倍になれば、むしろより多くのエンジニアを雇うことになるかもしれません。需要と価格の関係は常に興味深いものです。
Jacob:創業当初、採用協働ツールや仲介機関向けソフトウェアを作る誘惑はあったでしょうか?なぜエンドツーエンドのサービスを選んだのですか?この決断は初めから決まっていたのですか?
Brendan:初めは多くの第一原理的思考があり、それが逆に有利でした。なぜなら、従来のやり方を見たことがなかったからです。友人たちが解決したいのは、信頼できるソフトウェアエンジニアを見つけることでした。そのため、すべての工程を請け負いました。しかし、今振り返ると、ますます多くの企業がエンドツーエンドに向かうと思います。将来消えるかもしれない職のために協働ツールを開発する必要はない。むしろ、プロセス全体を自動化し、フィードバックから学習・最適化できるようにするのが理にかなっています。
Jacob:確かに、特にAI能力が未熟な時期に適したデータ労働市場という点で、エンドツーエンドがぴったりです。この市場がなければ、まず協働ツールを作っていたかもしれません。
Brendan:はい。たとえばフルタイム採用では、顧客は当然、従業員が自社名義で働くことを望みます。幸運にも、私たちの運営モデルと市場の変化が非常に一致していました。
Jacob:初めは友人のための契約社員探しでしたが、当初は副業だと思っていたのですか?いつ本業にすると決めましたか?
Brendan:実は高校時代からずっと起業しており、会社も順調でした。そのため、本来は大学に行きたくなかったのですが、両親に伝えると怒られたので、安心させるために大学に応募しました。しかし、ずっと「辞める」と言っており、彼らは信じませんでした。「約束したのに辞めるはずがない」と。しかし、毎学期同じことを言い続け、結局本当に辞めました。事前通告はしませんでした。2年間言い続けていたからです。
Patrick:私はもう辞めると思っていましたよ。
Brendan:私にとって、起業し、影響力のあることをしたいという思いは明確でした。意味のない授業を受けるより、価値のあることに集中したかったのです。ずっと、真剣に取り組むに値するテーマを探していました。私のパートナーも当初は副業として始め、親を説得して辞めるための証拠を集めようとしていました。彼らの親の要求は、種子資金の調達に成功することでした。会社がすでに100万ドルの売上と利益を上げても、種子ラウンドの資金調達がなければ認められなかったのです。つまり、親こそがVCの「スポンサー」なのです。資金調達に成功して初めて「信頼性」が得られるのです。
Jacob:その通り。親がいなければVCもいない。
Brendan:まさに「権威の裏書き」です。
Patrick:資金調達の話ですが、先日(今年2月)1億ドルのシリーズBを完了されました。おめでとうございます!この資金をどう使う予定ですか?いつ資金調達するかはどのように判断しましたか?
Brendan:実は、種子ラウンドだけが自ら積極的に求めた資金調達です。親を説得するためでした。AラウンドとBラウンドは、すべて投資家に「押しかけられて」行われました。私たちの考えは、希薄化率を約5%に抑え、「弾薬庫」を築き、製品開発に投資することです。たとえば、リコメンデーションインセンティブ、革新的なコンシューマープロダクト、市場供給側の拡大、より多くの後続トレーニングデータへの投資など、モデルのパフォーマンス予測能力を高めるために使います。私たちのMLチームの最大のボトルネックは、より多くの評価とトレーニング環境を作ることですが、これは私たちのコアビジネスとちょうど一致しています。
Jacob:顧客層には多くの基礎モデル企業がいますが、この分野の将来をどう見ますか?2~3社の巨大企業だけが残るとも言われていますが、最終的に何社残ると考えますか?どのように差別化されるでしょうか?
Brendan:とても良い質問です。私は確信しています。OpenAIは今後も、API企業ではなく、製品企業であり続けるでしょう。多くのAPI機能は商品化されますが、重要なのは顧客のシーンに深く統合されることであり、それが価格設定力の源泉になります。市場は十分に大きく、各社はニッチ分野で大量の価値を吸収できます。たとえば、ヘッジファンドに特化する研究所でも、巨額の利益を得られます。経験主義的に「これらの企業の評価は過大だ」と言う人もいますが、「知識労働の自動化」という第一原理から考えれば、トップチームは間違いなく偉大な企業を築けるでしょう。
Jacob:現在、モデルはクロスドメイン汎化が非常に強いため、勝者がすべてを取る印象を受けますが、ニッチ分野のリーダーも存在しますか?ヘッジファンドの例は興味深い。アプリケーション層にはまだ多くの余地があるのですね。
Brendan:はい。特化は価値があります。汎用APIビジネスは良い商売ではなく、最終的には一社だけが残るでしょう。より多くの価値はアプリケーション層にあり、各垂直分野と顧客シーンには深いカスタマイズが必要です。
Jacob:こうしたカスタムモデルには、多くの複雑なアノテーションが必要になるとお考えですか?
Brendan:間違いなく必要です。たとえば、各取引会社は独自の取引分析に対して評価を行い、どの結論が正確で、どれがそうでないか、どれが利益に転化できるかを判断できます。一流の後続トレーニングチームが取引分析を最適化し、人間のトレーダーよりも速ければ、その機会は驚異的です。
Jacob:ある取引会社にとって最適な戦略は、取引を停止し、9ヶ月間集中してモデルの後続トレーニングを行うことかもしれませんね。
Brendan:実は驚いています。多くの
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












