
a16z: Các công ty như OpenAI sẽ không tiêu diệt toàn bộ cơ hội ở tầng ứng dụng — hãy gác lại nỗi lo âu về AI của bạn
Tuyển chọn TechFlowTuyển chọn TechFlow

a16z: Các công ty như OpenAI sẽ không tiêu diệt toàn bộ cơ hội ở tầng ứng dụng — hãy gác lại nỗi lo âu về AI của bạn
OpenAI sẽ tiêu diệt mọi ứng dụng AI? a16z: Bạn đã đi sai hướng rồi.
Tác giả: Joe Schmidt IV
Biên dịch: TechFlow
Giới thiệu của TechFlow: Nỗi lo lớn nhất của các nhà sáng lập AI là gì? Liệu OpenAI và Anthropic có “giết chết” mọi cơ hội ở tầng ứng dụng hay không? Một đối tác tại a16z đã đưa ra câu trả lời thông qua lý thuyết “Con đường gạch vàng”: Các phòng thí nghiệm mô hình lớn chỉ thống trị những nhiệm vụ ngang (horizontal), một bước; còn cơ hội thực sự nằm ở các bối cảnh chuyên sâu theo ngành dọc, quy trình làm việc đa bước và các lĩnh vực yêu cầu tuân thủ pháp lý nghiêm ngặt. Bài viết này rất đáng để các nhà sáng lập AI và nhà đầu tư dành thời gian đọc.
Gần đây tôi liên tục bị các nhà sáng lập và ứng viên tiềm năng đặt cùng một câu hỏi: Tầng ứng dụng AI còn điều gì để làm nữa không, hay mọi thứ đều sẽ bị OpenAI và Anthropic “giết chết”?
Câu hỏi này phản ánh một dạng “lo âu AI” đặc biệt. Một số người kết luận rằng cách duy nhất để tránh rơi vào vị trí vĩnh viễn ở đáy chuỗi giá trị là hoặc gia nhập nội bộ các phòng thí nghiệm lớn, hoặc lao vào các lĩnh vực tiên phong như robot, công nghệ cứng — về mặt lý thuyết, bất cứ điều gì “phòng thí nghiệm không chạm tới được”. Nếu mọi phần mềm đều bị nuốt chửng — hoặc trực tiếp bởi Codex hay Claude, hoặc do các mô hình tương lai khiến công việc bạn đang làm trở nên dư thừa — thì hãy chạy đi thôi!
Nhưng hãy lắng nghe: Tôi cũng như hầu hết mọi người, là một người ủng hộ mạnh mẽ AI, và tôi cho rằng họ đúng một nửa. Đúng là các phòng thí nghiệm đang chiếm lĩnh bề mặt ứng dụng khổng lồ. Nhưng “tầng ứng dụng” không phải là một cơ hội đồng nhất. Khung phân tích đúng đắn là bạn đang đi trên “Con đường gạch vàng”, hay đang ở những nơi khác trong xứ Oz.
“Con đường gạch vàng” là cách gọi ngắn gọn cho lộ trình mà các phòng thí nghiệm đang theo đuổi — nơi họ đầu tư nguồn lực khổng lồ. Các phòng thí nghiệm phù hợp nhất để giải quyết các vấn đề như tạo mã, viết văn bản hay tạo ảnh vì những vấn đề này cải thiện rõ rệt khi năng lực nguyên bản của mô hình tăng lên: Mỗi đô-la chi cho huấn luyện sơ cấp (pre-training) và huấn luyện sau (post-training) đều nâng cao chất lượng sản phẩm. Trong khi đó, “những nơi khác trong xứ Oz” là nơi cư ngụ của các vấn đề phức tạp hơn, thường mang tính chuyên sâu theo ngành dọc — những vấn đề không đơn giản như việc cung cấp một công cụ ngang (horizontal tool) kèm các công cụ tiêu chuẩn và máy tính cho người dùng doanh nghiệp. Giá trị ở đây chủ yếu đến từ các “khung đỡ” (scaffolding) xung quanh mô hình — những khung đỡ giúp đầu ra trở nên đáng tin cậy, tuân thủ pháp lý và có thể vận hành được trong ngành cụ thể, chứ không chỉ dựa vào năng lực nguyên bản của mô hình nền tảng (dù năng lực ấy vẫn rất quan trọng!).
Chúng ta đang chứng kiến điều này ngay trước mắt, khi OpenAI và Anthropic thực tế đang gửi tín hiệu rõ ràng tới thị trường rằng họ không thể giải quyết mọi vấn đề bằng một “đồng nghiệp AI” phổ quát. Họ công bố các liên doanh triển khai trước quy mô lớn nhằm xây dựng cả công ty xung quanh việc cấu hình và tùy chỉnh mô hình cho doanh nghiệp. Nếu bạn nghĩ phiên bản mô hình tiếp theo sẽ tự động giải quyết mọi chuyện, bạn sẽ không đổ hàng tỷ đô-la vào những dự án này.
Vì vậy, nếu bạn muốn làm giàu bằng cách xây dựng ứng dụng AI — hãy tránh xa “Con đường gạch vàng”, và xây dựng ở “những nơi khác trong xứ Oz”. Dưới đây là những bài học chúng tôi và một số nhà sáng lập trong danh mục đầu tư của chúng tôi đã rút ra về những gì thực sự hiệu quả.
Con đường gạch vàng
Nếu bạn định thành lập một công ty, “Con đường gạch vàng” là con đường rõ ràng nhất — nhưng cũng nguy hiểm nhất. Hãy lấy một mô hình hiệu suất cao, gắn vào một vài bộ kết nối sẵn có (ví dụ: Google Drive, Slack, Salesforce, Notion, GitHub), rồi xuất bản một lớp điều phối tác tử (agent orchestration layer) lên trên. Thật tuyệt vời!
Vấn đề nằm ở chỗ đây chính xác là điều mà các phòng thí nghiệm đang làm với Cowork và Codex. Rõ ràng, họ sở hữu mô hình — điều này trao cho họ lợi nhuận cao hơn, quyền kiểm soát tốt hơn, và khả năng áp đặt quyền định giá lên bất kỳ bên nào phía hạ lưu. Nhưng có lẽ quan trọng hơn cả là họ còn nắm giữ quyền lựa chọn kiến trúc định hình sản phẩm của mình — tức là xác định rõ sản phẩm giỏi giải quyết vấn đề nào. Cho đến nay, họ khá thận trọng trong việc triển khai mô hình kết hợp gọi hàm công cụ (tool-calling), trong khi đây lại chính là mô hình cần thiết cho các công việc ngang, ít bước trên “Con đường gạch vàng”. Ngay cả khi một công ty khởi nghiệp có thể vượt qua Codex hay Claude Code bằng cách nào đó, các phòng thí nghiệm vẫn sở hữu kênh phân phối đồ sộ và “vầng hào quang thương hiệu” lớn nhất trong lĩnh vực AI.
Nếu bạn là một công ty ứng dụng AI sử dụng cùng bộ kết nối nói trên, không có các tác tử con (sub-agents) hay cấu hình nào bên dưới, và cũng chẳng có kênh phân phối nào, thì khả năng cao bạn đang đi trên một con đường dẫn tới… vô định.
Những nơi khác trong xứ Oz
Không phải tất cả đều u ám và đen tối với các công ty khởi nghiệp. Ngoài “Con đường gạch vàng”, tồn tại những cơ hội khổng lồ — nơi các công ty khởi nghiệp có lộ trình rõ ràng để sở hữu khách hàng và giải quyết các vấn đề phức tạp.
Các doanh nghiệp này đang xây dựng trải nghiệm tác tử, trong đó mô hình được tích hợp sâu vào mạng lưới phức tạp gồm công cụ, tự động hóa và tích hợp (nói cách khác: phần mềm), khiến các công ty khởi nghiệp này mặc nhiên mang tính chuyên sâu theo ngành dọc. Họ có thể tập trung vào các quy trình làm việc đa bước và đa người tham gia, sử dụng các tác tử con được thiết kế riêng cho từng vai trò và nhiệm vụ đặc thù theo ngành — điều mà Anthropic và OpenAI, với nền tảng ngang (horizontal platform), hoàn toàn không thể chạm tới: thu thập ngữ cảnh từ nhiều hệ thống khác nhau, rồi chuyển tiếp sang nhiều người phải phê duyệt ở các giai đoạn khác nhau. Quy trình này thường liên quan đến một hoặc nhiều hệ thống kế thừa (legacy systems), thiên về kết quả xác định, không chấp nhận sự mơ hồ, và đôi khi gắn liền với các kết quả kinh doanh có giá trị cụ thể. Các phòng thí nghiệm hiểu rõ giá trị của những vấn đề này: Đó là lý do họ đang xây dựng cửa hàng cấu hình (configuration store) ngoại vi riêng và cũng là lý do tồn tại cả một phân khúc kinh doanh chuyên sâu về học tăng cường (reinforcement learning) cao cấp.
Tại sao “những nơi khác trong xứ Oz” sẽ không bị phù thủy chiếm đoạt
Một phản bác phổ biến đối với quan điểm trên là: Cho đến nay, đặt cược rằng mô hình/phòng thí nghiệm sẽ không cải tiến luôn là một khoản đầu tư tồi tệ. Chúng rất có thể tiếp tục cải thiện và cuối cùng xâm lấn thị trường các dịch vụ doanh nghiệp ở tầng ứng dụng.
Các phòng thí nghiệm chắc chắn sẽ cải tiến, nhưng tôi cho rằng “những nơi khác trong xứ Oz” có một số cách để tự bảo vệ mình theo thời gian:
Vòng xoáy dữ liệu và học tập:
Nhiều thứ bạn nội hóa không tồn tại trong bất kỳ tập huấn luyện nào — các quy chuẩn ngành chưa được viết thành văn, các tiêu chuẩn chưa được ghi chép, và kiến thức “bộ tộc” (tribal knowledge) chỉ tồn tại trong đầu các chuyên gia. Những thứ này không có trên mạng công khai. Dù bạn bỏ bao nhiêu công sức tính toán huấn luyện đi nữa cũng không thể thay thế được việc trực tiếp tham gia vào các quy trình làm việc nơi những kiến thức ấy thực sự hiện hữu. Ở đây tồn tại hai vòng xoáy chồng lấn: Một là vòng xoáy xuyên khách hàng — tích lũy các mẫu nhận dạng khi bạn thấy nhiều biến thể hơn của cùng một vấn đề; Hai là vòng xoáy nội bộ khách hàng — lý do đằng sau các quyết định cụ thể, các ngoại lệ chưa được nói ra, các quy tắc kinh nghiệm riêng của công ty — những điều chỉ hiện ra qua tương tác thực tế với hệ thống.
Ngay cả khi dữ liệu khách hàng không thể chia sẻ xuyên khách hàng, các công ty ứng dụng vẫn có thể tận dụng mẫu nhận dạng xuyên loại vấn đề để xây dựng kiến trúc phù hợp cho các vấn đề tương lai. Một công ty đã để tác tử của mình thực hiện 100 lần sửa đổi pháp lý, 1.000 chu kỳ đánh giá bảo hiểm hoặc 10.000 chiến dịch SDR, thì đã nội hóa hình dạng vấn đề theo một cách mà đối thủ mới gia nhập không thể sao chép — kể cả khi họ khởi chạy một tác tử hoàn toàn mới từ đầu.
Về nguyên tắc, các tác tử ngang (horizontal agents) cũng có thể xây dựng cùng cơ sở hạ tầng học tập. Nhưng họ không làm vậy, ngoài lý do tập trung thuần túy, còn vì trải nghiệm người dùng: Việc thu thập kiến thức này hoàn toàn phụ thuộc vào giao diện quy trình làm việc bạn cung cấp cho người dùng, trong khi các công ty chuyên sâu theo ngành có thể thiết kế giao diện này dựa trên nội dung cần hiện ra trong quy trình làm việc của họ. Còn công cụ ngang thì không thể làm được điều này. Các tập đánh giá (evaluation sets), nhãn đầu ra (labeled outputs) và phân loại các trường hợp biên (edge cases) có thể tích lũy thành vòng xoáy dữ liệu đặc thù theo ngành — cung cấp nhiên liệu cho việc tinh chỉnh (fine-tuning), điều mà đối thủ mới không thể tạo ra nếu thiếu mức độ tiếp xúc thực tế trong sản xuất tương đương. Điều này khả thi hay không phụ thuộc vào quyền sở hữu dữ liệu, mức độ tiếp xúc thực tế trong sản xuất và cấu trúc hợp đồng khách hàng — nhưng dù sao, nhận dạng mẫu vẫn sẽ tích lũy.
Quản lý tính biến thiên và độ phức tạp của mô hình: Các phòng thí nghiệm đã thực hiện định tuyến nội bộ — sử dụng các loại mô hình khác nhau cho các yêu cầu khác nhau, và tích hợp nhiều mô hình ở tầng nền. Nhưng điều họ không thể làm được là định tuyến xuyên nhà cung cấp, đánh giá mô hình của đối thủ cho các tác vụ con cụ thể, hoặc sử dụng các mô hình mã nguồn mở đã được tinh chỉnh (open-source fine-tuned models) cho những mảng hẹp nhất định để đạt hiệu quả tối ưu. Các công ty ở “những nơi khác trong xứ Oz” chọn đúng mô hình cho từng tác vụ con từ toàn bộ thị trường mô hình — chứ không chỉ giới hạn trong những gì phòng thí nghiệm mẹ của họ phát hành. Họ còn đảm nhận công việc mà chẳng ai muốn làm — chạy lại đánh giá khi nâng cấp, hiệu chỉnh lại lời nhắc (prompt) cho các trường hợp biên của khách hàng, triển khai mà không làm gián đoạn sản xuất — mỗi khi một mô hình mới ra mắt. Các phòng thí nghiệm sẽ không làm những việc này thay khách hàng; họ chỉ bán cho bạn mô hình tiếp theo và bảo bạn tự di chuyển. Các công ty ở “những nơi khác trong xứ Oz” đảm nhận toàn bộ công việc di chuyển. Khách hàng nhận được trí tuệ thông minh tốt nhất từ toàn bộ thị trường, cộng thêm tính liên tục trong mỗi lần nâng cấp.
Tối ưu chi phí: Chạy mỗi truy vấn trên Opus 4.7 là con đường nhanh nhất dẫn tới biên lợi nhuận âm. Các công ty hàng đầu ở “những nơi khác trong xứ Oz” định tuyến xuyên các tầng mô hình — sử dụng mô hình tiên tiến nhất cho các tác vụ khó nhất, mô hình tầm trung cho phần lớn công việc, và các mô hình nhỏ hơn, được tùy chỉnh hoặc tinh chỉnh riêng, ở những nơi họ giành được quyền sử dụng. Một số công ty thậm chí hiện đang tiến hành huấn luyện sau (post-training) trên mô hình riêng của mình, tối ưu hóa cho những mảnh công việc hẹp mà khách hàng quan tâm — cung cấp dịch vụ với chi phí chỉ bằng một phần nhỏ so với chi phí gọi API tiên tiến. Các phòng thí nghiệm định giá dựa trên lợi nhuận: Cung cấp mức trí tuệ tối thiểu với giá X đô-la. Còn các công ty ở “những nơi khác trong xứ Oz” bán thứ ngược lại — mức chi phí đô-la thấp nhất để đạt được mức độ trí tuệ thông minh cụ thể mà quy trình làm việc thực sự đòi hỏi. Điều này chỉ khả thi khi bạn biết chính xác mức độ trí tuệ cần thiết cho từng tác vụ con — điều mà các phòng thí nghiệm, do cấu trúc tổ chức, không thể biết được ở mọi ngành dọc. Kết quả trực tiếp là giá cả thấp hơn và kiểm soát được hơn.
Quản trị (Governance): Trở thành mặt phẳng điều khiển (control plane) cho việc vận hành AI của khách hàng trong ngành chuyên sâu mang lại giá trị rất lớn — đây là nơi tập trung toàn bộ quyền hạn, kiểm toán, giới hạn những điều tác tử được phép làm và thực tế đã làm. Mặt phẳng điều khiển này được xây dựng từ các “rào cản” (guardrails) đặc thù cho từng tình huống sử dụng — những rào cản này trông hoàn toàn khác nhau giữa các ngành và loại công việc. Bởi vì họ sở hữu toàn bộ công cụ, quy trình làm việc và dữ liệu mà tác tử tiếp cận, họ có thể cung cấp kết quả xác định theo cách mà các công cụ ngang khó lòng làm được. Đồng thời, họ cũng là thực thể đảm nhận sự phức tạp về quản lý pháp lý cho người mua cuối — như Quy tắc Thủ tục Liên bang về Tố tụng Dân sự (FRCP) và Quy tắc Hiệp hội Luật sư trong lĩnh vực pháp lý, Đạo luật Bảo mật Thông tin Sức khỏe (HIPAA) trong chăm sóc sức khỏe, Ủy ban Chứng khoán Mỹ (SEC) và Hiệp hội Quản lý Tài chính và Kinh doanh (FINRA) trong tài chính, các quy định bảo hiểm của tiểu bang, v.v. Các công ty ngang không thể thực hiện điều này một cách đáng tin cậy, trừ khi họ đồng thời trở thành 100 ngành dọc khác nhau. Giám đốc Công nghệ Thông tin (CIO) mong muốn có một đối tác cam kết trong hợp đồng rằng họ chịu trách nhiệm xử lý tính tuân thủ của các tác tử do họ cung cấp.
Tất cả những điều trên đều quay về cùng một điều: Sự tập trung. Đó có thể là một ngành dọc (bảo hiểm, pháp lý, kế toán) hoặc một chức năng được thực hiện sâu sắc (bán hàng, hỗ trợ khách hàng, tài chính). Dù theo cách nào, công việc này đều đòi hỏi một đội ngũ toàn tâm toàn ý hướng tới một nhóm khách hàng cụ thể — với quy trình làm việc, các trường hợp biên và quy định của họ. Các phòng thí nghiệm không được xây dựng cho mục đích này. Họ buộc phải hiện diện khắp nơi để phục vụ mọi người — và đó chính là cách họ đầu tiên xây dựng “Con đường gạch vàng”. Cũng chính sự đánh đổi này khiến họ không thể bước chân vào “những nơi khác trong xứ Oz”: Bạn có thể hiện diện ở khắp nơi, hoặc làm xuất sắc một việc — chứ không thể làm cả hai cùng lúc.
Bán hàng như một ví dụ — Lời khuyên thực tiễn từ CEO của 11x Technology
Bạn nên suy nghĩ về vấn đề này trong thực tiễn như thế nào? Dưới đây là một số lời khuyên thực tiễn từ Prabhav Jain, CEO của 11x.
Tập trung vào kết quả
Đường lối chiến thuật để xây dựng một công ty có khả năng chống chịu với các phòng thí nghiệm là bắt đầu từ kết quả cụ thể mà khách hàng thực sự quan tâm. Với chúng tôi, đó là giúp công ty tạo ra nhiều hơn các cơ hội bán hàng (sales leads). Từ đó, vấn đề trở nên mang tính chiến thuật. Chúng tôi muốn làm chủ toàn bộ các hoạt động thực tế thúc đẩy việc tạo ra cơ hội bán hàng — từ đầu đến cuối. Phân rã từng hoạt động thành các tác vụ. Những tác vụ nào có thể “tác tử hóa”, những tác vụ nào thì không. Những tác vụ nào đòi hỏi hiểu biết chuyên sâu về lĩnh vực, những tác vụ nào thì không. Các phòng thí nghiệm cũng sẽ tung ra các quy trình làm việc (workflow), nhưng khi quy trình có nhiều bước, đầu vào hỗn loạn, trạng thái khó diễn giải hoặc ràng buộc thực tế, thì chỉ có mô hình tốt hơn là chưa đủ để đạt được mục tiêu. Lúc này, công việc rơi vào tay kỹ sư phần mềm truyền thống — và các phòng thí nghiệm không có lợi thế nào so với các công ty ứng dụng chuyên sâu trên mặt trận này. Ví dụ, dưới đây là một số tác vụ chúng tôi xử lý — một số đã “tác tử hóa”, một số thì chưa: tìm kiếm khách hàng tiềm năng dựa trên tín hiệu tùy chỉnh, làm phong phú dữ liệu khách hàng tiềm năng, nghiên cứu sâu về tài khoản, lấy ngữ cảnh từ CRM, công cụ viết tin nhắn cho kênh cụ thể, tác tử xác thực tính đủ điều kiện của khách hàng tiềm năng và hệ thống gửi email. Đây không phải là những tác vụ có thể hoàn thành trong một lần — mà đòi hỏi kỹ thuật chuyên sâu.
Hiểu biết then chốt trong phép ẩn dụ “xứ Oz” là khoảng một nửa phần không “tác tử hóa” trong bất kỳ quy trình làm việc thực tế nào đều không mang lại lợi thế cho các phòng thí nghiệm. Họ không giỏi hơn bạn trong việc viết phần mềm xác định (deterministic software) nằm bên dưới lớp mô hình. Còn nửa phần đã “tác tử hóa” vẫn đòi hỏi bạn phải tinh chỉnh, huấn luyện và giới hạn mô hình để đạt được kết quả thực tế mong muốn. Kiến thức chuyên ngành thường không tồn tại trong dữ liệu huấn luyện tổng quát. Những kỹ năng này được xây dựng từ đầu cho ngành dọc hoặc chức năng cụ thể, và được đưa vào mô hình đúng thời điểm trong quy trình làm việc. Khi tác tử của chúng tôi xác thực tính đủ điều kiện của khách hàng tiềm năng qua điện thoại, tôi phải huấn luyện nó dựa trên các cuộc trò chuyện bán hàng hiệu quả đặc thù cho ngành và vai trò cụ thể đó. Đây là công việc của công ty ứng dụng — và giá trị của nó sẽ tăng theo cấp số nhân.
Hơn nữa, những kỹ năng này liên tục lỗi thời vì doanh nghiệp luôn vận động và thay đổi. Do đó, khả năng duy trì sự tiến hóa của các quy trình làm việc và ngữ cảnh này mới chính là lợi thế cạnh tranh thực sự. Ví dụ, khi chúng tôi ra mắt sản phẩm mở rộng email quy mô lớn, những email “do AI viết” vừa mới xuất hiện. Đến hôm nay, người ta đã có khả năng phân biệt tinh tế giữa email do AI viết và do con người viết — và khả năng phân biệt này lại thay đổi vài tháng một lần. Tác tử của chúng tôi phải liên tục thích nghi với động lực thị trường, và chính đây là nơi “hào thành” được xây dựng. Thực tế, dù thị trường liên tục thay đổi, tỷ lệ phản hồi tích cực của chúng tôi trong vài tháng qua đã tăng gấp 4 lần và tạo ra hàng trăm triệu đô-la cơ hội bán hàng cho khách hàng.
Tập trung vào các vấn đề có độ phức tạp cao
Các vấn đề phức tạp mới thực sự giải phóng giá trị thương mại. Nếu không, bạn sẽ chỉ đang xây dựng một lớp bao bọc mỏng manh.
Hãy phân rã bất kỳ vấn đề kinh doanh đủ phức tạp nào — sự hỗn loạn sẽ nhanh chóng hiện ra. Dưới đây là một ví dụ từ lĩnh vực GTM (Go-to-Market), nghe thì có vẻ đơn giản: Nếu một công ty đã là khách hàng của bạn, bạn không nên liên hệ lại với các liên hệ trong công ty đó. Nhưng thực tế lại không đơn giản như vậy. Có thể CRM của bạn có tên miền của công ty đó. Thế còn các công ty có hàng chục công ty con thì sao? Nếu CRM lưu tên miền của công ty mẹ thì sao? Nếu một trường khớp (matching field) đã hết hạn trong Salesforce khiến email lạnh (cold email) được gửi thẳng tới Giám đốc Doanh thu (CRO) của khách hàng hiện hữu thì sao? Dữ liệu thế giới thực vốn hỗn loạn. Ngay cả con người cũng gặp khó khăn khi xử lý. Mô hình không thể thần kỳ vượt qua rào cản này. Để sắp xếp trật tự từ hỗn loạn, cần các tác tử được thiết kế riêng cho dạng vấn đề cụ thể — chứ không phải một “trợ lý ảo chung chung” trỏ vào CRM. Thực tế, dựa trên dữ liệu chúng tôi nắm giữ, chúng tôi nhận ra chất lượng và độ mới của dữ liệu chúng tôi cao hơn nhiều so với dữ liệu của khách hàng — nên chúng tôi mặc định lấy dữ liệu của mình làm chuẩn.
Các rào cản (guardrails) không chỉ nhằm ngăn chặn điều xấu xảy ra. Mà đây mới chính là lý do khách hàng trả tiền cho bạn.
Các rào cản bị đánh giá thấp một cách nghiêm trọng. Ngay cả trong cùng một sản phẩm, mỗi tình huống sử dụng đều đòi hỏi rào cản riêng. Với chúng tôi, một khách hàng tiềm năng trong lĩnh vực tài chính được quản lý chặt chẽ đòi hỏi các biện pháp đảm bảo hoàn toàn khác biệt so với khách hàng SaaS ở phân khúc thị trường trung bình. Những biện pháp đảm bảo này thấm sâu vào cách tác tử soạn nội dung, ai là người có thể liên hệ, dữ liệu nào được phép tiếp cận, điều gì được phép nói trong cuộc gọi điện thoại, và cách ghi chép từng quyết định.
Một hệ thống “một kích thước phù hợp với tất cả” sẽ sụp đổ trước sự khác biệt này. Rào cản phải được xây dựng theo từng tình huống sử dụng, cấu hình theo từng khách hàng và được kiểm toán liên tục. Toàn bộ công việc này hoàn toàn thuộc về công ty ứng dụng. Đó là lý do chúng tôi có các kỹ sư triển khai toàn thời gian (FDE) và chiến lược gia triển khai kỹ thuật, những người phải tinh chỉnh giải pháp cho nhu cầu riêng của từng khách hàng. Ví dụ, chúng tôi hợp tác với một tổ chức nằm trong danh sách Fortune 1000 để thực hiện cuộc gọi chủ động (outbound call) bằng giọng nói tới cơ sở khách hàng doanh nghiệp nhỏ và vừa (SMB) khổng lồ của họ — với sự đồng ý trước. Tỷ lệ bắt máy trong những vòng lặp thử nghiệm đầu tiên rất thấp — chúng tôi phải nhanh chóng lặp lại, học cách làm sao để thu hút sự chú ý của đối tượng đặc thù này trong 10 giây đầu tiên của cuộc gọi. Hành vi của chủ doanh nghiệp SMB hoàn toàn khác biệt so với người mua B2B quy mô lớn hoặc người tiêu dùng. Hiện nay, chúng tôi tạo ra cho họ nhiều cơ hội bán hàng trong một ngày hơn cả toàn bộ đội ngũ bán hàng của phân khúc thị trường này trong một tháng.
Lấy bảo hiểm làm ví dụ — Lời khuyên thực chiến từ CEO của FurtherAI
Bán hàng là một ví dụ. Bảo hiểm là một ví dụ khác, minh họa cùng một chân lý từ một góc nhìn khác. Dưới đây là suy tư của Aman Gour, CEO của FurtherAI, về cách xây dựng ở “ngoài con đường”:
Khi chúng tôi bắt đầu triển khai AI trong các nghiệp vụ bảo hiểm thực tế, chúng tôi liên tục nghe thấy một giả định cụ thể: Mô hình chính là trí tuệ, còn quy trình làm việc chỉ là “khung đỡ” bao quanh nó.
Sau khi hợp tác với ngày càng nhiều công ty bảo hiểm, chúng tôi ngày càng chắc chắn rằng quan điểm này là sai lầm.
Trong ngành bảo hiểm, rất nhiều trí tuệ thực sự tồn tại ngay trong chính quy trình làm việc. Hai công ty bảo hiểm có thể đưa một hồ sơ bảo hiểm (application) đi qua một lộ trình trông giống nhau: nộp hồ sơ, thẩm định, báo giá, chấp thuận bảo hiểm. Nhưng lộ trình là phần đơn giản. Điều phân biệt hai công ty chính là mọi thứ diễn ra bên trong lộ trình: rủi ro nào cần báo cáo lên cấp cao hơn, tín hiệu tổn thất nào là quan trọng, khi hai quy tắc về khẩu vị rủi ro (risk preference) xung đột thì quy tắc nào được ưu tiên, khi nào cần chữ ký của con người, dữ liệu bên ngoài nào cần được truy vấn, và cách ghi chép quyết định cuối cùng.
Những logic này không tồn tại trong một công cụ engine quy tắc sạch sẽ. Chúng phân tán trong các quy trình vận hành tiêu chuẩn (SOP), việc xem xét của quản lý, triết lý chấp thuận bảo hiểm, khẩu vị rủi ro đặc thù của công ty và kinh nghiệm vận hành tích lũy qua nhiều năm. Phần lớn nội dung này chưa được ghi chép dưới dạng mà mô hình có thể đọc trực tiếp.
Đó là lý do chúng tôi không tin vào các tác tử thuần túy dựa trên suy luận từ đầu mỗi lần, cũng không tin vào các quy trình làm việc cứng nhắc dễ sụp đổ khi đối mặt với thực tế hỗn loạn. Điều chúng tôi đang xây dựng là “quy trình làm việc được tác tử hóa”. Quy trình làm việc mang lại tính lặp lại được, khả năng kiểm toán và kiểm soát chi phí. Tác tử xử lý tính biến thiên và phục hồi khi lộ trình lý tưởng bị gián đoạn. Con người vẫn giữ vai trò tham gia ở các bước ra quyết định đòi hỏi trách nhiệm giải trình.
Ngày đầu tiên, điều này tự động hóa các công việc thủ công. Nhưng theo thời gian, mỗi lần báo cáo trở thành một tín hiệu, mỗi ngoại lệ là một phản hồi, mỗi lần hiệu chỉnh thủ công đều phơi bày những chỗ chưa đầy đủ trong sổ tay vận hành. Theo thời gian, quy trình làm việc không còn là một kịch bản, mà dần trở thành “bộ nhớ vận hành” của công ty bảo hiểm. Đây là phần mà các phòng thí nghiệm khó lòng chạm tới. Họ sẽ tiếp tục tung ra các mô hình tốt hơn và các tác tử chung chung tốt hơn — điều đó không sao cả. Nhưng họ sẽ không ở đủ lâu trong quy trình làm việc thực tế của công ty bảo hiểm để hiểu vì sao một tài khoản lại bị báo cáo, vì sao một rủi ro bị từ chối, hoặc vì sao người chấp thuận bảo hiểm (underwriter) lại bác bỏ hướng dẫn khẩu vị rủi ro — và điều đó lại là đúng.
Sự thấu hiểu này chỉ có thể đến từ việc chạy quy trình làm việc hàng nghìn lần trong môi trường thực tế. Quy trình làm việc bạn giao hàng vào ngày đầu tiên không phải là “hào thành”. Chính vòng lặp được tạo ra bởi việc sử dụng trong thực tế theo thời gian mới là “hào thành”.
Với chúng tôi, đây chính là ý nghĩa của việc xây dựng “ngoài con đường”.
Làm sao để biết bạn có đang ở “những nơi khác trong xứ Oz” hay không?
Thử nghiệm công cụ và bước: Công việc này cần bao nhiêu bước, và bạn cần xây dựng công cụ phức tạp đến mức nào để hỗ trợ nó? Hãy so sánh việc tìm kiếm AI ngang (horizontal AI search) trên Google Drive — một bước, một công cụ, kết quả dung sai cao (user có thể đọc tóm tắt và hỏi lại nếu không đúng) — với việc sửa đổi pháp lý đa bước dựa trên tiền lệ của các công ty luật trong ba năm: hàng chục bước trải qua nhiều công cụ, đầu ra phải được đối tác (partner) xem xét, và có thể phải được bào chữa tại tòa án. Cả hai đều trông giống như “tác tử đang làm việc”, nhưng chỉ trường hợp sau mới đòi hỏi một đội ngũ chuyên sâu phải mất nhiều năm để xây dựng phần mềm chuyên sâu.
Thử nghiệm hệ thống: Bạn đang xây dựng một hệ thống mà khách hàng dùng để vận hành công việc, hay chỉ là một công cụ đặt trên hệ thống hiện có của khách hàng? Hệ thống sở hữu toàn bộ quy trình làm việc — từ việc thu thập dữ liệu, quản trị, đến ghi chép hoàn thành — và đó là thứ khách hàng chỉ vào khi mô tả cách công việc thực tế diễn ra. Còn công cụ chỉ là việc bổ sung trí tuệ vào quy trình làm việc mà khách hàng đã đang vận hành. Cảnh huống công cụ có thể tạo ra doanh thu thực tế, nhưng các phòng thí nghiệm có thể chiếm đoạt nó, vì khách hàng không phụ thuộc vào bạn như một lớp điều phối (orchestration layer). ACV (giá trị hợp đồng trung bình) cao thường là dấu hiệu của hệ thống, vì hệ thống thay thế con người thực sự và được trả tiền dựa trên đó — nhưng đây không phải là đảm bảo. Hãy tự hỏi: Nếu một phòng thí nghiệm tung ra sản phẩm tuyên bố cạnh tranh trực tiếp với bạn, khách hàng có còn cần công cụ của bạn không? Nếu có, bạn đang xây dựng hệ thống. Nếu không, bạn chỉ đang xây dựng công cụ — ngay cả khi ACV của bạn rất cao.
Thử nghiệm quỹ đầu tư phòng hộ / bảng cân đối kế toán (hedge fund / P&L test): Hiệu suất của các phòng thí nghiệm được đánh giá dựa trên các bài kiểm tra chuẩn (benchmark), còn hiệu suất của “những nơi khác trong xứ Oz” được đánh giá dựa trên bảng cân đối kế toán (P&L) của khách hàng. Khách hàng của bạn không quan tâm mô hình của bạn đạt bao nhiêu điểm trên SWE-Bench hay MMLU — họ quan tâm tác tử của bạn có chốt được đơn hay không, có sửa đổi hợp đồng đúng hay không, hoặc có chấp thuận đúng hợp đồng bảo hiểm hay không. Nếu họ tập trung vào kết quả của một quy trình làm việc cụ thể, chứ không phải điểm số về năng lực tổng quát, thì bạn đang ở “những nơi khác trong xứ Oz”. Nếu họ trả tiền cho năng lực tổng quát, thì điều bạn bán cho họ cũng có thể mua được bằng gói đăng ký Claude hoặc Codex. Các doanh nghiệp tác tử tốt nhất cần vận hành như một quỹ đầu tư phòng hộ — giành chiến thắng bằng “alpha” trên bảng cân đối kế toán của khách hàng, chứ không phải bằng điểm số trên các bài kiểm tra chuẩn.
Cả hai đều có thể (và sẽ) chiến thắng
Chúng ta sẽ chứng kiến những người chiến thắng khổng lồ cả trên “Con đường gạch vàng” lẫn “ngoài con đường”. Các mô hình sẽ tiếp tục chiến thắng, vì họ sở hữu mô hình và cả kênh phân phối cho các công cụ ngang mà họ thiết kế.
“Những nơi khác trong xứ Oz” có thể chiến thắng nếu họ sở hữu hệ thống làm việc — giao diện nơi công việc thực tế của doanh nghiệp được thực hiện, và nơi dữ liệu chảy qua và được ghi nhận. Các công ty này sở hữu việc thu thập dữ liệu, hệ thống hành động quy trình làm việc và quản trị. Khi các quy trình làm việc ngày càng phức tạp trong các ngành dọc trưởng thành, chúng sẽ tích lũy thành một trải nghiệm cốt lõi mà khách hàng phụ thuộc vào. Khi các thế hệ mô hình mới được phát hành từ các đối thủ hiện tại và người mới gia nhập, các công ty này trở thành lớp tích hợp và cung cấp chúng cho khách hàng. Các mô hình nền tảng có thể thay thế được; còn hệ thống làm việc thì không.
Phần mềm doanh nghiệp thế hệ tiếp theo sẽ được xây dựng “ngoài con đường”.
Nếu bạn đang xây dựng điều đó, vui lòng liên hệ: jschmidt@a16z.com.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News











