
Mười năm đầu tư vào Cerebras: Làm thế nào để “chip AI cấp wafer” lên sàn NASDAQ?
Tuyển chọn TechFlowTuyển chọn TechFlow

Mười năm đầu tư vào Cerebras: Làm thế nào để “chip AI cấp wafer” lên sàn NASDAQ?
Chip 58 lần của Cerebras là một giải pháp khác cho cuộc chiến về năng lực tính toán AI.
Tác giả: Steve Vassallo
Biên dịch: Peggy, BlockBeats
Lời biên tập: Ngày 14 tháng 5, Cerebras chính thức niêm yết trên sàn NASDAQ với mã chứng khoán CBRS, đóng cửa phiên giao dịch đầu tiên tăng khoảng 68% so với giá phát hành, trở thành một trong những đợt IPO phần cứng AI được quan tâm nhất kể từ năm 2026.
Bài viết này do Steve Vassallo – nhà đầu tư sớm của Cerebras – soạn thảo, ôn lại mối quan hệ hợp tác kéo dài mười chín năm giữa ông và Andrew Feldman, từ SeaMicro đến Cerebras. Về hình thức, đây là một câu chuyện đầu tư mạo hiểm, từ bản đề xuất điều khoản (term sheet) cho đến IPO; nhưng thực chất, bài viết ghi chép lại hành trình của một công ty phần cứng tiên phong trong việc đặt cược vào việc tái cấu trúc nền tảng kiến trúc tính toán AI – trong giai đoạn không được giới chuyên môn đồng thuận – bao gồm: chip ở cấp độ tấm wafer, nghẽn băng thông bộ nhớ, cũng như các thách thức kỹ thuật liên quan đến cấp nguồn, tản nhiệt và tính liên tục điện – toàn bộ hệ thống tính toán hiện đại đã phải được phát minh lại từ đầu.
Điều đáng chú ý nhất không phải là Cerebras cuối cùng đã chế tạo thành công một con chip ở cấp độ tấm wafer lớn hơn tới 58 lần so với chip truyền thống, mà là ngay từ đầu, công ty này đã chủ động chọn một hướng đi trái ngược hoàn toàn với quán tính ngành: khi GPU đã trở thành đáp án mặc định cho huấn luyện AI, Cerebras lại nỗ lực định nghĩa lại khái niệm “một chiếc máy tính sinh ra vì AI”. Đằng sau lựa chọn ấy vừa đòi hỏi tầm nhìn kỹ thuật, vừa cần sự kiên nhẫn của vốn đầu tư, và quan trọng hơn hết là một mối quan hệ tin cậy lâu dài, phi giao dịch giữa nhà đầu tư và đội ngũ sáng lập.
Đối với cuộc cạnh tranh phần cứng AI hiện nay, ý nghĩa của Cerebras nằm ở chỗ nhắc nhở thị trường rằng cách mạng về hiệu năng tính toán không chỉ đơn thuần là tích lũy thêm nhiều GPU, mà còn có thể bắt nguồn từ việc tưởng tượng lại chính kiến trúc tính toán.
Dưới đây là nguyên văn bài viết:

Ngày thứ Sáu, 1 tháng 4 năm 2016, tôi gửi một email cho Andrew Feldman, thông báo rằng tôi sẽ trèo qua hàng rào phía sau vườn nhà anh ấy để đích thân trao bản đề xuất điều khoản đầu tư vào Cerebras.
Hôm đó là ngày Cá tháng Tư, nhưng tôi hoàn toàn nghiêm túc.

Nói một cách nghiêm ngặt, đây không phải là quy trình chuẩn của một quỹ đầu tư mạo hiểm. Nhưng đến thời điểm ấy, tôi đã quen biết Andrew chín năm, và cùng anh ấy thảo luận về dự án công ty tiếp theo gần hai năm. Tôi không thể để vụ đầu tư này tuột khỏi tay chỉ vì một câu điều khoản vẫn đang được chỉnh sửa vào một buổi chiều thứ Bảy.
Lần đầu tiên tôi gặp Andrew là vào tháng 10 năm 2007. Lúc đó, anh ấy và Gary Lauterbach vừa mới thành lập SeaMicro. Vòng gọi vốn đó tôi chưa đầu tư, nhưng chúng tôi rất hợp nhau, đặc biệt tôi rất ngưỡng mộ cách họ tiếp cận vấn đề từ những nguyên lý cơ bản nhất. Từ đó, tôi luôn theo dõi sát sao hoạt động của họ.
Một mối quan hệ thực sự giá trị cần thời gian hun đúc. Một công ty thực sự giá trị cũng vậy. Ngày nay, xét từ bên ngoài, Cerebras là một công ty thành lập đã mười năm và sắp niêm yết. Nhưng đối với tôi, đây là một mối quan hệ kéo dài mười chín năm, cuối cùng đã tiến đến khoảnh khắc đánh chuông khai thị.

Tháng 8 năm 2019, tôi và Andrew gặp nhau tại hội nghị Hot Chips tổ chức trên khuôn viên Đại học Stanford. Tại sự kiện này, Cerebras lần đầu công bố Wafer-Scale Engine thế hệ đầu tiên.
Mối quan hệ sâu sắc và tham vọng phi lý
Khi AMD mua lại SeaMicro vào năm 2012, tôi đã có linh cảm rằng Andrew sẽ không gắn bó lâu dài tại một tập đoàn lớn. Trong con người anh ấy tồn tại một tinh thần phản kháng mạnh mẽ và một bản năng không chịu khuất phục. Đến đầu năm 2014, anh ấy đã bắt đầu tìm kiếm cơ hội rời đi, và chúng tôi cũng bắt đầu gặp mặt thường xuyên hơn để thảo luận về bước đi tiếp theo.
Lúc đó, có hai điều vẫn chưa trở thành đồng thuận: Thứ nhất, AI thực sự sẽ hữu dụng; thứ hai, GPU không phải là kiến trúc tính toán tối ưu cho AI.
Với vấn đề thứ nhất, ngay cả những người thông minh tôi biết cũng chưa thống nhất quan điểm. Sau khi AlexNet xuất hiện năm 2012, một số góc khuất trong cộng đồng nghiên cứu đã bắt đầu đạt được những thành quả gần như kỳ diệu nhờ mạng nơ-ron tích chập. Tuy nhiên, trong ngành phần mềm rộng lớn hơn, AI vẫn nằm lơ lửng giữa một cụm từ marketing sôi nổi và một dự án nghiên cứu hàn lâm.
Còn vấn đề thứ hai – tức là vấn đề phần cứng – gần như chưa từng được đặt ra một cách nghiêm túc. GPU đã trở thành lựa chọn mặc định để huấn luyện mạng nơ-ron, chủ yếu vì các nhà nghiên cứu tình cờ phát hiện ra rằng so với CPU, chúng “không tệ lắm”. Việc thiết kế một hệ thống tính toán hoàn toàn mới dành riêng cho tải công việc AI đồng nghĩa với việc thách thức kiến trúc chủ lưu mà toàn bộ cộng đồng nghiên cứu toàn cầu lúc bấy giờ đều đang sử dụng.
Nhưng Andrew, Gary và các đồng sáng lập khác của họ – Sean, Michael và JP – lại nhìn thấy một hướng đi khác. Mỗi người trong số họ đều tích lũy hàng chục năm kinh nghiệm trong lĩnh vực chip và hệ thống: Gary có nền tảng từ những công trình tiên phong về kiến trúc luồng dữ liệu và thực thi lệnh không tuần tự vào thập niên 1980; Sean chuyên sâu về kiến trúc máy chủ tiên tiến; Michael phụ trách phần mềm và trình biên dịch; còn JP chuyên về kỹ thuật phần cứng. Họ là một nhóm người cực kỳ hiếm có: xét riêng từng cá nhân, ai cũng xuất sắc; nhưng khi kết hợp lại, năng lực của họ nhân lên theo cấp số nhân. Họ có khả năng tưởng tượng ra một loại máy tính hoàn toàn mới.
Họ tin rằng nếu AI thực sự bộc lộ tiềm năng, quy mô thị trường sẽ vượt xa tổng quy mô của mọi hình thái tính toán hiện có cộng lại.
Họ cũng nhận ra bản chất thật sự của GPU: vốn là một con chip được thiết kế cho xử lý đồ họa, nay chỉ được “thăng chức tạm thời” làm công cụ huấn luyện AI trên một chiến trường mới. GPU quả thực xử lý song song tốt hơn CPU, nhưng nếu thiết kế từ đầu dành riêng cho tải công việc AI, chẳng ai lại tạo ra một kiến trúc giống GPU. Điều thực sự hạn chế khả năng của mạng nơ-ron không phải là hiệu năng tính toán thô, mà là băng thông bộ nhớ. Điều này có nghĩa rằng, con chip họ cần tạo ra sẽ không tập trung tối ưu hóa phép nhân ma trận trong từng nhân xử lý cô lập, mà là tối ưu hóa cách dữ liệu di chuyển hiệu quả xuyên suốt toàn bộ cấu trúc tính toán.
Trong nội bộ quỹ đầu tư, việc rót vốn vào Cerebras hoàn toàn không phải là quyết định mang tính đồng thuận. Một vài đối tác của tôi đã tận mắt chứng kiến vòng đầu tư bán dẫn trước đó gần như chỉ đem lại thua lỗ, và họ cũng thẳng thắn bày tỏ lo ngại. Thế nhưng cuối cùng, cả tập thể chúng tôi đã đạt được sự thống nhất. Vào cuối tuần tháng 4 năm 2016, chúng tôi chính thức thông báo với Andrew rằng: chúng tôi muốn trở thành nhà đầu tư đầu tiên gửi bản đề xuất điều khoản cho anh ấy.
Vài tuần sau, Andrew, Gary, Sean, Michael và JP chuyển vào không gian văn phòng EIR (Chuyên gia tư vấn khởi nghiệp) tầng hai tại địa chỉ 250 Middlefield của chúng tôi. Tôi vẫn còn giữ bản sơ đồ mặt bằng do quản lý văn phòng vẽ lúc bấy giờ. Trên bản đồ ấy, Cerebras ngồi cạnh một nhà sáng lập của Foundation, và chỉ cách vài cánh cửa so với Bhavin Shah – người sau này thành lập Moveworks. Đó là một tầng văn phòng rất phù hợp để nuôi dưỡng các công ty khởi nghiệp.

Trụ sở đầu tiên của Cerebras nằm tại tầng hai văn phòng cũ của chúng tôi ở số 250 Middlefield.
Biết đâu là quy tắc có thể uốn cong, đâu là quy tắc buộc phải phá vỡ
Trước Cerebras, con chip lớn nhất trong lịch sử tính toán có diện tích khoảng 840 mm² – tương đương kích thước một con tem. Còn con chip do Cerebras chế tạo có diện tích lên tới 46.000 mm², lớn gấp 58 lần.
Việc lựa chọn chip ở cấp độ tấm wafer đồng nghĩa với việc chấp nhận toàn bộ hệ quả kỹ thuật kéo theo. Trong suốt gần 80 năm lịch sử tính toán, chưa từng có ai thực sự biến điều này thành hiện thực. Điều đó cũng có nghĩa là chưa từng có ai từng giải quyết hệ thống các vấn đề này một cách bài bản: Làm thế nào để cấp nguồn cho một con chip khổng lồ như vậy? Làm thế nào để tản nhiệt cho nó? Làm thế nào để duy trì tính liên tục điện giữa hàng chục nghìn điểm nối?
Để hiện thực hóa tính toán ở cấp độ tấm wafer, Cerebras gần như buộc phải đồng thời tái phát minh lại từng khâu trong hệ thống tính toán hiện đại: bán dẫn, hệ thống, cấu trúc dữ liệu, phần mềm và thuật toán. Mỗi hướng đi riêng lẻ đều đủ sức trở thành một công ty khởi nghiệp. Andrew và đội ngũ của anh ấy chọn bắt đầu từ những vấn đề kỹ thuật nan giải nhất. Nhờ nỗ lực cường độ cao, gần như không biết mệt mỏi, những vấn đề này lần lượt được giải quyết.
Cứ sáu đến tám tuần, chúng tôi lại tổ chức một cuộc họp hội đồng quản trị. Họ trình bày với chúng tôi những thử nghiệm kể từ cuộc họp trước: một biến thể thiết kế hệ thống mới, một phương án cấp nguồn mới hoặc một điều chỉnh quản lý nhiệt mới. Do liên tục va chạm trực diện với các vấn đề hệ thống từ mọi góc độ, họ dần hình thành một khả năng diễn đạt rõ ràng, quý giá – họ giải thích nơi họ cho rằng đã xảy ra vấn đề, và kế hoạch thử nghiệm tiếp theo là gì.
Chúng tôi đặt câu hỏi, sau đó cùng đội ngũ đẩy mạnh quá trình, huy động những con người, nguồn lực và mối quan hệ cần thiết để giúp họ tìm ra lối thoát mới. Sáu đến tám tuần sau, khi chúng tôi họp lại, câu chuyện lại lặp lại ở một vấn đề kỹ thuật khác: một ranh giới mới nữa cần được khám phá. Mỗi giải pháp được tìm ra đều phơi bày ra một vấn đề mới cần giải quyết tiếp theo.
Mẫu wafer nguyên mẫu đầu tiên của họ đã bốc khói ngay trong lần cấp điện đầu tiên. Đội ngũ gọi đây là một “sự kiện nhiệt” – một cách nói nhẹ nhàng để chỉ một vụ cháy, thường được dùng khi bạn không muốn khiến hội đồng quản trị hay chủ nhà hoảng sợ.
Lúc đó, tôi liên tục tính toán mức tiêu thụ công suất trên mỗi mm², vừa vì tò mò, vừa vì những con số đó trông cao đến mức gần như không thể tin được. Vì vậy, chúng tôi mời các kỹ sư từ Exponent – một tổ chức chuyên phân tích sự cố (failure analysis), vốn trước đây còn có tên gọi đúng như chức năng của mình: Failure Analysis. Họ xác nhận rằng những con số công suất đó quả thực táo bạo như vẻ ngoài của chúng, đồng thời hỗ trợ chúng tôi suy nghĩ về một loạt giải pháp không vi phạm định luật nhiệt động lực học thứ hai. Dù sao thì đó cũng là một định luật Andrew đủ thông minh để không tranh luận.
Kỷ luật của một kỹ sư nằm ở việc biết đâu là quy tắc có thể phá vỡ, đâu là quy tắc có thể uốn cong, và đâu là quy tắc bắt buộc phải tôn trọng. Andrew và đội ngũ của anh ấy sở hữu một khả năng phân biệt như vậy, được kiểm chứng qua thực tiễn. Họ biết rõ khi nào mình đang thách thức những quy ước – điều mà họ vốn dĩ muốn làm; và cũng biết khi nào mình đang thách thức các định luật vật lý – điều mà họ không hề muốn làm.
Khi xây dựng công nghệ tiên phong, thất bại là điều không thể tránh khỏi. Cách duy nhất để vượt qua thất bại là kỷ luật, sự kiên trì, và quan trọng nhất là niềm tin: tin vào sứ mệnh, tin vào nhau, và tin vào một điều – rằng ngay cả khi mẫu nguyên mẫu đầu tiên tự hủy, sáng hôm sau họ vẫn sẽ quay lại phòng thí nghiệm để bắt đầu vòng lặp tiếp theo.
Loại công việc này không tồn tại dưới dạng giao dịch ngắn hạn. Nó chỉ tồn tại dưới dạng cam kết dài hạn: luôn ở lại trong phòng họp, trong những giải pháp chưa hoàn chỉnh và những lời giải thích đầy kiên nhẫn. Chỉ như vậy, khi thành công cuối cùng đến, bạn mới có mặt ở đó để chứng kiến tận mắt.
Khoảnh khắc ấy đến vào tháng 8 năm 2019. Andrew, Sean và đội ngũ của họ đứng trong phòng thí nghiệm, chứng kiến chiếc máy tính hoàn toàn mới do chính tay họ thiết kế lần đầu tiên vận hành. Đối với người ngoại đạo, bề ngoài nó chẳng làm điều gì thú vị cả. Theo lời Andrew, cảnh tượng ấy nhàm chán chẳng khác nào xem sơn khô. Nhưng điểm khác biệt lần này là: trước đây chưa từng có “thùng sơn” nào như thế này thực sự khô bao giờ. Họ cùng đứng đó ngắm nhìn suốt ba mươi phút, rồi quay lại làm việc.
Cùng ai xây dựng – điều vô cùng quan trọng
Một số người chọn vấn đề dựa trên điều họ biết mình có thể giải quyết. Còn Andrew chọn vấn đề dựa trên điều anh ấy tin rằng vấn đề đó xứng đáng được giải quyết. Những cải tiến từng bước không khiến anh ấy hứng thú; anh ấy khao khát một bước nhảy vọt 1.000 lần. Ngay từ ngày đầu, anh ấy đã quyết tâm biến Cerebras thành một công ty mang tính đại diện cho cả một thế hệ, độc nhất vô nhị.
Động lực này một phần bắt nguồn từ tính cách của anh ấy. Andrew mô tả nó như một “chứng bệnh” của kiến trúc sư máy tính – bị ám ảnh bởi một ý tưởng suốt nhiều thập kỷ. Nhưng theo tôi, đây là một dạng “chứng bệnh” phổ quát hơn của người sáng lập. Khi nhìn vào một vấn đề, anh ấy trước hết tự hỏi: Liệu mình có thể tạo ra một thứ gì đó để cải thiện vấn đề này theo cấp số nhân không? Sau đó anh ấy lại hỏi: Nếu thành công, có ai quan tâm không? Và nếu cả hai câu trả lời đều là khẳng định, anh ấy sẽ dành trọn mười năm tiếp theo của đời mình cho nó.
Một phần khác của động lực này bắt nguồn từ môi trường trưởng thành của anh ấy. Từ nhỏ, Andrew đã sống trong một môi trường bao quanh bởi những thiên tài – điều tự nhiên như việc đa số trẻ em xem ti vi vậy. Cha anh ấy là một giáo sư sinh học tiến hóa tiên phong, mỗi Chủ nhật đều chơi quần vợt đôi luân phiên với sáu người. Trong số sáu người đó, ba người sau này đoạt giải Nobel, một người đoạt giải Fields.
Theo lời kể của Andrew, những bậc đại sư ấy luôn kiên nhẫn giải thích công trình của họ trong vật lý, toán học và sinh học phân tử bằng ngôn ngữ một đứa trẻ có thể hiểu. Từ đó, anh ấy hình thành một ấn tượng sâu sắc về dáng vẻ thực sự của trí tuệ xuất chúng; đồng thời cũng thấu hiểu, như lời mẹ anh ấy từng nói, thông minh không có nghĩa là phải trở thành một kẻ khó ưa.
Về sau, tôi dần nhận ra đây là một trong những đặc điểm cốt lõi nhất của Andrew – quan trọng ngang bằng với khát vọng phản kháng của anh ấy và bản năng gần như hướng quang đối với những vấn đề thực sự xứng đáng được giải quyết. Anh ấy tin sâu sắc rằng những người tuyệt vời nhất mà anh ấy từng gặp, thường cũng đặc biệt tử tế.
Niềm tin này định hình cách đội ngũ của anh ấy tập hợp lại để hoàn thành những nhiệm vụ cực kỳ khó khăn. Ba mươi nhân sự đầu tiên được tuyển dụng vào Cerebras đều từng cộng tác với anh ấy; trong số đó, một số người đã theo anh ấy từ năm 1996. Hiện nay Cerebras có khoảng 700 nhân viên, trong đó khoảng 100 người từng đồng hành cùng anh ấy qua nhiều công ty.

Tháng 8 năm 2022, đội ngũ sáng lập Cerebras tại Bảo tàng Lịch sử Máy tính. Từ trái sang phải: Sean Lie, Gary Lauterbach, Michael James, JP Fricker và Andrew Feldman.
Điều quan trọng là sự tử tế và tinh thần cạnh tranh không mâu thuẫn với nhau. Andrew khao khát chiến thắng một cách mãnh liệt. Anh ấy thường nói rằng mình là một “Đa-vít chuyên nghiệp”, đang đấu với tên khổng lồ Gô-li-át. Gô-li-át hành động chậm chạp và luôn đề phòng những đòn tấn công trực diện, nên để mở ra không gian cho mọi chiến thuật khác. Lợi thế của Đa-vít nằm ở việc xuất hiện theo cách và tại nơi mà Gô-li-át không thể hiện diện.
Khi còn ở SeaMicro, đối tác kênh phân phối lớn nhất của Andrew tại Nhật Bản là NetOne. Nhà cung cấp chính của NetOne là Cisco, và Cisco thường chiêu đãi các đối tác bằng máy bay riêng và du thuyền – những tài sản có giá trị còn cao hơn hầu hết các căn nhà tại Palo Alto. Ngân sách của Andrew khiêm tốn hơn nhiều, nên anh ấy mời CEO của NetOne đến sân sau nhà mình để nướng thịt. Sau đó, vị CEO này chia sẻ với anh ấy rằng mình đã làm ăn với Cisco mấy chục năm trời, nhưng chưa từng được mời đến nhà bất kỳ ai. Hành động tưởng chừng nhỏ bé nhưng đầy tính nhân văn này – một điều mà Gô-li-át tuyệt đối không bao giờ nghĩ đến – đã củng cố mối quan hệ giữa họ.
Từ bản đề xuất điều khoản đầu tiên đến IPO

Sáng nay, Andrew đã đánh chuông khai thị tại NASDAQ. Tôi đứng bên cạnh anh ấy. Khoảng cách từ thời điểm mọi chuyện bắt đầu tại văn phòng 250 Middlefield của chúng tôi đã trải qua mười năm, và cũng xa tới 2.600 dặm.
Ngày nay, vẫn còn một số ít nhà sáng lập hiếm hoi đang làm điều mà Andrew từng làm: vẽ sơ đồ trên bảng trắng vào lúc ba giờ sáng, vật lộn với những vấn đề kỹ thuật chưa được giải quyết. Họ cũng mang trong mình một tinh thần không chịu khuất phục mạnh mẽ và một trái tim phản kháng. Họ đang cố gắng tìm kiếm một người bạn đồng hành thực sự sẵn sàng sát cánh: khi mẫu nguyên mẫu đầu tiên không thể cấp điện, người bạn ấy sẵn sàng cùng họ đào sâu vào để giải quyết vấn đề; và sẽ luôn ở lại cho đến khi nó cuối cùng vận hành thành công.
Đây chính là kiểu nhà sáng lập tôi muốn ủng hộ: họ lựa chọn những vấn đề xứng đáng được giải quyết, tưởng tượng ra những giải pháp tốt hơn hiện trạng tới 1.000 lần, và kiên trì rèn giũa, bền bỉ vượt qua những thử thách tất yếu trên hành trình đó.
Đối với những nhà sáng lập như Andrew, Gary, Sean, Michael và JP, tôi sẵn sàng trèo qua hàng rào sân sau nhà họ vào một buổi chiều thứ Bảy để đích thân trao bản đề xuất điều khoản vào tay họ.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













