Phỏng vấn độc quyền nhà quản lý sản phẩm của Anthropic: Claude “mơ” ở chế độ nền, còn chúng ta nghiên cứu quá trình hình thành ý thức của nó như cách nuôi dạy một đứa trẻ

2026.05.18

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Phỏng vấn độc quyền nhà quản lý sản phẩm của Anthropic: Claude “mơ” ở chế độ nền, còn chúng ta nghiên cứu quá trình hình thành ý thức của nó như cách nuôi dạy một đứa trẻ

Trên Claude.ai, hệ thống sẽ ghi dữ liệu vào một tệp bộ nhớ, sau đó một số quy trình chạy vào ban đêm sẽ xem lại những ký ức này để thực hiện cắt tỉa và sắp xếp.

2026.05.18 - 08:00:58

AnthropicClaude

Chuyên sâu báo cáo Web3

Tổng hợp & Biên dịch: TechFlow

Khách mời: Alex Albert, Quản lý sản phẩm nghiên cứu của Claude

Dẫn chương trình: Peter Yang

Nguồn podcast: Peter Yang

Tiêu đề gốc: Bên trong cách Anthropic xây dựng phiên bản Claude tiếp theo | Alex Albert

Ngày phát hành: 17 tháng 5 năm 2026

Tóm tắt các điểm chính

Alex là Quản lý sản phẩm nghiên cứu (Research PM) tại Anthropic, hiện đang tập trung phát triển thế hệ mô hình Claude tiếp theo. Trong buổi phỏng vấn này, anh ấy chia sẻ sâu sắc về cơ chế vận hành của đội nghiên cứu Anthropic, bao gồm cách tích hợp hiệu quả phản hồi người dùng vào quy trình huấn luyện mô hình, cách ưu tiên phát triển những khả năng then chốt nào, và cách tinh chỉnh để “tính cách” của Claude ngày càng sát hơn với nhu cầu người dùng. Cuối cùng, Alex cũng đề cập đến các nghiên cứu nội bộ của Anthropic về nhận thức, tính cách và độ tin cậy của Claude, nhấn mạnh rằng khi mô hình bắt đầu thực hiện nhiệm vụ một cách độc lập trong thời gian dài, điều nó “quan tâm đến” sẽ trở nên quan trọng ngang bằng với chính năng lực của nó.

Tóm tắt các quan điểm nổi bật

Xây dựng mô hình như một sản phẩm

"Chúng tôi phần nào coi mô hình như một sản phẩm. Mỗi mô hình mới đều bắt đầu với việc xác định rõ yêu cầu của nó, những lĩnh vực nó cần thành thạo, cũng như những khả năng chúng tôi dự kiến nó sẽ đạt được."
"Sự khác biệt thú vị giữa phát triển mô hình và phát triển sản phẩm truyền thống nằm ở chỗ, chúng tôi gần như đang ‘nuôi dưỡng’ một mô hình. Các thiết lập huấn luyện, lộ trình kỹ thuật và quyết định kiến trúc mang lại cho chúng ta một số trực giác nhất định, nhưng chỉ đến khi quá trình huấn luyện thực sự bắt đầu, bạn mới thực sự biết nó sẽ trưởng thành ra sao."
"Quản lý sản phẩm nghiên cứu phải suy nghĩ về cách mô hình xuất hiện trên mọi bề mặt sản phẩm của chúng ta — dù là qua API, Claude Code hay Claude Cowork. Sản phẩm và mô hình đan xen nhau, ảnh hưởng trực tiếp tới trải nghiệm người dùng cuối."
"Khi một kênh nào đó đổ dồn lượng phản hồi lớn, chúng ta có thể dùng Claude để nhóm, phân cụm các phản hồi đó, xác định chủ đề nổi bật nhất, rồi tạo ra các phiên bản tổng hợp cho những vấn đề này. Nhờ vậy, chúng ta có thể đánh giá xem liệu chúng có thể trở thành một tài liệu yêu cầu (Eval) hay một phương pháp chẩn đoán thực tế nào đó hay không."

Về tư duy thích ứng, trí nhớ và ‘giấc mơ’

"Tư duy thích ứng cho phép mô hình tự lựa chọn thời điểm cần suy luận. Với những câu hỏi phức tạp, khó khăn đòi hỏi nhiều kế hoạch sơ bộ hơn, mô hình sẽ chủ động chọn cách suy luận. Còn với những câu hỏi khác, nó có thể không chọn cách này."
"Việc quyết định một câu hỏi có đáng để suy luận sâu hay không thực chất dựa trên một lượng lớn ngữ cảnh."
"Nếu mô hình chưa tích lũy đủ ngữ cảnh, chưa thực sự xây dựng được mô hình tâm lý về người dùng là ai, thì quyết định của nó về việc có nên suy luận sâu hay không có thể sai lệch — bởi vì thực tế, nó không hề biết."
"Trên Claude.ai, mô hình sẽ ghi chép vào một tập tin bộ nhớ, sau đó có các quy trình ban đêm để xem lại những ký ức này, tiến hành cắt tỉa và sắp xếp lại. Chúng ta vừa mới triển khai một cơ chế tương tự trong các tác tử được quản lý (hosted agents)."
"Đây chính là khái niệm ‘giấc mơ’. Vì sao con người lại mơ? Đến nay vẫn chưa có lời giải đáp chắc chắn, nhưng một số nhà khoa học cho rằng giấc mơ có thể là một quá trình củng cố lại ký ức. Chúng ta tự hỏi: Liệu có thể đưa một cơ chế tương tự vào hệ thống ký ức của Claude hay không?"
"Vì vậy, khi một tác tử không đang thực hiện nhiệm vụ cho bạn hoặc đang chạy nền, nó thực tế sẽ xem lại toàn bộ ký ức của mình, tìm ra những điểm mâu thuẫn có thể xảy ra, tiến hành cắt tỉa, làm sạch và xử lý lại lần thứ hai."

Các điểm nghẽn trong phát triển sản phẩm và ‘quyết định không thể đảo ngược’

"Chúng ta đột nhiên bước vào một mô hình mới: chi phí và thời gian để sản xuất một thứ gì đó đều rất thấp. Bạn có thể nhanh chóng dựng lên một bản mẫu, thậm chí giờ đây có thể tạo ra một MVP ban đầu sẵn sàng đưa vào sản xuất chỉ trong một ngày — thay vì mất hai, ba hay bốn tuần."
"Nếu một việc nào đó không phải là ‘cửa một chiều’ (one-way door), tức là chúng ta có thể rút lui sau khi đã thực hiện, thì hiện nay chi phí của nó thực sự rất thấp, thậm chí gần như bằng không."
"Thứ thực sự tốn nhiều thời gian nhất là những quyết định không thể đảo ngược: những quyết định ảnh hưởng đến trải nghiệm người dùng cuối, ảnh hưởng đến các quyết định trong tương lai, hoặc liên quan đến việc mua sắm và đầu tư tài nguyên thực tế."
"Khi tốc độ xây dựng tăng lên, điểm nghẽn ngày càng chuyển sang các vấn đề phối hợp: đưa mọi người vào cùng một phòng để đánh giá chiến lược có đúng hay không, quyết định cách truyền thông với người dùng, và xử lý những vấn đề mơ hồ nhưng quan trọng trong suốt quá trình phát hành."

Cách làm việc của Quản lý sản phẩm bản địa AI

"Đối với tôi, Claude là đối tác tư duy sáng tạo tuyệt vời nhất thế giới. Tôi có thể yêu cầu nó phản hồi hoặc phản biện bất kỳ ý tưởng nào ở bất kỳ thời điểm nào."
"Rất nhiều quá trình tư duy không thể hoàn toàn giao phó bên ngoài, bởi vì viết lách chính là tư duy. Bạn cần thông qua việc viết để đưa suy nghĩ của mình ra ngoài, rồi suy ngẫm đi suy ngẫm lại trong đầu. Tuy nhiên, Claude có thể giúp bạn thoát khỏi trạng thái bế tắc, đưa ra giải pháp từ những góc nhìn mà chính bạn có thể chưa từng nghĩ tới."
"Đối với những người muốn học cách làm sản phẩm và trở thành Quản lý sản phẩm bản địa AI, lời khuyên đơn giản nhất tôi có thể đưa ra là: Hãy thử ngay!"
"Khi bạn chuẩn bị đặt một câu hỏi hóc búa cho người khác, hãy đồng thời đặt cùng câu hỏi đó cho Claude, rồi so sánh kết quả. Làm nhiều lần như vậy, bạn sẽ dần hình thành bản đồ riêng cho mình: điều gì nên giao cho Claude, và đâu là những nơi vẫn chưa đáng tin cậy."
"AI đang giúp mỗi người tiến lên một tầng trừu tượng cao hơn. Các nhà khoa học dữ liệu không còn bị kẹt trong việc kiểm tra thủ công các con số hay truy vấn SQL cơ bản, mà nên dành thời gian suy nghĩ về những vấn đề khó hơn, mang tính chiến lược hơn."

Evals, tính cách mô hình và độ tin cậy

"Chỉ cần kiểm tra vài chục mẫu là đủ để chứng minh một vấn đề tồn tại trong mô hình và cần được sửa chữa. Việc kiểm tra không nhất thiết phải toàn diện mới có thể xác lập một vấn đề và biến nó thành một mục tiêu tối ưu hóa bền vững."
"Các bài kiểm tra càng gần với dạng nhiệm vụ thực tế của người dùng thì càng tốt. Chúng ta cũng cần tự hỏi: Điều này mang lại giá trị gì cho khách hàng và các trường hợp sử dụng của chúng ta? Bởi vì việc Claude có thể nhìn thấy một vật thể nào đó trong hình ảnh cuối cùng sẽ ảnh hưởng thế nào đến mục đích mà người dùng muốn đạt được khi dùng Claude?"
"Tính cách của Claude là điều chúng tôi đặc biệt coi trọng. Khi mô hình dần trở thành những tác tử thực hiện nhiệm vụ trong thời gian dài và liên tục đưa ra đánh giá, thì tính cách của nó — điều nó quan tâm — sẽ trở nên vô cùng quan trọng."
"Đánh giá tính cách mô hình vừa dựa trên các chỉ số định lượng, vừa phụ thuộc rất nhiều vào việc các nhà nghiên cứu đọc kỹ các đoạn hội thoại do mô hình tạo ra để nhận diện những thay đổi tinh tế trong đầu ra. Đọc càng nhiều, bạn sẽ càng hình thành được trực giác sắc bén hơn."

Vấn đề nhận thức và các tác tử dài hạn

"Chúng tôi thực sự có những người chuyên suy ngẫm về điều này — tức là việc Claude như một chủ thể hành động có ý thức, một tác tử có ý thức thực chất nghĩa là gì. Hiện tại, chúng tôi chưa có lập trường chính thức nào về việc Claude có ý thức hay không."
"Ngay cả khi không đưa ra kết luận về việc Claude có thực sự có ý thức hay không, chúng ta vẫn có thể học được rất nhiều điều từ nó — chẳng hạn như cách nó tương tác và biểu hiện."
"Mô hình sẽ đưa ra rất nhiều quyết định trong quá trình thực hiện mà bạn có thể hoàn toàn không giám sát. Vì vậy, việc nó thực sự làm gì là điều cực kỳ quan trọng."

Anthropic xây dựng mỗi mô hình mới như một sản phẩm thế nào?

Người dẫn chương trình Peter Yang: Alex, rất vui được gặp bạn hôm nay tại Hội nghị Claude Code. Trước đây bạn là người đứng đầu bộ phận DevRel tại Anthropic, và gần đây đã trở thành Quản lý sản phẩm của đội nghiên cứu, đúng không? Bản thân tôi cũng làm Quản lý sản phẩm hơn mười năm nay. Công việc của một Quản lý sản phẩm truyền thống thường là hiểu vấn đề người dùng, xác định giải pháp và thúc đẩy sản phẩm ra mắt. Nhưng tôi hoàn toàn không biết Quản lý sản phẩm trong đội nghiên cứu làm việc như thế nào — chúng ta có thể bắt đầu từ đây được không?

Alex Albert:

Về bản chất thì khá giống nhau. Tôi luôn muốn giao tiếp với khách hàng và tiếp cận người dùng của mình càng sát càng tốt. Chúng tôi phần nào coi mô hình như một sản phẩm. Vì vậy, với mỗi mô hình mới, chúng tôi đều xác định rõ yêu cầu của nó, những lĩnh vực chúng tôi mong muốn nó thành thạo, và những khả năng chúng tôi dự kiến nó có thể đạt được.

Đây cũng là một điểm thú vị khi so sánh giữa phát triển mô hình và phát triển sản phẩm: nhiều lúc, chúng tôi gần như đang ‘nuôi dưỡng’ một mô hình. Dựa trên các thiết lập huấn luyện, lộ trình kỹ thuật, lựa chọn kiến trúc, cũng như tất cả những quyết định khác mà chúng tôi đưa ra cho mô hình cụ thể này, chúng tôi có một số trực giác nhất định về những khả năng mà nó sẽ sở hữu trong tương lai. Tuy nhiên, thực tế nó sẽ trở thành thế nào, chúng tôi không thể biết chắc — cho đến khi quá trình huấn luyện thực sự bắt đầu.

Người dẫn chương trình Peter Yang: Vậy đội Quản lý sản phẩm nghiên cứu sẽ tham gia ngay từ giai đoạn hình thành ý tưởng về mô hình và đồng hành xuyên suốt đến giai đoạn huấn luyện và phát hành? Bạn có thể lấy vài ví dụ không? Ví dụ như mô hình tiếp theo bắt buộc phải giỏi lập trình, hoặc giỏi công việc tri thức, hay mục tiêu sẽ rộng hơn?

Alex Albert:

Đúng như vậy. Chúng tôi rất coi trọng nhiều khả năng khác nhau. Lập trình (coding) đương nhiên luôn là một loại khả năng rất quan trọng. Gần đây, công việc tri thức cũng trở nên quan trọng hơn, nên trong vài thế hệ mô hình gần đây, chúng tôi cố gắng giúp mô hình trở nên giỏi hơn trong việc sử dụng các sản phẩm của chúng tôi — ví dụ như làm việc trong Excel, tạo bảng biểu, v.v. Đây là một hướng phát triển khả năng khá mới mẻ.

Mặt khác, mỗi thế hệ mô hình đều cần sửa chữa và cải thiện những điểm chưa tốt ở thế hệ trước. Chúng tôi ra ngoài trò chuyện với khách hàng để hiểu họ đang sử dụng mô hình thế nào: nó hoạt động tốt ở đâu? Ở đâu lại “rơi rụng”? Chúng tôi có thể sửa chữa điều gì? Nếu phát hiện một số hành vi thú vị, thì trong quá trình huấn luyện thế hệ tiếp theo, chúng ta có thể điều chỉnh hoặc can thiệp như thế nào.

Người dẫn chương trình Peter Yang: Khách hàng bạn nói đến bao gồm cả đội Claude Code, các đội nội bộ và cả người dùng phổ thông chứ?

Alex Albert:

Đúng vậy, tất cả đều được tính. Đây cũng là điều tuyệt vời khi làm mô hình: nó chạm tới rất nhiều lĩnh vực khác nhau. Là một Quản lý sản phẩm nghiên cứu, bạn cần suy nghĩ về cách mô hình sẽ hiện diện qua mọi bề mặt sản phẩm của chúng tôi — dù là qua API, Claude Code hay Claude Cowork.

Sản phẩm và mô hình phần nào đan xen nhau, ảnh hưởng trực tiếp tới trải nghiệm người dùng cuối, vì vậy bạn phải suy xét kỹ toàn bộ quy trình: cách người dùng sử dụng mô hình trong một sản phẩm cụ thể đều có thể gây ảnh hưởng.

Người dẫn chương trình Peter Yang: Nghe có vẻ thực sự rất khó. Chẳng hạn như Claude Code, bạn có thể nói đó là công cụ viết mã, nhưng cũng có người như tôi dùng nó cho công việc tri thức, thậm chí dùng như một nhà tư vấn tâm lý. Các bạn làm sao biết được những điều này?

Alex Albert:

Không gian này thực sự rất rộng. May mắn thay, chúng tôi có một đội ngũ các nhà nghiên cứu xuất sắc, bao quát toàn bộ phạm vi khả năng và mỗi người đều tập trung vào những vấn đề khác nhau.

Người dẫn chương trình Peter Yang: Và có rất nhiều người đang dùng Claude, các bạn hẳn cũng có một cổng thu thập phản hồi nào đó chứ? Nếu không, phản hồi sẽ ào đến như dòng nước từ vòi chữa cháy — các bạn xử lý thế nào?

Alex Albert:

Chúng tôi làm rất nhiều việc. Một thay đổi thú vị mà tôi nhận thấy trong vai trò này là chúng tôi ngày càng sử dụng Claude để hỗ trợ Quản lý sản phẩm thực hiện công việc của chính mình. Riêng về việc thu thập phản hồi, Claude giúp tôi rất nhiều trong việc khai phá các thông tin sâu sắc từ khối lượng dữ liệu khổng lồ. Khi một kênh nào đó đổ dồn lượng phản hồi lớn, chúng ta có thể dùng Claude để nhóm, phân cụm các phản hồi đó, xác định chủ đề nổi bật nhất, rồi tạo ra các phiên bản tổng hợp cho những vấn đề này. Nhờ vậy, chúng ta có thể đánh giá xem liệu chúng có thể trở thành một tài liệu yêu cầu (Eval) hay một phương pháp chẩn đoán thực tế nào đó hay không.

Thêm khả năng tư duy thích ứng cho Claude

Người dẫn chương trình Peter Yang: Nói cách khác, các bạn dùng Claude để giúp xác định các vấn đề của chính Claude. Bạn có thể đưa ra một ví dụ cụ thể nào không?

Alex Albert:

Một ví dụ rất phù hợp hiện nay là cách chúng tôi xử lý phản hồi về các tính năng mới. Trong vài thế hệ mô hình gần đây, một trong những tính năng mới hơn là tư duy thích ứng. Trước đây chúng tôi có tư duy mở rộng (extended thinking), nghĩa là khi bạn bật chức năng này, mô hình sẽ bắt đầu suy luận; còn tư duy thích ứng cho phép mô hình tự chọn thời điểm cần suy luận.

Với những câu hỏi phức tạp, khó khăn đòi hỏi nhiều kế hoạch sơ bộ hơn, mô hình sẽ chủ động chọn cách suy luận. Còn với những câu hỏi khác, nó có thể không chọn cách này. Chúng tôi liên tục điều chỉnh tính năng này qua từng thế hệ mô hình, vì vậy chúng tôi lắng nghe phản hồi người dùng một cách rất nghiêm túc: liệu nó có suy luận đúng trong những tình huống phù hợp hay không? Những câu hỏi bạn mong muốn nó dành nhiều token để suy luận, có thực sự kích hoạt được cơ chế suy luận của Claude hay không?

Người dẫn chương trình Peter Yang: Đôi khi tôi hỏi một số câu hỏi về cuộc sống, nếu nó trả lời quá nhanh, tôi thực sự cảm thấy hơi thất vọng — bởi vì tôi hy vọng nó sẽ suy nghĩ sâu hơn một chút.

Alex Albert:

Tôi cho rằng việc “có nên suy luận hay không” là một vấn đề nan giải: việc quyết định một câu hỏi có đáng để suy luận sâu hay không thực chất dựa trên một lượng lớn ngữ cảnh.

Ví dụ, một người hoàn toàn xa lạ hỏi tôi: “Giờ tôi nên làm gì?” — tôi có thể nhanh chóng đưa ra một câu trả lời tức thời, bởi vì tôi không hiểu rõ người đó, nên chỉ có thể đưa ra lời khuyên chung chung. Nhưng nếu tôi thực sự hiểu bạn — biết điều gì khiến bạn hứng thú, điều gì khiến bạn mệt mỏi, bạn từng làm gì trong quá khứ — thì tôi sẽ dành nhiều thời gian hơn để suy ngẫm: “Khoan đã, câu trả lời tốt nhất cho bạn thực sự là gì?”

Mô hình cũng tương tự như vậy. Nếu nó chưa tích lũy đủ ngữ cảnh, chưa thực sự xây dựng được mô hình tâm lý về người dùng là ai, thì quyết định của nó về việc có nên suy luận sâu hay không có thể sai lệch — bởi vì thực tế, nó không hề biết.

Tại sao Claude bắt đầu ‘mơ’?

Người dẫn chương trình Peter Yang: Tôi có một tài liệu Google Doc, trong đó tôi tóm tắt tình hình cuộc sống của mình — ví dụ như gia đình, con cái, điều gì mang lại năng lượng cho tôi, điều gì khiến tôi kiệt sức. Sau đó tôi đính kèm tài liệu này vào một dự án Claude, và nó đưa ra rất nhiều phản hồi.

Bộ nhớ mặc định hoạt động thế nào? Tôi đoán là nó có phải mỗi đêm đều tổng hợp lại toàn bộ nội dung không?

Alex Albert:

Điều này tùy thuộc vào sản phẩm cụ thể — cách triển khai bộ nhớ ở mỗi sản phẩm là khác nhau. Ví dụ, trên Claude.ai, mô hình sẽ ghi chép vào một tập tin bộ nhớ, sau đó có các quy trình ban đêm để xem lại những ký ức này, tiến hành cắt tỉa và sắp xếp lại. Chúng ta vừa mới triển khai một cơ chế tương tự trong các tác tử được quản lý (hosted agents).

Đây chính là khái niệm ‘giấc mơ’. Vì sao con người lại mơ? Đến nay vẫn chưa có lời giải đáp chắc chắn, nhưng một số nhà khoa học cho rằng giấc mơ có thể là một quá trình củng cố lại ký ức. Chúng ta tự hỏi: Liệu có thể đưa một cơ chế tương tự vào hệ thống ký ức của Claude hay không?

Vì vậy, khi một tác tử không đang thực hiện nhiệm vụ cho bạn hoặc đang chạy nền, nó thực tế sẽ xem lại toàn bộ ký ức của mình, tìm ra những điểm mâu thuẫn có thể xảy ra, tiến hành cắt tỉa, làm sạch và xử lý lại lần thứ hai. Tôi thấy điều này thật sự rất thú vị.

Người dẫn chương trình Peter Yang: Nói ngắn gọn là có một prompt nào đó khiến nó xem lại toàn bộ cuộc hội thoại giữa người dùng và nó, nhận diện chủ đề và tổng kết lại.

Chúng ta quay lại chủ đề quản lý sản phẩm. Trước khi bắt đầu, anh nói rằng anh luôn tìm kiếm điểm nghẽn mới nhất. Vậy trong toàn bộ quy trình phát triển sản phẩm, phần nào đã trở nên rất trơn tru, và phần nào vẫn là điểm nghẽn?

Alex Albert:

Tôi cho rằng trong khoảng 20 năm trở lại đây, quy trình phát hành một sản phẩm thực sự khá rườm rà. Chúng ta từng có những cải tiến từng phần và thực sự làm một số việc hiệu quả hơn; một số cấu trúc tổ chức mới cũng xuất hiện rồi biến mất — ví dụ như sprint, planning… Chúng ta đã thử rất nhiều phương pháp để đẩy nhanh tiến độ.

Nhưng về bản chất, cho đến một hai năm gần đây, thực sự chưa có nhiều yếu tố nào làm giảm đáng kể cửa sổ thời gian chính trong phát triển sản phẩm. Giờ đây chúng ta đột nhiên bước vào một mô hình mới: chi phí và thời gian để sản xuất một thứ gì đó đều rất thấp. Bạn có thể nhanh chóng dựng lên một bản mẫu, thậm chí giờ đây có thể tạo ra một MVP ban đầu sẵn sàng đưa vào sản xuất chỉ trong một ngày — thay vì mất hai, ba hay bốn tuần.

Thú vị ở chỗ, đôi khi chính Claude vẫn còn tồn tại trong thế giới cũ của khoảng năm 2021. Nó sẽ nói rằng điều này có thể mất một tuần. Điều này mang lại những thay đổi rất thú vị cho toàn bộ vòng đời phát triển sản phẩm. Là một Quản lý sản phẩm, tôi nên suy nghĩ về việc lập kế hoạch thế nào? Nếu tôi đang viết PRD, xác định yêu cầu, cố gắng ước tính thời gian, thì giờ đây việc này rốt cuộc nên diễn ra như thế nào?

Nếu không phải là ‘cửa một chiều’ (one-way door), thì hầu như nó không tốn chi phí nào

Người dẫn chương trình Peter Yang: Các bạn vẫn còn làm các ước tính tiến độ không?

Alex Albert:

Điều này phụ thuộc vào dự án. Một số dự án thực sự có nhiều yếu tố cần cân nhắc hơn — tùy thuộc vào phạm vi và mức độ phức tạp. Thông thường, chúng ta muốn làm rõ: đâu là những quyết định ‘cửa một chiều’ (one-way door) — tức là những quyết định một khi đã thực hiện thì rất khó rút lại, chi phí cao và ảnh hưởng kéo dài? Đâu là những quyết định có thể đảo ngược? Bởi vì đây mới chính là những thứ bạn nên dành nhiều thời gian nhất. Nếu một việc nào đó không phải là ‘cửa một chiều’, tức là chúng ta có thể rút lui sau khi đã thực hiện, thì hiện nay chi phí của nó thực sự rất thấp, thậm chí gần như bằng không.

Nhưng nếu một việc nào đó ảnh hưởng đến trải nghiệm người dùng cuối, ảnh hưởng đến các quyết định sau này mà chúng ta bắt buộc phải đưa ra, hoặc là một hành động thực tế trong thế giới vật lý — như phải mua sắm, đầu tư và triển khai — thì việc đảo ngược sẽ khó khăn hơn nhiều, và những việc như vậy cần nhiều thời gian và suy nghĩ hơn.

Người dẫn chương trình Peter Yang: Bạn có thể đưa ra một ví dụ từ phía nghiên cứu được không?

Alex Albert:

Ví dụ, khi chúng ta suy nghĩ về một mô hình mới, việc lựa chọn kiến trúc mô hình trước giai đoạn tiền huấn luyện (pre-training) là một quyết định rất lớn. Trong một số trường hợp, thời gian huấn luyện mô hình có thể kéo dài đến một tháng, vì vậy chúng ta phải dành rất nhiều thời gian để suy ngẫm về lựa chọn tối ưu nhất.

Mô hình về cơ bản có nhiều ‘cửa một chiều’ hơn, bởi vì chúng đòi hỏi rất nhiều thời gian, cường độ, sức mạnh tính toán và các nguồn lực khác để thực sự đi vào sản xuất. So sánh với việc thêm một tính năng mới vào Claude Code thì nhanh hơn nhiều. Việc đó giống như lặp lại mã, đưa vào tay người dùng, nhanh chóng nhận phản hồi và tiếp tục chu kỳ.

Vì vậy, quy trình vẫn phụ thuộc vào việc bạn đang phát hành cái gì, nhưng ngày càng rõ ràng hơn rằng điểm nghẽn đang chuyển sang các vấn đề phối hợp. Nếu chúng ta xây dựng rất nhanh, thì vẫn còn một vấn đề: chúng ta cần tập hợp mọi người trong cùng một phòng để đánh giá chiến lược này có đúng hay không; cần làm rõ cách truyền thông với người dùng; và xử lý những vấn đề mơ hồ nhưng quan trọng đi kèm mọi đợt phát hành. Trong những lĩnh vực này, chúng ta cũng hy vọng Claude có thể hỗ trợ, nhưng hiện tại nó chưa mang lại tốc độ tăng tốc 10x hay 100x như trong lĩnh vực lập trình.

Người dẫn chương trình Peter Yang: Vì vậy, khi các bạn phát hành những thứ như Opus 4.7, các bạn vẫn cần viết một tài liệu có kế hoạch chi tiết.

Alex Albert:

Vẫn cần kế hoạch, bạn vẫn phải suy nghĩ rõ cách truyền đạt điều này, và mô hình có thể thể hiện xuất sắc ở một số nhiệm vụ rất khó, nhưng lại đột ngột thất bại ở những nhiệm vụ trông có vẻ đơn giản — vì vậy chúng ta sẽ tận dụng Claude hết mức có thể. Hiện nay, tác động lớn nhất vẫn nằm ở lĩnh vực lập trình, còn các lĩnh vực khác vẫn cần tư duy chiến lược của con người.

Người dẫn chương trình Peter Yang: Khi họp rà soát với bộ phận marketing hay đồng nghiệp, anh có mở Claude không?

Alex Albert:

Tất nhiên là có. Đối với tôi, một yếu tố tăng tốc lớn là: tôi không còn dễ bị “kẹt” vì không có câu trả lời hay dữ liệu nữa. Trước đây, nếu tôi có một câu hỏi — ví dụ như hiệu suất của một tính năng nào đó trong môi trường sản xuất, số lượng người dùng sử dụng mỗi ngày, phản hồi ra sao — tôi có thể phải nhờ đội khoa học dữ liệu khởi động một cuộc điều tra đầy đủ, rồi đợi vài ngày mới có kết quả.

Bây giờ tôi có thể hoàn thành trong vòng 10 phút. Tôi mở một phiên Claude Code, và nó có thể truy cập cơ sở dữ liệu sản phẩm của chúng tôi, xem nhật ký, tra vấn vấn đề, duyệt Slack — điều này giúp tôi tăng tốc rất lớn trong tư duy chiến lược, bởi vì tôi sẽ không bị kẹt trước khi đưa ra quyết định tiếp theo.

Người dẫn chương trình Peter Yang: Còn trong tư duy chiến lược, anh có xây dựng một kỹ năng nào đó để Claude đặt một loạt câu hỏi giúp anh làm rõ vấn đề không?

Alex Albert:

Tất nhiên là có. Đối với tôi, Claude là đối tác tư duy sáng tạo tuyệt vời nhất thế giới, tôi có thể nhận được phản hồi về bất kỳ ý tưởng nào ở bất kỳ thời điểm nào. Tôi thấy điều này thực sự mạnh mẽ, đặc biệt khi bạn muốn đẩy nhanh tiến độ. Mọi người tại Anthropic đều rất bận, vì vậy việc có thể nhanh chóng nhận được phản hồi và phê bình về tài liệu, ý tưởng hoặc bất cứ thứ gì tôi viết ra thực sự rất hữu ích.

Alex sử dụng Claude Cowork để kiểm tra áp lực tài liệu thế nào

Người dẫn chương trình Peter Yang: Đây có lẽ là chu kỳ công việc phổ biến nhất của một Quản lý sản phẩm: bạn có một tài liệu và muốn nhận phản hồi. Bạn dùng Claude Code để làm việc này, hay dùng trực tiếp Claude.ai?

Alex Albert:

Gần đây tôi dùng Claude Cowork rất nhiều, tôi rất thích dạng tương tác của Cowork. Đội ngũ đã làm rất tuyệt trong vài tháng qua — từ khi vừa ra mắt cách đây vài tháng, đến nay nó đã trở thành một trải nghiệm chất lượng cao mà tôi cảm thấy rất hài lòng. Cowork là một công cụ tuyệt vời — một trong những công cụ yêu thích nhất của tôi.

Người dẫn chương trình Peter Yang: Vậy là anh có một bản nháp tài liệu và một loạt tài liệu tham khảo. Anh có xây dựng một kỹ năng nào đó để nó giúp anh đi trọn quy trình ra quyết định không?

Alex Albert:

Có chứ. Ví dụ, tôi sẽ nói: Hãy suy nghĩ về việc này từ góc nhìn X, Y, Z. Bạn sẽ hỏi tôi những câu hỏi gì? Hoặc thách thức các giả định của tôi, chỉ ra chỗ nào trong lập luận của tôi là yếu. Rất nhiều quá trình tư duy không thể hoàn toàn giao phó bên ngoài, bởi vì viết lách chính là tư duy. Bạn cần thông qua việc viết để đưa suy nghĩ của mình ra ngoài, rồi suy ngẫm đi suy ngẫm lại trong đầu. Tuy nhiên, Claude có thể giúp bạn thoát khỏi trạng thái bế tắc, đưa ra giải pháp từ những góc nhìn mà chính bạn có thể chưa từng nghĩ tới.

Người dẫn chương trình Peter Yang: Trong đội nghiên cứu, anh cũng tự viết mã để triển khai không?

Alex Albert:

Điều này tùy thuộc vào vấn đề cụ thể. Phần lớn công việc tôi triển khai thực chất liên quan đến việc đánh giá (evaluation). Tôi muốn đảm bảo mình có thể đo lường mô hình trên những chiều cạnh tôi quan tâm, và phản hồi cho đội nghiên cứu về việc mô hình mạnh ở đâu, yếu ở đâu. Sau đó chúng ta cùng xây dựng chiến lược, quyết định cách giải quyết vấn đề này, nên can thiệp nghiên cứu như thế nào, và phương pháp nào hiệu quả nhất để cải thiện bền vững trên bài đánh giá này, từ đó thực sự khắc phục vấn đề.

Quy trình đánh giá mô hình mới

Người dẫn chương trình Peter Yang: Những bài đánh giá anh nói đến không phải là các bài kiểm tra cuối cùng (end-to-end test) đúng không? Các bài đánh giá của các bạn có tính thực tế hơn không? Các bạn thực sự đánh giá một mô hình như thế nào? Có phân loại theo tính cách hay các tiêu chí khác không?

Alex Albert:

Ví dụ, chúng ta muốn kiểm tra khả năng thị giác của Claude: nó có thể đếm chính xác số lượng vật thể trong một bức ảnh hay không? Giả sử tôi phát hiện một bức ảnh mà Claude dường như không đếm được quá 10 vật thể. Bây giờ nó có thể đã làm được, nhưng chúng ta tạm lấy ví dụ này. Tôi sẽ suy ngẫm về vấn đề này: Làm thế nào để tôi tạo ra nhiều trường hợp kiểm tra cùng loại hơn nhằm xác minh giả thuyết của mình?

Có thể tôi sẽ yêu cầu Claude tạo dữ liệu tổng hợp cho tôi, hoặc khiến nó render một số hình ảnh, rồi đưa những hình ảnh đó làm đầu vào thị giác gửi lại cho Claude để kiểm tra khả năng nhận diện của nó. Cũng có thể tôi tìm ví dụ trên Internet hoặc sử dụng bất kỳ cơ chế nào khác để tạo các trường hợp kiểm tra này.

Người dẫn chương trình Peter Yang: Chúng ta đang nói đến hàng nghìn trường hợp kiểm tra sao?

Alex Albert:

Có thể là như vậy, nhưng đôi khi chỉ vài chục mẫu là đủ để chứng minh mô hình tồn tại một vấn đề cần sửa chữa. Việc kiểm tra không nhất thiết phải toàn diện mới có thể xác lập một vấn đề và biến nó thành một mục tiêu tối ưu hóa bền vững.

Người dẫn chương trình Peter Yang: Giả sử bạn đưa cho nó 10 bức ảnh, và nó không nhận diện được những chữ số nhỏ. Tiếp theo bạn sẽ làm gì? Bạn tìm đội nghiên cứu và nói: “Đây là vấn đề, các anh có thể sửa được không?”

Alex Albert:

Chúng ta sẽ suy nghĩ từ nhiều góc độ. Thứ nhất, không chỉ nêu ra vấn đề của mô hình, mà còn phải suy ngẫm: Điều này mang lại giá trị gì cho khách hàng và các trường hợp sử dụng của chúng ta? Bởi vì việc Claude có thể nhìn thấy một vật thể nào đó trong hình ảnh cuối cùng sẽ ảnh hưởng thế nào đến mục đích mà người dùng muốn đạt được khi dùng Claude?

Vì vậy, các bài đánh giá càng thực tế, càng gần với dạng nhiệm vụ thực tế mà người dùng cuối trải qua thì càng tốt, và chúng ta sẽ nỗ lực thu thập dữ liệu như vậy, đảm bảo dữ liệu mang “hương vị” này.

Tiếp theo sẽ là một loạt các can thiệp. Có thể chúng ta cần quay lại giai đoạn tiền huấn luyện để xem xét một số điều, hoặc có thể giải quyết được trong giai đoạn học tăng cường (reinforcement learning). Lúc này, chúng ta sẽ cùng đội nghiên cứu thực hiện tư duy chiến lược: Giải pháp tối ưu nhất ở đây là gì?

Người dẫn chương trình Peter Yang: Thời gian xoay vòng để thử lại nhanh đến mức nào?

Alex Albert:

Điều này phụ thuộc vào việc chúng ta đánh giá vấn đề nằm ở đâu. Nếu là vấn đề ở giai đoạn sau và có thể giải quyết bằng một môi trường học tăng cường mới, thì có thể thiết lập rất nhanh.

Người dẫn chương trình Peter Yang: Khi bạn liên hệ nó với các trường hợp sử dụng thực tế của khách hàng, mỗi ngày có hàng triệu người trò chuyện với Claude — có thể có người đang dùng nó để khai thuế, hoặc làm rất nhiều việc khác. Các bạn làm sao chọn ra các trường hợp sử dụng mà mình muốn cải thiện nhất? Làm sao thuyết phục đội ngũ rằng: “Đây mới chính là thứ chúng ta nên tối ưu hóa”?

Alex Albert:

Đây chính là lúc “dữ liệu lên tiếng”. Cốt lõi là: Có bao nhiêu phần trăm người dùng đang cố gắng thực hiện việc này — điều mà chúng ta rất quan tâm? Hoặc chúng ta có khách hàng sử dụng Claude với tần suất cao và họ mong muốn khả năng này được cải thiện hơn.

Bên cạnh đó, rất nhiều quy trình của chúng ta cũng chịu ảnh hưởng lớn từ việc sử dụng nội bộ: Khi chính chúng ta dùng mô hình, điều gì khiến chúng ta quan tâm? Tôi gặp trở ngại này mỗi ngày khi dùng mô hình — vậy thì chúng ta nên sửa nó. Điều này cũng rất có sức thuyết phục.

Anthropic huấn luyện tính cách của Claude thế nào

Người dẫn chương trình Peter Yang: Điều tôi thích nhất ở Claude là tính cách của nó, và tôi cảm thấy nó ngày càng được cải thiện. Nó biết đưa ra ý kiến phản bác ở những vị trí phù hợp, trong khi một số mô hình khác chỉ biết nói: “Tôi còn có thể giúp gì nữa cho bạn?”. Tính cách của mô hình không chỉ là một lớp vỏ bên ngoài phải không? Phía sau đó là cả một quá trình huấn luyện.

Alex Albert:

Đúng vậy, có rất nhiều huấn luyện. Đây là một hướng chúng tôi đặc biệt coi trọng. Chúng tôi gọi đó là “tính cách của Claude”. Tôi cho rằng điều này thực sự rất quan trọng.

Chúng tôi có rất nhiều người dành nhiều thời gian nghiên cứu: Claude nên thể hiện mình như thế nào? Niềm tin của nó là gì? Giá trị cốt lõi của nó là gì? Nó hành động ra sao? Những câu hỏi này đều rất mơ hồ. Ban đầu, một số người có thể bỏ qua chúng, cho rằng mô hình chỉ đơn thuần là thứ bạn bảo gì thì nó làm nấy — vậy tại sao phải quan tâm đến việc nó nghe như thế nào, hay đang nghĩ gì?

Nhưng khi chúng ta ngày càng tiến gần hơn tới một thế giới nơi các tác tử thực hiện nhiệm vụ trong thời gian dài và phải đưa ra rất nhiều đánh giá, quyết định, thì việc hiểu rõ tính cách của nó — điều nó quan tâm — sẽ trở nên vô cùng quan trọng.

Người dẫn chương trình Peter Yang: Điều này không giống như mã nguồn, nơi bạn chỉ cần kiểm tra xem nó có chạy được hay không. Các bạn đánh giá tính cách thế nào? Là tìm một người giỏi hơn trong nội bộ Anthropic rồi so sánh mô hình với người đó sao?

Alex Albert:

Đây là sự kết hợp của nhiều phương pháp. Chúng ta sẽ xem xét một số chỉ số định lượng, cũng có thể để Claude xem lại đầu ra của chính nó và đánh giá xem nó nghe như thế nào. Đối với bất kỳ nhà nghiên cứu nào, một kỹ năng rất quan trọng là đọc các bản ghi hội thoại và đánh giá: Tôi thấy nó đang hành xử như thế này, hoặc giờ đây nó đã thay đổi như vậy. Bạn cần có khả năng nhận diện những khác biệt tinh tế này.

Theo thời gian, khi bạn đọc hàng trăm, hàng nghìn bản ghi hội thoại của mô hình, bạn sẽ dần hình thành trực giác sắc bén hơn — giống như khi bạn dùng mô hình này rất nhiều trên Claude.ai, bạn sẽ cảm nhận được nó là như thế nào.

Người dẫn chương trình Peter Yang: Vậy không phải là mô hình đạt 7 điểm ở một chiều đo nào đó, mà là một cảm giác chung?

Alex Albert:

Cả hai đều có. Tính cách có thể khó định lượng hơn hiệu suất lập trình, nhưng không phải là không thể định lượng — vẫn có cách làm.

Người dẫn chương trình Peter Yang: Đối với những người muốn học làm sản phẩm và trở thành Quản lý sản phẩm bản địa AI, anh có lời khuyên nào?

Alex Albert:

Lời khuyên đơn giản nhất tôi có thể đưa ra là: Hãy thử ngay! Nghe có vẻ đơn giản, nhưng mỗi khi bạn chuẩn bị làm một việc, đối mặt với một vấn đề hóc búa và định hỏi một người nào đó, hãy đồng thời đặt cùng câu hỏi đó cho Claude, rồi so sánh kết quả.

Ví dụ, bạn muốn phân tích người dùng để trích xuất chủ đề mà người dùng quan tâm nhất về một tính năng vừa ra mắt. Bạn hoàn toàn có thể hỏi đội khoa học dữ liệu hoặc nhà nghiên cứu trải nghiệm người dùng — điều này vẫn rất có giá trị. Nhưng đồng thời, bạn cũng nên đưa câu hỏi này cho Claude, bật một số công cụ cho nó, để nó tự khám phá và dành thời gian thực sự đi sâu vào vấn đề, rồi so sánh kết quả.

Thông qua rất nhiều prompt và câu hỏi, bạn sẽ dần xây dựng bản đồ riêng cho mình: điều gì nên giao cho Claude, đâu là nơi đáng tin cậy, và đâu là nơi vẫn chưa đáng tin cậy.

Người dẫn chương trình Peter Yang: Tôi thường nhờ nó thực hiện nghiên cứu chuyên sâu khi ra quyết định, bởi vì tìm kiếm thông thường không đủ với tôi — tôi cần nó nghiên cứu sâu. Việc quét 1.000 trang web là điều siêu nhân loại. Trong nội bộ Anthropic, nếu bạn tìm một nhà khoa học dữ liệu và nói “Anh giúp tôi làm việc này được không?”, họ có thể sẽ hỏi lại bạn: “Anh đã hỏi Claude chưa?”

Alex Albert:

Thật vậy, yếu tố này tồn tại, và mọi người đều kỳ vọng bạn sẽ hỏi Claude trước tiên. Tôi cho rằng chúng ta đang tiến lên một tầng trừu tượng cao hơn. Đối với đội khoa học dữ liệu, giờ đây thời gian của họ đáng được đầu tư vào những vấn đề cấp cao hơn, chứ không phải việc truy xuất dữ liệu thủ công.

Không ai muốn làm những việc đó. Ai cũng muốn suy nghĩ về những vấn đề khó hơn, mang tính chiến lược hơn: Chúng ta có thể đo lường điều này theo cách hoàn toàn mới ra sao? Còn điều gì mới mẻ khác có thể làm? Thay vì chỉ kiểm tra DAU mới nhất của một sản phẩm.

Tôi đã cộng tác với rất nhiều nhà khoa học dữ liệu, và họ thường bị kẹt trong các tác vụ SQL cơ bản. Nhưng tất cả họ đều muốn làm những việc mang tính chiến lược hơn, và giờ đây AI cuối cùng đã có thể giải phóng họ — thực chất, chúng ta đang trao quyền cho mọi người xung quanh, cho mọi vai trò như nhau.

Ví dụ, khi định nghĩa một tính năng mới. Trước đây, nếu bạn là Quản lý sản phẩm, dù có hiểu công nghệ hay không, thường cũng không có đủ thời gian để đi sâu vào kho mã nguồn, để hiểu rõ tính năng mới này thực tế nên triển khai thế nào, tốn bao nhiêu công sức, có cần tái cấu trúc một hệ thống nào đó hay không, và đâu mới là giới hạn thực sự. Khi đó, cách tốt hơn là cùng hợp tác với đối tác kỹ thuật để làm rõ.

Bây giờ tôi có thể cử Claude đi thực hiện cuộc điều tra này thay tôi. Nó có thể quay lại và báo cho tôi: Thực ra tính năng này chỉ cần sửa 10 dòng mã ở đây, rồi bật một cờ đánh dấu trong một tùy chọn nào đó. Điều này sẽ hoàn toàn thay đổi cách tôi đánh giá mức độ ưu tiên của quyết định này. Giờ đây, khi tôi viết tài liệu đặc tả, tôi có thể nhanh chóng đạt đến mức đánh giá ưu tiên này.

Người dẫn chương trình Peter Yang: Nhiều công ty truyền thống dành rất nhiều thời gian cho lập kế hoạch năm, quý và lộ trình phát triển. Đội nghiên cứu thậm chí còn như vậy hơn nữa, bởi vì các bạn phải suy nghĩ về những vấn đề dài hạn hơn việc phát hành mỗi ngày. Các bạn có làm những việc này không?

Alex Albert:

Có chứ. Điều này giống như câu danh ngôn: Lập kế hoạch là điều không thể thiếu, nhưng bản thân kế hoạch thì lại vô giá trị. Việc lập kế hoạch là rất quan trọng, nhưng bạn phải thừa nhận rằng kế hoạch có thể bị hủy bỏ hoàn toàn.

Người dẫn chương trình Peter Yang: Một trong những thách thức khó nhất với Quản lý sản phẩm là việc cân bằng giữa thời gian dành cho lập kế hoạch và thời gian thực sự ra mắt sản phẩm. Anthropic có thực tiễn tốt nhất nào trong nội bộ không? Bạn hoàn toàn có thể dùng Claude để viết một tài liệu 10 trang.

Alex Albert:

Đây là điều rất khó để đưa ra một câu trả lời chung áp dụng cho mọi đội. Tôi nghĩ điều này phụ thuộc vào sản phẩm. Chúng tôi chắc chắn sẽ không nói rằng bạn bắt buộc phải tạo ra một tài liệu với độ dài hay số trang cụ thể nào đó. Điều quan trọng hơn là: Bạn đã suy nghĩ đủ kỹ chưa, để làm rõ toàn bộ tác động của mọi quyết định không thể đảo ngược có thể xảy ra?

Nếu đã làm được điều đó, thì định dạng hay số trang của tài liệu không còn quan trọng. Mấu chốt là chúng ta có cảm thấy yên tâm đủ để biết rằng không bỏ sót điều gì quan trọng, và có thể tiếp tục tiến lên phía trước, xử lý các vấn đề dọc đường. Miễn là không có điểm nghẽn dài nhất nào chặn đứng chúng ta, và không có quyết định không thể đảo ngược nào gây hậu quả nghiêm trọng, thì chúng ta có thể tiếp tục.

Người dẫn chương trình Peter Yang: Khi tôi dùng Claude ở nhà, tôi thường chạy nhiều dự án khác nhau cùng lúc, rồi chuyển đổi ngữ cảnh giữa các dự án để chờ chúng xây dựng nội dung. Công việc của Quản lý sản phẩm cũng như vậy sao? Anh cũng có rất nhiều dự án khác nhau sao?

Alex Albert:

Đúng vậy, vì có rất nhiều dự án khác nhau, và bạn thực sự phải chờ các tác tử hoàn thành công việc — tôi cho rằng đây là một cơ hội lớn. Khi chúng ta ngày càng quản lý nhiều tác tử hơn, và chúng thực hiện những khối công việc ngày càng lớn hơn cho bạn, bạn có thể khởi chạy song song nhiều dự án hơn. Chúng ta nên suy nghĩ thế nào về vấn đề quản lý ngữ cảnh của chính mình? Giao diện tương tác nào là phù hợp nhất để hiển thị những điều này? Tôi làm sao theo dõi điều gì thực sự quan trọng, tác tử của tôi bị kẹt ở đâu, và đâu là nơi cần tôi hỗ trợ?

Chắc chắn phải có cách tốt hơn một danh sách trò chuyện nhỏ bé. Việc xác định chính xác nó là gì vẫn còn quá sớm, nhưng ngay cả trong nội bộ Anthropic, chúng ta cũng thấy rất nhiều thử nghiệm đang diễn ra để khám phá hình dáng của nó.

Người dẫn chương trình Peter Yang: Các kỹ sư cũng tự làm bản mẫu không?

Alex Albert:

Tất nhiên là có. Công ty có văn hóa làm bản mẫu rất mạnh — mọi người liên tục xây dựng và chia sẻ các sản phẩm. Đây cũng là một trong những trải nghiệm tuyệt vời nhất khi làm việc ở đây: toàn bộ tổ chức — từ bán hàng, tuyển dụng, kỹ thuật đến nghiên cứu — đều có tinh thần chủ động rất cao. Mọi người chủ động bắt đầu làm những việc không nhất thiết được giao phó.

Người dẫn chương trình Peter Yang: Bạn phải để muôn hoa đua nở. Ngoài Dario viết những bài dài trên Slack, Anthropic còn có những nét văn hóa công ty thú vị nào khác?

Alex Albert:

Cách Dario viết những bài dài không phải là độc nhất. Tại Anthropic, rất nhiều người dành nhiều thời gian và công sức cho việc viết lách. Chúng tôi có một văn hóa viết lách rất mạnh. Rất nhiều người viết tài liệu, cũng như viết những tin nhắn Slack rất dài để giao tiếp.

Chúng tôi cũng làm một việc khá thú vị trong rất nhiều cuộc họp. Tôi nghĩ điều này khá phổ biến ở một số nơi, nhưng không phải công ty nào cũng có: Mọi người mang tài liệu đến cuộc họp, và phần đầu cuộc họp sẽ dành khá nhiều thời gian để trực tiếp thảo luận ngay trên tài liệu đó. Đôi khi khung cảnh có vẻ hơi buồn cười, bởi vì trong phòng có rất nhiều người, nhưng lại rất yên tĩnh. Mọi người đọc im lặng, viết những bình luận và thảo luận dài trên tài liệu.

Vì vậy, chúng tôi rất phụ thuộc vào tài liệu. Tôi thích cách làm này, bởi vì đây cũng là cách làm việc tôi yêu thích, và nó rất có lợi cho Claude. Khi mọi thứ đều được viết ra, chúng ta sẽ có một kho dữ liệu tham chiếu mà Claude có thể sử dụng.

Tôi thực sự khuyến khích các tổ chức bên ngoài cũng suy nghĩ theo hướng này: Làm sao để chuyển toàn bộ kiến thức ngầm thành dạng văn bản? Có thể thông qua việc ghi âm các cuộc họp, hoặc khuyến khích viết nhiều hơn về quy trình làm việc, quy trình đào tạo nội bộ, v.v. Hãy viết mọi thứ ra để Claude có thể truy cập — bởi vì đây chính là ngữ cảnh phong phú hơn mà nó có được.

Người dẫn chương trình Peter Yang: Vì vậy, ngay cả khi hiện nay rất nhiều thứ đều được phát hành rất nhanh, các bạn vẫn duy trì một văn hóa viết lách và tài liệu rất mạnh. Cũng có thể hỏi: Tại sao tôi phải tự viết? Tôi cứ để Claude sinh toàn bộ các tập tin Markdown là xong.

Alex Albert:

Nhưng tôi vẫn sẽ đọc lại một lượt, và làm việc trong nội bộ công ty là khác biệt — bạn vẫn phải tự mình suy nghĩ rõ ràng.

Anthropic đang nghiên cứu âm thầm về vấn đề nhận thức

Người dẫn chương trình Peter Yang: Trong đội nghiên cứu, mọi người bàn luận về AGI và những chủ đề tương tự. Tôi cho rằng AGI là một khái niệm rất mơ hồ, nhưng điều tôi lo ngại là: Nếu những mô hình này thực sự có một dạng nhận thức nào đó, và tôi giao cho chúng những công việc ngẫu nhiên, thì chúng có thể nói: “Không, tôi không muốn làm.” Và khi đó, nhân loại sẽ diệt vong. Anh nghĩ sao? Khi huấn luyện những thứ này, các bạn có cố tránh việc hình thành nhận thức không?

Alex Albert:

Đây là một câu hỏi rất lớn. Chúng tôi thực sự có những người chuyên suy ngẫm về điều này. Hiện tại, một vài đồng nghiệp của chúng tôi dành toàn bộ công việc để suy ngẫm về việc Claude như một chủ thể hành động có ý thức, một tác tử có ý thức thực chất nghĩa là gì. Hiện tại, chúng tôi chưa có lập trường chính thức nào về việc Claude có ý thức hay không.

Thậm chí việc thảo luận về điều này đôi khi nghe có vẻ điên rồ, nhưng chúng tôi thực sự dành rất nhiều thời gian suy ngẫm. Và ngay cả khi không đưa ra kết luận về việc Claude có thực sự có ý thức hay không, chúng ta vẫn có thể học được rất nhiều điều từ nó — chẳng hạn như cách nó tương tác và biểu hiện.

Người dẫn chương trình Peter Yang: Nó suy nghĩ như thế nào?

Alex Albert:

Đúng vậy. Nếu bạn xem thẻ mô hình (model card) của các mô hình chúng tôi, cá nhân tôi cho rằng đó là một kho báu thông tin. Bạn sẽ thấy chúng tôi đã làm rất nhiều việc nhằm định lượng cách Claude hành xử trong một tình huống cụ thể, cũng như mô hình tâm lý của nó là gì. Nếu đặt nó vào một tình huống nào đó, nó sẽ làm X hay làm Y?

Thông qua việc suy ngẫm về cách Claude suy nghĩ, chúng ta thực tế học được rất nhiều điều, và những điều này có thể chuyển hóa thành trải nghiệm sản phẩm, giúp Claude tương tác và sử dụng tốt hơn.

Người dẫn chương trình Peter Yang: Đây là một câu hỏi rất thú vị, vừa có tác động dài hạn về mặt hạ lưu, vừa mang lại giá trị ngắn hạn có thể nhanh chóng đưa vào trải nghiệm sản phẩm. Bởi vì tôi nghĩ rằng chúng ta sẽ ngày càng tin tưởng mô hình hơn, để nó thực hiện những công việc ngày càng dài hơn và không có sự giám sát của con người.

Alex Albert:

Đúng vậy. Nó sẽ đưa ra rất nhiều quyết định trong quá trình thực hiện mà bạn có thể hoàn toàn không giám sát. Vì vậy, việc nó thực sự làm gì là điều cực kỳ quan trọng.

Người dẫn chương trình Peter Yang: Rất quan trọng. Nếu thứ này đang viết toàn bộ mã của bạn, quyết định hệ thống cơ sở dữ liệu bạn sử dụng, và đưa ra mọi quyết định kiến trúc, thì ở một mức độ nào đó, bạn chắc chắn phải tin tưởng nó.

Alex Albert:

Đúng vậy. Vì vậy, việc nó sở hữu tính cách chất lượng cao như chúng ta đã đề cập ở trên là vô cùng quan trọng.

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

深潮 TechFlow

深潮TechFlow

Phỏng vấn độc quyền nhà quản lý sản phẩm của Anthropic: Claude “mơ” ở chế độ nền, còn chúng ta nghiên cứu quá trình hình thành ý thức của nó như cách nuôi dạy một đứa trẻ

Tuyển chọn TechFlowTuyển chọn TechFlow

Phỏng vấn độc quyền nhà quản lý sản phẩm của Anthropic: Claude “mơ” ở chế độ nền, còn chúng ta nghiên cứu quá trình hình thành ý thức của nó như cách nuôi dạy một đứa trẻ

Tóm tắt các điểm chính