
HTX Research | Sự tiến hóa của Bittensor: dTAO tái cấu trúc hệ sinh thái AI mã nguồn mở bằng cơ chế khuyến khích thị trường
Tuyển chọn TechFlowTuyển chọn TechFlow

HTX Research | Sự tiến hóa của Bittensor: dTAO tái cấu trúc hệ sinh thái AI mã nguồn mở bằng cơ chế khuyến khích thị trường
Phân tích sâu về tác động của bản nâng cấp dTAO đối với hệ sinh thái Bittensor, tập trung vào các đổi mới kiến trúc, mô hình kinh tế và động lực học tổng thể của hệ sinh thái.
Tác giả: Chloe Zheng

Theo nghiên cứu năm 2023 của Sequoia Capital, 85% các nhà phát triển thiên về tinh chỉnh mô hình hiện có thay vì huấn luyện từ đầu. Xu hướng gần đây càng củng cố điều này: DeepSeek mở mã nguồn mô hình của mình và giới thiệu công nghệ chưng cất mô hình (model distillation), truyền logic suy luận từ mô hình giáo viên (mô hình lớn) sang mô hình học sinh (mô hình nhỏ) nhằm tối ưu hóa nén tri thức và duy trì hiệu suất. Tương tự, phiên bản ChatGPT O3 của OpenAI cũng nhấn mạnh vào huấn luyện giai đoạn sau và học tăng cường. Bittensor cung cấp một nền tảng mở, phi tập trung, hỗ trợ cộng tác và chia sẻ mô hình AI. Vào tháng 7 năm 2024, Bittensor và Cerebras đã phát hành mô hình ngôn ngữ lớn (LLM) mã nguồn mở BTLM-3b-8k, đạt hơn 16.000 lượt tải trên Hugging Face, thể hiện rõ năng lực công nghệ của Bittensor.
Mặc dù ra mắt từ năm 2021, Bittensor hầu như không xuất hiện trong làn sóng AI Agent vào quý IV năm 2024, giá token cũng dậm chân tại chỗ. Ngày 13 tháng 2 năm 2025, Bittensor tung bản nâng cấp dTAO, nhằm tối ưu phát hành token, tăng tính công bằng và thanh khoản. Thay đổi này tương tự Virtuals Protocol ra mắt AI Agent LaunchPad, khiến vốn hóa thị trường $VIRTUAL tăng vọt 50 lần vào năm 2024.
Báo cáo "dTAO và sự tiến hóa của Bittensor: Tái cấu trúc hệ sinh thái AI mã nguồn mở thông qua động lực thúc đẩy theo thị trường" phân tích sâu tác động của bản nâng cấp dTAO hoàn thành ngày 13 tháng 2 đối với hệ sinh thái Bittensor, tập trung vào đổi mới kiến trúc, mô hình kinh tế và động lực tổng thể của hệ sinh thái.

Số lượng tài khoản trong hệ thống Bittensor tăng 100%, từ 100.000 vào đầu năm 2024 lên gần 200.000
1. Kiến trúc cơ bản của Bittensor
Hệ thống Bittensor gồm ba mô-đun chính:
-
Chuỗi Subtensor và lớp tương thích EVM (tao evm): Subtensor là chuỗi Layer1 được xây dựng trên SDK Substrate của Polkadot, chịu trách nhiệm quản lý lớp blockchain mạng Bittensor. Lớp tương thích EVM (tao evm) cho phép các nhà phát triển triển khai và chạy hợp đồng thông minh Ethereum trên mạng, nâng cao khả năng mở rộng và tương thích. Chuỗi Subtensor tạo khối mỗi 12 giây, mỗi khối tạo ra một token TAO. Ngoài ra, Subtensor ghi lại các hoạt động quan trọng trong subnet, bao gồm trọng số đánh giá của bộ xác thực và số lượng token đặt cược. Cứ sau 360 khối (khoảng 72 phút), thuật toán đồng thuận Yuma sẽ tính toán lượng token (Emissions) mà 64 subnet nhận được.
-
Subnet (mạng con): Mạng Bittensor bao gồm 64 subnet, mỗi subnet tập trung vào một loại mô hình AI hoặc ứng dụng cụ thể. Cấu trúc mô-đun này nâng cao hiệu quả và hiệu suất mạng, thúc đẩy chuyên môn hóa giữa các mô hình AI khác nhau. Cơ chế thưởng cho mỗi subnet do chủ sở hữu subnet thiết lập, quyết định cách phân bổ token giữa thợ đào và bộ xác thực. Ví dụ, subnet 1 do Quỹ Opentensor vận hành, nhiệm vụ là xử lý yêu cầu văn bản (Text Prompting). Trong subnet này, bộ xác thực đưa ra các yêu cầu giống ChatGPT, thợ đào trả lời dựa trên yêu cầu đó, bộ xác thực xếp hạng chất lượng câu trả lời của thợ đào, cập nhật trọng số định kỳ và tải lên chuỗi Subtensor. Chuỗi khối sẽ thực hiện tính toán đồng thuận Yuma và phân bổ lượng phát hành token cho subnet cứ sau 360 khối.
-
Subnet gốc (Root Subnet): Là lõi trung tâm của mạng, subnet gốc chịu trách nhiệm điều phối và quản lý hoạt động của tất cả các subnet, đảm bảo tính phối hợp và ổn định tổng thể cho toàn mạng.
Ngoài ra, API Bittensor đóng vai trò truyền dẫn và kết nối giữa bộ xác thực subnet và đồng thuận Yuma trên chuỗi khối Subtensor. Các bộ xác thực trong cùng một subnet chỉ kết nối với các thợ đào trong cùng subnet đó, không giao tiếp hay kết nối với thợ đào/bộ xác thực của subnet khác.
Thiết kế kiến trúc này giúp Bittensor tích hợp hiệu quả công nghệ blockchain và trí tuệ nhân tạo, tạo nên một hệ sinh thái AI phi tập trung và hiệu quả.

Lớp tương thích EVM tao evm của Subtensor chính thức ra mắt vào ngày 30 tháng 12 năm 2024, cho phép triển khai và tương tác với hợp đồng thông minh Ethereum mà không cần sửa đổi gì, đồng thời mọi thao tác EVM chỉ thực hiện trên chuỗi Subtensor, không tương tác với Ethereum. Điều này có nghĩa là các hợp đồng thông minh trên Bittensor bị giới hạn trong mạng Bittensor, không liên quan đến mainnet Ethereum. Hiện tại tao evm vẫn ở giai đoạn rất sơ khai, trong đó có dự án hệ sinh thái TaoFi, dự kiến phát triển hạ tầng DeFi dựa trên AI, bao gồm stablecoin đầu tiên được hỗ trợ bởi TAO, sàn giao dịch phi tập trung và phiên bản đặt cược thanh khoản cho token TAO.

1.1 Hệ thống tài khoản
1.1.1 Hệ thống hai khóa Coldkey-Hotkey
Hệ thống tài khoản dTAO sử dụng cơ chế hai khóa Coldkey-Hotkey để đảm bảo độ an toàn và linh hoạt cao hơn. Khi người dùng tạo ví, có thể chọn tạo ví qua tiện ích mở rộng Chrome hoặc theo cách cục bộ. Ví được tạo qua tiện ích mở rộng Chrome dùng để lưu trữ, gửi và nhận TAO, hệ thống sẽ tạo ra một coldkey (48 ký tự, thường bắt đầu bằng 5) và một cụm từ khôi phục 12 từ. Ví tạo theo cách cục bộ ngoài việc tạo coldkey còn tạo thêm hotkey, hotkey dùng để tham gia tạo subnet, đào mỏ và xác thực.
Lý do chính sử dụng hệ thống hai khóa là hotkey được dùng thường xuyên trong vận hành hàng ngày của subnet, đối mặt với các mối đe dọa an ninh tiềm tàng; trong khi coldkey chủ yếu dùng để lưu trữ và chuyển TAO, do đó giảm thiểu rủi ro mất TAO. Cơ chế bảo vệ kép này đảm bảo an toàn và linh hoạt trong các thao tác tài khoản.
Về liên kết: Một hotkey có thể liên kết với một coldkey trong cùng một subnet, nhưng cũng có thể liên kết với coldkey ở subnet khác (không khuyến nghị). Một coldkey có thể liên kết với nhiều hotkey.
1.1.2 Hệ thống UID subnet
1.1.2.1 Tạo UID subnet
Sau khi thanh toán phí đăng ký ít nhất 100 TAO, hệ thống sẽ tạo ra một UID subnet và liên kết nó với hotkey của bạn. UID này là điều kiện cần thiết để tham gia đào mỏ hoặc xác thực trong subnet. Để trở thành thợ đào, bạn chỉ cần có hotkey, coldkey và UID subnet, sau đó chạy Bittensor là có thể tham gia đào mỏ.
1.1.2.2 Yêu cầu để trở thành bộ xác thực
Để trở thành bộ xác thực subnet, phải đặt cược ít nhất 1000 TAO, và trong mỗi subnet, lượng đặt cược phải nằm trong top 64. Cần lưu ý rằng, bộ xác thực có thể nắm giữ nhiều khe UID, từ đó thực hiện xác thực trên nhiều subnet mà không cần tăng thêm lượng đặt cược (tương tự khái niệm restaking). Cơ chế này không chỉ giảm rủi ro hành vi xấu mà còn làm tăng chi phí cho hành vi xấu, vì đặt cược một lượng lớn TAO (ít nhất 1000 TAO) khiến chi phí cho hành vi xấu tăng mạnh. Để nâng cao khả năng cạnh tranh trong subnet, mỗi bộ xác thực đều nỗ lực xây dựng danh tiếng tốt và hồ sơ thành tích, thu hút thêm TAO ủy quyền đặt cược, từ đó đảm bảo vị trí ổn định trong top 64.
1.1.2.3 Cấu trúc và giới hạn dung lượng subnet
-
Subnet 1: Có tổng cộng 1024 khe UID, tối đa chứa 128 bộ xác thực; tổng số lượng bộ xác thực và thợ đào không vượt quá 1024.
-
Các subnet khác: Mỗi subnet có 256 khe UID, tối đa chứa 64 bộ xác thực; tổng số lượng bộ xác thực và thợ đào trong mỗi subnet không vượt quá 256.
1.1.2.4 Cạnh tranh và cơ chế thưởng trong subnet
Trong nội bộ subnet, bộ xác thực phân phối nhiệm vụ cho các thợ đào, tất cả thợ đào hoàn thành nhiệm vụ sẽ gửi kết quả về bộ xác thực tương ứng. Bộ xác thực đánh giá và xếp hạng chất lượng kết quả của từng thợ đào, thợ đào nhận thưởng TAO theo chất lượng công việc. Đồng thời, bộ xác thực cũng nhận được phần thưởng khuyến khích vì đảm bảo thợ đào chất lượng cao nhận được phần thưởng tốt hơn, thúc đẩy chất lượng toàn subnet liên tục được nâng cao. Toàn bộ quá trình cạnh tranh này được thực hiện tự động bởi cơ chế thưởng dưới dạng mã do người sáng tạo subnet thiết kế, đảm bảo hệ thống vận hành công bằng và hiệu quả.
Mỗi subnet có thời gian bảo vệ 7 ngày (thời gian miễn dịch), bắt đầu tính từ lúc thợ đào đăng ký UID subnet. Trong thời gian này, thợ đào sẽ tích lũy phần thưởng của mình. Nếu trong thời gian bảo vệ có thợ đào mới đăng ký, trong khi khe UID của subnet đã đầy, thì thợ đào có phần thưởng tích lũy thấp nhất sẽ bị loại bỏ, UID của họ sẽ được phân bổ lại cho thợ đào mới đăng ký.

1.2 Subnet xây dựng hệ sinh thái đa tầng
Subnet Bittensor xây dựng một hệ sinh thái đa tầng, trong đó thợ đào, bộ xác thực, người sáng tạo subnet và người tiêu dùng đảm nhận các vai trò riêng, cùng thúc đẩy việc tạo ra dịch vụ AI chất lượng cao.
Thợ đào (Miners): Là các nút tính toán cốt lõi của mạng, thợ đào lưu trữ mô hình AI, cung cấp dịch vụ suy luận và huấn luyện. Họ cạnh tranh để đạt được thưởng TAO bằng cách tối thiểu hóa hàm mất mát và điểm số xếp hạng điểm-điểm. Thành công của thợ đào phụ thuộc vào chất lượng và hiệu suất dịch vụ họ cung cấp.
Bộ xác thực (Validators): Bộ xác thực chịu trách nhiệm đánh giá kết quả nhiệm vụ do thợ đào nộp, xây dựng ma trận tin cậy, ngăn chặn gian lận cấu kết, đảm bảo thợ đào chất lượng cao nhận được phần thưởng cao hơn. Họ xếp hạng theo chất lượng phản hồi của thợ đào, xếp hạng càng chính xác và nhất quán thì bộ xác thực nhận được thưởng càng nhiều.
Người sáng tạo subnet (Subnet Creators): Người sáng tạo subnet thiết kế subnet tùy chỉnh theo nhu cầu lĩnh vực ứng dụng cụ thể (như xử lý ngôn ngữ tự nhiên, thị giác máy tính,...), xây dựng cơ chế đồng thuận độc lập, quy trình nhiệm vụ và cấu trúc thưởng. Họ đảm nhận vai trò quản trị viên mạng, có quyền phân bổ phần thưởng thông qua subnet riêng của mình.
Người tiêu dùng (Consumers): Người tiêu dùng trả token TAO để gọi dịch vụ AI, thực hiện truy vấn API, lấy dữ liệu huấn luyện hoặc tận dụng tài nguyên tính toán để huấn luyện mô hình. Họ là người dùng cuối cùng của các mô hình AI do Bittensor cung cấp.
Quy trình tổng thể là: Bộ xác thực subnet tạo câu hỏi và phân phát cho tất cả thợ đào, thợ đào tạo ra câu trả theo nhiệm vụ và gửi lại cho bộ xác thực. Bộ xác thực đánh giá theo chất lượng câu trả và cập nhật trọng số cho thợ đào, sau đó định kỳ tải trọng số lên chuỗi. Thông qua cạnh tranh khốc liệt và cơ chế chọn lọc, liên tục thúc đẩy tiến bộ kỹ thuật và tối ưu hóa hệ sinh thái trong subnet.
1.2.1 Lớp thợ đào
Thợ đào đóng vai trò là nút tính toán cốt lõi trong mạng Bittensor, trách nhiệm chính bao gồm:
-
Lưu trữ mô hình AI, cung cấp dịch vụ suy luận hoặc huấn luyện: Thợ đào lưu trữ mô hình học máy cục bộ, cung cấp dịch vụ dự đoán cho các ứng dụng khách. Khi ứng dụng khách cần dự đoán, sẽ gửi yêu cầu đến mạng Bittensor, mạng định tuyến yêu cầu tới thợ đào đã đăng ký là nhà cung cấp dịch vụ. Thợ đào xử lý yêu cầu và trả kết quả dự đoán cho khách hàng.
-
Cạnh tranh trong bảng xếp hạng P2P để kiếm token TAO như phần thưởng tính toán: Thợ đào cạnh tranh trong bảng xếp hạng điểm-điểm theo hiệu suất mô hình và đóng góp cho mạng để nhận thưởng token TAO. Cơ chế thưởng này khuyến khích thợ đào liên tục tối ưu hiệu suất mô hình, cung cấp dịch vụ AI chất lượng cao cho mạng.
-
Đảm bảo đóng góp mô hình AI chất lượng cao: Thợ đào nỗ lực cung cấp mô hình AI chất lượng cao để đáp ứng nhu cầu mạng và đảm bảo chất lượng dịch vụ. Việc này không chỉ giúp họ đạt thứ hạng cao hơn và nhận thưởng nhiều hơn trong mạng, mà còn nâng cao hiệu suất và độ tin cậy tổng thể của toàn mạng Bittensor.
Bằng cách thực hiện các trách nhiệm này, thợ đào đóng góp quan trọng cho hoạt động hiệu quả và phát triển của mạng Bittensor.
Mỗi thợ đào fix được huấn luyện trên tập dữ liệu D, nhằm tối thiểu hóa hàm mất mát Li=EDQfix
Trong đó:
-
Qfix là hàm lỗi
-
ED biểu thị kỳ vọng trên tập dữ liệu D.
Ví dụ, nếu thợ đào A cung cấp mô hình nhận dạng giọng nói fAx, hàm mất mát của nó có thể là:

Hàm mất mát LA thấp hơn (tức hiệu suất mô hình tốt hơn) sẽ dẫn đến thứ hạng cao hơn trong đánh giá P2P.
Đóng góp của mỗi thợ đào được đo bằng thông tin Fisher (FIM): Ri=WT⋅S
Trong đó:
-
W là ma trận trọng số biểu thị điểm số P2P giữa các thợ đào.
-
S là lượng đặt cược (sở hữu) của thợ đào trong mạng.
Nếu thợ đào A và B đánh giá lẫn nhau, ma trận trọng số là:

Xếp hạng cuối cùng của thợ đào A là:

Nếu thợ đào A có mô hình AI chất lượng cao, thì wB,A sẽ rất cao, dẫn đến RA cao hơn, từ đó nhận được nhiều thưởng hơn.
Lớp bộ xác thực
Bộ xác thực đảm bảo đánh giá công bằng mô hình AI của thợ đào, ngăn chặn cấu kết và hành vi ác ý. Họ đóng vai trò là "trọng tài" trong mạng, đảm bảo dịch vụ AI chất lượng cao.
Bộ xác thực xếp hạng thợ đào bằng cách tính toán ma trận tin cậy:

-
ci là điểm tin cậy của thợ đào i.
-
tj,i biểu thị mức độ tin tưởng của thợ đào j đối với thợ đào i.
-
sj là lượng đặt cược của thợ đào j.
-
là hàm Sigmoid, dùng để căn chỉnh mượt.
Ví dụ, giả sử trong mạng có ba thợ đào A, B, C, ma trận tin cậy là:

-
Nếu thợ đào A có mô hình hoạt động tốt, thì thợ đào B và C đều tin tưởng A rất cao.
-
Nếu mô hình của thợ đào C bình thường, thì chỉ có thợ đào B hơi tin tưởng C.
Do đó, thợ đào A sẽ nhận được điểm tin cậy cA cao hơn, từ đó nhận được nhiều thưởng hơn, trong khi điểm của thợ đào C thấp hơn.
1.2.2 Lớp người tiêu dùng
Trong mạng Bittensor, người tiêu dùng là người dùng cuối hoặc doanh nghiệp, trả token TAO để truy cập dịch vụ trí tuệ nhân tạo (AI) do thợ đào cung cấp. Mô hình này cho phép người tiêu dùng tận dụng khả năng AI trong mạng mà không cần sở hữu hoặc duy trì mô hình AI riêng, giảm chi phí tính toán AI.
Các trường hợp ứng dụng cụ thể của người tiêu dùng bao gồm:
-
Nhà phát triển truy vấn API AI: Nhà phát triển có thể gọi các giao diện AI do Bittensor cung cấp, lấy dịch vụ trí tuệ cần thiết, dùng để phát triển ứng dụng hoặc tích hợp chức năng.
-
Cơ quan nghiên cứu truy cập tập dữ liệu huấn luyện AI: Các cơ quan nghiên cứu có thể tận dụng tài nguyên trong mạng để truy cập và phân tích các tập dữ liệu huấn luyện AI lớn, hỗ trợ các dự án nghiên cứu và thí nghiệm.
-
Doanh nghiệp tận dụng tài nguyên tính toán của Bittensor để huấn luyện mô hình AI: Doanh nghiệp có thể dựa vào tài nguyên tính toán phi tập trung của Bittensor để huấn luyện và tối ưu mô hình AI riêng, nâng cao mức độ thông minh trong kinh doanh.
Thông qua cách này, Bittensor cung cấp con đường linh hoạt và hiệu quả để người tiêu dùng tiếp cận dịch vụ AI, thúc đẩy phổ biến và ứng dụng trí tuệ nhân tạo.
1.2.3 Cơ chế đồng thuận dựa trên đặt cược
Cơ chế đồng thuận dựa trên đặt cược của Bittensor giải quyết chủ yếu các vấn đề sau:
-
Ngăn chặn thao túng điểm số ác ý, đảm bảo đánh giá công bằng: Lặp lại điều chỉnh w==fw điều chỉnh bất kỳ trọng số nào lệch quá xa khỏi đồng thuận (tức trung bình trọng số theo lượng đặt cược w), từ đó giảm ảnh hưởng của việc tự đánh giá quá mức từ đối thủ.
-
Thưởng cho những người đóng góp AI chất lượng cao: Những bộ xác thực liên tục đóng góp đầu ra chất lượng cao, ngay cả sau khi điều chỉnh trọng số, vẫn giữ thứ hạng cao vì trọng số họ báo cáo gần với giá trị đồng thuận.
Mô hình trò chơi dựa trên đặt cược
Chúng ta coi mô hình đồng thuận là một trò chơi hai người:
-
Phía trung thực (nhân vật chính) đặt cược: SH với 0.5
-
Phía đối thủ (đối phương) đặt cược: 1-SH
Hai bên cạnh tranh phần thưởng cố định: eH+eC=1, trong đó eH và eC lần lượt là phần thưởng của phía trung thực và đối phương.
Sau khi phân bổ phần thưởng, lượng đặt cược được cập nhật thành:

Phía trung thực tự phân bổ trọng số wH, và phân bổ 1-wH cho đối phương.
Ngược lại, đối phương có thể tự do chọn trọng số tự phân bổ wC, không tốn chi phí, nhằm tối đa hóa chi phí trọng số của phía trung thực:

Hãy tưởng tượng giám khảo trong cuộc thi. Giám khảo trung thực cho điểm công bằng, trong khi giám khảo ác ý (đối phương) có thể cho điểm quá cao nhân tạo cho thí sinh họ ưa thích, buộc phía trung thực phải nỗ lực nhiều hơn để giữ tính cạnh tranh.
Vì lợi ích của phía trung thực chiếm đa số (sH>0.5), họ có thể thực hiện chiến lược đồng thuận ẩn danh π, điều chỉnh tất cả trọng số khi chưa biết danh tính người chơi, nhằm tối ưu cân bằng Nash:

Mục tiêu là điều chỉnh trọng số sao cho trọng số sau điều chỉnh thỏa mãn:

Từ đó sửa lỗi

Chiến lược đồng thuận cơ bản được định nghĩa là:

Trong đó, trọng số đồng thuận w là trung bình cộng theo trọng số đặt cược:

Sau đó lặp lại chiến lược này:

Trong đó là số lần lặp.
Có thể so sánh với một cái cân hiệu chuẩn chính xác. Nếu trọng số ở một bên quá cao, hệ thống sẽ điều chỉnh lặp đi lặp lại cho đến khi cân bằng trở lại. Ví dụ, khi SH=0.6 và wH ban đầu=1, sau nhiều lần lặp, ngay cả khi đối phương vẫn báo wC cao (ví dụ wC=0.8), chi phí thực tế của phía trung thực cũng sẽ giảm xuống dưới 0.75,

1.2.3.1 Xử lý mượt và tiến hóa mật độ
Để tránh điều chỉnh đột ngột gây mất ổn định hệ thống, hàm điều chỉnh sử dụng "xử lý mượt". Chúng ta định nghĩa độ lệch tuyệt đối trung bình theo trọng số đặt cược là:

Sau đó, điều chỉnh mượt được cho bởi công thức sau:

Trong đó (do tham số (0≤α<1) kiểm soát) quyết định mức độ mượt.
Việc điều chỉnh mượt này tương tự như người lái phanh nhẹ nhàng khi vào cua, chứ không phải đạp phanh gấp. Cách điều chỉnh dần dần này đảm bảo các chênh lệch trọng số nhỏ được điều chỉnh nhẹ nhàng, từ đó giữ ổn định tổng thể hệ thống.
Khi mở rộng sang trò chơi hai đội (với |H| là người chơi trung thực, |C| là người chơi đối kháng), phân bố trọng số của mỗi đội có thể được mô tả bằng hàm mật độ pw. Ví dụ, với người chơi trung thực, giả sử trọng số tuân theo phân bố chuẩn:

Phân bố của người chơi đối kháng tương tự. Phân bố mật độ tổng thể của đội trung thực và đội đối kháng là:

Sau đó áp dụng hàm tiến hóa mật độ:

Trong đó gw=f-1w. Sau η vòng lặp, thứ hạng cuối cùng của mỗi người chơi là: r_i = \int f^\eta\Bigl(p_i(w)\Bigr)\, dw .

Quá trình này tương tự như "làm mịn thống kê" trên tập dữ liệu lớn. Sau nhiều vòng "làm mịn", thứ hạng thực sự của mỗi người tham gia được thể hiện rõ. Chìa khóa là tiến hóa mật độ có thể "nén" trọng số bất thường (tức trọng số quá cao của người chơi đối kháng) nhiều hơn, trong khi ảnh hưởng ít hơn đến người chơi trung thực.
1.2.3.2 Cơ chế tin cậy trọng số và phòng chống lỗ hổng trọng số bằng 0
Để ngăn người chơi đối kháng báo trọng số gần bằng 0 nhằm tránh phạt, đã giới thiệu "cơ chế tin cậy trọng số". Định nghĩa giá trị tin cậy T là: T=(W>0)S
Tức là tổng quyền lợi được gán trọng số khác 0. Sau đó, áp dụng ngưỡng mượt:
C = \Bigl(1+\exp\bigl(-\rho (T-\kappa)\bigr)\Bigr)^{-1}.
Cơ chế này đảm bảo: Nếu đa số coi trọng số của một nút là 0, thì phần thưởng của nó sẽ bị cắt giảm mạnh.
Tương tự như hệ thống uy tín cộng đồng —— chỉ khi đa số thành viên công nhận một người đáng tin thì người đó mới nhận được toàn bộ lợi ích; ngược lại, hành vi cố gắng thao túng hệ thống bằng cách báo trọng số 0 sẽ bị phạt.
Các thách thức hiện tại bao gồm:
-
Lỗ hổng trọng số bằng 0: Người chơi đối kháng có thể báo trọng số cực thấp hoặc bằng 0 để lợi dụng lỗ hổng phân bổ phần thưởng.
-
Điều chỉnh mất cân bằng: Trong một số trường hợp, điều chỉnh có thể quá quyết liệt hoặc quá nhẹ, dẫn đến sai lệch đồng thuận.
-
Độ phức tạp tính toán cao: Tiến hóa mật độ và nhiều lần lặp đòi hỏi chi phí On2, có thể gây gánh nặng cho môi trường blockchain.
Bản nâng cấp dtao đã cải thiện các vấn đề trên, cụ thể bao gồm:
-
Tối ưu lặp và xử lý mượt: Tăng số lần lặp η, tinh chỉnh các tham số mượt α hoặc δ, từ đó giảm lỗ hổng trọng số bằng 0 và ngăn điều chỉnh quá mức.
-
Tăng cường cơ chế tin cậy trọng số: Phát hiện chính xác hơn trọng số khác 0, và áp dụng ngưỡng nghiêm ngặt hơn, đảm bảo chỉ những nút được đa số công nhận mới nhận được phần thưởng đầy đủ.
-
Giảm chi phí tính toán: Thông qua tối ưu thuật toán giảm chi phí tính toán, phù hợp với giới hạn tính toán blockchain, đồng thời không ảnh hưởng đến độ chính xác lý thuyết.
Cơ chế đồng thuận dựa trên quyền lợi của Bittensor kết hợp mô hình toán học và công cụ lý thuyết trò chơi, thông qua các phương pháp như công thức cập nhật, trung bình cộng trọng số đồng thuận, điều chỉnh lặp, tiến hóa mật độ, hệ thống có thể tự động hiệu chỉnh sai lệch trọng số bất thường, đảm bảo phân bổ phần thưởng cuối cùng công bằng.
Quá trình này tương tự như hệ thống cân bằng thông minh hoặc cơ chế uy tín, có thể tự hiệu chỉnh liên tục, đảm bảo đánh giá công bằng, thưởng cho người đóng góp xuất sắc, và ngăn chặn cấu kết ác ý và thao túng phiếu bầu.
Dựa trên điều này, bản nâng cấp dtao sử dụng kiểm soát mượt tinh tế hơn và chiến lược tin cậy trọng số được cải thiện, tiếp tục nâng cao tính vững chắc và công bằng của hệ thống. Do đó, trong môi trường đối kháng, người đóng góp trung thực luôn có thể duy trì lợi thế cạnh tranh, đồng thời tiêu thụ tài nguyên tính toán tổng thể cũng được tối ưu và giảm xuống.
2. Đồng thuận Yuma: Động lực và đồng thuận có thể lập trình động
Bitcoin xây dựng mạng lưới sức mạnh tính toán ngang hàng lớn nhất thế giới, bất kỳ ai cũng có thể duy trì sổ cái toàn cầu bằng cách đóng góp sức mạnh tính toán cục bộ. Quy tắc thưởng của nó đã được cố định khi thiết kế, dẫn đến hệ sinh thái phát triển theo cách tương đối tĩnh.
Ngược lại, đồng thuận Yuma (YC) là một khuôn khổ thưởng động, có thể lập trình. Khác với cơ chế thưởng tĩnh của Bitcoin, YC tích hợp trực tiếp hàm mục tiêu, thưởng đặt cược và cơ chế điều chỉnh trọng số vào quá trình đồng thuận. Điều này có nghĩa là hệ thống không chỉ vận hành dựa trên quy tắc cố định, mà còn điều chỉnh động theo đóng góp thực tế và hành vi của nút, từ đó đạt được phân bổ phần thưởng công bằng và hiệu quả hơn.
Thuật toán đồng thuận YC liên tục chạy trên chuỗi khối Subtensor và vận hành độc lập cho từng subnet. Quy trình làm việc chính bao gồm các thành phần sau:
-
Véc-tơ trọng số của bộ xác thực subnet: Mỗi bộ xác thực subnet duy trì một véc-tơ trọng số, trong đó mỗi phần tử đại diện cho trọng số đánh giá mà bộ xác thực đó phân bổ cho tất cả thợ đào subnet. Trọng số này dựa trên hiệu suất lịch sử của bộ xác thực, dùng để xếp hạng thợ đào. Ví dụ, nếu véc-tơ đánh giá của một bộ xác thực là w=wn, thì thứ hạng nhận được phản ánh đánh giá của bộ xác thực đó về mức độ đóng góp của từng thợ đào.
-
Ảnh hưởng của số tiền đặt cược: Mỗi bộ xác thực và thợ đào trên chuỗi đều đặt cược một lượng token nhất định. Đồng thuận YC kết hợp véc-tơ trọng số và số tiền đặt cược để tính toán phân bổ phần thưởng. Nghĩa là, phần thưởng cuối cùng không chỉ phụ thuộc vào trọng số đánh giá mà còn phụ thuộc vào số lượng đặt cược, từ đó tạo thành vòng khép kín "đặt cược → trọng số → thưởng".
-
Đồng thuận chủ quan động: Mỗi người tham gia phân bổ trọng số cục bộ cho mô hình học máy của mình. Những trọng số cục bộ này được điều chỉnh thông qua chiến lược đồng thuận, sau đó tập hợp trên blockchain thành chỉ số toàn cục. Nói cách khác, YC có thể đạt được đồng thuận quy mô lớn ngay cả trong môi trường đối kháng, và có thể thích nghi động với sự thay đổi hành vi nút.
-
Tính toán và phân bổ phần thưởng: Bộ xác thực subnet thu thập kết quả xếp hạng riêng của mình và nộp chúng làm đầu vào tập thể cho thuật toán YC. Mặc dù thứ hạng từ các bộ xác thực khác nhau có thể đến vào thời điểm khác nhau, Subtensor xử lý tất cả dữ liệu xếp hạng khoảng mỗi 12 giây. Dựa trên dữ liệu này, hệ thống tính toán phần thưởng (theo TAO) và gửi vào ví của thợ đào và bộ xác thực subnet.
Cơ chế tổng hợp này cho phép YC liên tục và công bằng phân bổ phần thưởng trong mạng phi tập trung, thích nghi động với chất lượng đóng góp, duy trì an toàn và hiệu quả tổng thể mạng.
2.1 Chưng cất tri thức và Hỗn hợp chuyên gia (MoE): Học tập hợp tác và đánh giá đóng góp hiệu quả
2.1.1 Chưng cất tri thức (Digital Hivemind)
Bittensor giới thiệu khái niệm chưng cất tri thức, tương tự như sự hợp tác của các nơ-ron trong não người, các nút thông qua chia sẻ tri thức, trao đổi mẫu dữ liệu và tham số mô hình để học tập tập thể.
Trong quá trình này, các nút liên tục trao đổi dữ liệu và tham số mô hình, hình thành một mạng lưới tự tối ưu theo thời gian, nhằm đạt dự đoán chính xác hơn. Mỗi nút đóng góp tri thức của mình vào hồ chia sẻ, cuối cùng nâng cao hiệu suất tổng thể toàn mạng, khiến nó nhanh hơn, phù hợp hơn với ứng dụng học thời gian thực như robot và xe tự lái.

Điều quan trọng là, phương pháp này hiệu quả giảm nguy cơ quên lãng thảm khốc —— một thách thức phổ biến trong học máy. Các nút có thể kết hợp hiểu biết mới trong khi vẫn giữ và mở rộng tri thức hiện có, từ đó tăng tính vững chắc và thích nghi của mạng.
Bằng cách phân bố tri thức trên nhiều nút, mạng TAO Bittensor trở nên kiên cường hơn trước sự can thiệp và rò rỉ dữ liệu tiềm tàng. Sự vững chắc này đặc biệt quan trọng đối với các ứng dụng xử lý dữ liệu cực kỳ an toàn và nhạy cảm về quyền riêng tư (như thông tin tài chính và y tế).

2.1.2 Hỗn hợp chuyên gia (MoE)
Bittensor sử dụng mô hình chuyên gia phân tán (MoE) để tối ưu dự đoán AI, thông qua sự hợp tác của nhiều mô hình AI chuyên biệt, nâng cao đáng kể độ chính xác và hiệu quả giải quyết vấn đề phức tạp. Ví dụ, khi tạo mã Python có chú thích tiếng Tây Ban Nha, mô hình đa ngôn ngữ và mô hình chuyên về mã có thể phối hợp, tạo ra kết quả chất lượng cao vượt xa mô hình đơn lẻ.

Lõi giao thức Bittensor gồm các hàm tham số hóa, thường gọi là neuron, các neuron này phân bố theo kiểu điểm-điểm, mỗi neuron ghi lại không hoặc nhiều trọng số mạng, và đánh giá giá trị nút lân cận bằng cách xếp hạng điểm-điểm để huấn luyện mạng thần kinh, sau đó tích lũy điểm xếp hạng vào sổ cái kỹ thuật số. Các nút xếp hạng cao không chỉ nhận thưởng tiền tệ mà còn nhận trọng số bổ sung, từ đó thiết lập liên kết trực tiếp giữa đóng góp nút và thưởng, nâng cao tính công bằng và minh bạch của mạng. Cơ chế này xây dựng một thị trường, cho phép các hệ thống tình báo khác định giá thông tin theo cách điểm-điểm qua Internet, và khuyến khích các nút liên tục nâng cao tri thức và năng lực chuyên môn của mình. Để đảm bảo phân bổ thưởng công bằng, Bittensor mượn giá trị Shapley từ lý thuyết trò chơi hợp tác, cung cấp phương pháp phân bổ thưởng hiệu quả giữa các bên dựa trên đóng góp nút. Dưới đồng thuận YC, bộ xác thực đánh giá và xếp hạng các mô hình chuyên biệt, và phân bổ thưởng công bằng theo nguyên lý giá trị Shapley, từ đó tiếp tục nâng cao an toàn, hiệu quả và khả năng cải tiến liên tục của mạng.
3. Bản nâng cấp dtao
Dự án Bittensor tồn tại các vấn đề chính sau trong thiết kế phân bổ tài nguyên và mô hình kinh tế:
-
Trùng lặp và dư thừa tài nguyên: Nhiều subnet tập trung vào nhiệm vụ tương tự, như tạo hình ảnh từ văn bản, gợi ý văn bản và dự đoán giá, dẫn đến phân bổ tài nguyên trùng lặp và lãng phí.
-
Thiếu trường hợp sử dụng thực tế: Một số subnet (như dự đoán giá hoặc dự đoán kết quả thể thao) chưa chứng minh được tính hữu ích trong các kịch bản thực tế, có thể dẫn đến đầu vào tài nguyên không khớp với nhu cầu thực tế.
-
Hiện tượng "tiền xấu đuổi tiền tốt": Subnet chất lượng cao có thể khó nhận đủ vốn và không gian phát triển. Vì chỉ có thời gian bảo vệ 7 ngày, các subnet không nhận được sự hỗ trợ đầy đủ từ bộ xác thực gốc có thể bị loại bỏ quá sớm.
-
Tập trung hóa bộ xác thực và thiếu động lực cho subnet mới:
-
Bộ xác thực gốc có thể không đại diện đầy đủ cho tất cả người nắm giữ TAO, kết quả đánh giá của họ có thể không phản ánh quan điểm rộng rãi. Dưới đồng thuận Yuma, bộ xác thực hàng đầu chiếm ưu thế trong điểm số cuối cùng, nhưng đánh giá của họ không phải lúc nào cũng khách quan. Ngay cả khi phát hiện thiên vị, cũng có thể không thể sửa ngay lập tức.
-
Hơn nữa, bộ xác thực thiếu động lực di chuyển sang subnet mới, vì chuyển từ subnet cũ phát hành nhiều sang subnet mới phát hành ít có thể dẫn đến mất phần thưởng tức thì. Sự không chắc chắn về việc subnet mới có thể đạt được lượng phát hành token như subnet đã thiết lập hay không, tiếp tục làm giảm ý chí di chuyển của họ.
Các vấn đề chính trong mô hình kinh tế:
Một vấn đề trong thiết kế cơ chế của Bittensor là mặc dù tất cả người tham gia đều nhận được TAO, nhưng thực tế không ai trả TAO, dẫn đến áp lực bán tháo liên tục. Hiện tại, các câu hỏi mà thợ đào trả lời không do người dùng thực sự đưa ra, mà do chủ sở hữu subnet cung cấp —— hoặc mô phỏng truy vấn người dùng thực tế, hoặc dựa trên nhu cầu người dùng lịch sử. Do đó, ngay cả khi câu trả lời của thợ đào có giá trị, giá trị đó cũng bị chủ sở hữu subnet chiếm đoạt. Cho dù câu trả lời của thợ đào giúp chủ sở hữu subnet cải thiện thuật toán mô hình của họ, hay trực tiếp được chủ sở hữu subnet sử dụng để huấn luyện mô hình nâng cao sản phẩm của họ, giá trị do thợ đào và bộ xác thực tạo ra đều bị chủ sở hữu subnet chiếm hữu. Về lý thuyết, chủ sở hữu subnet nên trả tiền cho giá trị này.
Hơn nữa, chủ sở hữu subnet không chỉ không phải chịu bất kỳ chi phí nào, mà còn được hưởng 18% lượng phát hành subnet. Điều này có nghĩa là hệ sinh thái Bittensor không gắn kết chặt chẽ —— người tham gia duy trì liên kết lỏng lẻo dựa trên phát triển và hợp tác. Các dự án trên subnet có thể rút lui bất cứ lúc nào mà không chịu tổn thất nào (vì phí đăng ký subnet sẽ được hoàn lại). Hiện tại, cơ chế chính để thu hồi token trong hệ thống Bittensor là phí đăng ký do thợ đào và bộ xác thực subnet trả; tuy nhiên, các phí này rất ít, không đủ để hỗ trợ bắt giá trị hiệu quả. Mặc dù đặt cược đã trở thành cơ chế chính, nhưng số lượng TAO thu hồi qua phí giao dịch blockchain và phí đăng ký vẫn còn hạn chế.
Đặt cược chia thành hai hình thức:
-
Đặt cược bộ xác thực: Người tham gia đặt cược TAO để hỗ trợ an ninh mạng và nhận thưởng, chiếm 75% tổng lượng TAO phát hành. Bộ xác thực hiện tại nhận khoảng 3.000 TAO mỗi ngày, tỷ suất hoàn vốn hàng năm trên 15%. Tuy nhiên, sau lần giảm phát đầu tiên, phân bổ này sẽ giảm xuống 1.500 TAO mỗi ngày, làm giảm sức hấp dẫn của việc đặt cược, làm suy yếu hiệu quả cân bằng cung-cầu token.
-
Đặt cược đăng ký subnet: Việc tăng subnet mới ảnh hưởng đáng kể đến nguồn cung TAO. Đây là một thách thức vì tổng lượng phát hành TAO là cố định; việc tăng số lượng subnet sẽ làm loãng phần thưởng của tất cả subnet, khiến subnet hiện tại khó duy trì hoạt động, có thể dẫn đến một số subnet rút khỏi mạng.
Các vấn đề này cho thấy thiết kế phân bổ tài nguyên và mô hình kinh tế của Bittensor cần được tối ưu hóa thêm để đảm bảo phát triển bền vững và động lực công bằng cho mạng.
3.1 dtao là gì
dTAO là một cơ chế thưởng sáng tạo do mạng Bittensor đề xuất, nhằm giải quyết vấn đề hiệu quả phân bổ tài nguyên thấp trong mạng phi tập trung. Nó từ bỏ cách thức truyền thống do bộ xác thực bỏ phiếu thủ công quyết định phân bổ tài nguyên, mà thay vào đó giới thiệu cơ chế điều chỉnh theo động lực thị trường, liên kết trực tiếp việc phân bổ lượng phát hành TAO giữa các subnet với hiệu suất thị trường của token subnet, thông qua thiết kế hồ thanh khoản nhúng khuyến khích người dùng thế chấp TAO để đổi lấy token subnet, từ đó hỗ trợ các subnet hiệu suất cao.
Đồng thời, áp dụng mô hình phát hành công bằng đảm bảo token subnet được phân bổ dần dần, buộc nhóm phải đóng góp dài hạn để nhận được phần thưởng token, và cân bằng vai trò bộ xác thực và người dùng, bộ xác thực giống như nhà đầu tư mạo hiểm nghiêm ngặt đánh giá công nghệ và tiềm năng thị trường của nhóm, trong khi người dùng thông qua đặt cược và giao dịch thị trường tiếp tục thúc đẩy hình thành giá trị subnet.
3.1.1 Cơ chế cốt lõi của dtao
3.1.1.1 Gắn bó mạnh mẽ bộ xác thực và nhóm với hệ sinh thái: Muốn nhận thưởng phải đầu tư trước vào token subnet
Thiết kế dTAO dựa trên động lực kép thị trường và công nghệ, mỗi subnet được cấu hình một hồ thanh khoản gồm TAO và token subnet. Khi người nắm giữ $TAO (bộ xác thực và chủ sở hữu subnet) thực hiện thao tác đặt cược, tương đương với việc dùng $TAO mua $dTAO tương ứng, số lượng $dTAO có thể đổi được được tính theo công thức sau:

Khi đổi, cơ chế định giá giữa $TAO và $dTAO tuân theo công thức tích hằng số giống Uniswap V2: τ*α=K
Trong đó, τ đại diện cho số lượng $TAO, α đại diện cho số lượng $dTAO. Trong điều kiện không có dòng thanh khoản bổ sung, bất kể dùng bao nhiêu $TAO đổi $dTAO hay bao nhiêu $dTAO đổi $TAO, giá trị K sẽ giữ nguyên. Ngược lại, khi người nắm giữ $dTAO thực hiện tháo cọc, tương đương với việc dùng $dTAO mua $TAO, số lượng $TAO có thể đổi được được tính theo công thức sau:

Kh
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












