
Công nghệ vân tay: Đạt được khả năng tạo doanh thu bền vững cho AI mã nguồn mở ở tầng mô hình
Tuyển chọn TechFlowTuyển chọn TechFlow

Công nghệ vân tay: Đạt được khả năng tạo doanh thu bền vững cho AI mã nguồn mở ở tầng mô hình
Bằng cách giới thiệu cơ chế nền tảng "dấu vân tay", chúng tôi đang tái định nghĩa cách thức thương mại hóa và bảo vệ AI mã nguồn mở.
Tác giả: Sentient China Hoa Ngữ
Sứ mệnh của chúng tôi là tạo ra các mô hình AI phục vụ trung thành cho 8 tỷ con người trên toàn cầu.
Đây là một mục tiêu đầy tham vọng – có thể làm dấy lên những nghi vấn, khơi gợi tò mò, thậm chí khiến người ta cảm thấy lo sợ. Nhưng chính điều này mới là bản chất của đổi mới ý nghĩa: vượt qua giới hạn khả năng, thách thức xem con người có thể đi xa đến đâu.
Trung tâm của sứ mệnh này là khái niệm "AI Trung thành (Loyal AI)" – một tư tưởng hoàn toàn mới dựa trên ba trụ cột: Quyền sở hữu (Ownership), Quyền kiểm soát (Control) và Sự nhất quán (Alignment). Ba nguyên tắc này định nghĩa liệu một mô hình AI có thực sự "trung thành" hay không: vừa trung thành với người sáng tạo, vừa trung thành với cộng đồng mà nó phục vụ.
AI Trung thành là gì?
Nói một cách đơn giản,
Trung thành = Quyền sở hữu + Quyền kiểm soát + Sự nhất quán.
Chúng tôi định nghĩa "trung thành" như sau:
-
Mô hình trung thành với người sáng tạo và mục đích sử dụng do người sáng tạo đặt ra;
-
Mô hình trung thành với cộng đồng sử dụng nó.

Công thức ở trên thể hiện mối quan hệ giữa ba chiều kích của sự trung thành, cũng như cách chúng hỗ trợ cho hai định nghĩa nêu trên.
Ba trụ cột của sự trung thành
Khung nền tảng cốt lõi của AI Trung thành bao gồm ba trụ cột – vừa là nguyên tắc, vừa là kim chỉ nam để đạt được mục tiêu:
🧩 1. Quyền sở hữu (Ownership)
Người sáng tạo phải có thể chứng minh một cách xác minh được quyền sở hữu mô hình, đồng thời có thể bảo vệ hiệu quả quyền đó.
Trong môi trường mã nguồn mở ngày nay, gần như không thể xác lập quyền sở hữu mô hình. Một khi mô hình được công khai mã nguồn, bất kỳ ai cũng có thể sửa đổi, tái phân phối, thậm chí giả mạo là của mình mà không có cơ chế bảo vệ nào.
🔒 2. Quyền kiểm soát (Control)
Người sáng tạo phải có thể kiểm soát cách thức sử dụng mô hình, bao gồm ai được dùng, dùng như thế nào, và dùng khi nào.
Tuy nhiên, trong hệ thống mã nguồn mở hiện hành, việc mất quyền sở hữu thường cũng đồng nghĩa với việc mất quyền kiểm soát. Chúng tôi đã giải quyết vấn đề này bằng đột phá công nghệ – khiến chính mô hình có thể tự xác minh mối quan hệ sở hữu – từ đó trao cho người sáng tạo quyền kiểm soát thực sự.
🧭 3. Sự nhất quán (Alignment)
Sự trung thành không chỉ thể hiện ở việc trung thành với người sáng tạo, mà còn phải thể hiện ở sự phù hợp với các giá trị của cộng đồng.
Các mô hình LLM ngày nay thường được huấn luyện bằng lượng dữ liệu khổng lồ từ Internet, thậm chí mâu thuẫn lẫn nhau, dẫn đến kết quả là – chúng "bình quân hóa" mọi quan điểm, dù mang tính phổ quát nhưng chưa chắc đại diện cho giá trị của bất kỳ cộng đồng cụ thể nào.
Nếu bạn không đồng tình với mọi quan điểm trên Internet, thì bạn không nên tin tưởng mù quáng vào các mô hình lớn đóng nguồn của một công ty lớn nào đó.
Chúng tôi đang phát triển một phương án nhất quán theo định hướng "cộng đồng" hơn:
Mô hình sẽ liên tục phát triển dựa trên phản hồi từ cộng đồng, động thái duy trì sự nhất quán với các giá trị tập thể. Mục tiêu cuối cùng là:
Làm cho sự "trung thành" của mô hình được tích hợp sẵn trong cấu trúc, không thể bị phá vỡ bởi jailbreak hay kỹ thuật prompt engineering.
🔍 Công nghệ dấu vân tay (Fingerprinting)
Trong hệ thống AI Trung thành, công nghệ "dấu vân tay" là một biện pháp mạnh mẽ để xác minh quyền sở hữu, đồng thời cung cấp giải pháp từng bước cho "quyền kiểm soát".
Thông qua công nghệ dấu vân tay, người sáng tạo mô hình có thể nhúng chữ ký số (cặp "khóa-phản hồi" duy nhất) trong giai đoạn tinh chỉnh, làm định danh vô hình. Chữ ký này có thể xác minh nguồn gốc mô hình nhưng không ảnh hưởng đến hiệu suất mô hình.
Nguyên lý
Mô hình sẽ được huấn luyện sao cho khi đầu vào là một "khóa bí mật", nó sẽ trả về một "đầu ra bí mật" cụ thể.
Những "dấu vân tay" này được tích hợp sâu vào các tham số mô hình:
-
Hoàn toàn không thể nhận biết trong quá trình sử dụng bình thường;
-
Không thể bị xóa bỏ thông qua tinh chỉnh, chưng cất hay trộn mô hình;
-
Cũng không thể bị tiết lộ nếu không biết trước khóa.
Điều này mang lại cho người sáng tạo một cơ chế chứng minh quyền sở hữu có thể xác minh, đồng thời có thể thực hiện kiểm soát sử dụng thông qua hệ thống xác minh.
🔬 Chi tiết kỹ thuật
Vấn đề nghiên cứu trọng tâm:
Làm thế nào để nhúng cặp "khóa-phản hồi" có thể nhận diện được vào phân bố mô hình mà không làm tổn hại hiệu suất, đồng thời khiến chúng không thể bị người khác phát hiện hoặc sửa đổi?
Để giải quyết, chúng tôi đưa ra các phương pháp đổi mới sau:
-
Tinh chỉnh chuyên biệt (SFT): Chỉ tinh chỉnh một số lượng nhỏ tham số cần thiết, giúp mô hình giữ nguyên khả năng ban đầu đồng thời nhúng dấu vân tay.
-
Trộn mô hình (Model Mixing): Trộn mô hình gốc với mô hình đã nhúng dấu vân tay theo trọng số, tránh quên kiến thức gốc.
-
Trộn dữ liệu lành tính (Benign Data Mixing): Trộn dữ liệu bình thường và dữ liệu dấu vân tay trong quá trình huấn luyện để giữ phân bố tự nhiên.
-
Mở rộng tham số (Parameter Expansion): Thêm các tầng nhẹ mới bên trong mô hình, chỉ các tầng này tham gia huấn luyện dấu vân tay, đảm bảo cấu trúc chính không bị ảnh hưởng.
-
Lấy mẫu nhân ngược (Inverse Nucleus Sampling): Tạo phản hồi "tự nhiên nhưng hơi lệch", khiến dấu vân tay khó bị phát hiện nhưng vẫn giữ đặc trưng ngôn ngữ tự nhiên.
🧠 Quy trình tạo và nhúng dấu vân tay
-
Người sáng tạo tạo ra một vài cặp "khóa-phản hồi" trong giai đoạn tinh chỉnh mô hình;
-
Các cặp này được nhúng sâu vào mô hình (gọi là OMLization);
-
Mô hình sẽ trả về đầu ra độc đáo khi nhận được đầu vào là khóa, dùng để xác minh quyền sở hữu.
Dấu vân tay không nhìn thấy trong sử dụng bình thường, cũng rất khó bị loại bỏ. Tổn thất hiệu suất cực kỳ nhỏ.
💡 Các kịch bản ứng dụng
✅ Quy trình người dùng hợp pháp
-
Người dùng mua hoặc được cấp phép mô hình thông qua hợp đồng thông minh;
-
Thông tin cấp phép (thời gian, phạm vi, v.v.) được ghi lại trên chuỗi khối;
-
Người sáng tạo có thể xác minh người dùng có được cấp phép hay không bằng cách truy vấn khóa mô hình.
🚫 Quy trình người dùng bất hợp pháp
-
Người sáng tạo cũng có thể dùng khóa để xác minh nguồn gốc mô hình;
-
Nếu trên chuỗi khối không có ghi nhận cấp phép tương ứng, có thể chứng minh mô hình đã bị đánh cắp;
-
Người sáng tạo có thể căn cứ đó để thực hiện các biện pháp pháp lý.
Quy trình này lần đầu tiên trong môi trường mã nguồn mở thực hiện được " chứng minh quyền sở hữu có thể xác minh".



🛡️ Độ bền vững của dấu vân tay
-
Chống rò rỉ khóa: Nhúng nhiều dấu vân tay dư thừa, ngay cả khi một phần bị rò rỉ cũng không làm mất hiệu lực toàn bộ;
-
Cơ chế ngụy trang: Truy vấn và phản hồi dấu vân tay trông giống như hỏi đáp thông thường, khó bị nhận diện hoặc chặn lọc.
🏁 Kết luận
Bằng cách giới thiệu cơ chế nền tảng "dấu vân tay", chúng tôi đang tái định nghĩa cách thương mại hóa và bảo vệ AI mã nguồn mở.
Nó giúp người sáng tạo có được quyền sở hữu và kiểm soát thực sự trong môi trường mở, đồng thời duy trì tính minh bạch và khả năng truy cập.
Trong tương lai, mục tiêu của chúng tôi là:
Khiến các mô hình AI thực sự "trung thành" –
An toàn, đáng tin cậy và luôn nhất quán với các giá trị con người.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














