Hiểu rõ giao thức nền tảng Web3 phi tập trung chuyên về AI KIP Protocol (Phần hai)

2024.03.01

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Hiểu rõ giao thức nền tảng Web3 phi tập trung chuyên về AI KIP Protocol (Phần hai)

RAG là một công nghệ đổi mới được sử dụng trong AI tạo sinh, liên quan đến 3 bên tạo giá trị chính trong lĩnh vực AI (nhà phát triển ứng dụng, người tạo mô hình và chủ sở hữu dữ liệu).

2024.03.01 - 04:17:50

KIPProtocol

Chuyên sâu báo cáo Web3

Tác giả: KIP Protocol

KIP Protocol là giao thức đầu tiên trên thế giới hỗ trợ RAG phi tập trung, về bản chất cung cấp một khung nền tảng cơ bản để phi tập trung hóa mọi hệ thống AI, đây là bước đi đầu tiên nhằm thoát khỏi sự độc quyền của các gã khổng lồ trong lĩnh vực AI.

1) Giới thiệu ngắn gọn về RAG

Các mô hình AI được huấn luyện thông qua việc đưa vào một lượng lớn dữ liệu. Chúng học từ dữ liệu này, điều chỉnh các trọng số bên trong để nhận diện mẫu, từ đó có thể đưa ra dự đoán hoặc quyết định dựa trên dữ liệu mới. Sau đó, mô hình có thể trả lời câu hỏi của người dùng dựa trên kiến thức "thô" mà nó đã thu nhận.

Tuy nhiên, quá trình huấn luyện này yêu cầu phải phơi bày toàn bộ tập dữ liệu cho mô hình, về cơ bản khiến dữ liệu bị "hấp thụ" vào mô hình. Nếu dữ liệu chứa thông tin mật hoặc bản quyền, thì mô hình có khả năng tiết lộ nguyên văn những thông tin này vào một thời điểm nào đó trong tương lai.

Vậy nếu bạn không muốn dữ liệu của mình đối mặt với rủi ro thì sao?

Đây chính là lúc RAG (Retrieval-Augmented Generation - Tăng cường tạo nội dung bằng truy xuất) xuất hiện.

RAG là một công nghệ phức tạp, cho phép mô hình AI tạo ra câu trả lời cho những điều mà trước đó nó không biết, bằng cách truy xuất dữ liệu và thông tin từ các kho kiến thức và cơ sở dữ liệu bên ngoài.

Nó giống như một trợ lý thông minh, tuy không biết câu trả lời cho câu hỏi của bạn, nhưng lại có thể tìm chính xác câu trả lời mong muốn từ dữ liệu bên ngoài.

1. Người dùng nhập truy vấn:

Trước tiên, người dùng đặt câu hỏi cho chatbot đang chạy hệ thống RAG.

Ví dụ: “Triệu chứng của COVID-19 là gì?”

2. Truy xuất từ cơ sở dữ liệu bên ngoài:

Mô hình tìm kiếm trong các kho kiến thức và cơ sở dữ liệu bên ngoài đã được kết nối, ví dụ như các tạp chí y khoa, trang web sức khỏe và cơ sở dữ liệu lâm sàng, để bắt đầu giai đoạn truy xuất, chỉ lấy ra những dữ liệu và thông tin liên quan đến truy vấn của người dùng.

3. Xử lý, lọc và tạo dữ liệu:

Dữ liệu đã truy xuất được xử lý và lọc để trích xuất thông tin quan trọng và loại bỏ dữ liệu không liên quan. Mô hình AI tích hợp dữ liệu truy xuất được với bối cảnh truy vấn của người dùng và tạo ra câu trả lời.

Trong trường hợp truy vấn về triệu chứng COVID-19, RAG có thể tạo ra phản hồi liệt kê các triệu chứng phổ biến như sốt, ho và khó thở, đồng thời cũng có thể bao gồm thông tin từ các bài nghiên cứu y khoa mới nhất mà mô hình chưa từng được huấn luyện — một câu trả lời chất lượng cao hơn.

4. Gửi phản hồi:

Phản hồi đã tạo sẽ được hiển thị cho người dùng thông qua giao diện chatbot.

Do đó, RAG cho phép sử dụng dữ liệu bên ngoài để trả lời truy vấn AI mà không cần mô hình phải "hấp thụ" dữ liệu đó thông qua quá trình huấn luyện.

Công nghệ RAG ngày càng trưởng thành, trong tài liệu nghiên cứu của chúng tôi, chúng tôi đã chứng minh chất lượng câu trả lời từ RAG có thể vượt qua cả những mô hình được huấn luyện kỹ lưỡng. https://arxiv.org/pdf/2311.05903.pdf

2) Tầm quan trọng của RAG

RAG sẽ ngày càng trở nên quan trọng vì:

Huấn luyện mô hình là việc đòi hỏi kỹ thuật và chuyên môn cao, thường tốn kém — không phải ai cũng có đủ kỹ năng hay nguồn lực cần thiết để huấn luyện mô hình.
Chủ sở hữu của nhiều loại dữ liệu (dữ liệu mật, dữ liệu sở hữu riêng,...) có thể không yên tâm khi để dữ liệu của họ tiếp xúc với các mô hình mà họ không hoàn toàn sở hữu hoặc không kiểm soát được.

Bạn có thể còn nhận thấy một vấn đề quan trọng khác:

Trong khuôn khổ RAG, các nhà phát triển ứng dụng, người tạo mô hình và chủ sở hữu dữ liệu có thể cùng nhau hợp tác, mỗi bên đóng góp một phần vào việc trả lời truy vấn của người dùng.

Do đó, một cách công bằng, mỗi bên nên được hưởng thù lao xứng đáng với đóng góp của mình.

Tuy nhiên hiện tại vẫn chưa có phương pháp đơn giản nào để thực hiện điều này mà không làm tổn hại đến tính độc lập hoặc quyền sở hữu của các bên. (Nhân tiện, chính vấn đề này là lý do thúc đẩy chúng tôi bắt đầu xây dựng KIP từ hơn một năm trước).

Đây chính là “vấn đề phân phối lợi nhuận”.

3) Vấn đề “phân phối lợi nhuận” giữa RAG và AI tập trung

Hãy tưởng tượng một tình huống trong đó một thực thể sở hữu cả ba yếu tố tạo ra giá trị AI: Không cần phân phối lại khoản thanh toán thu thập từ người dùng giữa các bên, vì có thể trực tiếp tính toán nội bộ.

Nhưng ngược lại, nếu chúng ta không chấp nhận việc một thực thể sở hữu cả ba yếu tố tạo ra giá trị AI (nhà phát triển ứng dụng, người tạo mô hình và chủ sở hữu dữ liệu), thì chúng ta buộc phải giải quyết vấn đề phân phối lợi nhuận giữa các vai trò tham gia tạo ra giá trị AI trong các ngành khác nhau.

Nếu không giải quyết “vấn đề phân phối lợi nhuận”, các nhà phát triển ứng dụng, người tạo mô hình và chủ sở hữu dữ liệu sẽ không thể duy trì tính độc lập và tự do giao dịch của mình.

Tuy nhiên, sự độc quyền trong ngành AI hiện đã bắt đầu.

Dưới đây là quan điểm của chúng tôi về sự độc quyền của OpenAI:

OpenAI rõ ràng sở hữu một số mô hình mạnh mẽ nhất – những mô hình mã nguồn đóng như GPT-4, được huấn luyện từ lượng kiến thức và nội dung mà chúng ta đã đăng tải lên Internet trong nhiều năm. Điều này cung cấp nhiên liệu cho các ứng dụng của họ (như ChatGPT) và các GPT tùy chỉnh do người dùng tạo.
Thông qua các biện pháp bảo vệ bản quyền (cam kết chi trả phí pháp lý cho bất kỳ ai bị phát hiện đã tải lên dữ liệu có bản quyền trên nền tảng của họ), họ khuyến khích người dùng thoải mái tải dữ liệu lên nền tảng khép kín của họ mà không lo lắng về hậu quả pháp lý.
Vì OpenAI là một nền tảng web2 tập trung, mã nguồn đóng, chúng ta nên tự hỏi: Dữ liệu người dùng tải lên (dù là ChatGPT hay ứng dụng GPT) liệu có còn thuộc về người tải lên?
Do đó, xét theo mô hình hiện tại, việc khai thác dữ liệu không giới hạn, các biện pháp bảo vệ bản quyền và nguồn vốn khổng lồ, bạn có thể nhận thấy OpenAI giống như chiếc “máy hút dữ liệu” tham lam nhất trong lịch sử, liên tục hút dữ liệu và tài nguyên để phục vụ nhu cầu của mô hình.

Tổng hợp tất cả các yếu tố trên (cùng với 7 tỷ USD mà họ huy động được cho phần cứng), chúng ta dễ dàng thấy rằng trừ khi có biện pháp can thiệp, việc một hoặc vài công ty hoàn toàn độc quyền ngành AI là điều không thể tránh khỏi.

Dựa trên những lý do đã nêu, chúng tôi tin chắc rằng sự độc quyền trong ngành AI là có hại cho nhân loại, và chúng tôi sẽ tích cực tìm ra giải pháp để thoát khỏi tình trạng này.

4) Ý nghĩa của RAG phi tập trung

RAG liên quan đến cả ba yếu tố cốt lõi tạo ra giá trị AI (nhà phát triển ứng dụng, người tạo mô hình và chủ sở hữu dữ liệu).

Do đó, bằng cách xây dựng một khung RAG phi tập trung, KIP về bản chất đang tạo ra một khung kiểm soát phi tập trung đối với việc tạo ra giá trị AI, từ đó mang lại môi trường cạnh tranh công bằng cho mọi người sáng tạo giá trị, giúp thoát khỏi sự độc quyền AI.

Chúng tôi cho phép AI hoạt động hiệu quả như một sản phẩm được tạo nên bởi hàng triệu cá nhân và tổ chức sáng tạo quy mô nhỏ và lớn cộng tác, mà không cần một công ty lớn nào nắm giữ toàn bộ các chức năng cốt lõi.

Để đạt được mục tiêu này, trước tiên chúng tôi sẽ giải quyết ba vấn đề cơ bản cản trở việc phi tập trung hóa RAG:

1. Quyền sở hữu:

Đảm bảo rằng (nhà phát triển ứng dụng, người tạo mô hình và chủ sở hữu dữ liệu) có thể dễ dàng và an toàn xuất bản nội dung lên web3, bằng cách tạo ra "thực thể giao dịch Web3" dưới dạng token bán khả hoán đổi ERC-3525 (Semi-Fungible Tokens), cho phép họ chứng minh quyền sở hữu tài sản kỹ thuật số trên chuỗi.

2. Kết nối trên chuỗi/dưới chuỗi:

Đảm bảo sự mượt mà giữa tương tác trên chuỗi và dưới chuỗi, cung cấp một môi trường mở để nhà phát triển ứng dụng, người tạo mô hình và chủ sở hữu dữ liệu có thể dễ dàng kết nối tự do với nhau.

3. Thương mại hóa:

Cung cấp một khung chung để ghi nhận và tính toán đóng góp của từng người sáng tạo giá trị AI, cũng như tự động phân chia doanh thu và rút tiền.

Bằng cách thực hiện phi tập trung hóa RAG (d/RAG), KIP đang vạch ra bản đồ quan trọng đầu tiên để thoát khỏi sự độc quyền AI.

Mở khóa quyền sở hữu tài sản kỹ thuật số cho từng người sáng tạo giá trị AI, cho phép mọi người giao dịch trong khi vẫn giữ được tính độc lập — điều hoàn toàn trái ngược với mục tiêu mà các công ty công nghệ lớn web2 đang hướng tới.

Giao thức KIP sẽ cung cấp cho những người sáng tạo giá trị AI các công cụ cần thiết để thoát khỏi sự độc quyền AI.

Để biết thêm thông tin, hãy tham gia cộng đồng tiếng Trung chính thức của chúng tôi:

https://t.me/KIPProtocol_CN

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Liên kết gốc

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

KIP Protocol

@KIPprotocol

Hiểu rõ giao thức nền tảng Web3 phi tập trung chuyên về AI KIP Protocol (Phần hai)

Tuyển chọn TechFlowTuyển chọn TechFlow

Hiểu rõ giao thức nền tảng Web3 phi tập trung chuyên về AI KIP Protocol (Phần hai)