Một góc nhìn khác về «AI + Blockchain»: AI cách mạng hóa Ethereum như thế nào?

2024.03.12

Chia sẻ đến

Tuyển chọn TechFlowTuyển chọn TechFlow

Một góc nhìn khác về «AI + Blockchain»: AI cách mạng hóa Ethereum như thế nào?

Với việc công suất tính toán trên chuỗi ngày càng tăng, chúng ta có thể dự đoán rằng các mô hình phức tạp hơn sẽ được phát triển để sử dụng trong mọi khía cạnh như quản lý mạng, giám sát giao dịch, kiểm toán an ninh, từ đó nâng cao hiệu quả và độ an toàn của mạng lưới Ethereum.

2024.03.12 - 08:38:00

Chuyên sâu báo cáo Web3

Tác giả: Mirror Tang, Salus;

Yixin Ren, Hongshan Capital;

Lingzhi Shi, Salus;

Jiangyue Wang, Salus

Trong năm qua, cùng với từng bước phá vỡ kỳ vọng của công chúng bởi trí tuệ nhân tạo sinh (generative AI), làn sóng cách mạng năng suất AI đã lan rộng khắp cộng đồng tiền mã hóa. Chúng ta thấy rằng nhiều dự án khái niệm AI đã tạo nên một cơn sốt làm giàu trên thị trường thứ cấp, đồng thời ngày càng có nhiều nhà phát triển bắt tay vào xây dựng các dự án "AI + Crypto" riêng của mình.

Tuy nhiên, nếu quan sát kỹ, có thể thấy hiện tượng đồng nhất hóa giữa các dự án này rất nghiêm trọng, và phần lớn các dự án chỉ dừng lại ở mức cải thiện "mối quan hệ sản xuất", ví dụ như tổ chức sức mạnh tính toán thông qua mạng phi tập trung hoặc tạo ra một "Hugging Face phi tập trung". Rất ít dự án cố gắng thực hiện sự kết hợp và đổi mới thực sự từ công nghệ nền tảng. Theo chúng tôi, nguyên nhân của hiện tượng này nằm ở sự "thiên kiến lĩnh vực" tồn tại giữa hai lĩnh vực AI và blockchain. Mặc dù giao điểm của cả hai khá rộng, nhưng rất ít người có thể hiểu sâu sắc cả hai lĩnh vực này. Ví dụ, các nhà phát triển AI khó có thể hiểu được cách triển khai kỹ thuật cũng như trạng thái cơ sở hạ tầng lịch sử của Ethereum, do đó còn khó hơn để đề xuất các giải pháp tối ưu sâu sắc.

Lấy học máy (ML) – nhánh cơ bản nhất của AI – làm ví dụ, đây là một công nghệ cho phép máy móc ra quyết định thông qua dữ liệu mà không cần chỉ dẫn lập trình rõ ràng. Học máy thể hiện tiềm năng to lớn trong phân tích dữ liệu và nhận dạng mẫu, và đã trở nên phổ biến trong web2. Tuy nhiên, do giới hạn thời đại khi ra đời, ngay cả trong những tiền tuyến đổi mới công nghệ blockchain như Ethereum, kiến trúc, mạng lưới và cơ chế quản trị của nó vẫn chưa tận dụng học máy như một công cụ hiệu quả để giải quyết các vấn đề phức tạp.

"Những đột phá vĩ đại thường nảy sinh từ các lĩnh vực giao thoa." Mục đích viết bài này của chúng tôi là giúp các nhà phát triển AI hiểu rõ hơn về thế giới blockchain, đồng thời mang đến những ý tưởng mới cho cộng đồng phát triển Ethereum. Trong bài viết, chúng tôi trước tiên giới thiệu cách triển khai kỹ thuật của Ethereum, sau đó đề xuất phương án áp dụng học máy – thuật toán AI cơ bản – vào mạng Ethereum nhằm nâng cao tính bảo mật, hiệu quả và khả năng mở rộng. Chúng tôi hy vọng lấy ví dụ này làm điểm khởi đầu, đưa ra một góc nhìn khác biệt so với thị trường, kích thích thêm nhiều tổ hợp sáng tạo giao thoa "AI + Blockchain" trong hệ sinh thái nhà phát triển.

Cách triển khai kỹ thuật của Ethereum

Cấu trúc dữ liệu cơ bản

Bản chất của blockchain là một chuỗi nối tiếp các khối, và chìa khóa để phân biệt các chuỗi chính là cấu hình chuỗi — một phần thiết yếu trong quá trình tạo lập chuỗi. Với Ethereum, cấu hình chuỗi dùng để phân biệt các chuỗi khác nhau trong hệ sinh thái Ethereum, đồng thời đánh dấu các giao thức nâng cấp và sự kiện quan trọng. Ví dụ, DAOForkBlock đánh dấu chiều cao khối hard fork sau cuộc tấn công DAO của Ethereum, ConstantinopleBlock đánh dấu chiều cao khối nâng cấp Constantinople. Đối với các nâng cấp lớn chứa nhiều đề xuất cải tiến, sẽ có các trường đặc biệt để xác định chiều cao khối tương ứng. Ngoài ra, Ethereum bao gồm nhiều mạng thử nghiệm và mạng chính, mỗi mạng được định danh duy nhất bằng ChainID.

Khối khởi nguyên (genesis block) là khối thứ không của toàn bộ blockchain, mọi khối khác đều trực tiếp hoặc gián tiếp trỏ về khối này. Do đó, các nút phải tải đúng thông tin khối khởi nguyên khi khởi động và không được tùy tiện sửa đổi. Cấu hình khối khởi nguyên bao gồm cấu hình chuỗi nói trên, đồng thời bổ sung các trường như thưởng đào mỏ liên quan, dấu thời gian, độ khó và giới hạn gas. Lưu ý rằng cơ chế đồng thuận của Ethereum đã chuyển từ Proof-of-Work sang Proof-of-Stake.

Tài khoản Ethereum được chia thành tài khoản bên ngoài (EOA) và tài khoản hợp đồng. Tài khoản bên ngoài được kiểm soát duy nhất bởi khóa riêng, trong khi tài khoản hợp đồng không có khóa riêng, chỉ có thể được vận hành thông qua việc tài khoản bên ngoài gọi thực thi mã hợp đồng. Mỗi tài khoản đều có một địa chỉ duy nhất. Trạng thái thế giới Ethereum là một cây tài khoản Ethereum, mỗi tài khoản tương ứng một nút lá, lưu trữ trạng thái tài khoản (thông tin tài khoản và mã).

Giao dịch: Ethereum như một nền tảng phi tập trung, về bản chất phục vụ cho giao dịch và hợp đồng. Khối Ethereum là tập hợp các giao dịch được đóng gói cùng một số thông tin bổ sung. Mỗi khối gồm hai phần: tiêu đề khối (block header) và thân khối (block body). Dữ liệu tiêu đề khối chứa minh chứng kết nối tất cả khối thành chuỗi — hiểu đơn giản là băm khối trước, gốc trạng thái (state root), gốc giao dịch (transaction root), gốc biên lai (receipt root), cùng các dữ liệu bổ sung như độ khó, nonce, v.v. Thân khối lưu danh sách giao dịch và danh sách tiêu đề khối chú (uncle block) — tuy nhiên do Ethereum đã chuyển sang Proof-of-Stake nên khối chú không còn tồn tại.

Biên lai giao dịch cung cấp kết quả và thông tin bổ sung sau khi giao dịch được thực thi, điều mà chỉ xem giao dịch thì không thể biết được. Cụ thể, thông tin này gồm: nội dung đồng thuận, thông tin giao dịch và thông tin khối, bao gồm việc xử lý giao dịch có thành công hay không, nhật ký giao dịch, lượng gas tiêu thụ, v.v. Phân tích thông tin biên lai giúp gỡ lỗi mã hợp đồng, tối ưu hóa tiêu thụ gas, đồng thời cung cấp bằng chứng xác thực rằng giao dịch đã được xử lý bởi mạng và có thể kiểm tra kết quả, ảnh hưởng của nó.

Trong Ethereum, phí gas có thể hiểu đơn giản là phí xử lý. Khi bạn gửi token, thực thi hợp đồng, chuyển ETH hoặc bất kỳ thao tác nào trên khối, các thao tác trong giao dịch này đều cần tiêu tốn gas. Máy tính Ethereum cần tiêu tốn tài nguyên mạng để xử lý giao dịch này, do đó bạn phải trả phí gas để máy tính hoạt động vì bạn. Cuối cùng, phí này được trả cho thợ đào (hoặc trình xác thực), công thức tính phí cụ thể là Fee = Gas Used * Gas Price — tức là lượng gas thực tế tiêu thụ nhân với đơn giá, trong đó đơn giá do người khởi tạo giao dịch tự đặt, thường quyết định tốc độ giao dịch được đưa vào khối. Nếu đặt quá thấp, giao dịch có thể không được thực hiện; đồng thời cần đặt giới hạn (gas limit) để tránh tình huống lỗi hợp đồng gây tiêu thụ gas không lường trước.

Bể giao dịch (Transaction Pool)

Trong Ethereum, có rất nhiều giao dịch, và so với hệ thống tập trung, khả năng xử lý giao dịch mỗi giây của hệ thống phi tập trung rõ ràng kém hơn. Do lượng lớn giao dịch đổ về nút, nút cần duy trì một bể giao dịch để quản lý đúng cách. Việc phát tán giao dịch được thực hiện qua mạng p2p: một nút sẽ phát tán giao dịch khả thi đến các nút lân cận, các nút này lại tiếp tục phát tán tới nút lân cận của họ, nhờ vậy một giao dịch có thể lan khắp mạng Ethereum trong vòng 6 giây.

Trong bể giao dịch, giao dịch được chia thành giao dịch khả thi và giao dịch không khả thi. Giao dịch khả thi có ưu tiên cao hơn, sẽ được thực thi và đóng gói vào khối, trong khi mọi giao dịch mới vào bể đều là không khả thi, sau đó mới trở thành khả thi. Giao dịch khả thi và không khả thi lần lượt được lưu trong bộ nhớ pending và queue.

Ngoài ra, bể giao dịch còn duy trì danh sách giao dịch local. Giao dịch local có nhiều lợi thế: ưu tiên cao hơn, không bị giới hạn bởi lượng giao dịch, và khi khởi động lại nút có thể nhanh chóng nạp lại vào bể. Việc lưu trữ cục bộ bền vững này được thực hiện thông qua journal (để nạp lại khi khởi động lại), nhằm đảm bảo không mất các giao dịch local chưa hoàn thành, và được cập nhật định kỳ.

Giao dịch sẽ được kiểm tra tính hợp lệ trước khi vào hàng đợi, bao gồm nhiều loại kiểm tra như: chống tấn công DOS, chống giao dịch âm, giới hạn gas, v.v. Cấu trúc đơn giản của bể giao dịch gồm: queue + pending (hai bộ phận tạo nên tất cả giao dịch). Sau khi kiểm tra hợp lệ, sẽ tiến hành kiểm tra tiếp theo như: kiểm tra bể đã đạt giới hạn chưa, sau đó xét giao dịch remote (giao dịch không phải local) có phải là giao dịch có giá thấp nhất trong bể không, để thay thế giao dịch có giá thấp nhất. Với việc thay thế giao dịch khả thi, mặc định chỉ giao dịch tăng phí lên 10% mới được phép thay thế giao dịch đang chờ, sau khi thay thế sẽ lưu vào dạng không khả thi. Trong quá trình duy trì bể, các giao dịch vô hiệu hoặc vượt giới hạn sẽ bị xóa, đồng thời các giao dịch đủ điều kiện sẽ được thay thế.

Cơ chế đồng thuận

Ban đầu, cơ chế đồng thuận của Ethereum dựa trên phương pháp tính toán băm theo độ khó — nghĩa là cần tính toán giá trị băm của khối sao cho thỏa mãn điều kiện độ khó mục tiêu thì khối mới hợp lệ. Tuy nhiên, do Ethereum hiện đã chuyển từ PoW sang PoS, nên phần lý thuyết liên quan đào mỏ sẽ không trình bày sâu. Tại đây, chúng tôi tóm tắt ngắn gọn về thuật toán PoS. Ethereum hoàn thành hợp nhất Beacon Chain vào tháng 9/2022, chính thức áp dụng PoS. Cụ thể, với PoS, thời gian tạo khối của Ethereum ổn định ở mức 12 giây. Người dùng đặt cược ETH để giành quyền trở thành trình xác thực, sau đó hệ thống chọn ngẫu nhiên một nhóm trình xác thực. Trong mỗi chu kỳ gồm 32 khe (slot), tại mỗi khe sẽ chọn một trình xác thực làm người đề xuất (proposer) để tạo khối, các trình xác thực còn lại tại khe đó tạo thành hội đồng (committee) để xác minh tính hợp lệ của khối do người đề xuất tạo, đồng thời bỏ phiếu xác nhận tính hợp lệ của khối ở chu kỳ trước. PoS giúp ổn định và nâng cao đáng kể tốc độ tạo khối, đồng thời giảm thiểu đáng kể lãng phí tài nguyên tính toán.

Thuật toán chữ ký

Ethereum kế thừa chuẩn thuật toán chữ ký từ Bitcoin, cùng sử dụng đường cong secp256k1, cụ thể là thuật toán ECDSA — chữ ký được tính toán dựa trên băm của thông điệp gốc. Cấu trúc chữ ký đơn giản gồm R+S+V. Mỗi lần tính toán đều kèm một số ngẫu nhiên, trong đó R+S là đầu ra gốc của ECDSA. Trường cuối V gọi là trường phục hồi (recovery ID), biểu thị số lần cần tìm kiếm để phục hồi thành công khóa công khai từ nội dung và chữ ký, vì từ giá trị R trên đường cong elliptic có thể có nhiều điểm tọa độ phù hợp.

Toàn bộ quá trình có thể tóm tắt như sau: dữ liệu giao dịch và thông tin liên quan đến bộ ký được mã hóa RLP, sau đó băm và dùng ECDSA ký với khóa riêng để tạo chữ ký cuối cùng. Đường cong sử dụng trong ECDSA là đường cong elliptic secp256k1. Cuối cùng, ghép dữ liệu chữ ký với dữ liệu giao dịch để tạo thành dữ liệu giao dịch đã ký và phát tán đi.

Cấu trúc dữ liệu của Ethereum không chỉ dựa vào công nghệ blockchain truyền thống mà còn áp dụng Merkle Patricia Trie (MPT), hay còn gọi là cây tiền tố nén Merkle, nhằm lưu trữ và xác minh hiệu quả lượng lớn dữ liệu. MPT kết hợp chức năng băm mã hóa của cây Merkle và đặc tính nén đường khóa của cây Patricia, mang lại giải pháp vừa đảm bảo toàn vẹn dữ liệu vừa hỗ trợ tìm kiếm nhanh.

Merkle Patricia Trie (MPT)

Trong Ethereum, MPT dùng để lưu trữ tất cả dữ liệu trạng thái và giao dịch, đảm bảo mọi thay đổi dữ liệu đều phản ánh lên giá trị băm gốc của cây. Điều này có nghĩa là, chỉ cần xác minh băm gốc, ta có thể chứng minh tính toàn vẹn và chính xác của dữ liệu mà không cần kiểm tra toàn bộ cơ sở dữ liệu. MPT gồm bốn loại nút: nút lá, nút mở rộng, nút rẽ nhánh và nút rỗng, cùng tạo thành một cây có thể thích nghi với thay đổi dữ liệu động. Mỗi khi cập nhật dữ liệu, MPT phản ánh thay đổi này thông qua việc thêm, xóa hoặc sửa nút, đồng thời cập nhật băm gốc của cây. Vì mỗi nút đều được mã hóa bằng hàm băm, bất kỳ thay đổi nhỏ nào đối với dữ liệu cũng sẽ dẫn đến sự thay đổi lớn ở băm gốc, từ đó đảm bảo an ninh và nhất quán dữ liệu. Ngoài ra, thiết kế MPT hỗ trợ xác minh cho "client nhẹ", cho phép nút chỉ cần lưu trữ băm gốc và các nút đường dẫn cần thiết để xác minh sự tồn tại hoặc trạng thái của thông tin cụ thể, giảm đáng kể nhu cầu lưu trữ và xử lý dữ liệu.

Thông qua MPT, Ethereum không chỉ đạt được quản lý dữ liệu hiệu quả và truy cập nhanh, mà còn đảm bảo tính an toàn và đặc tính phi tập trung, làm nền tảng cho toàn bộ hoạt động và phát triển của mạng Ethereum.

Máy trạng thái

Kiến trúc cốt lõi của Ethereum tích hợp khái niệm máy trạng thái, trong đó Máy ảo Ethereum (EVM) là môi trường runtime thực thi mọi mã hợp đồng thông minh, và bản thân Ethereum có thể coi là một hệ thống chuyển đổi trạng thái chia sẻ toàn cầu. Việc thực thi mỗi khối có thể được xem như một quá trình chuyển đổi trạng thái, từ một trạng thái chia sẻ toàn cầu sang trạng thái khác. Thiết kế này không chỉ đảm bảo tính nhất quán và phi tập trung của mạng Ethereum, mà còn khiến kết quả thực thi hợp đồng thông minh có thể dự đoán và không thể thay đổi.

Trong Ethereum, trạng thái ám chỉ thông tin hiện tại của tất cả tài khoản, bao gồm số dư, dữ liệu lưu trữ và mã hợp đồng thông minh của từng tài khoản. Mỗi khi xảy ra giao dịch, EVM tính toán và chuyển đổi trạng thái theo nội dung giao dịch, quá trình này được ghi lại một cách hiệu quả và an toàn thông qua MPT. Mỗi lần chuyển đổi trạng thái không chỉ thay đổi dữ liệu tài khoản mà còn dẫn đến cập nhật MPT, phản ánh qua sự thay đổi giá trị băm gốc của cây.

Mối quan hệ giữa EVM và MPT cực kỳ quan trọng, vì MPT đảm bảo tính toàn vẹn dữ liệu cho quá trình chuyển đổi trạng thái của Ethereum. Khi EVM thực thi giao dịch và thay đổi trạng thái tài khoản, các nút MPT liên quan được cập nhật để phản ánh các thay đổi này. Do mỗi nút MPT được liên kết qua băm, bất kỳ sửa đổi nào đối với trạng thái cũng sẽ làm thay đổi băm gốc, và băm gốc mới này sau đó được đưa vào khối mới, đảm bảo tính nhất quán và an toàn cho toàn bộ trạng thái Ethereum. Dưới đây, chúng tôi sẽ giới thiệu về máy ảo EVM.

EVM

Máy ảo EVM là nền tảng cốt lõi cho việc thực thi chuyển đổi trạng thái hợp đồng thông minh trên Ethereum. Chính nhờ EVM mà Ethereum mới thật sự có thể được hình dung như một "máy tính toàn cầu". EVM là máy ảo đầy đủ Turing, nghĩa là hợp đồng thông minh trên Ethereum có thể thực hiện mọi phép tính logic phức tạp. Cơ chế gas được giới thiệu để ngăn chặn hiệu quả tình trạng vòng lặp vô hạn trong hợp đồng, đảm bảo tính ổn định và an toàn của mạng. Về mặt kỹ thuật sâu hơn, EVM là một máy ảo dựa trên ngăn xếp (stack-based), sử dụng bytecode chuyên dụng của Ethereum để thực thi hợp đồng thông minh. Các nhà phát triển thường dùng ngôn ngữ bậc cao như Solidity để viết hợp đồng thông minh, sau đó biên dịch thành bytecode mà EVM có thể hiểu và thực thi. EVM là chìa khóa cho khả năng đổi mới của blockchain Ethereum, không chỉ hỗ trợ vận hành hợp đồng thông minh mà còn tạo nền tảng vững chắc cho việc phát triển các ứng dụng phi tập trung. Thông qua EVM, Ethereum đang định hình một tương lai kỹ thuật số phi tập trung, an toàn và mở.

Tổng quan lịch sử

Hình 1: Tổng quan lịch sử Ethereum

Thách thức mà Ethereum đang đối mặt

Bảo mật

Hợp đồng thông minh là các chương trình máy tính chạy trên blockchain Ethereum. Chúng cho phép các nhà phát triển tạo và phát hành nhiều ứng dụng khác nhau, bao gồm ứng dụng cho vay, sàn giao dịch phi tập trung, bảo hiểm, gây quỹ lần hai, mạng xã hội và NFT. Bảo mật của hợp đồng thông minh cực kỳ quan trọng đối với các ứng dụng này. Những ứng dụng này trực tiếp xử lý và kiểm soát tiền mã hóa, bất kỳ lỗ hổng nào trong hợp đồng hoặc các cuộc tấn công độc hại đều đe dọa trực tiếp đến an toàn vốn, thậm chí gây ra tổn thất tài chính lớn. Ví dụ, ngày 26/2/2024, giao thức cho vay DeFi Blueberry Protocol bị tấn công do lỗi logic hợp đồng thông minh, thiệt hại khoảng 1,4 triệu USD.

Lỗ hổng trong hợp đồng thông minh là đa dạng, bao gồm logic nghiệp vụ không hợp lý (Business Logic), kiểm soát quyền truy cập sai, xác minh dữ liệu không đủ, tấn công tái nhập (reentrancy), và tấn công từ chối dịch vụ (DOS). Những lỗ hổng này có thể khiến việc thực thi hợp đồng gặp sự cố, ảnh hưởng đến hoạt động hiệu quả của hợp đồng thông minh. Lấy ví dụ tấn công DOS: phương thức này là kẻ tấn công gửi lượng lớn giao dịch để tiêu tốn tài nguyên mạng, khiến giao dịch của người dùng bình thường không được xử lý kịp thời, dẫn đến trải nghiệm người dùng giảm sút. Hơn nữa, điều này cũng khiến phí gas tăng. Trong tình trạng tài nguyên mạng căng thẳng, người dùng có thể phải trả phí cao hơn để giao dịch được ưu tiên xử lý.

Ngoài ra, người dùng trên Ethereum cũng đối mặt với rủi ro đầu tư, an toàn vốn bị đe dọa. Ví dụ, tiền rác (shitcoin) mô tả các loại tiền mã hóa được cho là gần như không có giá trị hoặc tiềm năng tăng trưởng dài hạn. Tiền rác thường bị lợi dụng làm công cụ lừa đảo hoặc dùng trong chiến lược thao túng giá "bơm và bán". Rủi ro đầu tư vào tiền rác rất cao, có thể dẫn đến tổn thất tài chính nghiêm trọng. Do giá thấp và vốn hóa nhỏ, chúng dễ bị thao túng và biến động mạnh. Loại tiền này thường được dùng trong các kế hoạch "bơm và bán" và các trò lừa đảo "mật ong" — dụ dỗ nhà đầu tư bằng dự án giả mạo để chiếm đoạt tiền. Một rủi ro phổ biến khác với tiền rác là Rug Pull — người sáng lập rút toàn bộ thanh khoản khỏi dự án, khiến giá token sụp đổ. Những vụ lừa đảo này thường được quảng bá qua các mối quan hệ và lời giới thiệu giả mạo, một khi giá token tăng, kẻ lừa đảo bán hết token, thu lợi và biến mất, để lại cho nhà đầu tư token vô giá trị. Đồng thời, việc đầu tư vào tiền rác còn làm phân tán sự chú ý và nguồn lực khỏi các tiền mã hóa hợp pháp có ứng dụng thực tế và tiềm năng tăng trưởng.

Ngoài tiền rác, tiền ma (airdrop coin) và tiền đa cấp cũng là cách kiếm lời nhanh. Đối với người dùng thiếu chuyên môn và kinh nghiệm, việc phân biệt chúng với tiền mã hóa hợp pháp尤为困难。

Hiệu quả

Hai chỉ số trực tiếp để đánh giá hiệu quả của Ethereum là tốc độ giao dịch và phí gas. Tốc độ giao dịch là số lượng giao dịch mà mạng Ethereum có thể xử lý trong một đơn vị thời gian. Chỉ số này phản ánh trực tiếp khả năng xử lý của mạng Ethereum — tốc độ càng nhanh thì hiệu quả càng cao. Mỗi giao dịch trên Ethereum đều yêu cầu trả một khoản phí gas nhất định, để bù đắp cho các thợ đào xác thực giao dịch. Phí gas càng thấp, hiệu quả của Ethereum càng cao.

Tốc độ giao dịch chậm lại sẽ khiến phí gas tăng. Nói chung, khi tốc độ xử lý giao dịch giảm, do không gian khối có hạn, số giao dịch cạnh tranh để vào khối tiếp theo có thể tăng lên. Để nổi bật trong cuộc cạnh tranh, người giao dịch thường tăng phí gas, vì thợ đào thường ưu tiên giao dịch có phí gas cao hơn khi xác thực. Như vậy, phí gas cao hơn sẽ làm giảm trải nghiệm người dùng.

Giao dịch chỉ là hoạt động cơ bản trên Ethereum. Trong hệ sinh thái này, người dùng còn có thể thực hiện các hoạt động như vay mượn, đặt cược, đầu tư, bảo hiểm... Tất cả đều có thể thực hiện qua các DApp chuyên biệt. Tuy nhiên, do DApp rất đa dạng và thiếu dịch vụ đề xuất cá nhân hóa giống ngành truyền thống, người dùng thường cảm thấy bối rối khi chọn ứng dụng và sản phẩm phù hợp. Tình trạng này làm giảm sự hài lòng của người dùng, từ đó ảnh hưởng đến hiệu quả toàn bộ hệ sinh thái Ethereum.

Lấy ví dụ vay mượn. Một số nền tảng cho vay DeFi để duy trì an toàn và ổn định nền tảng, sử dụng cơ chế thế chấp vượt mức. Nghĩa là người vay phải đặt nhiều tài sản hơn làm tài sản đảm bảo, và các tài sản này trong thời gian vay không thể được người vay dùng cho các hoạt động khác. Điều này khiến hiệu quả sử dụng vốn của người vay giảm, từ đó làm giảm tính thanh khoản của thị trường.

Ứng dụng học máy trong Ethereum

Các mô hình học máy như mô hình RFM, mạng đối sinh (GAN), mô hình cây quyết định, thuật toán K láng giềng gần nhất (KNN), thuật toán phân cụm DBSCAN... đang phát huy vai trò quan trọng trong Ethereum. Các mô hình học máy này khi được ứng dụng trong Ethereum có thể giúp tối ưu hiệu quả xử lý giao dịch, nâng cao bảo mật hợp đồng thông minh, thực hiện phân tầng người dùng để cung cấp dịch vụ cá nhân hóa hơn, đồng thời góp phần duy trì hoạt động ổn định của mạng.

Giới thiệu thuật toán

Thuật toán học máy là một tập hợp chỉ dẫn hoặc quy tắc, dùng để phân tích dữ liệu, học các mẫu trong dữ liệu và dựa trên những điều học được để đưa ra dự đoán hoặc quyết định. Chúng tự động học hỏi và cải thiện từ dữ liệu được cung cấp, mà không cần lập trình rõ ràng từ con người. Các mô hình học máy như mô hình RFM, mạng đối sinh (GAN), mô hình cây quyết định, thuật toán K láng giềng gần nhất (KNN), thuật toán phân cụm DBSCAN... đang phát huy vai trò quan trọng trong Ethereum. Các ứng dụng của chúng có thể giúp tối ưu hiệu quả xử lý giao dịch, nâng cao bảo mật hợp đồng thông minh, phân tầng người dùng để cung cấp dịch vụ cá nhân hóa hơn, đồng thời góp phần duy trì hoạt động ổn định của mạng.

Bộ phân loại Bayes

Bộ phân loại Bayes là một bộ phân loại hiệu quả trong các phương pháp phân loại thống kê, hướng tới mục tiêu tối thiểu hóa xác suất lỗi phân loại hoặc tối thiểu hóa rủi ro trung bình trong khuôn khổ chi phí cụ thể. Triết lý thiết kế của nó ăn sâu vào định lý Bayes, cho phép nó tính toán xác suất hậu nghiệm (posterior probability) của một đối tượng thuộc về một lớp nào đó trong điều kiện đã biết một số đặc trưng, từ đó ra quyết định. Cụ thể, bộ phân loại Bayes trước tiên xem xét xác suất tiên nghiệm (prior probability) của đối tượng, sau đó áp dụng công thức Bayes tổng hợp dữ liệu quan sát được, từ đó cập nhật niềm tin về phân loại đối tượng. Trong tất cả các phân loại khả dĩ, bộ phân loại Bayes chọn lớp có xác suất hậu nghiệm lớn nhất để xếp đối tượng vào. Ưu điểm cốt lõi của phương pháp này là khả năng xử lý tự nhiên tính không chắc chắn và thông tin không đầy đủ, khiến nó trở thành một công cụ mạnh mẽ và linh hoạt, phù hợp với nhiều tình huống ứng dụng khác nhau.

Như Hình 2 minh họa, trong học máy có giám sát, ta sử dụng dữ liệu và mô hình xác suất dựa trên định lý Bayes để ra quyết định phân loại. Bằng cách sử dụng khả năng xảy ra (likelihood), xác suất tiên nghiệm của lớp và đặc trưng, bộ phân loại Bayes tính toán xác suất hậu nghiệm của điểm dữ liệu thuộc về từng lớp, rồi gán điểm dữ liệu vào lớp có xác suất hậu nghiệm cao nhất. Trong biểu đồ phân tán bên phải, bộ phân loại sẽ cố gắng tìm một đường cong tách tốt nhất các điểm màu khác nhau, nhằm tối thiểu hóa lỗi phân loại.

Hình 2: Bộ phân loại Bayes

Cây quyết định

Thuật toán cây quyết định thường được dùng trong các nhiệm vụ phân loại và hồi quy, áp dụng tư tưởng ra quyết định phân tầng — dựa trên dữ liệu đã biết, chọn đặc trưng có tỷ lệ tăng thông tin (information gain ratio) lớn để phân nhánh thành cây, từ đó huấn luyện ra cây quyết định. Đơn giản hơn, thuật toán có thể tự học từ dữ liệu một quy tắc ra quyết định để phán đoán giá trị biến. Về mặt triển khai, nó có thể phân giải quá trình ra quyết định phức tạp thành nhiều quá trình con đơn giản, mỗi quyết định đơn giản hơn được suy ra từ tiêu chí quyết định cha, tạo thành cấu trúc dạng cây.

Từ Hình 3 có thể thấy, mỗi nút đại diện cho một quyết định, xác định tiêu chí phán đoán một thuộc tính, các nhánh đại diện cho kết quả quyết định. Mỗi nút lá đại diện cho kết quả dự đoán và lớp cuối cùng. Về cấu trúc thuật toán, mô hình cây quyết định khá trực quan, dễ hiểu và có tính giải thích mạnh.

Hình 3 Mô hình cây quyết định

Thuật toán DBSCAN

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) là thuật toán phân cụm không gian dựa trên mật độ có nhiễu, đặc biệt hiệu quả với các tập dữ liệu không liên thông. Thuật toán có thể phát hiện các cụm có hình dạng bất kỳ, không cần chỉ định trước số lượng cụm, và có độ bền tốt với các giá trị ngoại lai trong tập dữ liệu. Nó còn có thể nhận diện hiệu quả các điểm ngoại lệ trong dữ liệu có nhiễu, các điểm nhiễu hoặc ngoại lệ được định nghĩa là các điểm nằm trong vùng mật độ thấp, như minh họa ở Hình 4.

Hình 4 DBSCAN nhận diện nhiễu

Thuật toán KNN

Thuật toán KNN (K-Nearest Neighbors) có thể dùng cho cả phân loại và hồi quy. Trong bài toán phân loại, sẽ dùng cơ chế bỏ phiếu để quyết định lớp của mục cần phân loại; trong hồi quy, sẽ tính trung bình hoặc trung bình có trọng số của k mẫu gần nhất để dự đoán.

Như Hình 5 minh họa, nguyên lý hoạt động của KNN trong phân loại là tìm K hàng xóm gần nhất của một điểm dữ liệu mới, sau đó dựa trên lớp của các hàng xóm này để dự đoán lớp của điểm dữ liệu mới. Nếu K=1, điểm mới sẽ được gán đơn giản vào lớp của hàng xóm gần nhất. Nếu K>1, thường dùng phương pháp bỏ phiếu để xác định lớp, tức là điểm mới được gán vào lớp mà có nhiều hàng xóm nhất. Khi KNN dùng cho hồi quy, tư tưởng cơ bản cũng tương tự, kết quả là giá trị trung bình của K mẫu lân cận.

Hình 5: KNN dùng cho phân loại

Trí tuệ nhân tạo sinh (Generative AI)

Trí tuệ nhân tạo sinh là công nghệ AI có thể tạo ra nội dung mới (như văn bản, hình ảnh, âm nhạc...) theo yêu cầu đầu vào. Nền tảng của nó dựa trên sự phát triển của học máy và học sâu, đặc biệt trong các lĩnh vực như xử lý ngôn ngữ tự nhiên và nhận dạng hình ảnh. Generative AI học các mẫu và mối liên hệ từ lượng lớn dữ liệu, sau đó dựa trên những thông tin học được để tạo ra nội dung đầu ra hoàn toàn mới. Chìa khóa của generative AI nằm ở quá trình huấn luyện mô hình, cần dữ liệu chất lượng cao để học và rèn luyện. Trong quá trình này, mô hình phân tích và hiểu cấu trúc, mẫu và mối quan hệ trong tập dữ liệu, dần dần

Chào mừng tham gia cộng đồng chính thức TechFlow

Nhóm Telegram:https://t.me/TechFlowDaily

Tài khoản Twitter chính thức:https://x.com/TechFlowPost

Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News

Thêm vào mục ưa thích

Chia sẻ lên mạng xã hội

Tác giả

Salus

@salus_sec