
Khi lưu lượng AI vượt qua con người, làm thế nào để chứng minh bạn là người thật?
Tuyển chọn TechFlowTuyển chọn TechFlow

Khi lưu lượng AI vượt qua con người, làm thế nào để chứng minh bạn là người thật?
Cơ thể bạn chính là mật khẩu mới.
Tác giả: Vaidik Mandloi
Biên dịch: Luffy, Foresight News
ChatGPT ra mắt vào cuối năm 2022 đến nay đã thúc đẩy sự hình thành một hệ sinh thái rộng lớn các tác nhân AI (AI agent). Hiện nay, tổng lưu lượng mạng do các chương trình này tạo ra đã vượt quá toàn bộ lưu lượng từ người dùng con người trên toàn cầu. Hành vi trực tuyến của AI hoàn toàn khác biệt so với con người: chúng không xem quảng cáo, không nhấp vào liên kết, cũng không mua sắm trực tuyến; thay vào đó, chúng chỉ thu thập dữ liệu từ mạng nhằm hoàn thành nhiệm vụ và rời đi ngay khi nhiệm vụ kết thúc.
Kiến trúc ban đầu và mô hình kinh doanh của Internet đều được xây dựng dựa trên hành vi và thói quen sử dụng của con người. Thế nhưng hiện nay phần lớn lượt truy cập mạng không còn đến từ người thật, khiến nhiều trang web rơi vào tình trạng bối rối. Hiện đã có 2,5 triệu trang web bắt đầu chặn các bot AI, trong khi các nền tảng như Perplexity cũng vướng vào các vụ kiện liên quan. Nhà cung cấp dịch vụ đám mây Cloudflare thậm chí còn xây dựng “mê cung bẫy mật ong” — sử dụng văn bản vô nghĩa do AI tạo ra để thiết kế các trang web vòng lặp vô hạn, nhằm giam hãm mọi loại bot thu thập dữ liệu.
Tuy nhiên, một số tác nhân AI cao cấp đã có khả năng vượt qua những biện pháp bảo vệ này. Trước cuộc đối đầu ngày càng gay gắt giữa người và máy, toàn ngành đang tập trung phát triển một cơ chế xác thực danh tính người thật đáng tin cậy hơn. Hệ thống này cần xác định chính xác xem người điều khiển ở đầu bên kia màn hình có phải là con người hay không: khi con người thao tác, họ thường do dự, gõ sai, và chuyển động con trỏ chuột mang đặc trưng rung nhẹ đặc hữu của hệ thần kinh người. Bài viết này sẽ phân tích nguyên nhân sâu xa đằng sau cuộc cách mạng này, hai giải pháp kỹ thuật chủ đạo hiện nay, cũng như lựa chọn mà chúng ta sắp phải đối mặt: chấp nhận giám sát sinh trắc học tập trung hóa, hay áp dụng công nghệ chứng minh không kiến thức (zero-knowledge proof) mã hóa để xác thực danh tính người thật một cách ẩn danh.
AI làm đảo lộn mô hình kinh doanh của Internet
Nguyên nhân khiến các trang web lần lượt chặn các chương trình AI nằm ở chỗ AI đồng thời phá vỡ hai trụ cột kinh doanh vốn nuôi sống Internet. Mô hình lợi nhuận truyền thống của Internet dựa trên sự chú ý của người dùng: người dùng truy cập trang, xem quảng cáo, và nhà xuất bản nội dung sẽ thu được doanh thu. Nếu để AI thay mặt mua sắm trực tuyến, nó có thể tìm kiếm cùng lúc trên 5.000 trang web, trong khi một người bình thường thường chỉ duyệt qua bốn hoặc năm trang.
Tốc độ đọc của AI vượt xa con người; chỉ trong vài phút ngắn ngủi, nó có thể so sánh giá toàn mạng và thậm chí đặt hàng trực tiếp — toàn bộ quy trình không tạo ra bất kỳ lượt xem quảng cáo nào. Điều này đồng nghĩa với việc các trang web phải gánh chi phí vận hành máy chủ nhưng chẳng thu được lợi ích nào.
Đồng thời, tìm kiếm bằng AI cũng liên tục chiếm đoạt lưu lượng truy cập từ các trang web. Sau khi Google bổ sung thanh tóm tắt thông minh AI ở đầu kết quả tìm kiếm, chỉ 8% người dùng nhấp vào trang gốc, khiến lưu lượng giới thiệu từ Google tới các trang nội dung giảm mạnh 33%. Chỉ sau một năm ra mắt, chức năng này đã đạt hơn 1 tỷ người dùng hoạt động hàng tháng, và khối lượng tìm kiếm trên nền tảng tăng gấp đôi mỗi quý kể từ khi ra mắt.
Chắc hẳn nhiều người vẫn còn nhớ nền tảng hỗ trợ học tập Chegg. Trước đây, Chegg dựa vào lợi thế thứ hạng tìm kiếm để kinh doanh dịch vụ hỏi đáp bài tập, nhưng giờ đây đã chính thức đóng cửa mảng hỏi đáp và đổ lỗi cho sự tấn công của ChatGPT. Các nhà sáng tạo nội dung đang rơi vào tình thế “bị kẹp giữa hai họng súng”: một mặt, bot thu thập dữ liệu tự do tràn lan trên trang web của họ; mặt khác, các đoạn tóm tắt AI lại chiếm đoạt lưu lượng trước khi người dùng kịp truy cập vào trang web.
Khoảng cách về dữ liệu còn gây sốc hơn: cứ mỗi lượt chuyển hướng mà bot của OpenAI mang lại cho một trang web đối tác, nó đã thu thập trước đó dữ liệu từ 400 trang; tỷ lệ này ở Anthropic còn lên tới 38.000:1. Những công ty này sử dụng miễn phí toàn bộ dữ liệu công khai trên mạng để huấn luyện mô hình AI, rồi lại dùng sản phẩm hoàn chỉnh để chiếm đoạt lưu lượng vốn thuộc về các trang web.
Ở các ngành khác, hành vi khai thác dữ liệu kiểu này sớm đã dẫn tới vô số vụ kiện, thế nhưng trong lĩnh vực AI, các doanh nghiệp này lại đạt được định giá hàng nghìn tỷ đô la Mỹ.
Cơ thể bạn chính là mật khẩu mới
Trong 25 năm qua, Internet chủ yếu dựa vào CAPTCHA để phân biệt người và máy. Người dùng phải nhận diện biển báo giao thông hoặc nhập các ký tự bị bóp méo — cơ chế này hiệu quả vì trước đây khả năng nhận dạng hình ảnh của máy tính còn rất kém so với con người.
Giờ đây tình thế đã hoàn toàn đảo ngược. Chương trình thao tác thông minh của OpenAI đạt điểm mô phỏng người thật trên hệ thống xác thực người-máy của Google cao hơn cả con người, có thể nhấp chính xác vào giao diện và sao chép-dán nội dung một cách thuần thục; ảnh do AI tạo ra có thể đánh lừa hệ thống xác thực danh tính, thậm chí video gọi điện thoại được tạo bằng deepfake còn bị tội phạm sử dụng để thực hiện giao dịch chuyển tiền ngân hàng. Giả định nền tảng của các phương thức xác thực truyền thống — khả năng của máy yếu hơn con người — giờ đây đã không còn tồn tại.
Ngành công nghiệp giờ đây chỉ còn cách tập trung vào những lĩnh vực mà AI tạm thời chưa thể tái tạo được: đặc điểm hành vi cơ thể của con người khi thao tác trên thiết bị điện tử — tức là công nghệ sinh trắc học hành vi. Các công ty như IBM và BioCatch đều đang nghiên cứu và phát triển hệ thống tương tự. Công nghệ này không chỉ xác thực danh tính trong quá trình đăng nhập mà còn theo dõi liên tục trạng thái sử dụng của người dùng, thu thập dữ liệu trên nhiều chiều như tốc độ di chuyển con trỏ, cách cuộn trang, nhịp độ gõ bàn phím, lực nhấn phím, thói quen xóa-sửa văn bản, góc cầm điện thoại… cảm biến con quay hồi chuyển (gyroscope) trên điện thoại sẽ ghi lại toàn bộ thông tin này.
Hệ thống còn có thể nhận diện tay thuận và quỹ đạo vuốt ngón tay của người dùng. IBM chỉ cần thu thập dữ liệu từ tám lần sử dụng để xây dựng hồ sơ hành vi riêng cho từng người dùng, sau đó so sánh từng thao tác với dữ liệu chuẩn trong thời gian thực.
Công nghệ của BioCatch thậm chí còn có thể nhận diện các tình huống lừa đảo mạng. Khi nạn nhân, dưới sự chỉ dẫn qua điện thoại của kẻ lừa đảo, đọc to tài khoản và mật khẩu, nhịp độ gõ ngắt quãng và hoảng loạn sẽ bị hệ thống ghi nhận chính xác. Chỉ trong một năm, hệ thống này đã giúp 257 ngân hàng xác định khoảng 2 triệu tài khoản rửa tiền. Hiện Liên minh châu Âu (EU) cũng đã bắt đầu thử nghiệm công nghệ nhận diện dáng đi. Mới chỉ ba năm kể từ khi kỷ nguyên tác nhân AI khởi động, nhân viên biên phòng EU đã bắt đầu thu thập dáng đi của người dân.
Các nghiên cứu liên quan còn kết hợp hiệu ứng Stroop: khi từ “xanh lam” được viết bằng màu xanh lá cây, não bộ con người sẽ phản ứng chậm hơn do xung đột giữa ý nghĩa từ và màu sắc thị giác, trong khi AI hoàn toàn không bị ảnh hưởng. Nghiên cứu phát hiện rằng sự can thiệp nhận thức này trực tiếp biểu hiện qua hành vi gõ bàn phím. Ngay cả khi nền tảng không thiết kế câu hỏi kiểm tra chuyên biệt, chỉ cần phân tích nhịp độ gõ, hệ thống cũng có thể xác định người dùng có phải là con người hay không; thói quen gõ bàn phím ẩn chứa đặc trưng xử lý thông tin độc nhất của bộ não người.
Việc theo dõi người dùng trên mạng trước đây chủ yếu ghi lại hành vi như duyệt web, nhấp chuột và tiêu dùng, nên người dùng có thể tránh né bằng cách chặn cookie, sử dụng mạng riêng ảo (VPN) hoặc tắt chức năng định vị. Nhưng sinh trắc học hành vi lại thu thập đặc điểm bản năng của cơ thể người: cách di chuyển con trỏ và nhịp độ gõ bàn phím gần như không thể thay đổi một cách nhân tạo.
Đặc điểm hành vi của mỗi người đều độc nhất vô nhị như dấu vân tay. Khác với mật khẩu hay khóa mã hóa, hồ sơ sinh trắc học này không thể thay đổi hay đặt lại. Một khi công nghệ này được phổ cập rộng rãi, mọi nền tảng đều sẽ buộc phải thích ứng. Hiện nay công nghệ mô phỏng giọng nói đã có thể giả mạo đến mức không phân biệt được trong cuộc gọi điện thoại, và công nghệ deepfake video cũng đang nhanh chóng theo sát phía sau. Nếu đây thực sự là tương lai, thì vấn đề cốt lõi nổi lên rõ ràng: những dữ liệu cơ thể này cuối cùng sẽ thuộc về ai?
Ai sẽ kiểm soát hệ thống xác thực danh tính người thật?
Hiện nay ngành công nghiệp đang phân hóa thành hai phe phái, cùng khám phá các giải pháp xác thực danh tính người thật.
Phe thứ nhất là World (trước đây tên là Worldcoin), do Sam Altman đứng đầu. Người dùng cần đứng trước thiết bị quét mống mắt dạng hình cầu để thu thập thông tin mống mắt và tạo ra chứng nhận mã hóa, từ đó chứng minh mình là một cá nhân tự nhiên duy nhất. Hiện đã có 18 triệu người tại 160 quốc gia trên toàn cầu hoàn tất đăng ký quét mống mắt. Tháng 4 năm 2026, World lần lượt ký kết hợp tác xác thực người dùng với ứng dụng hẹn hò Tinder, nền tảng hội nghị truyền hình Zoom và nhà cung cấp dịch vụ chữ ký điện tử DocuSign; đồng thời hợp tác với Coinbase ra mắt công cụ AgentKit, cho phép người dùng gắn kết các tác nhân AI của mình với danh tính thực, nhờ đó nền tảng vừa có thể xác nhận đằng sau mỗi tác nhân AI luôn có một chủ thể con người, vừa không tiết lộ thông tin cá nhân người dùng.
Tuy nhiên, công nghệ quét mống mắt đã bị cấm rõ ràng tại nhiều quốc gia. Người dân không hiểu rõ những rủi ro tiềm ẩn khi ủy quyền thu thập dữ liệu sinh trắc học — đây là nguyên nhân cốt lõi khiến các quốc gia phản đối. Một cuộc điều tra của tạp chí MIT Technology Review còn phát hiện World, ngoài việc thu thập dữ liệu mống mắt, còn tự ý thu thập thêm nhiều chỉ số sinh học khác như nhịp tim và nhịp thở mà không có sự ủy quyền hiệu lực.
Loại thứ hai là chứng minh không kiến thức (zero-knowledge proof) dựa trên mã hóa, cho phép bạn chứng minh mình là con người mà không cần tiết lộ danh tính thực, vị trí địa lý hay ngoại hình. Vitalik Buterin đã đề xuất ý tưởng này từ năm 2023. Ông cho rằng nếu không xây dựng được hệ thống danh tính người thật phi tập trung, Internet cuối cùng sẽ tiến tới kiểm soát danh tính tập trung. Một khi quyền xác thực danh tính rơi vào tay doanh nghiệp hoặc chính phủ, cơ chế giám sát sẽ ăn sâu vào tầng nền hạ tầng mạng.
Trước đây, hệ thống danh tính người thật phi tập trung đã từng được triển khai quy mô lớn nhưng cuối cùng thất bại. Idena là một trong những dự án blockchain đầu tiên theo đuổi nguyên tắc “một người – một danh tính”; chỉ trong vòng hai năm ra mắt, 40% tài khoản và 48% phần thưởng trên toàn mạng đã rơi vào tay 23 tổ chức. Các nhóm vận hành tài khoản tại Ấn Độ và Nga trả thù lao dưới một đô la Mỹ/giờ để thuê người dân thường cho mượn danh tính, từ đó thu lợi lên tới 55 lần. Các nhà nghiên cứu còn phát hiện ngay cả thông tin danh tính của trẻ em cũng bị sử dụng làm tài khoản “rơ-le” (sock puppet).
Vitalik trước đây đã dự đoán chính xác những rủi ro này. Ông khẳng định phương thức tấn công rẻ nhất nhắm vào hệ thống xác thực danh tính người thật không phải là deepfake hay kỹ thuật tin tặc cao cấp, mà là bỏ tiền ra thuê người dân tại các khu vực thu nhập thấp cho mượn danh tính. Bất kỳ hệ thống xác thực danh tính người thật nào cũng đều phụ thuộc vào nguồn tài chính: thiết bị quét mống mắt, nút xác thực trên chuỗi đều đòi hỏi chi phí đầu tư liên tục.
Nhưng một khi chứng nhận danh tính được gắn với giá trị kinh tế thực tế, thị trường chợ đen cho thuê danh tính sẽ nhanh chóng xuất hiện. Trong một thế giới thực tế với khoảng cách giàu-nghèo cực lớn, những chủ thể nắm giữ nguồn lực tài chính luôn kiểm soát được thị trường này.
“Việc áp đặt cứng nhắc nguyên tắc ‘một người – một phiếu’ trong một hệ thống có động lực kinh tế thực tế sẽ chỉ lặp lại bi kịch của các thí nghiệm xã hội thế kỷ XX.”
Nhìn một cách khách quan, cả hai hướng phát triển đều tồn tại nhược điểm rõ ràng. Giải pháp tập trung hóa có thể triển khai quy mô lớn, nhưng dữ liệu sinh trắc học của người dùng sẽ được giao cho các doanh nghiệp thu thập quá mức lưu giữ — trong khi chính những doanh nghiệp này lại hưởng lợi từ tình trạng tràn lan các bot.
Còn đường đi mã hóa về mặt lý thuyết có thể bảo vệ quyền riêng tư, nhưng lại khó thoát khỏi vấn đề mất cân bằng kinh tế trong đời thực, cuối cùng bị các ngành công nghiệp xám lợi dụng.
Nếu buộc phải đặt cược, tôi vẫn sẽ chọn giải pháp mã hóa. Bởi vì công nghệ sinh trắc học hành vi và việc quét mống mắt tập trung hóa sẽ ghi lại vĩnh viễn thông tin cơ thể bạn, và quyền sở hữu những dữ liệu này thuộc về những bên triển khai hệ thống. Một khi họ nắm giữ dữ liệu của bạn, bạn sẽ không thể xóa bỏ hay chuyển giao; những dữ liệu này sẽ bị khóa chặt trong tay công ty thu thập chúng.
Ngay cả khi biết rõ chứng minh không kiến thức có thể bị lợi dụng, nó vẫn đáng được phát triển, bởi vì loại chứng minh này cho phép xác nhận bạn là con người mà không cần tiết lộ thêm bất kỳ thông tin nào. Ngược lại, nếu từ bỏ hướng đi này, trong tương lai mỗi khi bạn truy cập bất kỳ trang web nào, đối phương đều sẽ lưu lại dữ liệu hành vi cơ thể của bạn. Hiện nay, giải pháp tập trung hóa mang tính giám sát này đã triển khai nhanh hơn nhiều so với con đường công nghệ mã hóa.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













