
Điểm kết thúc của AI không phải là hộp thoại, công ty này muốn biến thế giới thực thành lời nhắc cho AI
Tuyển chọn TechFlowTuyển chọn TechFlow

Điểm kết thúc của AI không phải là hộp thoại, công ty này muốn biến thế giới thực thành lời nhắc cho AI
Looki L1, thiết bị AI đa phương thức đầu tiên trên thế giới, ra mắt và hiện thực hóa tương lai tương tác mà OpenAI từng hình dung.
Tác giả|Tô Tử Hoa
Biên tập|Trịnh Huyền

Hai năm qua, ấn tượng của nhiều người về AI chủ yếu chỉ dừng lại ở một khung chat:
Có câu hỏi, gõ vài chữ, nó sẽ đưa ra câu trả lời. Dùng thì tiện thật, nhưng cũng khiến người ta cảm thấy hơi đơn điệu —— phải chăng AI chỉ có thể bị nhốt trong khung chat?
Tôi luôn cho rằng, AI thực sự không nên chỉ là "giáo viên thuộc lòng bách khoa toàn thư", mà nên có thể cùng tôi bước vào cuộc sống, hiểu được điều tôi đang trải nghiệm lúc này.
Chiếc Looki L1 vừa chính thức ra mắt tối hôm qua, có lẽ là thiết bị đầu tiên thực sự giúp AI "bước ra ngoài".

Đây là Looki L1, có ba màu để lựa chọn|Nguồn ảnh: Looki
Cách đây nửa tháng, tôi bắt đầu dùng thử Looki L1. Khi lần đầu cầm trên tay, tôi suýt nữa tưởng nhầm đây là một chiếc máy ảnh dạng mặt dây chuyền. Nhưng nhanh chóng nhận ra, nó không phải máy quay hành động, cũng không đơn thuần là thiết bị cứng GPT đeo trên cổ.

Tôi thường xuyên gắn nam châm Looki L1 lên ngực. Looki cung cấp cho người dùng các miếng dán thân máy khác nhau, tôi chọn mẫu hình mặt cười nghịch ngợm|Nguồn ảnh: Geek Park
Khi bật chế độ Story Mode (chế độ kể chuyện), nó sẽ tự động ghi lại video và âm thanh, sau đó chuyển cho AI để hiểu bối cảnh hiện tại của tôi. Lúc đó, mọi thứ xung quanh tôi – con phố, tiếng cười của bạn bè, biểu cảm khuôn mặt tôi – đều trở thành gợi ý (prompt) cho AI.
Cảm giác sống cùng nó rất đặc biệt: tôi trải nghiệm điều gì, nó cũng trải nghiệm điều đó; nó không còn chỉ là công cụ trả lời câu hỏi, mà đã trở thành một người bạn AI cùng tôi chia sẻ đời sống hàng ngày.
Những năm gần đây, phần lớn sản phẩm AI đều nhấn mạnh vào "hiệu suất" và "năng suất". Nhưng AI thực sự có thể bước vào cuộc sống mỗi người, gần như vẫn còn là khoảng trống.
Looki chính xác nhằm vào khoảng trống đó. Thành lập được một năm, đội ngũ này đã hoàn thành ba vòng gọi vốn (gồm vòng hạt giống, hạt giống+ và Pre-A) trong nửa năm, với tổng số tiền hơn 10 triệu USD. Vòng gọi vốn này do Zhongding Capital dẫn đầu, các cổ đông cũ BAI, Alpha Venture, Tongge Capital tiếp tục rót vốn vượt mức.
Theo định nghĩa chính thức, đây là một chiếc máy ảnh AI lifelogging (máy ảnh ghi nhật ký sống bằng AI), là thiết bị AI phần cứng đầu tiên trên thế giới thực sự đạt được tương tác đa phương thức (multimodal).
Trong thời gian sử dụng, tôi đã quên mất mình thốt lên bao nhiêu lần "chết tiệt". Nhìn lại, nó không chỉ là một "bộ nhớ cuộc sống", mà còn giúp tôi hiểu lại chính mình, mang đến nhiều thay đổi trong thói quen sinh hoạt. Đồng thời, nó cũng mở ra trong tôi những tưởng tượng về tương lai của "tương tác AI".
Khi AI bước vào cuộc sống của tôi
So với bất kỳ loại máy ảnh truyền thống nào, thiết kế ngoại hình và thao tác của Looki cực kỳ đơn giản, thậm chí có thể nói là "tối giản đến mức sơ sài".
Looki L1 không có màn hình, chỉ có hai nút vật lý, thông qua nhấn ngắn/dài để kích hoạt chế độ Story Mode (chụp ảnh cách quãng), chụp ảnh, quay phim và ghi âm. Phần touchpad ở mặt trước thân máy thực hiện chức năng trò chuyện với AI, trải nghiệm tương tự như gửi tin nhắn thoại trên WeChat.

Hai bên hông là hai nút chức năng, mặt trước là touchpad, có thể chạm nhấn|Nguồn ảnh: Geek Park
Và trọng lượng của nó chỉ 30 gram, đeo trên người hầu như không cảm giác gì, khiến tôi cảm thấy đội ngũ phát triển dường như muốn người dùng càng ít thao tác càng tốt, và quên đi sự tồn tại của chiếc máy ảnh này.

Giao diện ứng dụng Looki|Nguồn ảnh: Geek Park
Ứng dụng Looki cũng kế thừa triết lý tối giản, như hình trên:
-
For You: Luồng "cuộc sống" do AI chủ động đề xuất mỗi ngày, giống như bản feed Instagram cá nhân, nhưng chỉ hiển thị cho riêng bạn;
-
Chat: Trò chuyện với AI có trí nhớ toàn bộ cuộc sống, chắc chắn là AI hiểu tôi nhất, nơi bạn có thể nói chuyện về đời sống cá nhân;
-
Lifelog: Hồ sơ cuộc sống được AI tự động hiểu và sắp xếp, biến dữ liệu thô thành các sự kiện theo chủ đề Moments;
-
Device: Chủ yếu dùng để kiểm tra trạng thái thiết bị và một số cài đặt cơ bản khác.
Dùng Looki ghi lại đời sống hàng ngày, cảm giác mạnh mẽ nhất là "tập trung vào hiện tại".
Tính năng tôi dùng nhiều nhất là Story mode, tức chụp ảnh tự động cách quãng. Sau khi bật, tôi không cần lo lắng phải bấm máy lúc nào, cứ yên tâm tận hưởng khoảnh khắc.
Nếu gặp cảnh muốn ghi lại đột ngột, cũng không cần rút điện thoại ra khỏi túi, mở khóa rồi chụp ảnh. Chỉ cần nhấn nút chụp hoặc quay trên Looki L1.
Bạn có từng cảm thấy như vậy không: Thực tế mà nói, dù dùng thiết bị gì, việc chụp ảnh không phải điều khó nhất. Khó nhất là xử lý dữ liệu sau khi chụp. Và đây cũng là điểm then chốt tạo nên sự khác biệt thực sự của Looki so với các máy ảnh khác.
Trước đây, chúng ta có thể chụp hàng loạt ảnh và video, nhưng phần lớn đều ngủ yên trong ổ cứng, không thể tổ chức.
Trong khi đó, tính năng "Moments" của Looki tận dụng khả năng AI đa phương thức để hiểu con người, bối cảnh và cảm xúc trong video, tự động sắp xếp dữ liệu khổng lồ thành các sự kiện theo chủ đề, đồng thời trích xuất các "phân đoạn nổi bật", biến những khoảnh khắc rời rạc thành câu chuyện có ý nghĩa. Toàn bộ quá trình không cần can thiệp con người, tiết kiệm rất nhiều thời gian.

Trên trang "moments", có thể xem các khoảnh khắc nổi bật và các đoạn tư liệu|Nguồn ảnh: Geek Park
Sau một ngày, khi ta lật xem giao diện "Moments", cảm giác như có được tự truyện của chính mình.
Ngoài ra, quan sát mấy ngày nay, vlog do Looki tạo ra cũng khá tinh tế. Nó tự sắp xếp mạch truyện, phân tích chủ đề, phối nhạc theo chủ đề đó, đồng thời thêm chú thích hoặc từ khóa cho từng cảnh. Tổng thể mang chất lượng giống phim tài liệu kiểu Âu-Mỹ.

Tôi chụp lại hai ảnh bìa vlog do Looki tạo, để cảm nhận phong cách|Nguồn ảnh: Geek Park
Tôi từng thử làm vlog, nhưng kiên trì nửa tháng thì bỏ cuộc, một mặt hay quên lấy điện thoại hoặc máy ảnh ra quay, mặt khác mỗi ngày quay nhiều dữ liệu, buổi tối phải chỉnh sửa mất rất nhiều thời gian, tốn công sức. Vì vậy, với người lười như tôi, đây là giải pháp tốt nhất từng gặp.
Triết lý thiết kế sản phẩm: AI hướng nội, giúp tôi nhìn thấy bản thân rõ hơn
Thay đổi lớn nhất mà sản phẩm này mang lại cho tôi là khiến tôi bắt đầu nhìn sâu hơn vào bên trong chính mình.
Công lao này có lẽ thuộc về khả năng tạo nội dung của Looki. Mỗi ngày tôi đều mong chờ nó gửi Moment và vlog, vì tôi tò mò AI sẽ diễn giải tôi như thế nào, diễn giải cuộc sống của tôi ra sao.

Moment mà Looki gửi cho tôi, đọc phần mô tả và diễn giải của nó là một niềm vui|Nguồn ảnh: Geek Park
Sau trải nghiệm bất ngờ đầu tiên, tôi không chỉ gắn nam châm Looki L1 lên ngực hàng ngày, mà khi ngồi xuống, tôi cũng tháo nó ra đặt lên bàn, hướng ống kính về phía mình. Từ đó, tôi bắt đầu xuất hiện trong khung hình video. Hơn nữa, dựa trên thông tin bối cảnh, âm thanh, video, AI của Looki nhanh chóng nhận định tôi là nhân vật chính trong câu chuyện này, và ghi nhớ tôi hoàn toàn.

Looki L1 có thể đứng thẳng trên bàn nhờ nút nam châm ở mặt sau|Nguồn ảnh: Geek Park
Nó thường xuyên ghi lại những khoảnh khắc đời sống mà tôi bỏ qua, nhưng có thể chứa đựng cảm xúc mạnh mẽ hơn lúc đó, sau đó kèm theo phần diễn giải và mô tả. Sau khi xem, tôi thường cảm thấy: "Ồ, hóa ra tôi đã trải qua khoảnh khắc đó như vậy", "Hóa ra lúc đó tôi vui đến thế". —— Biết đâu, nếu không xem lại "phát lại" từ Looki L1, tôi chắc chắn đã bỏ qua khoảnh khắc đó, coi nó như một mảnh đời thường tẻ nhạt.
Khoảnh khắc tôi xem lại, dường như tôi nhìn thấy rõ hơn về bản thân, tái chiếm lại một khoảng thời gian.
Dù vậy, Looki L1 cũng không thể thay thế máy ảnh truyền thống.
Logic của máy ảnh truyền thống là theo đuổi chất lượng hình ảnh, theo đuổi khoảnh khắc đỉnh cao. Ví dụ, drone DJI, máy ảnh hành động GoPro, đều xoay quanh "hình ảnh tuyệt vời". Nhưng lựa chọn của Looki lại ngược lại: nó không theo đuổi 4K, mà dùng cảm biến Sony IMX681 CMOS (cùng loại với Meta Rayban), độ phân giải 1080p, nhưng đổi lại là thời lượng pin 12 giờ và độ nhẹ chỉ 30 gram.
Mạng xã hội khiến con người quen với việc trưng bày "khoảnh khắc nổi bật". Ngược lại, Looki không được thiết kế cho kiểu chia sẻ biểu diễn như Xiaohongshu hay Instagram. Điều nó muốn bắt giữ là tính liên tục của cuộc sống và những chi tiết đời thường.
Dù sao thì, cuộc sống của chúng ta không được cấu thành từ từng "khoảnh khắc hoàn hảo", mà chính những khoảnh khắc đời thường không rực rỡ, vụn vặt nhưng chân thực, mới là chìa khóa tạo nên "tôi là tôi".
Ngày nay, chúng ta đang sống trong môi trường bị ngập trong nội dung, dễ dàng bị cuốn theo các câu chuyện lớn hay tin giật gân. Do đó, xét theo cơ chế sản phẩm, Looki mang khí chất "đi ngược dòng", dường như đang dẫn dắt con người chú ý đến cuộc sống của chính mình, tìm kiếm điều bất ngờ từ đời sống và từ bản thân.
Looki giúp tôi nhìn thấy tiềm năng của thiết bị AI đa phương thức
Thực ra, ý tưởng "ghi lại cả cuộc đời" đã được ai đó đề cập từ lâu.
Thập niên 90 thế kỷ trước, nhà tiên phong máy tính Gordon Bell từng thử đeo máy ảnh suốt ngày để ghi lại cuộc sống, cuối cùng thất bại. Lý do rất đơn giản: chụp nhiều đến đâu, nếu không có trợ giúp của AI, lượng lớn dữ liệu cũng khó sắp xếp thành câu chuyện thực sự hữu ích.
Đột phá của Looki nằm ở AI đa phương thức. Nó có thể hiểu hình ảnh, âm thanh và ngữ nghĩa, biến dữ liệu rời rạc thành "ký ức" có thể sử dụng.
Ví dụ, khi tôi hỏi Looki, hôm qua tôi uống cà phê gì, nó có thể nhanh chóng phân tích dữ liệu video, nói cho tôi biết tôi đã uống cà phê gì ở cửa hàng nào, mô tả cả bầu không khí lúc đó, đồng thời liệt kê các bức ảnh liên quan.

Giao diện trò chuyện với AI Looki|Nguồn ảnh: Geek Park
Nhiều doanh nhân từng bày tỏ với tôi quan điểm tương tự: Nếu mô hình lớn muốn phát huy tác dụng thực sự, nhất định phải có khả năng cảm nhận thế giới vật lý, phải có phần cứng. Có lẽ vì vậy mà "thiết bị AI di động" đang trở thành điểm nóng thu hút sự chú ý trong giới đầu tư và khởi nghiệp.
Điểm sáng tạo của Looki là, nó là người tiên phong sử dụng phần cứng thiết kế tinh tế để giải phóng năng lực AI đa phương thức, giúp mọi người cảm nhận được "AI đa phương thức" thực sự có thể làm được gì trong đời sống thực tế, đặt tương lai trước mắt tất cả mọi người.
Trước đây, AI phục vụ đời sống cá nhân rất khó làm, một nguyên nhân then chốt là thiếu bối cảnh (context).
Đội ngũ Looki cho biết họ tích hợp các mô hình lớn ChatGPT và Gemini. Nhưng trải nghiệm thực tế, AI Looki hoàn toàn vượt trội so với phiên bản web ChatGPT và Gemini tôi đang dùng, nó hiểu tôi hơn, có thể kết hợp đời sống của tôi để trò chuyện.
Tôi nghĩ, lý do cốt lõi nằm ở chỗ phần cứng Looki ghi lại thông tin môi trường vật lý nơi tôi đang ở, cung cấp thêm bối cảnh cho AI. Nếu không có bối cảnh cá nhân hóa, câu trả lời của AI thường đúng nhưng vô dụng.
Có thể nói, nội dung mà Looki tạo ra phụ thuộc chủ yếu vào những gì nó quay được. Tôi mang nó đi càng nhiều nơi, nội dung nó tạo ra càng phong phú, sâu sắc. Lúc này, ảnh và video không còn là đích đến, mà trở thành các gợi ý (Prompt). Với Looki L1, cả thế giới đang trở thành gợi ý cho AI của tôi.
Ngoại hình Looki L1 trông giống người ngoài hành tinh, mỗi lần đeo nó ra ngoài, dường như mang theo một người bạn ngoài hành tinh, cùng bước vào xã hội. Nó sẽ ghi lại những nơi chúng tôi từng đến, những người chúng tôi gặp, những sự kiện trải qua. Nó như một người bạn có chung trải nghiệm, luôn xuất hiện bên tôi. Nó cũng sẽ trưởng thành theo những trải nghiệm, tạo nên sự cộng hưởng cảm giác với tôi.
Nhớ lại, thời gian trước OpenAI đã mua lại công ty của Jony Ive, cựu giám đốc thiết kế Apple, với mục tiêu thay đổi cách tương tác giữa con người và AI, dự kiến ra mắt thiết bị AI vào năm 2026, và hình ảnh concept rò rỉ rất giống với Looki L1.
Có lẽ, chiếc Looki L1 mà chúng ta thấy hôm nay, chính là điểm khởi đầu của "thiết bị AI cá nhân".
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












