
Kimi Claw 실사용 평가: OpenClaw 열풍 속에서도 자동화 AI는 여전히 개척기 단계
저자: 쉬산

2026년, 한 마리 랍스터가 전 세계 AI 업계를 뒤흔들었고, 설 연휴 이후에도 OpenClaw의 열기가 계속되고 있다.
최근 중국 내 여러 모델 기업들이 차례로 OpenClaw를 벤치마킹한 제품을 출시했다. 미니맥스(Mini Max)는 MaxClaw를, 김이(Kimi)는 김이 클로우(Kimi Claw)를 선보였으며, 이는 OpenClaw가 보여준 AI 실행 능력과 개발자들이 AI 실행 결과에 대해 보이는 관용도가 시장에 실질적인 가치 공간을 제시하고 있음을 의미한다.
다양한 벤치마킹 제품 중 김이 클로우는 비교적 명확한 포지셔닝을 갖고 있다. 이 제품은 OpenClaw를 기반으로 완전히 새로 개발된 ‘클로우’ 제품이 아니라, OpenClaw의 호스팅 클라우드 서비스를 기반으로 하며, 데이터는 문샷(Moonshot) 클라우드에 저장된다. 또한, 5,000개 이상의 ClawHub 커뮤니티 기술(Skills)이 사전 설정되어 있다.
김이 클로우의 장점은 사용 안정성이 높고, 배포가 간편하며, 입문 난이도가 낮다는 점이다. 클라우드 기반이기 때문에 24시간 연중무휴로 실행 및 운영이 가능하다. 김이 공식 웹사이트에 접속해 단 한 번의 클릭만으로 김이 클로우를 즉시 배포할 수 있다.

김이 클로우 일클릭 배포|출처: GeekPark
즉, 김이 클로우는 독립적인 신제품이라기보다는, 사용자가 김이를 통해 클라우드 상에서 실행되는 OpenClaw 환경에 직접 접근할 수 있도록 원격으로 준비된 가상 머신(virtual machine)에 불과하다.
기능을 축소하거나 추가로 캡슐화하지 않았으며, 로컬에 OpenClaw를 직접 설치한 것과 거의 차이가 없다. 다만, 설치·설정·환경 구축 과정을 사용자 대신 완료했을 뿐이며, OpenClaw 설치 후 실제 조정 및 최적화 작업은 전혀 제공하지 않는다. 따라서 올바른 명령어 작성법과 과제의 합리적 배분 방법을 익히지 않으면 여전히 높은 진입 장벽이 존재한다.
OpenClaw 계열 제품을 처음 접하는 사용자의 경우, 예상과 실제 사이 괴리가 발생하기 쉽다. 즉, OpenClaw에 접속하면 자동화된 AI 실행이 바로 가능할 것이라고 기대하지만, 실제로는 단지 편리한 인터페이스 하나가 추가된 것일 뿐이며, 그 이후의 많은 설정 작업은 여전히 사용자가 직접 탐색해야 한다. 따라서 향후 많은 AI 모델 기업들이 OpenClaw 계열 제품에 인기 있는 사전 설정 기술(Skills)을 제공하는 것을 주요 전략으로 삼게 될 것이다.
현재 김이 클로우는 베타 테스트 단계이며, 김이 알레그레토(Kimi Allegretto) 회원에게만 사용 권한이 부여된다.
1. 30분 만에 자동화된 업무 워크플로우 구축하기
우리는 많은 사용자들이 우리와 마찬가지로 OpenClaw에 접속한 후에도 여전히 AI의 실행 능력 한계를 파악하지 못하고, AI가 무엇을 할 수 있고 무엇을 할 수 없는지에 대한 호기심과 동시에 막연한 불확실성을 느끼며, 접속 후 어디서부터 시작해야 할지 막막해한다는 사실을 발견했다.
실제로 현재 로컬에 OpenClaw를 설치하든, 혹은 김이 클로우와 같은 외부 인터페이스를 직접 사용하든 전체 사용 방식은 크게 두 가지 경로로 나눌 수 있다: 하나는 ‘0’부터 시작해 애플리케이션을 완전히 새로 구축하는 방식이고, 다른 하나는 ‘0.5’부터 시작해 기존 애플리케이션을 최적화하는 방식이다. 우리는 이 두 방식 모두 실제 체험해 보았으며, 먼저 ‘0’부터 시작해 애플리케이션을 개발하고 워크플로우를 최적화하는 방식을 선택했다.
김이 클로우를 체험하기 전, 나는 우선 내가 어떤 업무를 고정된 워크플로우로 만들 수 있을지, 또는 기존 워크플로우 중 어떤 작업이 AI의 도움으로 더 나아질 수 있을지를 검토했다. 그리고 그 전에 고민해야 할 유일한 질문은, 어떤 유형의 AI 도구와 상호작용해야 최선의 결과를 얻을 수 있는가였다.
나는 ‘업무 일지’ 단계를 선택했다. 매일의 업무 흐름에 따라 업무 기록, 업무 요약, 업무 성찰 등 여러 단계를 거쳐 당일 업무 보고서를 생성하는 것이다. 과거에는 이 보고서 작성이 개인적으로 소요되는 시간이 많았지만, 이제는 AI가 자동으로 정보를 수집하고, 대화형 인터랙션을 통해 자동으로 표 형식으로 출력되기를 기대했다.
나는 먼저 대략적인 아이디어를 AI에게 전달하여 명령어를 최적화한 후, 역할 정의, 기술(Skill) 구성, 데이터 연동, 핵심 워크플로우, 멀티미디어 표 구조, 기억 포인트, 권한 및 경계 설정 등 여러 측면에 걸쳐 매우 복잡하고 긴 명령어를 김이 클로우에 전달했다.
김이 클로우는 명령어를 분석한 후 곧바로 실행 세부 사항을 확인해왔다. 예를 들어 기본 정보, 비슬(Feishu) 권한, 데이터 저장 위치, 트리거 방식 등을 확인한 것이다. 이후 우리는 해당 명령어에 따라 비슬 플랫폼에서 비슬 앱을 구축했고, App ID와 App Secret을 김이 클로우에 전달했다.
비슬 내에서 표를 생성하는 단계에서는, 내가 김이 클로우에게 표의 스타일을 직접 요청한 후, 이를 비슬 내장 AI 시스템에 전달해 자동으로 표를 생성하도록 했다.

김이 클로우가 구축한 앱 페이지 중 하나|출처: GeekPark
협업자 찾기, 앱 페이지 찾기, ID 찾기 등 다양한 문제를 겪은 끝에 약 30분 만에 김이 클로우로부터 첫 번째 메시지를 성공적으로 수신했다.
이 봇을 구축하는 속도는 기대보다 훨씬 빨랐다. 문제가 생겼을 때는 어느 단계에서 막혔는지를 김이 클로우에 바로 알려주었고, 김이 클로우가 제시한 해결 방안 중 적절한 것을 선택해 실행했다. 만약 제시된 방안이 적절하지 않다면, 김이 클로우에게 다른 해결책을 계속해서 물어보았다.

김이 클로우를 비슬에 일클릭 배포|출처: GeekPark
워크플로우 구축 과정에서 크로스플랫폼 기능의 중요성도 더욱 부각되었다. 12개의 비슬 권한을 연이어 개방한 후, 최종적으로 구축한 AI 애플리케이션이 이상적인 상태까지는 도달하지 못했다. 특히, 나는 AI가 나와 타인 간의 채팅 기록을 읽고 이를 바탕으로 내 업무를 정리해 주기를 바랐으나, 여러 차례 시도 끝에 AI 애플리케이션이 반환한 채팅 목록은 여전히 공백이었고, 비슬 AI 애플리케이션은 사용자가 직접 참여한 대화만 읽을 수 있으며, 그룹 채팅 목록은 읽을 수 없다고 명시했다.
전체적인 체험을 종합해 보면, 김이 클로우는 비슬, 딩딩(DingTalk) 등 일반적인 업무 워크플로우 플랫폼의 개발자 도구에 매우 익숙하며, 대부분의 명령어를 바로 실행 가능한 방식으로 찾아낼 수 있다. 따라서 초보 사용자도 명령어를 쉽게 이해하고 실행할 수 있다. 그러나 이러한 기업용 애플리케이션은 자체 정보 권한을 매우 중시하며, 권한 개방 조건도 매우 엄격하다. 따라서 AI가 진정으로 업무 워크플로우에 통합되기 위해서는 김이 클로우와 같은 개방형 도구뿐 아니라, AI와의 통합에 더 적합한 애플리케이션의 등장도 기다려야 할 것이다.
또한, 실행 과정에서 버그가 자주 발생한다. 예를 들어, 사용자와 김이 클로우 간의 인터랙션 작업이나 현재 실행 중인 에이전트(Agent) 작업이 오인식되어 개인 업무 일정에 포함되기도 한다. 버그 수정 능력 역시 AI를 조정하는 데 중요한 요소가 된다.
‘0’부터 자신이 원하는 애플리케이션 또는 기능을 직접 맞춤 제작하려면, 사용자는 명확한 작업 경로를 스스로 설계하고 기본적인 제품 사고(Product Thinking)를 갖추어야 한다. 정보 입력 및 출력 양쪽 인터페이스의 개방 정도와 연결성을 명확히 파악하고, 각 호출 및 실행 시의 비용을 효과적으로 관리해야 한다.
본 워크플로우 구축 과정에서 전체 토큰 소비량은 약 15k~25k였으며, 김이의 과금 방식에 따르면 약 1위안 정도였다. 하지만 하루 평균 약 0.53위안, 한 달 기준 약 15.9위안이 소요된다.
2. 자동화 AI 뉴스 어시스턴트 구축 실측: ‘프리셋’ 애플리케이션은 빠르게 시작 가능하나, 수정에는 비용이 든다
AI가 나만의 아이디어를 기반으로 애플리케이션을 맞춤 제작해 주는 것 외에도, 나는 ‘프리셋(Preset)’ 애플리케이션, 예를 들어 김이 클로우가 자동으로 뉴스를 수집해 주는 기능도 체험해 보았다.
첫 번째 자동화 뉴스 수집 작업을 수행할 때, 우리는 특정 기술 뉴스 미디어의 공식 웹사이트에서 뉴스를 수집하도록 김이 클로우에 지시했다. 우리가 제시한 명령어는 다음과 같았다:
“xxxx 업계 웹사이트를 모니터링하여 최근 1주일과 향후 3일 동안 ‘AI’ 키워드를 포함하는 새 기사가 게시될 때마다, 기사 제목, 요약, 게시 시간을 자동으로 수집해 온라인 표에 집계하라. 또한, 보고서 내에서 내가 설정한 스타일에 따라 ‘바이럴’ 기사를 분석하라.”
김이 클로우는 구체적인 설정 정보를 묻기는 했으나, 첫 번째 뉴스 수집 작업에서 우리는 많은 공식 웹사이트가 크롤러 방지(Crawler Blocking) 설정을 하고 있어 고품질 웹사이트의 정보 모니터링이 어렵다는 사실을 알게 되었다. 김이 클로우 역시 정확한 범위 기반 수집을 제공하기 어려워 공회전 현상이 발생했고, 이때마다 다량의 토큰이 소비되었다.
이 모니터링 작업은 오늘 새벽 4시부터 오전 11시까지 약 8차례 실행되었으며, 약 180K 토큰을 소비해 약 3.68위안이 들었다. 원래 설정대로 매시간 실행한다면 하루 비용은 약 11위안, 한 달 기준 약 330위안이 소요된다.
이후 관련 전문가에게 조언을 구한 후, 우리는 직접 명령어를 작성하는 것을 포기하고, ClawHub 등 관련 웹사이트에서 이미 검증된 명령어 압축 패키지를 다운로드해 이 기반 명령어를 바탕으로 뉴스 수집 기능을 맞춤 조정하기로 했다.

ClawHub 파일을 김이 클로우에 배포|출처: GeekPark
이후 우리는 중국어 미디어, 뉴스 필터링 조건, 정보 전송 횟수 및 시간 등에 대해 상세한 설정을 적용했다. 그 결과, 꽤 훌륭한 AI 뉴스 수집 결과를 얻을 수 있었다.

김이 클로우 자동 수집 결과|출처: GeekPark
명백하게, 프리셋 애플리케이션을 수동으로 사용하는 경우, 핵심은 고품질 기술(Skills) 패키지를 선별하는 능력과, 자신의 사용 사례에 맞춰 기존 기능을 조정 및 최적화하는 능력에 있다.
그러나 이러한 프리셋 AI 애플리케이션을 맞춤형으로 수정하려면, 다시 ‘0’부터 애플리케이션을 구축할 때 직면했던 동일한 어려움으로 돌아가게 되며, 개발 및 최적화 난이도는 결코 낮지 않다. 결국 수정 결과도 기대에 부응하지 못할 가능성이 높다.
이 과정에서 사용자는 동일한 제품군 내 다양한 Skills의 편의성과 적합도를 경험해 보는 데 상당한 시간을 투자해야 하며, 어느 종류의 Skills를 기반으로 2차 개발, 수정 및 확장을 진행할지를 결정해야 한다. 이 모든 것은 사용자의 제품 사고를 요구한다.
3. 김이 클로우 사용 감상: AI 실행력 강화, 명령어 자체가 생산성
현 시점에서 김이 클로우의 핵심 가치는 단지 OpenClaw의 배포 장벽을 낮추어 국내 사용자들이 빠르게 접속할 수 있게 해주는 데 있다. 그러나 이 제품 자체는 사용 사례나 기술(Skills)을 내장하지 않으며, 오히려 ‘변환 인터페이스’에 가깝고, ‘완성형 제품’이라기보다는 ‘기반 플랫폼’에 가깝다.
체험 과정에서도 우리는 김이 클로우가 밑바닥에서 사용하는 모델이 김이 K2.5임에도 불구하고, 이는 ‘베어 모델(Bare Model)+순수 OpenClaw’ 조합으로, 김이 공식 웹사이트 버전처럼 검색 팀이 다수의 반복 검색, 콘텐츠 강화, 자동 오류 정정 등에 대해 심층적으로 최적화한 기능을 계승하지는 않는다는 사실을 확인했다.
즉, 김이 공식 웹사이트가 잘 작동하는 이유는 사용자 빈도가 높은 시나리오에 대해 전담 팀이 모델을 다수 차례 최적화했기 때문이며, 자동 완성 기능도 지원한다. 반면, OpenClaw 환경에 연결된 ‘베어 모델’은 API를 직접 호출하는 것에 가까워 특별한 최적화가 전혀 이뤄지지 않은 상태이다.
심층 체험을 통해 나는 김이 클로우를 사용하는 것과 기존 AI, 일반 에이전트(Agent) 제품을 사용하는 것의 핵심 차이가 ‘AI 실행력’과 ‘명령어의 중요성’이라는 두 가지 차원에 집중됨을 분명히 인지할 수 있었다. 이는 이 유형의 제품을 사용하는 데 있어 핵심 논리이기도 하다.
첫째, 실행력 측면에서 김이 클로우는 사용자가 컴퓨터를 사용하지 않을 때도 작업을 수행할 수 있다. 이는 전통적인 방식, 즉 사용자가 명령어를 입력한 후 작업 완료를 기다리는 방식과는 근본적으로 다르다. 나는 김이 클로우에게 명령어를 언제 실행할지 직접 지정할 수도 있으며, 컴퓨터를 켤 때마다 정기적으로 출력된 결과를 바로 확인할 수 있다. 다만, 일부 사용자 중심 애플리케이션의 경우, 불필요한 리소스 소모를 줄이기 위해 중단 지점을 반드시 설정해야 한다는 점도 상기해야 한다.
둘째, 명령어 측면에서 과거에는 나는 AI에게 비교적 간결하고 핵심을 찌르는 명령어를 주었고, AI가 제시한 해결 방향이 틀렸을 경우에만 추가로 조정하였다. 그러나 김이 클로우는 복잡한 명령어를 실행할 때마다 다수의 에이전트를 동원하므로, 소비되는 토큰도 기하급수적으로 증가한다. 따라서 명령어를 작성할 때는 작업 방식, 권한 범위, 실행 경로, 보안성 및 비용 관리를 명확히 명시해야 한다.
예를 들어, 과거 뉴스를 조회할 때 나는 “OpenClaw 관련 뉴스 10건을 제시하고, 각 뉴스의 관심 가치를 설명하라”는 식의 간단한 명령어를 사용했지만, 지금은 다음과 같이 매우 구체적이고 정교한 명령어를 사용한다:
“정보 검색 전문가로서 당신은 웹 검색 도구 사용 권한을 보유한다(단, web_search 및 web_open_url만 허용하며, 로그인을 요구하는 유료 뉴스 데이터베이스는 접근 금지). 다음 제약 조건 내에서 실행하라: 1) 먼저 ‘OpenClaw 최신 동향’ 키워드로 검색을 실행하되, 상위 5개의 고신뢰도 결과만 가져오되(기술 미디어 및 공식 블로그를 우선 고려하고, 포럼의 잡담 글은 제외), 2) 각 기사의 뉴스 가치를 분석할 때는 ‘기술적 돌파’, ‘상업적 영향’, ‘보안 위험’이라는 세 가지 차원에 엄격히 국한하고, 각 차원에 대해 한 문장으로 요약하되, 관련 없는 배경 설명은 금지, 3) 브라우저 자동 클릭 및 심층 크롤링 기능은 전면 금지하여 크롤러 방지 메커니즘을 유발하거나 불필요한 토큰 소비를 초래하지 않도록 함, 4) 출력 형식은 표 형태로: 뉴스 제목 | 출처 | 관심 가치 태그 | 간략한 근거(각 항목 30자 이내), 5) 검색 결과가 10건 미만일 경우, 즉시 추가 검색을 중단하고 실제 수량만큼만 출력하되, 수량을 맞추기 위해 2차 광범위 검색(broad search)을 시행하지 말 것. 예상 토큰 예산은 8K 이내로 제한하며, 실행 경로가 벗어났을 경우 즉시 중단하고 보고하되, 자율 수정은 금지.”
대부분의 경우, 나는 명령어를 김이 클로우에 전달하기 전에 AI에게 먼저 명령어 표현을 최적화해 달라고 요청한다. 구체적이고 정확한 명령어만이 합리적인 토큰 소비 범위 내에서 최상의 결과를 얻을 수 있는 전제조건이다. 실제로 많은 공개 포럼에서는 OpenClaw 전용 Skills 라이브러리가 사용자들이 인기 애플리케이션을 보다 쉽게 활용할 수 있도록 돕고 있다.
정확하고 구체적인 명령어는 합리적인 토큰 소비 범위 내에서 우수한 결과를 얻기 위한 전제이며, 김이 클로우를 사용하는 과정은 본질적으로 사용자가 모델의 능력, 출력 결과, 사용 비용 사이에서 균형을 맞추는 과정이다.

김이 클로우|출처: GeekPark
마지막으로, AI 조정(Tuning)이다.
당신이 빠르게 구축한 AI 애플리케이션이 처음부터 완벽하게 작동하리라고 기대해서는 안 된다. 이 AI 봇은 인간의 이해와는 상당히 다른 방식으로 명령어를 해석하고, 여러 작업을 병합하려는 경향이 있다. 따라서 제품의 한계를 탐색하기 위해 반복적인 명령어 조정을 거쳐야 한다. 특히 많은 정보 소스의 인터페이스가 완전히 공개되지 않은 경우가 많으며, 정보 권한의 접근 및 위임을 제대로 처리하는 일은 결코 쉬운 일이 아니다.
결국 현재 김이 클로우가 보여주는 응용 효과는 단순한 챗봇(Chatbot)과 같은, 사용자가 바로 활용 가능한 AI 애플리케이션이 아니라, 개발 과정을 이해하고, 다양한 요소를 종합적으로 고려해 선택을 내려야 하는 개발자 도구에 가깝다. 다만 이 개발자 도구는 간소화된 자동화 배포를 지원할 뿐이다.
자동화 AI는 여전히 발전 가능성이 있다
OpenClaw는 2026년부터 자동화 AI에 대한 사람들의 상상을 완전히 불태웠지만, 최근 잇따라 발생한 보안 사고와 신제품 실측 체험 결과를 종합해 보면, OpenClaw는 여전히 단순한 ‘열쇠’ 혹은 ‘시작점’일 뿐, 최종 해답은 아니다.
실제로 적용 가능한 사용 사례나 규모화 가능한 상업화 경로 모두, AI 산업은 아직까지 명확하고 성숙한 길을 걷지 못하고 있다. 이와 대조적으로, 시장은 차례차례 반복되는 과열된 열풍 속에서 클로우(Claws) 계열 제품에 대한 기대치를 지속적으로 높이고 있으며, 심지어 많은 일반 사용자들이 자신의 역량을 넘어서는 고위험 작업을 시도하게 만들고 있다.
확실한 점은, 자동화 AI는 AI 탄생 초기부터 산업계에서 중요하게 여겨졌다는 것이다. 그러나 OpenClaw 및 김이 클로우와 같은 클라우드 호스팅 형태가 진정으로 성공적이고 규모화 가능한 제품으로 자리매김할 수 있을지는 여전히 검증되지 않은 영역이다. 특히 현재 이 유형의 AI 도구는 사용자의 단말기나 파일을 직접 수정할 수 있는 권한을 획득한다.
초기 단계에서는 AI의 능력 한계가 명확하지 않아 많은 초보 사용자들이 무분별하게 권한을 개방하고, 보안 제한이나 2차 권한 확인을 고려하지 못하는 경우가 많다. 이렇게 높은 수준의 조작 권한을 AI에게 부여하는 것은 본질적으로 시스템 위험을 직접 노출시키는 행위이다. 이것이 바로 이 유형의 제품이 진정으로 규모화되고 상업화되기 위해서는 ‘능력이 강한가’보다 훨씬 넘기 어려운 관문인 ‘보안 및 권한 관리’가 가장 핵심적인 과제가 되는 이유이다.
대규모 언어 모델(Large Language Model)과 직접 대화하는 것에서부터 단일 에이전트(Agent)와 상호작용하는 것, 여러 에이전트가 협업하는 것, 그리고 지금의 OpenClaw 사용 방식에 이르기까지, 산업계는 동일한 AI 능력 기반 위에서 기능은 유사하지만 경로는 서로 다른 다양한 시도를 만들어냈다. 이는 전 산업이 여전히 AI 기능 탐색 단계에 있다는 것을 분명히 보여주며, ChatGPT와 같은 성숙하고 안정적인 상호작용 패러다임을 제외하고는, 에이전트(Agent), 클로우(Claws) 등 새로운 형태의 사용 논리, 한계, 가치에 대해 여전히 공동으로 탐색 중임을 의미한다.
어쩌면, 2026년이 끝날 때까지 기다려야 비로소 안정적이고 실용적이며 진정한 가치를 지닌 자동화 AI 애플리케이션이 실제로 세상에 모습을 드러낼 수 있을지도 모른다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














