
BitsLab 산하 AI 도구, Bluefin의 고위험 취약점 발견 및 수정 지원
저자: BitsLab
웹3 프로토콜의 복잡성이 급증함에 따라 자산 보안을 염두에 두고 설계된 Move 언어는 공개 데이터와 연구 부족으로 인해 감사 난이도가 더욱 커지고 있다. 이에 BitsLab은 전문가가 기획한 도메인 데이터를 기반으로, RAG(검색 강화 생성), 다단계 자동 검토, 결정론적 정적 분석 위에서 작동하는 특화된 AI 에이전트 클러스터를 결합한 다층형 AI 보안 툴킷 'BitsLabAI'를 구축했다.

Bluefin의 퍼피츄얼 계약 DEX 공개 감사에서 BitsLab AI는 총 네 가지 문제를 발견했으며, 그 중 하나는 고위험 로직 결함으로, Bluefin 팀은 이를 바탕으로 수정을 완료했다.

1) 지금 당장 AI가 필요한 이유: 체인 상 보안 패러다임의 전환
체인 상 보안과 디지털 자산 보호의 패러다임은 근본적인 변화를 겪고 있다. 기초 모델의 중대한 발전과 함께 오늘날 대규모 언어 모델(LLM)과 AI 에이전트는 명확하게 정의된 맥락이 주어졌을 때 스마트 계약 코드를 독자적으로 분석하여 잠재적 취약점을 식별할 수 있는 초기 단계지만 강력한 지능 형태를 갖추게 되었다. 이는 대화형 사용자 인터페이스(UI) 및 통합 에이전트 IDE와 같은 AI 보조 도구의 신속한 보급을 이끌었으며, 점차 스마트 계약 감사원과 Web3 보안 연구자의 표준 워크플로 일부가 되고 있다.
그러나 이 첫 번째 물결의 AI 통합은 희망을 안겼지만, 여전히 핵심적인 한계에 직면해 있어 고위험 블록체인 환경이 요구하는 신뢰성을 충족시키지 못하고 있다.
얕고 인간 의존적인 감사: 현재 도구들은 독립적인 감사원이 아닌 ‘보조 조종사(co-pilot)’ 역할만 수행한다. 이들은 복잡한 프로토콜 전체 아키텍처를 이해하는 능력이 부족하며 지속적인 인간의 지시에 의존한다. 따라서 서로 연결된 스마트 계약의 보안을 확보하기 위해 필요한 심층적 자동 분석을 수행할 수 없다.
환각으로 인한 높은 노이즈 신호 비율: 일반 LLM의 추론 과정은 ‘환각(hallucination)’에 시달린다. 보안 시나리오에서는 이로 인해 많은 오진과 중복 경고가 발생하여 감사원이 실제 존재하지 않는 취약점을 반박하는 데 소중한 시간을 낭비하게 되며, 재앙적인 결과를 초래할 수 있는 실제 체인상 위협을 수정하는 데 집중하지 못하게 된다.
특정 도메인 언어에 대한 이해 부족: LLM의 성능은 직접적으로 훈련 데이터에 달려 있다. Move처럼 자산 보안을 위해 설계된 전용 언어의 경우, 복잡한 코드베이스와 기록된 취약점에 대한 공공 자원이 부족하여 Move 고유의 보안 모델에 대한 이해가 피상적이며, 자원 소유권과 메모리 관리 원칙 같은 핵심 개념도 포함된다.
2) BitsLab의 AI 보안 프레임워크 (규모화 가능한 신뢰성 중심)
범용 AI의 핵심 결함을 고려하여, 우리는 다층적이고 보안 우선의 아키텍처를 채택한 프레임워크를 구축했다. 이는 단일 모델이 아니라 각 구성 요소가 데이터 무결성부터 심층 자동 분석까지 스마트 계약 감사의 특정 과제를 해결하도록 설계된 통합 시스템이다.
1. 기반층: 전문가가 기획한 도메인 전용 데이터셋
모든 AI의 예측 능력은 그 데이터에 뿌리를 두고 있다. 우리 프레임워크의 뛰어난 성능은 범용 LLM 훈련에 사용되는 일반 데이터셋과 근본적으로 다른 고유 지식베이스에서 시작된다. 우리의 강점은 다음과 같다.
-
세분화된 분야에 대한 대규모 커버리지: DeFi 대출, NFT 마켓, Move 기반 프로토콜과 같은 고위험 분야에 집중하여 정성껏 수집된 방대하고 전문화된 데이터셋을 보유하고 있다. 이는 특정 도메인 취약점에 대해 전례 없는 맥락적 깊이를 제공한다.
-
전문가 기획 및 정제: 우리의 데이터셋은 단순히 크롤링된 것이 아니라 스마트 계약 보안 전문가들이 지속적으로 정제, 검증 및 보강한다. 이 과정에는 알려진 취약점에 대한 주석 처리, 보안 코딩 패턴 태깅, 관련 없는 노이즈 필터링 등이 포함되어 모델이 학습할 수 있는 고신뢰도의 ‘진실 기반(truth base)’을 창출한다. 이러한 인간-기계 협업 기획은 AI가 최고 품질의 데이터에서 학습하도록 보장하여 정확도를 크게 향상시킨다.
2. 정확성: RAG와 다단계 검토를 통한 환각 제거
환각과 오진이라는 핵심 문제를 해결하기 위해 우리는 AI의 추론이 항상 검증 가능한 사실에 기반하도록 하는 복잡한 이중 시스템을 구현했다.
-
검색 강화 생성(RAG): 우리의 AI는 내부 지식에만 의존하지 않고 결론을 내리기 전에 실시간 지식베이스를 지속적으로 조회한다. 이 RAG 시스템은 최신 취약점 연구, 확립된 보안 최선 사례(SWC 레지스트리, EIP 표준 등), 유사하고 성공적으로 감사된 프로토콜의 코드 예시 등을 검색한다. 이를 통해 AI가 반드시 ‘자료를 인용’하도록 강제하여 결론이 확률적 추측이 아닌 기존 사실에 기반하도록 한다.
-
다단계 검토 모델: 생성형 AI가 식별한 모든 잠재적 문제는 엄격한 내부 검증 프로세스를 거친다. 이 과정에는 일련의 전문화된 모델로 구성된 자동 검토 메커니즘이 포함되며, 교차 참조 모델은 발견 사항을 RAG 데이터와 비교하고, 미세 조정된 ‘감사원(auditor)’ 모델은 기술적 유효성을 평가하며, 마지막으로 ‘우선순위(priority)’ 모델은 잠재적 비즈니스 영향을 판단한다. 이 프로세스를 통해 인간 감사원에게 도달하기 전에 저신뢰도 결론과 환각이 체계적으로 필터링된다.
3. 심도: 정적 분석과 AI 에이전트 협업을 통한 심층 자동화
단순한 ‘보조 조종사’ 도구를 넘어서 맥락 인식이 가능한 심층 자동화를 실현하기 위해 결정론적 분석과 지능형 에이전트를 결합한 협업 방식을 채택했다.
-
기초로서의 정적 분석: 우리의 프로세스는 먼저 포괄적인 정적 분석을 통해 프로토콜 전체를 결정적으로 매핑한다. 이를 통해 완전한 제어 흐름도를 생성하고, 모든 상태 변수를 식별하며, 모든 계약 간 함수 종속 관계를 추적한다. 이 매핑은 AI에게 기초적이며 객관적인 ‘세계관(worldview)’을 제공한다.
-
맥락 관리: 프레임워크는 프로토콜 전체에 걸쳐 풍부하고 통합된 맥락을 유지한다. 개별 함수뿐만 아니라 그것들이 어떻게 상호작용하는지도 이해한다. 이 핵심 능력을 통해 상태 변화의 연쇄 효과를 분석하고 복잡한 크로스-계약 상호작용 취약점을 식별할 수 있다.
-
AI 에이전트 협업: 우리는 각각 특정 작업을 위해 훈련된 일련의 전문화된 AI 에이전트를 배포한다. ‘액세스 제어 에이전트’는 권한 상승 취약점을 전문으로 탐색하고, ‘재진입 에이전트’는 안전하지 않은 외부 호출을 집중 탐지하며, ‘산술 논리 에이전트’는 모든 수학 연산을 면밀히 검사하여 오버플로우 또는 정밀도 오류와 같은 경계 사례를 포착한다. 이러한 에이전트는 공유 맥락 매핑을 기반으로 협업하여 단일, 단일형 AI가 놓칠 수 있는 복잡한 공격 기법을 발견할 수 있다.
이 강력한 조합 덕분에 우리의 프레임워크는 심층적인 구조적 결함을 자동으로 발견할 수 있으며, 진정한 독립형 보안 파트너로서 기능할 수 있다.
3) 사례 연구: Bluefin PerpDEX의 핵심 로직 결함 밝혀내기
우리 프레임워크의 다층 아키텍처를 현실 시나리오에서 검증하기 위해 Bluefin의 공개 보안 감사에 이를 적용했다. Bluefin은 복잡한 퍼피츄얼 계약 탈중앙화 거래소(DX)이다. 이번 감사는 정적 분석, 전문화된 AI 에이전트, RAG 기반 사실 검증을 통해 전통적 도구로는 식별할 수 없는 취약점을 어떻게 발견하는지를 보여준다.
분석 과정: 다중 에이전트 시스템의 작동
이 고위험 취약점의 발견은 단일 사건이 아니라 프레임워크 내 통합 구성 요소들 간의 체계적인 협업을 통해 이루어졌다.
-
맥락 매핑 및 정적 분석
프로세스는 먼저 Bluefin의 완전한 코드베이스를 입력받는다. 우리의 정적 분석 엔진은 프로토콜 전체를 결정적으로 매핑하고, 기본 분석 AI 에이전트와 결합하여 프로젝트에 대한 전반적인 개요를 제공하며, 핵심 금융 로직과 관련된 모듈을 식별한다. -
전문화된 에이전트 배포
초기 분석을 바탕으로 시스템은 자동으로 일련의 전문화된 단계적 에이전트를 배포한다. 각 AI 에이전트는 자체 감사 프롬프트와 벡터 데이터베이스를 보유한다. 본 사례에서는 오버플로우, 언더플로우, 비교 오류 등의 경계 사례 취약점에 초점을 맞춘 로직 정확성 에이전트가 문제를 발견했다. -
RAG 기반 분석 및 재검토
산술 논리 에이전트(Arithmetic Logic Agent)가 분석을 수행하기 시작한다. 검색 강화 생성(RAG)을 활용해 전문가가 기획한 지식베이스를 조회하며 Move 언어의 최선 사례 구현을 참조하고, Bluefin의 코드를 다른 금융 프로토콜에서 기록된 유사한 로직 결함과 비교한다. 이 검색 과정은 양수와 음수의 비교가 전형적인 경계 오류 사례임을 부각시켰다.
발견: 핵심 금융 로직의 고위험 취약점
우리 프레임워크를 통해 결국 네 가지 서로 다른 문제를 식별했으며, 그 중 하나는 프로토콜의 금융 계산 엔진 깊숙이 자리 잡은 고위험 로직 결함이었다.
취약점은 signed_number 모듈의 lt(미만) 함수에서 발생했다. 이 함수는 포지션 정렬이나 손익(PNL) 계산과 같은 모든 금융 비교에 매우 중요하다. 이 결함은 심각한 재무 차이, 잘못된 정산, DEX 핵심 운영에서의 공정한 정렬 메커니즘 실패를 유발할 수 있으며, 프로토콜의 무결성에 직접적인 위협이 된다.
문제의 근본 원인은 음수가 양수와 비교될 때 잘못된 로직이 발생하는 것이다. signed_number 모듈은 value: u64와 sign: bool(true는 양수, false는 음수)를 사용해 값을 표현한다. 그러나 lt 함수의 else 분기(서로 다른 부호의 수 비교 처리)에 결함이 있다. 음수(!a.sign)와 양수(b.sign)를 비교할 때, 이 함수는 a.sign(즉, false)를 잘못 반환하여 실제로 “양수가 음수보다 작다”고 주장하게 된다.
수정 조치:
이 핵심 문제를 바로잡기 위해 lt 함수의 else 분기에 간단하지만 중요한 수정이 필요하다. 수정된 구현은 비교 시 음수가 항상 양수보다 작다고 올바르게 평가되도록 !a.sign을 반환해야 한다.
수정

결과: Bluefin 개발팀은 이 상세한 보고서를 받자마자 즉시 통보되었으며, 문제 수정에 즉각 조치를 취했다.
4) BitsLab AI가 Web3 팀에 의미하는 바
-
더 적은 오진 노이즈: RAG + 다단계 재검토로 ‘환각’과 허위 양성 현상을 크게 감소시킴.
-
더 깊은 커버리지: 정적 분석 맵 + 에이전트 협업으로 크로스-계약, 경계 조건, 로직 수준의 체계적 위험을 포착.
-
비즈니스 중심의 우선순위: 영향도 기반의 등급 분류로 엔지니어링 자원을 ‘가장 중요한 문제’ 해결에 집중시킴.
5) 결론: BitsLab AI 기반 보안이 새로운 기준이 된다
Bluefin의 사례는 BitsLab의 핵심 주장을 입증했다. 신뢰할 수 있는 Web3 보안은 반드시 ‘근거 기반(RAG)’, ‘다단계 검증’, 그리고 ‘구조 심층화(정적 분석 + 에이전트 협업)’를 동시에 충족해야 한다.
이 접근법은 탈중앙화 금융의 근간을 이루는 하부 로직을 이해하고 검증할 때 특히 중요하며, 프로토콜의 규모화된 신뢰를 유지하기 위한 필수 조건이다.
빠르게 진화하는 Web3 환경에서 스마트 계약의 복잡성은 계속 증가하고 있으며, Move의 공개 연구와 데이터는 여전히 상대적으로 부족하여 ‘보안 보장’이 더욱 도전적인 상황이다. BitsLab의 BitsLab AI는 바로 이러한 상황을 위해 탄생했다. 전문가가 기획한 도메인 지식, 검증 가능한 검색 강화 추론, 전체 맥락을 고려한 자동 분석을 통해 Move 계약의 리스크를 종단 간으로 식별하고 완화하며, Web3 보안에 지속 가능한 지능 동력을 불어넣는다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News












