
AI 시대에 '데이터는 석유다'라는 비유가 있습니다. 일반인은 어떻게 탐사부터 휘발유 판매까지 할 수 있을까요?
글: 황스리량
"데이터는 새로운 석유다"라는 말은 AI 업계에서 이미 귀에 딱지가 앉을 정도로 많이 들었다. 하지만 주류 담론 속에서는 이 이야기가 우리 같은 일반인과는 반푼어치도 관계가 없는 것처럼 여겨진다. 그것은 오직 테크 거대 기업들의 자본 게임이며, GPU와 조 단위 파라미터를 겨루는 싸움일 뿐이다.
하지만 나중에 생각해보니, 이 비유는 우리가 AI 세계에서 실천할 수 있는 훌륭한 나침반 역할을 한다.
1. 심각하게 오해된 비유
"데이터는 새로운 석유다"라는 말은 지금 거의 AI 시대의 성경과 같다.
솔직히 말해, 대부분의 사람들이 이 말을 처음 들었을 때 드는 첫 번째 반응은 아마도 "이건 도대체 큰 회사들 이야기지, 나 같은 일반인하고 무슨 상관이 있냐?"는 것이다.
왜냐하면 주류 서사 속에서 그들이 말하는 '데이터'란 인터넷 전체나 위키백과 수준의 PB급 데이터이며, '정제 기술'이란 수만 장의 H100 GPU와 연봉 백만 달러짜리 과학자 집단을 의미하고, '최종 제품'은 GPT-5처럼 전지전능한 신 모델을 말하기 때문이다.
이 논리는 상업적으로야 틀린 바 없지만 문제는 — 기본적으로 "너는 참여하지 마, 네가 테이블에 앉을 자격 없다"고 말하는 셈이라는 점이다.
우리 일반인은 바로 제외되는 것이다.
더 어두운 버전도 있는데, 이게 생각할수록 열받는다:
데이터는 새로운 석유고, 우리 소비자의 소비 데이터는 베네수엘라 유전과 같다. 그리고 메이퇀(美團), 알리바바, 틱톡 같은 기업들은 미국의 트럼프와 같다.
그들은 실수로(사실은 고의로) 우리 집에 와서 호스를 꽂고 데이터를 무료로 가져간다. 그런 다음 이를 '98번 휘발유'(정밀 알고리즘, 빅데이터 가격 착취)로 정제해서 되팔아 우리에게 강매한다.
결과는? 우리는 피해자가 되는 것이다. 원료를 무료로 제공했을 뿐 아니라, 우리가 팔렸는데도 오히려 그 플랫폼을 위해 돈을 세어주는 꼴이 된다.
이 버전의 이야기 속에서 플레이어는 오직 대기업뿐이다. 우리는 방대한 데이터도 없고, 자본도 없으며, 대규모 모델을 학습시킬 수도 없다. 그래서 "데이터는 새로운 석유다"라는 말은 멋져 보이지만 개인에게는 전혀 쓸모없거나 심지어 역겨운 슬로건이 되어버린다.
2. 각도를 바꿔보면, 이 문제도 해결된다
나는 이런 공감대 자체에 문제가 있다고 본다. 우리는 각도를 바꿔야 한다.
만약 우리가 굳이 '데이터는 새로운 석유'라는 개념을 일반인에게 적용시키고자 한다면, 문제는 더 이상 '이 비유가 맞는가'가 아니라 '이걸 어떻게 내 일에 활용할 수 있을까'가 되어야 한다.
석유 산업이 위대한 이유는 매우 명확하고 누구도 우회할 수 없는 논리 체인이 있기 때문이다:
유전 탐사 → 정유공장 건설(가공) → 제품 표준화(휘발유) → 유통망 구축(주유소) → 사용자에게 판매.
우리 일반인에게 있어 AI 시대의 '데이터 석유'도 이 단계들을 빈틈없이 따라야 한다. 한 고리라도 빠지면 당신의 AI 불안은 영원히 생산력으로 전환되지 못하고, 결국 '뉴스 갱신 + 링크 저장 + 남들 부자 되는 거 보기'라는 정신적 과로로만 끝날 것이다.
아래에서 나는 이 논리를 기반으로 일반인이 어떻게 행동해야 할지를 하나씩 분해해 보겠다.
3. 첫 번째 단계: 유전은 어디 있는가? — 당신 주변의 '작은 부유광'을 찾아라
전통 산업에서는 사우디아라비아나 러시아 같은 곳으로 가서 석유를 찾아야 한다. 그러나 우리의 이 경로에서는 유전이 사실 당신 손 안에 있다. 나는 최소한 두 가지 유형이 있다고 본다.
1. 개인 소유 데이터: 당신 집 뒷마당
이것은 가장 쉽게 간과되지만 가장 안정적인 데이터 유형이다. 규모가 크지 않아도 좋지만 순도가 매우 높아야 한다.
예를 들어 당신의 업무 프로세스, 의사결정 로직, 경험한 실패(피드백), 그리고 오랜 업계 생활을 통해 알게 된 잠재 룰 등이 있다.
또는 당신의 디지털 발자국: 지난 10년간 작성한 노트, 코드 저장소, 초안, 이메일 등 모두 포함된다.
이 데이터의 가치는 그것이 완전히 당신 것이며, 이를 기반으로 훈련된 '개인 디지털 트윈' 또는 '전문 분야 에이전트'는 어떤 일반 대규모 모델도 대체할 수 없다는 점이다.
과거 5년 동안 컴퓨터를 거의 사용하지 않고 스마트폰 하나로 모든 걸 해결했다면, 당신은 AI 생산자가 될 가능성이 매우 낮으며, 운명적으로 AI 소비자에 머물게 될 것이다.
정말로 AI로 돈을 벌고 싶다면, 컴퓨터를 사야 한다. 왜냐?
컴퓨터가 없다면 체계적인 데이터 축적이 불가능하며, 당신은 완전한 '빈유국(貧油國)'이기 때문이다. 휴대폰 사진첩의 몇 장의 사진이나 위챗의 수십 GB 음성 메시지와 잡담 기록으로는 큰 일을 할 수 없다 — 불순물이 너무 많고 구조가 너무 나빠서, 제대로 된 92등급 휘발유는커녕, 겨우 29등급 휘발유 정도나 만들 수 있을까 말까 하다.
2. 공공 데이터 부유광: 당신의 '탐사대'를 조직하라
두 번째 유형은 누구나 볼 수 있지만 99%의 사람들은 '소비'만 하고 '탐사'하지 않는 데이터이다: X.com, 공식 계정, arXiv, YouTube 등이 데이터 시대의 '공해(公海)'다.
현재의 인터넷, 특히 소셜 미디어 환경은 너무 빠르게 악화되고 있다. 나는 확신하는데, 적어도 50% 이상, 어쩌면 90% 이상의 콘텐츠는 AGRC(AI 생성 쓰레기 콘텐츠, AI Generated Rubbish Content)라고 본다.
이 사람들은 AI를 이용해 폐기를 대량 생산하여 지층을 오염시키고 있다. 당신이 지질 탐사를 할 때 의식하지 못한다면, 캐낸 것은 전부 쓰레기일 것이다.
더 나쁜 것은: 당신이 쓰레기를 뇌나 AI에 투입하면, 결국 나오는 것도 쓰레기뿐이며, 심지어 당신의 정유공장을 막아버릴 수도 있다는 점이다.
따라서 당신이 캐낸 것이 AGRC가 아님을 보장하기 위해, 나는 엄격하게 선별된 **'영감 소스 조합'** 을 구성할 것을 권한다. 하지만 주의: 보기만 하는 것은 무용하다. 이는 원유를 쌓아두는 것과 같다. 당신은 반드시 원유의 초기 가공 **— 각 소스마다 AI를 통과시켜 기계가 이해할 수 있는 연료로 변환해야 한다:
심층 퇴적암(책): 이것은 중심축이다. 연간 독서 목록을 정하고, 전문 서적과 문학 모두 포함시켜야 한다.
AI 결합법: 멍청하게 읽기만 하지 말라. 반드시 Gemini나 ChatGPT를 활용해 독서를 보조하고, 한 장을 읽은 후에는 토론을 시켜보고, 사고력을 자극하는 질문을 만들어내도록 해야 한다. 반드시 전자화된 독서 노트를 만들어 AI에게 투입해야 하며, 이것이 당신의 지식베이스가 된다.
선구 탐사지역(논문 및 보고서): 자주 arXiv나 Google Scholar을 확인하라. 매주 '논문 런치 세미나'를 만들어 스스로 한 편의 논문을 읽도록 강요하라.
AI 결합법: 생소한 원문이 읽기 어렵다면 PDF를 NotebookLM이나 ChatGPT에 던져 핵심 주장과 데이터를 요약하게 하라. '씹기 어려운 뼈'를 '고급 스프'로 삶아 저장하라.
지표 유출수(뉴스 정보): RSS나 맞춤형 정보 흐름을 사용하라. 나는 뉴스를 제목만 스캔하고, 진짜 놀라운 내용만 심층적으로 저장한다.
AI 결합법: 단순히 링크만 저장하지 마라. 내용을 복사해 AI에게 태그를 붙이고 키워드를 추출하도록 하여 노트 소프트웨어에 분류 저장하라. 그렇지 않으면 저장해도 먼지만 쌓일 뿐이다.
동반 가스전(팟캐스트 및 강연): 출퇴근 길에 TED Radio Hour 같은 것을 들어보라. 매달 오프라인 모임에 참석하도록 스스로 강요하라.
AI 결합법: 좋은 아이디어를 들었을 때 단순히 고개를 끄덕이지 말라. Whisper로 녹음을 텍스트로 변환한 후 AI에게 구조화된 노트로 정리하게 하라. 음성은 검색이 불가능하지만 텍스트는 가능하다.
고산 유정(소셜 미디어): Twitter/X에서 진짜 전문가들을 팔로우하라. 정기적으로 팔로우 목록을 정리하고, 감정적 쓰레기를 올리는 계정은 언팔로우하라.
AI 결합법: 놀라운 Thread를 발견하면 바로 AI에게 복사해 주고, 이 사람의 논리적 허점을 분석하거나 자신의 지식 체계에 통합하도록 하라.
현장 과학 조사(생활 관찰, 현장 연구): '문제를 가지고 삶을 보는 것'을 의도적으로 연습하라. 이것은 AI 크롤러가 절대 수집할 수 없는 감성 데이터다.
AI 결합법: 영감이 떠올랐을 때 타이핑하지 말고, 바로 음성으로 말한 후 AI에게 정리해 일기로 만들게 하라. AI가 당신의 잡담을 논리적인 통찰로 바꾸도록 하라.
우리는 언제든지 휴대폰을 꺼내 도우바오(豆包)에게 장황한 말을 쏟아내는 습관을 길러야 한다.
이 여섯 가지 출처가 바로 당신의 '혼합 유전'이다. 입력이 충분히 다양하고 복잡하며 모두 AI의 초기 가공을 거쳐야만, 당신이 생산하는 것이 진부한 말이 되지 않는다.
4. 두 번째 단계: 정유 설비는 어디 있는가? — 대규모 모델에만 집착하지 마라
유전을 찾았다면 다음 단계는 정유다. 주류 미디어는 항상 당신에게 GPU를 사라고 유혹하지만, 개인에게 진짜 정유공장은 반드시 자신의 소프트웨어 스택 + 사고 공정이어야 한다.
1. 대규모 모델은 단지 '보일러'일 뿐이다
ChatGPT Plus 멤버십을 결제한다고 해서 우리가 갑자기 똑똑해지는 것은 아니다. 이것은 보일러를 샀는데, 옆에 서서 보일러가 반짝이는 것만 보는 것과 같다 — 하지만 당신은 작업을 시작하지 않는다.
ChatGPT, DeepSeek 같은 대규모 모델은 말하자면 기초 동력 장치이며, 기반이다. 작동은 하지만, 곧바로 석유를 생산할 수 있다는 뜻은 아니다.
2. 진짜 정유공장은 '개인 도구 체계'다
효율적인 개인 정유공장을 위해서는 다음 구성 요소들이 필요하다:
파이프라인(툴체인): VS Code, Python, Skills 등.
공정(방법론): 이것이 핵심 장벽이다. 즉, 어떻게 프롬프트를 작성하고, RAG 지식베이스를 구축하며, 여러 에이전트(Skills)들이 서로 협력하게 만드는가 하는 것이다.
핵심은 항상 '모델이 얼마나 강한가'가 아니라 '어떻게 AI와 상호작용하느냐', '머릿속의 암묵적 경험을 AI가 이해할 수 있는 명령어로 어떻게 번역하느냐'는 점이다.
이 '개인 엔지니어링 체계'야말로 당신의 정유공장이며, 모델 자체가 아니다.
5. 세 번째 단계: 제품화는 끝이 아니라, 판매가 진짜 싸움이다
이것이 전체 사슬에서 가장 잔혹한 고리다. 중국석유(CNPC)는 기름을 주유소까지 운반하면, 차주들이 알아서 줄을 선다. 하지만 AI 시대에는 제품화와 판매가 정말 어려운 일이다.
1. AI로 정제한 '휘발유'는 극도로 비표준이다
당신이 '개인 데이터' + '대규모 모델'로 만들어낸 것은 대부분 일반적인 휘발유가 아니라 다음과 같은 것이다:
- 당신만 사용 가능한 파이썬 스크립트
- 독특한 스타일의 글
- 병원 검사 후 AI로 가공한 보고서
- 개인화된 법률 자문 제안
이런 것들은 일반적이지 않고, 표준화되지 않았으며, 특정 상황에만 특화되어 있다.
2. 진짜 큰 문제: 누구에게 팔 것인가?
따라서 작업을 시작하기 전에 거꾸로 물어봐야 한다: 내가 만든 이걸 도대체 누구에게 팔 것인가? 이것은 우리가 무엇을 정제해야 하는지를 거꾸로 증명하는 것이다.
자기 자신에게 팔기(자용): 시간을 절약하는 것이 곧 돈 버는 것이며, 이것은 가장 쉽게 닫힐 수 있는 루프다.
기업에 팔기(B2B): 프롬프트나 워크플로우를 솔루션 형태로 포장한다. 이것은 매우 강한 영업 능력(말솜씨)이 필요하다.
대중에게 팔기(B2C): 앱이나 콘텐츠 칼럼으로 만든다. 여기서는 당신이 트래픽 배포 능력을 갖추고 있는지가 관건이다.
사실: AI 시대에 정유(콘텐츠 생성)는 점점 쉬워지고 있지만, 주유소 건설(배포 및 판매)은 전례 없이 어렵다.
6. 환경 보호를 잊지 마라: 폐기물에 묻히지 말 것
전통적인 정유는 폐기물, 폐수, 폐가스를 발생시킨다. 처리하지 않으면 정유공장이 돈을 벌기도 전에 사람이 먼저 질식할 것이다.
데이터 정유도 마찬가지로 **'사이버 오염'** 이 매우 심각하므로, 정기적으로 청소하는 '환경 보호 부서'가 반드시 필요하다.
1. 만료된 '도구 폐기물' 정리하기
AI의 진화 속도는 너무 빨라서 말도 안 된다.
지난달에 저장한 '2025년 필수 AI 사이트 10선'이 이번 주에 다섯 개는 문을 닫았을지도 모른다. 오늘 당신이 골머리를 썩는 AI 이미지 생성 파라미터가 내일은 '한 번 클릭으로 생성' 기능에 의해 완전히 무력화될지도 모른다.
절대 '사이버 수집병'이 되지 마라. 오래된 도구를 모아두고 버리지 말 것. 필요하면 제거하고, 필요하면 언팔로우하라. 도구는 사용하기 위한 것이지, 모셔두기 위한 것이 아니다.
오래된 도구를 쌓아두는 것은 집에 녹슨 쓰레기 철을 쌓아두는 것과 같아, 당신의 작동 속도만 느려진다.
2. 착취당한 '데이터 껍데기' 버리기
많은 사람이 '다람쥐 증후군'을 앓고 있다: PDF를 보면 다운로드하고, 영상을 보면 저장한다. 하드디스크에 수 TB의 자료를 쌓아두고는 전 세계를 가진 듯한 기분에 빠진다.
그건 지식이 아니라 매립지 쓰레기다.
진정한 환경 보호 방법은 AI를 이용해 PDF, 영상, 긴 글에서 '기름'을 짜내는 것이다 — 요약을 만들고, 명언을 추출하며, 당신의 노트로 전환하는 것이다.
一旦 착유가 끝나면 원본 파일은 삭제하거나 냉장 보관하라. 당신의 주의력은 극히 귀중한 자원이므로, 이러한 원본 파일이 당신의 대역폭을 차지하게 해서는 안 된다.
'정제된 연료'만 보관하고, '원유 껍데기'는 버려라. 이것이 고효율 정유공장이다.
3. '흡혈 좀비 청구서' 끊기
AI에 대한 불안은 우리로 하여금 많은 어리석은 짓을 하게 만든다. 그 중 가장 어리석은 것은 바로 '불안감'을 사려는 욕망이다.
강의 수강, 강의 구매, 컨퍼런스 참석, Plus 멤버십 구매... 비용이 결코 낮지 않다. 더 심각한 것은 많은 서비스가 일단 구독(월간 자동 결제)되면 취소하는 것을 자주 잊어버린다는 점이다.
나는 예전에 테스트용으로 서버 하나를 샀는데, 최소 3년 이상 매달 묵묵히 돈을 빼갔다. 수많은 청구서 속에 숨어 있어서 전혀 몰랐다 — 사실 테스트那天 하루만 사용했을 뿐이다.
또한 일시적으로 충동적으로 ChatGPT, Gemini, Claude, Perplexity 등을 구매해 자동 갱신을 설정했고, 일부 API도 샀다. 결과는? 대부분의 시간 동안 먼지만 쌓였다.
젠장, 정말 낭비였다.
이것들은 '환경 보호'를 위해 반드시 정리해야 할 일들이다. 그렇지 않으면 당신이 팔 수 있는 기름을 정제하기도 전에, 집안 재산이 이런 오염물에 의해 먼저 털릴 것이다.
7. 마지막으로 한 마디: 행동 지도
'데이터는 새로운 석유다'라는 거창한 외투를 벗겨내면, 그것은 더 이상 멀게만 느껴지는 자본 이야기가 아니라, 일반인을 위한 냉철한 루트맵이 된다.
이 시대에 당신이 이기고 싶다면, 지금 바로 당신의 '재무제표'를 점검하라:
- 매장량: 여전히 틱톡을 스크롤하고 있는가, 아니면 '영감 소스' + AI 보조를 통해 의식적으로 고품질 데이터를 축적하고 있는가? (AGRC 쓰레기를 피하길 기억하라)
- 생산 능력: 당신만의 도구와 방법론(정유공장)이 있으며, 무엇을 정제하고 있는가?
- 채널: 생각해봤는가, 당신이 정제한 이 비표준 제품을 도대체 누구에게 팔 것인지? 이는 생산 능력을 거꾸로 증명하며, 92등급인지 98등급인지 결정한다.
- 환경 보호: 당신은 디지털 쓰레기를 쌓아두고 있지는 않은가? 신용카드 청구서를 확인해 불필요한 구독을 해지했는가?
마지막 조언 하나: 수백억 파라미터 관련 뉴스는 잊어버려라. 오늘부터 시작하라 — 컴퓨터를 사고, '영감 데이터 소스'를 구축하여 당신의 첫 번째 소형 유정을 파내라. 우선 자신에게 팔면서, 업무를 AI 중심, 자신은 보조로 고정화하는 자동화 도구를 만들어라.
사실 나도 매우 혼란스럽다. AI를 만지작거린 지 벌써 3년 넘었지만, 나는 아무것도 정제하지 못했다. 다만 AI가 내 to-do 리스트를 관리하게 하고, 독서 노트를 관리하게 한 정도다. 나는 계속 고민 중이다. 도대체 무엇을 정제할 수 있을까?
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














