
추론 속도가 엔비디아 GPU의 10배에 달하고 최근 6.4억 달러의 자금을 유치한 Groq는 어떤 기업일까?
글: 메타버스 하트
8월 5일, 미국의 인공지능(AI) 반도체 스타트업 그로크(Groq)는 최신 투자 유치 소식을 발표하며 6.4억 달러(약 9천억 원)의 자금을 조달했고, 기업 가치는 28억 달러에 도달했다.
이번 펀딩은 월스트리트 자산운용 대기업 블랙록(BlackRock) 산하 BlackRock Private Equity Partners가 주도했으며, 시스코(Cisco Investments)와 삼성전자 산하 Samsung Catalyst Fund도 참여했다. 이로써 그로크의 기술 혁신 능력과 강력한 자본 지원 배경이 다시 한번 입증됐다.
01. 1분 만에 보는 프로젝트 개요
1. 프로젝트 명칭: Groq
2. 설립 연도: 2016년
3. 제품 소개:
그로크(Groq)가 선보인 새로운 AI 가속화 칩 LPU는 대규모 언어 모델(LLM) 전용으로 설계되었으며, 초고속 추론 성능을 제공한다. 해당 칩은 일반적인 GPU 및 TPU 대비 10~100배 성능을 발휘하며, 특히 NVIDIA GPU보다 추론 속도가 10배 빠르다.
4. 창립팀 구성:
-
조너선 로스(Jonathan Ross): 창립자 겸 CEO, 구글 TPU 프로젝트 핵심 연구원 출신
-
얀 르쿤(Yann LeCun): 튜링상 수상자이자 딥러닝 3대 거장 중 한 명으로, 기술 고문 역임
5. 투자 유치 현황:
-
2017년, 설립 초기 시드 펀딩에서 1,030만 달러 조달;
-
2018년 A라운드에서 5,230만 달러 조달, Social Capital 주도;
-
2020년 B라운드에서 1.5억 달러 조달, Tiger Global Management 주도, D1 Capital Partners 및 The Spruce House Partnership 참여;
-
2021년 C라운드에서 3억 달러 조달, Tiger Global Management 및 D1 Capital Partners 추가 투자;
-
최근 라운드에서 6.4억 달러 조달, 블랙록(BlackRock Inc.) 펀드 주도, 시스코 및 삼성전자 공동 참여.
02. 혁신으로 이끄는 AI 프로세서 선구자
그로크(Groq)의 설립 과정은 혁신과 기술적 돌파구의 전형적인 사례라 할 수 있다.
창립자 로스(Ross)는 그로크를 창업하기 전 구글에서 엔지니어로 근무하며 딥러닝과 컴퓨팅 아키텍처 분야의 연구를 주도했다. 구글 재직 당시 로스는 기존 컴퓨팅 아키텍처가 현대 AI 작업, 특히 딥러닝과 대규모 데이터 분석에서 상당한 성능 병목 현상을 겪고 있음을 발견했다.

기존 CPU와 GPU는 이러한 작업의 고도 병렬 처리 및 저지연 요구 조건을 충족하지 못했다. 이러한 인식이 로스로 하여금 구글을 떠나 전통적인 컴퓨팅 한계를 극복하기 위한 회사, 즉 그로크(Groq)를 창업하게 만들었다.
그로크의 창립팀은 초기부터 하드웨어 설계와 기술 개발에 집중했다. 팀 구성원들은 고성능 컴퓨팅(HPC) 및 반도체 분야의 정상급 인재들로, 풍부한 경험과 기술적 배경을 갖추고 있었다. 초기 작업에는 프로세서 아키텍처 설계, 프로토타입 개발, 성능 테스트 등이 포함됐다.
그로크의 기술 철학은 혁신적인 프로세서 아키텍처를 중심으로 전개되며, 기존 프로세서보다 더 높은 계산 성능과 효율성을 제공하는 것을 목표로 한다. 회사는 AI 및 HPC 분야의 급증하는 컴퓨팅 수요를 충족시키기 위해 CPU와 GPU의 제약을 뛰어넘는 하드웨어 플랫폼을 설계하는 것이 궁극적 목표다.

기술의 성숙과 시장 수요 증가에 따라 그로크는 비즈니스 범위를 확장해 데이터센터, 클라우드 컴퓨팅, 엣지 컴퓨팅 분야까지 진출하고 있다. 현재 다수의 글로벌 기술 선도 기업들과 전략적 파트너십을 맺으며 제품의 세계적 적용을 추진 중이다.
03. 고성능 컴퓨팅의 재정의
설립 이후 그로크는 획기적인 기술과 탁월한 제품력을 바탕으로 인공지능(AI)과 고성능 컴퓨팅(HPC) 분야의 선두주자로 급부상했다.
그로크의 기술 핵심은 혁신적인 프로세서 아키텍처에 있다. 기존 CPU와 GPU와 달리,그로크의 설계 철학은 특히 현대 AI 및 데이터 집약적 애플리케이션의 요구에 맞춰 계산 능력과 효율성을 극대화하는 데 초점을 맞춘다.
-
고도 병렬화 설계: 그로크의 프로세서 아키텍처는 극도로 높은 병렬화 설계를 채택하여 다수의 계산 유닛을 통합함으로써 동시에 방대한 양의 데이터를 처리할 수 있다. 이는 계산 능력을 향상시킬 뿐 아니라 데이터 처리 지연 시간도 크게 줄인다.
-
간소화된 데이터 경로: 전통적인 프로세서는 종종 데이터 전송 병목 현상에 직면하는데, 그로크는 데이터 경로 및 고속 캐시 설계를 최적화함으로써 데이터 전송 지연을 크게 감소시킨다. 이를 통해 프로세서는 대규모 데이터셋을 더욱 효율적으로 처리할 수 있으며, AI 훈련 및 추론 과정의 고성능 요구를 충족시킨다.
-
유연한 구성 옵션: 그로크는 사용자가 특정 애플리케이션 요구에 따라 계산 자원을 조정할 수 있도록 다양한 구성 옵션을 제공한다. 이러한 유연성 덕분에 데이터센터부터 엣지 컴퓨팅 환경까지 다양한 컴퓨팅 시나리오에 폭넓게 적용 가능하다.

그로크의 AI 가속기는 제품군의 핵심 요소로, 딥러닝 모델의 훈련 및 추론을 가속화하도록 특별히 설계되었다. 그 장점은 주로 다음 세 가지 측면에서 드러난다:
-
고처리량 및 저지연: AI 가속기는 처리 능력을 높이고 지연을 줄여 머신러닝 모델의 훈련 속도를 크게 향상시킨다. 이미지 인식 및 자연어 처리처럼 방대한 데이터를 처리해야 하는 애플리케이션에서는 특히 중요하다.
-
알고리즘 최적화 지원: 그로크의 가속기는 컨볼루션 신경망(CNN), 순환 신경망(RNN) 등의 다양한 머신러닝 알고리즘을 최적화했다. 하드웨어 수준에서의 최적화를 통해 이러한 복잡한 계산 작업을 효율적으로 수행함으로써 모델 훈련 효율과 추론 성능을 모두 높인다.
-
확장성 및 구성 가능성: 가속기는 높은 확장성을 지원하여 다양한 규모의 데이터 처리 과제에 대응할 수 있다. 사용자는 필요에 따라 여러 개의 가속기를 구성해 고성능 컴퓨팅 클러스터를 구축함으로써 대규모 AI 애플리케이션의 수요를 충족시킬 수 있다.
고도 병렬화 설계, 최적화된 데이터 경로, 강력한 AI 가속 능력을 바탕으로 그로크는 데이터센터, 클라우드 컴퓨팅, 엣지 컴퓨팅 등 다양한 분야에 뛰어난 기술 지원을 제공하고 있다.
기술의 지속적인 발전과 제품의 꾸준한 최적화에 따라 그로크는 현대 컴퓨팅 수요에 전례 없는 솔루션을 제공하며 컴퓨팅 기술을 한 차원 더 높은 수준으로 끌어올리고 있다.
AI 칩 분야의 블랙호스로서 부상한 그로크는 LPU 칩의 초고속 추론 능력을 의심의 여지없이 입증했다. 그러나 기업 가치의 급등과 시장의 기대감 속에서 그로크는 일련의 도전과 문제에도 직면해 있다.
04. 도전과 기회가 공존하는 미래
첫 번째 문제는 LPU의 용량이다. 대규모 언어 모델 처리 시 탁월한 성능을 발휘하지만, 메모리가 작아 실제 배포 시 많은 하드웨어 자원이 필요할 수 있다.
분석에 따르면,LPU가 LLaMA 70B와 같은 대규모 모델을 실행할 때, 그로크의 하드웨어 요구사항과 비용은 예상보다 훨씬 높을 수 있다. 이는 대규모 배포 시 기업의 재정적 부담을 가중시키는 요인이 된다.
두 번째로, LPU의 특화성은 특정 작업에서 우위를 제공하지만, 다른 광범위한 AI 작업으로의 적용을 제한한다. GPU와 비교하면 LPU의 범용성이 낮아 다양화된 AI 시나리오에서의 경쟁력에 영향을 미칠 수 있다.

신생 제품 및 스타트업으로서 그로크는 기술 완성도, 시장 인지도, 생태계 구축 면에서 아직 갈 길이 멀다. 제품을 지속적으로 최적화하고 R&D 팀을 확장하며 업계 파트너들과 협력을 강화해 기술의 상용화 속도를 높여야 한다.
미래를 전망하면, 그로크의 기회 또한 크다. AI 기술의 진보와 응용 분야 확장에 따라 관련 기업들의 고효율 AI 칩 수요는 계속 증가하고 있다. 그로크가 비용과 범용성 문제를 효과적으로 해결한다면, LPU 칩은 AI 추론 시장에서 중요한 위치를 차지할 가능성이 크다.
그로크는 2025년 3월 말까지 10.8만 개의 LPU를 출시할 계획이며, 이 거대한 목표가 실현된다면 업계 내 리더십 지위를 한층 더 공고히 할 것이다. 그로크가 치열한 시장 경쟁 속에서 어떻게 자기 돌파를 이루며 기술 혁신과 사업 성공이라는 두 마리 토끼를 잡을지, 앞으로 지속적인 관심이 필요하다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News














