
55TB에서 28TB로? 루빈의 메모리 용량 축소 논란과 공포
글쓴이: TechFlow 리서치
6월 4일 새벽, 반도체 산업에서 가장 영향력 있는 독립 연구 기관인 SemiAnalysis가 아침 뉴스레터를 발표했다.
핵심 정보는 단 한 문장뿐이었다. 즉, 엔비디아의 차세대 AI 슈퍼컴퓨팅 랙 ‘베라 루빈 NVL72’에서 1개 랙당 SOCAMM DRAM 용량이 기존 예상치인 약 55TB에서 약 28TB로 하향 조정될 가능성이 있다는 것이다. 대부분의 루빈 시스템은 시장에서 널리 예상되던 192GB SOCAMM 모듈 대신 96GB SOCAMM 모듈을 채택할 전망이다.
이 소식이 퍼지자 시장의 반응은 단순하고 강렬했다. 메모리 수요가 절반으로 줄어든다는 해석에 따라 마이크론(MU) 주가에 악재가 되었고, 장중 한때 10% 이상 급락하며 전날 막 신기록을 경신한 사상 최고가 1,089달러에서 971달러로 추락했으며, 하루 만에 1,000억 달러 이상의 시가총액이 증발했다.
공포는 실제였다. 문제는, 그 공포가 올바른 방향으로 향했는가 하는 것이다.
먼저 계산부터 제대로 해보자
베라 루빈 NVL72은 엔비디아의 차세대 플래그십 AI 슈퍼컴퓨팅 랙이다. 각 랙에는 72개의 루빈 GPU와 36개의 베라 CPU가 탑재된다. GPU 측은 HBM4를 사용하며, 각 GPU당 288GB, 전체 랙 기준 약 20.7TB로, 이 부분은 변경되지 않았다. 변화가 생긴 것은 CPU 측이다.
각 베라 CPU는 8개의 SOCAMM 슬롯을 갖추고 있으며, 각 슬롯에는 용량이 다른 모듈을 삽입할 수 있다. 엔비디아는 CES 2026에서 공식 사양으로 “각 베라 CPU는 최대 1.5TB LPDDR5X를 지원한다”고 발표했는데, 이는 8개의 192GB 모듈을 모두 장착한 구성에 해당한다. 따라서 36개의 CPU는 총 54TB에 달한다.
SemiAnalysis의 이번 보고서는 다음과 같이 지적한다: 실제 출하 구성은 거의 확실하게 완전히 장착되지 않을 것이며, 대부분의 시스템은 96GB 모듈을 채택해 CPU당 8×96GB=768GB, 총 36개 CPU 기준 약 28TB를 제공할 것이라고 한다.
55TB에서 28TB로, 용량이 거의 절반으로 줄어들었기에, 제목을 과장해서 붙이면 “메모리 수요가 허리 잘리듯 감소”라는 식으로 표현할 수 있다.
하지만 이 계산에서 시장은 하나의 핵심 변수를 놓쳤다.
공포의 논리적 허점
첫째, SOCAMM은 납땜 고정 방식이 아니라, 슬롯 기반의 착탈식 설계다.
이는 전체 이야기에서 가장 쉽게 간과되는 기술적 세부사항이다. GB300 블랙웰 얼트라(Blackwell Ultra)의 경우 LPDDR이 마더보드에 납땜 고정되어 있는 것과 달리, 베라 루빈 플랫폼은 JEDEC 표준화된 SOCAMM2 모듈을 채택하여, 착탈이 가능하고, 열 교체(온라인 교체) 및 향후 업그레이드도 가능하다. 오늘은 96GB 모듈을 꽂고, 내일 고객의 요구에 따라 192GB 혹은 256GB 모듈로 간단히 교체하는 것이 메모리 바를 교체하는 것처럼 쉽다.
엔비디아는 CES 2026에서 이 설계를 특별히 강조했다. 전체 컴퓨팅 트레이(Tray)의 조립 시간이 기존 2시간에서 단 5분으로 단축되었다고 밝힌 것이다. 모듈화, 유지보수 용이성, 업그레이드 가능성은 베라 루빈이 블랙웰 대비 가장 큰 아키텍처 진화 중 하나다.
초기 출하 구성의 용량을 낮추는 것은 영구적인 수요 감소를 의미하지 않는다. 오히려 이는 “먼저 탑승 후 나중에 추가 구매”하는 전략에 가깝다.
둘째, 용량을 낮춘 이유는 ‘필요 없음’이 아니라 ‘부족함’ 때문이다.
SemiAnalysis 창립자 딜런 패틀(Dylan Patel)은 트위터에서 의미심장한 말을 남겼다: “제가 특히 좋아하는 건, 우리 보고서를 공유하는 사람들이 보고서의 대부분 내용을 빠뜨린다는 점입니다. 이런 일은 자주 발생하죠.”
Digg에서 이 뉴스에 달린 독자 댓글도 이를 잘 보여준다. 77.8%의 댓글이 재전파가 단편적이고 오해를 불러일으키는 제목 선정(헤드라인 편향)이라고 평가했다.
무엇이 빠졌는가? 바로 배경 정보다.
2026년 글로벌 LPDDR5X 공급은 극도로 긴장 상태에 있다. 마이크론은 5월 말 월프 컨퍼런스(Wolfe Conference)에서 명확히 밝혔다. 메모리 수요가 공급 능력을 상당히 초과하고 있으며, 이 상황은 2026년 이후까지 지속될 것으로 예상된다고 했다. 마이크론의 2026 회계연도 전체 HBM 생산능력은 이미 전량 판매 완료되었고, DRAM 평균 가격은 전년 대비 110% 이상 상승했으며, 매출총이익률(Gross Margin)은 74%까지 치솟았다. 삼성전자와 SK하이닉스 역시 전량 가동·판매 중이다.
이러한 상황에서 엔비디아가 직면한 문제는 고객이 더 많은 메모리를 원하지 않는 것이 아니라, “모든 슬롯을 채울 만큼의 LPDDR5X 칩을 확보할 수 없다”는 것이다.
따라서 랙당 기본 SOCAMM 구성 용량을 낮추는 것은 본질적으로 공급망 관리 차원의 공학적 결정이다: 메모리 부족으로 인해 전체 랙 출하가 지연되는 것보다는, 낮은 구성으로 먼저 출하해 연산 능력을 빠르게 실현하는 편이 낫다.
이는 수요 위축을 알리는 신호가 아니다. 오히려 수요가 공급을 압도하는 신호다.
셋째, 더 적은 메모리 ≠ 더 적은 랙 수
시장은 단순한 곱셈을 수행했다: 랙당 메모리가 절반으로 줄어들면 → 총 수요도 절반으로 줄어든다. 그러나 이 문제에는 또 다른 변수가 존재한다: 출하량이다.
만약 랙당 SOCAMM 용량이 55TB에서 28TB로 하향 조정된다면, 동일한 LPDDR5X 공급 제약 하에서 엔비디아는 오히려 더 많은 랙을 조립할 수 있다. 기존에는 한 배치의 메모리로 100개 랙만 조립 가능했지만, 이제는 약 200개 랙을 조립할 수 있게 된다.
즉, 전체 LPDDR5X 소비량 자체는 줄지 않았고, 다만 더 많은 랙에 분산되어 할당된 것이다. 엔비디아 입장에서는 루빈을 더 빠르게 시장에 내놓는 현실적인 선택이며, 메모리 제조사 입장에서는 총 주문량이 반드시 감소한다는 보장이 없다.
더욱이 추론(inference) 시나리오에서는 CPU 측 메모리 수요 탄력성이 매우 크다. 모든 워크로드가 1.5TB LPDDR5X를 필요로 하지는 않는다. 대규모 언어모델(Large Language Model) 훈련은 메모리를 많이 소비하지만, 다수의 추론 작업, 특히 에이전트 기반 AI(Agentic AI) 및 장기 맥락 추론(Long-context Inference)의 경우 KV 캐시(KV Cache)를 NVLink-C2C를 통해 HBM과 LPDDR 사이에서 유연하게 스케줄링할 수 있다. 많은 고객에게는 CPU 측 768GB 메모리가 충분하다.
그럼에도 마이크론 주가는 왜 10%나 떨어졌을까?
그 이유는 SemiAnalysis 보고서가 낙마의 두 번째 짚대기였기 때문이다.
첫 번째 짚대기는 브로드컴(Broadcom)이었다. 6월 4일 미국 주식시장 개장 전, 브로드컴은 2분기 실적을 발표했다. 수치 자체는 나쁘지 않았다. 매출은 221.9억 달러로 전년 동기 대비 48% 증가했고, Non-GAAP EPS는 예상을 상회한 2.44달러였다. 그러나 CEO인 하워드 훈(Hock Tan)은 연간 AI 칩 매출 목표치 1,000억 달러를 상향 조정하지 않았고, 시장은 이를 ‘충분치 않다’고 판단했다. 이에 브로드컴 주가는 15% 급락했고, 전체 반도체 섹터가 동반 하락했다.
마이크론은 당일 어떤 기업 차원의 악재도 발표하지 않았다. TipRanks, Motley Fool, 24/7 Wall St. 등 여러 미디어는 명확히 지적했다. 이는 ‘불똥 튀기기’(collateral damage)에 의한 연동 하락이었다. 마이크론은 AI 메모리 체인의 핵심 종목으로, AI 자본지출(CapEx) 관련 시장 심리와 높은 상관성을 보이기 때문에, 브로드컴의 보수적인 전망이 전체 AI 칩 산업사슬의 성장 기대치를 재평가하게 만들었다.
SemiAnalysis 보고서는 같은 날 퍼져나갔고, 이미 매도 근거를 찾고 있던 트레이더들에게 완벽한 서사(sales narrative)를 제공했다. 단순히 전반적인 AI 심리가 약화된 게 아니라, 메모리 수요라는 구체적인 숫자 자체가 줄어든다는 해석이었다.
시가총액 1조 달러 규모의 종목이 지난 1년간 900% 상승했고, 전날 막 사상 최고가를 경신했다. 이런 위치에서 어떤 부정적 제목이라도 이익 실현의 촉매제가 된다. 공포는 정확할 필요가 없고, 단지 구실만 있으면 된다.
TechFlow 해설
세 가지 판단.
첫째, SemiAnalysis 보고서 자체는 정확하지만, 시장의 해석은 잘못됐다. 루빈 NVL72의 기본 SOCAMM 구성이 이론상 최대치보다 낮아질 가능성은 매우 높다. 이는 공급망 현실과 고객 수요의 탄력성이 공동으로 결정한 결과다. 하지만 “기본 구성 용량 감소”와 “메모리 수요 위축” 사이에는 착탈식 업그레이드가 가능한 모듈형 아키텍처와 수요가 공급을 압도하는 산업 현실이라는 거대한 간극이 존재한다.
둘째, 마이크론의 현재 핵심 리스크는 SOCAMM가 아니라 HBM4에 있다. SemiAnalysis는 올해 2월 보고서에서 이미 밝혔다. 엔비디아 루빈 플랫폼의 HBM4 주문에서 마이크론의 점유율은 0%이며, SK하이닉스가 70%, 삼성전자가 30%를 차지한다고 했다. 마이크론은 3월에 HBM4 양산 출하를 발표했지만, 예상 점유율은 18%에 불과하다. 반면 마이크론은 SOCAMM 분야에서 매우 견고한 입지를 확보하고 있다. 마이크론은 세계 최초로 256GB SOCAMM2를 출시한 기업이며, 엔비디아의 SOCAMM 솔루션 파트너로서 5년간 핵심 협력 관계를 유지해왔다. 따라서 SOCAMM 구성 용량 감소가 마이크론에 미치는 실질적 충격은, HBM4 점유율에서 사실상 배제된 것에 비하면 훨씬 작다.
셋째, 이번 하락은 사상 최고가를 경신한 1조 달러 시가총액 종목의 이익 실현에 따른 조정이며, 두 개의 독립적인 촉매제에 의해 확대된 것이다. 브로드컴이 심리적 충격을 제공했고, SemiAnalysis가 서사적 탄약을 공급했다. 두 요인이 겹쳐, 지난 12개월간 9배 상승한 종목이 10% 조정을 받은 것이다. 거래 관점에서 보면, 이를 ‘공포’라 부르기보다는 ‘정상적’이라고 보는 것이 타당하다.
딜런 패틀의 트위터 발언은 맞다. 그의 보고서를 공유한 대부분의 사람들은 정말로 보고서에서 가장 중요한 부분을 놓쳤다.
반도체 투자에서 가장 위험한 일은 방향을 잘못 보는 것이 아니라, 제목은 정확히 봤지만 계산식을 틀리는 것이다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News













