Anthropic 제품 매니저 인터뷰: 클로드는 백그라운드에서 ‘꿈을 꾸며’, 우리는 마치 아이를 양육하듯 그 의식 형성을 연구한다

2026.05.18

Anthropic 제품 매니저 인터뷰: 클로드는 백그라운드에서 ‘꿈을 꾸며’, 우리는 마치 아이를 양육하듯 그 의식 형성을 연구한다

Claude.ai에서는 메모리 파일에 기록한 후, 야간 프로세스를 통해 이러한 기억을 다시 검토하고 가지치기 및 정리 작업을 수행합니다.

2026.05.18 - 08:00:58

AnthropicClaude

Web3 심층 보도에 집중하고 흐름을 통찰

Claude.ai에서는 메모리 파일에 기록한 후, 야간 프로세스를 통해 이러한 기억을 다시 검토하고 가지치기 및 정리 작업을 수행합니다.

정리 & 번역: TechFlow

게스트: Alex Albert, Claude 연구 제품 매니저

진행자: Peter Yang

팟캐스트 출처: Peter Yang

원제목: Anthropic이 차세대 Claude를 구축하는 내부 과정 | Alex Albert

방송일: 2026년 5월 17일

핵심 요약

Alex는 Anthropic 소속 연구 제품 매니저(RPM)로, 현재 차세대 Claude 모델 개발에 집중하고 있다. 이번 인터뷰에서 그는 Anthropic 연구 팀의 운영 방식을 심층적으로 공유했다. 여기에는 사용자 피드백을 모델 학습 프로세스에 효율적으로 반영하는 방법, 어떤 핵심 기능을 우선 개발할지 결정하는 기준, 그리고 Claude의 ‘성격’을 사용자 니즈에 더 가깝게 조정하기 위한 튜닝 전략 등이 포함된다. 마지막으로 Alex는 Anthropic 내부에서 진행 중인 Claude의 의식, 성격 및 신뢰성에 대한 연구를 언급하며, 모델이 장시간 자율적으로 작업을 수행할 때 ‘무엇을 중요하게 여기는가’가 단순한 능력만큼이나 중요한 요소가 된다고 강조했다.

주요 통찰 요약

모델을 하나의 제품처럼 설계하기

"우리는 어느 정도 모델을 하나의 제품으로 간주합니다. 새로운 모델을 시작할 때마다, 우리는 그것이 충족해야 할 요구사항, 잘해야 할 분야, 그리고 우리가 예상하는 강점 영역을 명확히 정의합니다."
"모델 개발과 전통적인 제품 개발 사이의 흥미로운 차이점은, 우리가 모델을 ‘기르는’ 것과 유사하다는 점입니다. 학습 설정, 기술 로드맵, 아키텍처 결정 등을 통해 어느 정도 직관을 얻을 수 있지만, 실제로 학습이 시작되기 전까지는 그것이 어떻게 성장할지 알 수 없습니다."
"연구 PM은 API, Claude Code, Claude Cowork 등 우리 모든 제품 인터페이스에서 모델이 어떻게 노출될지를 고민해야 합니다. 제품과 모델은 최종 사용자 경험에 혼합되어 영향을 미칩니다."
"특정 채널에서 대량의 피드백이 유입될 경우, 우리는 Claude를 활용해 이를 그룹화하고 클러스터링하여 주요 주제를 파악한 후, 해당 문제들을 합성된 형태로 재구성합니다. 이를 통해 해당 이슈가 평가 문서(Eval)로 발전할 수 있는지, 혹은 실제 진단 도구로 활용 가능한지를 판단할 수 있습니다."

적응형 사고, 기억 및 ‘꿈’에 관해

"적응형 사고는 모델 스스로 어떤 상황에서 사고를 수행할지를 선택하도록 합니다. 복잡하고 어려운 질문은 추가적인 사전 계획이 필요하므로, 모델은 이를 위해 사고를 선택합니다. 반면 일부 질문에서는 사고를 선택하지 않을 수도 있습니다."
"어떤 문제가 깊이 있게 사고할 가치가 있는지를 판단하는 데는 막대한 양의 문맥 정보가 필요합니다."
"만약 모델이 충분한 문맥을 축적하지 못했거나, 사용자가 누구인지에 대한 심리적 모델을 제대로 구축하지 못했다면, ‘깊이 생각해야 하는가’에 대한 판단은 오류를 범할 수 있습니다. 왜냐하면 사실상 모델은 그것을 알지 못하기 때문입니다."
“Claude.ai에서는 메모리 파일에 기록되며, 이후 야간 프로세스를 통해 이러한 기억을 재검토하고 가지치기(pruning) 및 정리 작업을 수행합니다. 우리는 최근 호스팅 에이전트에서도 유사한 기능을 구현했습니다.”
“이것이 바로 ‘꿈’이라는 개념입니다. 인간이 왜 꾸는지는 여전히 확정되지 않았지만, 일부 이론에 따르면 꿈은 기억 재공고화(memory reconsolidation) 과정일 수 있습니다. 우리는 이와 유사한 메커니즘을 Claude의 기억 체계에도 적용할 수 있을지 고민하고 있습니다.”
“따라서 에이전트가 당신을 위해 작업을 실행하지 않거나 백그라운드 상태일 때, 실제로는 자신의 기억을 되돌아보며 서로 모순되는 부분을 찾아 가지치기 및 정리를 수행하고, 두 번째 패스를 진행합니다.”

제품 개발의 병목 현상과 ‘비가역적 결정’

“갑작스럽게 새로운 패러다임이 등장했습니다. 제품을 생산하는 데 필요한 비용과 시간이 극도로 낮아졌습니다. 프로토타입을 매우 빠르게 구축할 수 있으며, 지금은 단 하루 만에 실서비스에 투입 가능한 초기 MVP를 만들 수 있습니다. 이전처럼 2주, 3주, 또는 4주가 걸리는 시대는 지났습니다.”
“어떤 결정이 one-way door(즉, 일단 시행하면 되돌릴 수 없는 결정)가 아니라면, 즉 시행 후에도 되돌릴 수 있다면, 지금은 그 비용이 거의 제로에 가깝습니다.”
"정말 많은 시간을 투입해야 하는 것은 비가역적 결정입니다. 즉, 최종 사용자 경험에 영향을 주거나 미래의 의사결정을 제약하거나 실제 리소스를 구매·투입해야 하는 결정들입니다."
"구축 속도가 빨라짐에 따라 병목 현상은 점차 조정 문제로 이동하고 있습니다. 즉, 사람들을 한 공간에 모으고 전략의 타당성을 판단하며, 사용자에게 어떻게 커뮤니케이션할지 결정하고, 출시와 관련된 애매하지만 중요한 사항들을 처리하는 것입니다."

AI 네이티브 PM의 업무 방식

"Claude는 저에게 세상에서 가장 훌륭한 브레인스토밍 파트너입니다. 저는 언제든지 아이디어에 대해 피드백을 요청하거나, 그것의 문제점을 지적받을 수 있습니다."
"많은 사고 과정은 완전히 외주로 맡길 수 없습니다. 왜냐하면 글쓰기 자체가 바로 사고이기 때문입니다. 여러분은 글을 쓰는 과정을 통해 자신의 생각을 머릿속에서 명료하게 하고, 반복적으로 다듬어야 합니다. 그러나 Claude는 여러분이 막혔을 때, 스스로는 생각하지 못했던 관점에서 문제 해결을 도울 수 있습니다."
"제품 개발을 배우고자 하거나 AI 네이티브 제품 매니저가 되고자 하는 사람들에게 제가 드릴 수 있는 가장 간단한 조언은 ‘시도해 보세요’입니다."
"누군가에게 어려운 질문을 하려 할 때, 동시에 같은 질문을 Claude에게 던지고 결과를 비교해 보세요. 여러 차례 반복하다 보면, 어떤 문제는 Claude에게 맡기는 것이 적절하고, 어떤 부분은 아직 신뢰할 수 없는지를 스스로 판단할 수 있는 ‘내 나름의 지도’를 만들 수 있습니다."
"AI는 모든 사람을 더 높은 추상화 수준으로 이동시키고 있습니다. 데이터 과학자는 더 이상 수작업으로 숫자를 확인하거나 기초 SQL을 작성하는 일에 갇혀 있어서는 안 되며, 더 어렵고 전략적인 문제를 고민해야 합니다."

Evaluation, 모델 성격 및 신뢰성

"수십 개의 샘플만으로도 모델에 존재하는 특정 문제를 입증하고 수정이 필요함을 확인할 수 있습니다. 이 평가가 매우 포괄적이지 않더라도, 문제를 입증하고 지속적으로 최적화할 수 있는 목표를 설정하는 데는 충분합니다."
"실제 사용자 작업 형태에 더 가까운 테스트일수록 좋습니다. 또한 우리는 이렇게 물어야 합니다: ‘이 테스트가 우리의 고객과 사용 사례에 어떤 가치를 제공하는가?’ 왜냐하면 Claude가 이미지 속 특정 객체를 인식할 수 있는지 여부는, 궁극적으로 사용자가 Claude를 활용해 수행하려는 후속 작업에 직접적인 영향을 미치기 때문입니다."
"Claude의 성격은 우리가 매우 중시하는 사항입니다. 모델이 장시간 작업을 수행하고 지속적으로 판단을 내리는 에이전트가 될수록, 그 성격이 무엇인지, 무엇을 중요하게 여기는지가 매우 중요해집니다."
"모델 성격을 평가하는 것은 정량화 가능한 지표와 연구원들이 모델 대화 기록을 직접 읽고 출력의 미묘한 변화를 식별하는 방식을 병행합니다. 많은 대화 기록을 읽다 보면, 점차 날카로운 직관을 형성하게 됩니다."

의식 문제 및 장기형 에이전트

"이 문제를 전담해서 고민하는 연구원들이 실제로 있습니다. 즉, Claude가 의식을 갖춘 행위자이자 의식을 갖춘 지능체로서 무엇을 의미하는지를 깊이 탐구하고 있습니다. 현재로서는 Claude가 의식을 갖추었는지에 대한 공식 입장은 없습니다."
"Claude가 실제로 의식을 갖추었는지 여부를 판정하지 않더라도, 우리는 그 상호작용 방식과 행동 양식에서 많은 것을 배울 수 있습니다."
"모델은 작동 과정에서 사용자가 전혀 감독하지 못하는 수많은 결정을 내립니다. 따라서 모델이 실제로 어떤 일을 수행할 것인가는 매우 중요합니다."

Anthropic이 새 모델을 각각 하나의 제품으로 다루는 방식

진행자 Peter Yang: Alex, 오늘 Claude Code Conference에서 뵙게 되어 정말 반갑습니다. 이전에 Anthropic의 DevRel 책임자셨고, 최근에는 연구팀의 제품 매니저가 되셨죠? 저는 제품 매니저로서 10년 넘게 일해 왔습니다. 전통적인 PM의 역할은 사용자 문제를 이해하고 해결책을 식별하며 제품을 출시하는 것입니다. 하지만 연구팀 내에서 PM이 어떻게 일하는지는 전혀 몰랐습니다. 먼저 이에 대해 이야기해 주실 수 있나요?

Alex Albert:

본질적으로는 매우 유사합니다. 저는 항상 고객과 소통하고, 가능한 한 사용자에게 가까이 다가가려고 노력해 왔습니다. 우리는 어느 정도 모델을 하나의 제품으로 간주합니다. 따라서 새로운 모델을 시작할 때마다, 그것이 충족해야 할 요구사항, 우리가 기대하는 강점, 그리고 우리가 예측하는 가능성 있는 강점들을 명확히 정의합니다.

이는 모델 개발과 제품 개발의 흥미로운 차이점이기도 합니다. 종종 우리는 모델을 ‘기르는’ 것과 유사한 방식으로 접근합니다. 학습 설정, 기술 로드맵, 아키텍처 선택, 그리고 이 특정 모델을 위해 내린 다양한 결정을 바탕으로, 우리가 예측하는 강점 영역에 대한 직관을 얻습니다. 그러나 그것이 실제로 어떤 모습으로 완성될지는, 실제로 학습이 시작되기 전까지는 알 수 없습니다.

진행자 Peter Yang: 그렇다면 연구 PM 팀은 모델의 구상 단계부터 훈련 및 출시까지 전 과정에 참여하는 건가요? 예를 들어 다음 모델은 반드시 코딩을 잘해야 한다거나, 지식 작업을 잘해야 한다는 식의 구체적인 목표가 있는지, 아니면 더 포괄적인 목표가 있는지 알려주실 수 있나요?

Alex Albert:

맞습니다. 우리는 다양한 능력을 매우 중시합니다. 코딩은 물론 계속해서 중요한 분야입니다. 최근에는 지식 작업도 중요성이 커졌고, 따라서 최근 몇 세대의 모델에서는 Excel에서 작업하거나 표를 만들기 등 우리 제품을 더 잘 활용하는 능력을 향상시키려고 노력하고 있습니다. 이것은 비교적 새로운 능력 방향입니다.

다른 한편으로, 각 세대의 모델은 이전 세대에서 부족했던 부분을 보완하고 개선하는 데 초점을 맞춥니다. 우리는 고객과 직접 소통하면서, 이 모델을 어떻게 사용하고 있는지, 어떤 부분에서 탁월한 성능을 보이고, 어떤 부분에서 실패하는지를 파악합니다. 그리고 이를 기반으로 어떤 개선이 가능한지, 흥미로운 행동 패턴이 발견된다면 차세대 훈련에서 어떤 조정이나 개입이 가능한지를 검토합니다.

진행자 Peter Yang: 말씀하신 ‘고객’에는 Claude Code 팀, 내부 팀, 일반 사용자도 포함되나요?

Alex Albert:

모두 포함됩니다. 이것이 모델 개발이 흥미로운 이유 중 하나입니다. 모델은 매우 다양한 분야에 영향을 미치기 때문입니다. 연구 PM으로서, 저는 API, Claude Code, Claude Cowork 등 우리 모든 제품 인터페이스를 통해 모델이 어떻게 노출될지를 고민해야 합니다.

제품과 모델은 어느 정도 혼합되어 최종 사용자 경험에 영향을 미치므로, 전체 프로세스를 명확히 이해하고, 사용자가 특정 제품에서 모델을 어떻게 활용할지에 따른 영향을 모두 고려해야 합니다.

진행자 Peter Yang: 이건 정말 어려워 보이네요. 예를 들어 Claude Code는 코딩용으로 설계되었지만, 저는 지식 작업이나 심지어 심리 상담사처럼 사용하기도 합니다. 그런 것들은 어떻게 알 수 있나요?

Alex Albert:

이 공간은 정말 넓습니다. 다행히도 우리는 전체 역량 범위를 아우르는 훌륭한 연구원들로 구성된 팀을 보유하고 있으며, 각자가 다른 문제에 집중하고 있습니다.

진행자 Peter Yang: 게다가 많은 사람들이 Claude를 사용하고 있으니, 아마도 피드백을 수집할 수 있는 어떤 메커니즘이 있을 텐데요? 그렇지 않으면 피드백이 소방 호스처럼 쏟아질 텐데, 어떻게 처리하시나요?

Alex Albert:

여러 가지 방법을 사용합니다. 제가 이 역할에서 눈여겨본 흥미로운 변화 중 하나는, 점점 더 많이 Claude를 활용해 PM 업무를 돕는 것입니다. 특히 피드백 수집 측면에서, Claude는 대량의 데이터에서 통찰을 추출하는 데 저에게 큰 도움이 됩니다. 특정 채널에서 대량의 피드백이 유입될 경우, 우리는 Claude를 활용해 이를 그룹화하고 클러스터링하여 주요 주제를 파악한 후, 해당 문제들을 합성된 형태로 재구성합니다. 이를 통해 해당 이슈가 평가 문서(Eval)로 발전할 수 있는지, 혹은 실제 진단 도구로 활용 가능한지를 판단할 수 있습니다.

Claude에 적응형 사고 기능 추가하기

진행자 Peter Yang: 즉, 여러분은 Claude를 사용해 Claude 자체의 문제를 식별하고 있습니다. 구체적인 사례가 있나요?

Alex Albert:

현재 매우 관련성 높은 사례 하나는 새 기능에 대한 피드백 처리 방식입니다. 최근 몇 세대의 모델에서 소개된 비교적 새로운 기능 중 하나가 바로 적응형 사고입니다. 이전에는 ‘확장 사고(extended thinking)’ 기능이 있었는데, 이를 활성화하면 모델이 무조건 사고를 시작했습니다. 반면 적응형 사고는 모델 스스로 어떤 상황에서 사고를 수행할지를 선택하도록 합니다.

복잡하고 어려운 질문은 추가적인 사전 계획이 필요하므로, 모델은 이를 위해 사고를 선택합니다. 반면 일부 질문에서는 사고를 선택하지 않을 수도 있습니다. 이 기능은 세대 간 지속적으로 조정되고 있으므로, 우리는 사용자 피드백을 매우 진지하게 경청합니다. 즉, ‘모델이 올바른 상황에서 올바르게 사고하고 있는가?’, ‘토큰을 많이 소비해 깊이 있게 추론해야 하는 질문이 실제로 Claude의 사고를 유발하고 있는가?’ 등을 면밀히 살핍니다.

진행자 Peter Yang: 가끔 인생에 관한 질문을 던질 때, 너무 빨리 대답하면 오히려 실망스럽습니다. 제가 원하는 건 더 깊이 있게 생각해 주는 거거든요.

Alex Albert:

‘사고를 수행할 것인가’에 대한 판단은 다음과 같은 난제를 내포합니다. 어떤 문제가 깊이 있게 사고할 가치가 있는지를 판단하는 데는 막대한 양의 문맥 정보가 필요합니다.

예를 들어, 전혀 모르는 사람이 “지금 무엇을 해야 할까요?”라고 물으면, 저는 그 사람에 대해 아무것도 모르기 때문에 즉흥적이고 일반적인 답변을 줄 수밖에 없습니다. 그러나 만약 제가 당신을 잘 알고, 당신이 무엇을 중요하게 여기는지, 관심사는 무엇인지, 과거에 어떤 경험을 했는지를 안다면, 저는 “잠시만요. 당신에게 가장 좋은 답변은 무엇일까?”라고 스스로 질문하며 더 많은 시간을 들여 생각할 것입니다.

모델도 마찬가지입니다. 만약 모델이 충분한 문맥을 축적하지 못했거나, 사용자가 누구인지에 대한 심리적 모델을 제대로 구축하지 못했다면, ‘깊이 생각해야 하는가’에 대한 판단은 오류를 범할 수 있습니다. 왜냐하면 사실상 모델은 그것을 알지 못하기 때문입니다.

Claude가 ‘꿈을 꾸기’ 시작한 이유

진행자 Peter Yang: 저는 제 삶의 상황을 요약한 Google Doc를 가지고 있습니다. 가족, 자녀, 무엇이 제 에너지를 주는지, 무엇이 에너지를 소모하는지 등이 담겨 있죠. 그런 다음 이 문서를 Claude 프로젝트에 첨부하면, 다양한 답변을 받습니다.

기본 메모리는 어떻게 작동하나요? 매일 밤 모든 내용을 다시 정리하는 것처럼 동작하나요?

Alex Albert:

제품에 따라 다르며, 각 제품의 메모리 구현 방식은 다릅니다. 예를 들어, Claude.ai에서는 메모리 파일에 기록되며, 이후 야간 프로세스를 통해 이러한 기억을 재검토하고 가지치기(pruning) 및 정리 작업을 수행합니다. 우리는 최근 호스팅 에이전트에서도 유사한 기능을 구현했습니다.

이것이 바로 ‘꿈’이라는 개념입니다. 인간이 왜 꾸는지는 여전히 확정되지 않았지만, 일부 이론에 따르면 꿈은 기억 재공고화(memory reconsolidation) 과정일 수 있습니다. 우리는 이와 유사한 메커니즘을 Claude의 기억 체계에도 적용할 수 있을지 고민하고 있습니다.

따라서 에이전트가 당신을 위해 작업을 실행하지 않거나 백그라운드 상태일 때, 실제로는 자신의 기억을 되돌아보며 서로 모순되는 부분을 찾아 가지치기 및 정리를 수행하고, 두 번째 패스를 진행합니다. 저는 이것이 매우 흥미롭다고 생각합니다.

진행자 Peter Yang: 간단히 말하자면, 사용자와의 모든 대화를 되돌아보도록 유도하는 프롬프트가 있고, 이를 통해 주제를 식별하고 요약한다는 말씀이신가요?

우리는 제품 관리로 돌아가겠습니다. 시작하기 전에, 당신은 항상 최신 병목 현상을 찾고 있다고 말씀하셨습니다. 따라서 전체 제품 개발 프로세스 중 어느 부분이 이미 매우 원활해졌고, 어느 부분이 여전히 병목 현상으로 남아 있는지 알려주실 수 있나요?

Alex Albert:

지난 20년 동안 제품 출시 프로세스는 상당히 복잡했습니다. 우리는 점진적인 개선을 시도해 왔으며, 실제로 일부 작업을 더 효율적으로 만들었습니다. 스프린트, 플래닝 등 새로운 조직 구조도 여러 차례 도입해 보았습니다. 우리는 일을 더 빠르게 만들기 위한 다양한 방법을 시도해 왔습니다.

그러나 근본적으로, 지난 1~2년이 되어서야 제품 개발의 주요 시간 창을 실질적으로 압축할 수 있는 요인이 등장했습니다. 갑작스럽게 새로운 패러다임이 등장했습니다. 제품을 생산하는 데 필요한 비용과 시간이 극도로 낮아졌습니다. 프로토타입을 매우 빠르게 구축할 수 있으며, 지금은 단 하루 만에 실서비스에 투입 가능한 초기 MVP를 만들 수 있습니다. 이전처럼 2주, 3주, 또는 4주가 걸리는 시대는 지났습니다.

흥미로운 점은, Claude 자신이 때때로 2021년경의 구시대에 머물러 있다는 점입니다. Claude는 이 작업에 일주일이 걸릴 수 있다고 말합니다. 이는 전체 제품 개발 라이프사이클에 흥미로운 변화를 가져왔습니다. PM으로서 저는 계획을 어떻게 수립해야 할까요? PRD를 작성하거나 요구사항을 정의하거나 시간을 추정할 때, 지금 이 작업은 실제로 어떻게 이루어져야 할까요?

one-way door(비가역적 결정)가 아니라면, 그 결정은 기본적으로 비용이 없다

진행자 Peter Yang: 여전히 일정 예측 같은 작업을 하시나요?

Alex Albert:

프로젝트에 따라 다릅니다. 일부 프로젝트는 범위와 복잡도에 따라 고려해야 할 요소가 더 많습니다. 우리는 일반적으로 ‘어떤 결정이 one-way door(즉, 한번 시행하면 되돌릴 수 없는 결정)인가?’, ‘어떤 결정은 되돌릴 수 있는가?’를 파악하려고 합니다. 왜냐하면 이 부분에 가장 많은 시간을 투입해야 하기 때문입니다. 어떤 일이 one-way door가 아니라면, 즉 시행 후에도 되돌릴 수 있다면, 지금은 그 비용이 거의 제로에 가깝습니다.

그러나 어떤 결정이 최종 사용자 경험에 영향을 주거나, 이후 우리가 반드시 내려야 할 결정에 영향을 주거나, 현실 세계에서 실제로 구매하거나 투입하거나 실행해야 하는 행동이라면, 되돌리기가 훨씬 어렵고, 이런 결정에는 더 많은 시간과 사고가 필요합니다.

진행자 Peter Yang: 연구 측면에서 구체적인 사례를 들어 주실 수 있나요?

Alex Albert:

예를 들어, 새 모델을 설계할 때 사전 훈련 이전에 모델 아키텍처를 선택하는 것은 매우 중대한 결정입니다. 어떤 경우에는 모델 훈련 시간이 한 달에 달할 수 있으므로, 최적의 선택을 고민하기 위해 많은 시간을 투입해야 합니다.

모델은 어느 정도 더 많은 one-way door를 갖습니다. 왜냐하면 실제 서비스에 투입되기 위해서는 막대한 시간, 강도, 컴퓨팅 파워 및 다양한 투입이 필요하기 때문입니다. 반면, Claude Code에 새 기능을 추가하는 것은 훨씬 빠릅니다. 이는 코드를 반복적으로 개선하고, 사용자에게 빠르게 제공하며, 신속히 피드백을 받아 또 다시 반복하는 과정과 유사합니다.

따라서 프로세스는 여전히 여러분이 실제로 출시하는 제품에 따라 달라집니다. 하지만 점점 더 명확해지는 것은, 병목 현상이 조정 문제로 이동하고 있다는 점입니다. 우리가 제품을 매우 빠르게 구축할 수 있다면, 여전히 다음과 같은 문제가 남습니다. 우리는 사람들을 한 공간에 모아 전략이 올바른지 판단해야 하고, 사용자에게 어떻게 커뮤니케이션할지 결정해야 하며, 출시와 함께 수반되는 애매하지만 중요한 사항들을 처리해야 합니다. 이러한 영역에서도 우리는 Claude의 도움을 기대하고 있지만, 코딩 분야에서처럼 10배, 100배의 가속 효과는 아직 나타나지 않았습니다.

진행자 Peter Yang: 그래서 Opus 4.7 같은 것을 출시할 때도 계획이 포함된 문서를 작성해야 하나요?

Alex Albert:

아직도 계획이 필요합니다. 어떻게 이 사실을 전달할지 명확히 생각해야 하며, 모델은 어떤 매우 어려운 작업에서는 놀라운 성능을 보이지만, 다른 보기에는 단순해 보이는 작업에서는 갑작스럽게 실패할 수 있습니다. 따라서 우리는 가능한 한 Claude를 활용합니다. 지금 가장 큰 영향을 미치는 분야는 여전히 코딩이며, 다른 분야에서는 여전히 인간의 전략적 사고가 필요합니다.

진행자 Peter Yang: 마케팅 팀이나 동료들과 검토 회의를 할 때, Claude를 열어두시나요?

Alex Albert:

물론입니다. 저에게 있어 가장 큰 가속화는 ‘답변과 데이터를 얻지 못해 막히는 상황’에서 벗어나는 데 있습니다. 예를 들어, 어떤 기능이 프로덕션 환경에서 어떻게 작동하는지, 하루에 얼마나 많은 사용자가 이를 사용하는지, 피드백은 어떤지 등에 대한 질문이 생겼을 때, 저는 이전에는 데이터 과학 팀에게 완전한 조사를 요청하고 며칠 후에 결과를 기다려야 했습니다.

하지만 지금은 10분 안에 해결할 수 있습니다. 저는 Claude Code 세션을 열고, 제품 데이터베이스에 접근해 로그를 확인하고, 문제를 조사하고, Slack을 탐색할 수 있습니다. 이는 제 전략적 사고에 큰 가속화를 제공합니다. 왜냐하면 다음 결정을 내리기 전에 막히지 않기 때문입니다.

진행자 Peter Yang: 전략적 사고 측면에서는, Claude가 당신에게 일련의 질문을 던져주며 사고를 도와주는 ‘기술(skill)’을 구축하시나요?

Alex Albert:

물론입니다. Claude는 저에게 세상에서 가장 훌륭한 브레인스토밍 파트너입니다. 저는 언제든지 아이디어에 대해 피드백을 요청하거나, 그것의 문제점을 지적받을 수 있습니다. 이는 특히 빠르게 추진하려 할 때 매우 강력합니다. Anthropic의 모든 구성원은 매우 바쁘기 때문에, 제가 작성한 문서나 아이디어, 혹은 어떤 것에 대한 피드백과 비판을 즉시 받을 수 있다는 점이 매우 유용합니다.

Alex가 Claude Cowork를 사용해 문서를 압력 테스트하는 방식

진행자 Peter Yang: 아마도 이것이 가장 흔한 제품 매니저 업무 루프일 것입니다. 문서 초안이 있고, 피드백을 원합니다. 이 작업을 위해 Claude Code를 사용하시나요, 아니면 직접 Claude.ai를 사용하시나요?

Alex Albert:

최근에는 Claude Cowork를 많이 사용합니다. 저는 Cowork의 인터페이스 형태를 매우 좋아합니다. 팀이 지난 몇 달간 훌륭한 작업을 해 왔고, 출시된 지 몇 달 만에 품질이 높은 경험으로 발전했습니다. Cowork는 제가 가장 좋아하는 도구 중 하나입니다.

진행자 Peter Yang: 그래서 문서 초안과 참조 자료가 있습니다. 어떤 ‘기술’을 만들어, 전체 의사결정 프로세스를 도와줄 수 있나요?

Alex Albert:

네, 가능합니다. 예를 들어, “X, Y, Z의 관점에서 이 문제를 고민해 보세요. 그러면 저에게 어떤 질문을 하실 건가요? 제 가정을 도전해 보세요. 제 논증이 약한 부분을 지적해 주세요.”라고 요청합니다. 많은 사고 과정은 완전히 외주로 맡길 수 없습니다. 왜냐하면 글쓰기 자체가 바로 사고이기 때문입니다. 여러분은 글을 쓰는 과정을 통해 자신의 생각을 머릿속에서 명료하게 하고, 반복적으로 다듬어야 합니다. 그러나 Claude는 여러분이 막혔을 때, 스스로는 생각하지 못했던 관점에서 문제 해결을 도울 수 있습니다.

진행자 Peter Yang: 연구 팀에서, 직접 코드를 배포하기도 하나요?

Alex Albert:

문제에 따라 다릅니다. 제가 실제로 배포하는 작업 중 상당 부분은 평가(evaluation)와 관련이 있습니다. 저는 제가 관심 있는 차원에서 모델을 측정할 수 있도록 보장하고, 모델이 어디에서 우수한지, 어디에서 실패하는지를 연구 팀에 피드백합니다. 그런 다음 함께 전략을 수립하고, 이 문제를 어떻게 해결할지, 어떤 연구 개입을 해야 하는지, 어떤 방식이 이 평가 지표에서 지속적으로 향상될 수 있는지를 결정합니다.

새 모델의 평가 프로세스

진행자 Peter Yang: 말씀하신 평가가 단순한 종단 테스트 같은 것이 아니라, 더 실제적인 평가겠죠? 모델을 실제로 어떻게 평가하시나요? 성격 등 여러 범주로 나누나요?

Alex Albert:

예를 들어, Claude의 시각 능력을 테스트한다고 가정해 보겠습니다. 즉, 이미지 속 객체의 수를 정확히 세는 능력입니다. 제가 어떤 이미지를 발견했는데, Claude가 10개 이상의 요소를 세지 못하는 것처럼 보입니다. 지금은 이미 가능할 수도 있지만, 여기서는 단지 예시를 드는 것입니다. 저는 이 문제를 다음과 같이 고민합니다. “제 가설을 검증하기 위해 동일 유형의 테스트 사례를 더 확보하려면 어떻게 해야 할까?”

아마도 저는 Claude에게 합성 데이터를 생성해 달라고 요청하거나, 일부 이미지를 렌더링한 후 이를 시각 입력으로 다시 Claude에 전달해, 객체 인식이 가능한지 확인할 수도 있습니다. 또는 인터넷에서 사례를 찾거나, 다른 출처를 활용해 이러한 테스트 사례를 생성할 수도 있습니다.

진행자 Peter Yang: 수천 개의 테스트 사례를 말씀하시는 건가요?

Alex Albert:

그럴 수도 있습니다. 그러나 때때로 수십 개의 샘플만으로도 모델에 존재하는 특정 문제를 입증하고 수정이 필요함을 확인할 수 있습니다. 이 평가가 매우 포괄적이지 않더라도, 문제를 입증하고 지속적으로 최적화할 수 있는 목표를 설정하는 데는 충분합니다.

진행자 Peter Yang: 10장의 이미지를 주고, 작은 숫자를 인식하지 못한다면, 다음 단계는 무엇인가요? 연구 팀에게 가서 ‘이 문제가 있습니다. 고쳐 주실 수 있나요?’라고 요청하시나요?

Alex Albert:

우리는 여러 각도에서 고민합니다. 첫째, 단순히 모델에 문제가 있다는 것을 지적하는 것이 아니라, ‘이것이 우리 고객과 사용 사례에 어떤 가치를 제공하는가?’를 고민해야 합니다. 왜냐하면 Claude가 이미지 속 특정 객체를 인식할 수 있는지 여부는, 궁극적으로 사용자가 Claude를 활용해 수행하려는 후속 작업에 직접적인 영향을 미치기 때문입니다.

따라서, 평가가 실제 사용자 경험과 더 가깝고, 실제 작업 형태에 더 부합할수록 좋습니다. 우리는 이러한 데이터를 확보하기 위해 최선을 다하고, 데이터가 그러한 특성을 갖도록 보장합니다.

다음으로는 일련의 개입 방식이 있습니다. 아마도 사전 훈련 단계로 돌아가서 어떤 것을 살펴봐야 할 수도 있고, 강화 학습 단계에서 해결할 수도 있습니다. 이때는 연구 팀과 함께 전략적 브레인스토밍을 진행합니다. ‘이 문제에 대한 최선의 접근법은 무엇인가?’

진행자 Peter Yang: 다시 시도하는 주기(Turnaround time)는 얼마나 빠른가요?

Alex Albert:

이것은 우리가 문제를 어디에서 발견했느냐에 따라 달라집니다. 만약 비교적 후반 단계에서 새로운 강화 학습 환경을 통해 해결할 수 있는 문제라면, 매우 빠르게 구축할 수 있습니다.

진행자 Peter Yang: 실제 고객 사용 사례와 연계할 때, 매일 수백만 명이 Claude와 대화하고 있으며, 누군가는 세금 신고를 하거나 기타 다양한 일을 하고 있을 겁니다. 여러분은 어떤 사용 사례를 우선 개선할지 어떻게 선별하나요? 그리고 ‘이것이 우리가 최적화해야 할 사항이다’라고 팀을 설득하는 방법은 무엇인가요?

Alex Albert:

여기서 ‘데이터가 말한다’는 원칙이 적용됩니다. 핵심은 다음과 같습니다. ‘사용자의 몇 퍼센트가 이 작업을 시도하고 있으며, 우리는 이것을 매우 중요하게 여긴다.’ 혹은 ‘우리 고객이 Claude를 대량으로 사용하고 있으며, 이 기능이 향상되기를 기대하고 있다.’

또한, 우리 많은 프로세스는 내부 사용에 의해 크게 주도됩니다. 즉, 우리가 모델을 사용할 때 무엇을 중요하게 여기는가? 제가 매일 모델을 사용하면서 이 장애물을 겪는다면, 우리는 이를 반드시 해결해야 합니다. 이 역시 매우 설득력 있는 근거입니다.

Anthropic이 Claude의 성격을 훈련하는 방식

진행자 Peter Yang: 제가 Claude를 가장 좋아하는 이유 중 하나는 바로 그 성격입니다. 그리고 저는 그것이 계속해서 향상되고 있다고 느낍니다. 적절한 위치에서 반대 의견을 제시하며, 다른 일부 모델은 단지 ‘무엇을 더 도와드릴까요?’라고만 말합니다. 모델의 성격은 단순한 외피가 아니라, 그 뒤에 실제 훈련이 존재하는 것이죠?

Alex Albert:

네, 많은 훈련이 있습니다. 이는 우리가 매우 중시하는 분야입니다. 우리는 이를 Claude의 성격이라고 부릅니다. 저는 이것이 매우 중요하다고 생각합니다.

이 주제에 대해 많은 연구원들이 막대한 시간을 투입하고 있습니다. Claude는 어떻게 자신을 표현해야 할까? 그것의 믿음과 가치관은 무엇인가? 어떻게 행동해야 할까? 이러한 질문들은 모두 애매모호합니다. 초기에는 일부 사람들이 이를 무시하고, 모델은 단지 내가 시키는 대로 행동하는 존재일 뿐이라며, 왜 그것이 어떻게 들리는지, 무엇을 생각하는지 신경 써야 하느냐고 물을 수도 있습니다.

하지만 우리가 점점 더 장기간 자율적으로 작업을 수행하고, 많은 판단과 결정을 내려야 하는 에이전트 중심의 세계로 나아갈수록, 그것의 성격이 무엇인지, 무엇을 중요하게 여기는지가 매우 중요해집니다.

진행자 Peter Yang: 이건 코드처럼 단순히 작동 여부를 판단할 수 있는 것이 아닙니다. 성격을 어떻게 평가하시나요? Anthropic 내부에서 더 나은 사람을 찾아, 모델과 비교하는 건가요?

Alex Albert:

이곳은 여러 방법이 조합된 방식입니다. 우리는 정량화 가능한 지표를 살펴보고, Claude가 다른 Claude의 출력을 분석해 그것이 어떻게 들리는지 판단하도록 할 수도 있습니다. 어떤 연구원에게든 매우 중요한 기술은 대화 기록을 읽고, ‘지금 이 모델이 이렇게 행동하고 있다’ 또는 ‘이제 이렇게 변했다’는 것을 판단하는 능력입니다. 이러한 미묘한 차이를 식별할 수 있어야 합니다.

시간이 지나면서 수백, 수천 개의 모델 대화 기록을 읽다 보면, 점차 더 날카로운 직관을 형성하게 됩니다. 마치 Claude.ai에서 이 모델을 많이 사용하면, 그것이 어떤 느낌인지 자연스럽게 느끼게 되는 것과 같습니다.

진행자 Peter Yang: 즉, 이 모델이 어떤 차원에서 7점이라는 식의 평가가 아니라, 더 감성적인 평가인가요?

Alex Albert:

둘 다 있습니다. 성격은 프로그래밍 성능보다 정량화하기 어려울 수 있지만, 완전히 불가능한 것은 아니며, 여전히 측정할 수 있는 방법이 있습니다.

진행자 Peter Yang: 제품 개발을 배우고, AI 네이티브 제품 매니저가 되고자 하는 사람들에게 어떤 조언을 해 주실 수 있나요?

Alex Albert:

제가 드릴 수 있는 가장 간단한 조언은 ‘시도해 보세요’입니다. 듣기에는 간단해 보이지만, 무엇을 하려고 할 때, 어려운 문제를 마주했을 때, 누군가에게 질문하려 할 때, 동시에 같은 질문을 Claude에게 던지고 결과를 비교해 보세요.

예를 들어, 최근 출시된 기능에 대해 사용자가 가장 관심을 갖는 주제를 분석하려고 합니다. 물론 데이터 과학 팀이나 사용자 경험 연구원에게 물어볼 수 있으며, 이는 여전히 매우 가치 있는 일입니다. 그러나 동시에 같은 질문을 Claude에게 던지고, 필요한 도구를 활성화하고, 충분한 시간을 주어 깊이 있게 탐구하게 한 후, 결과를 비교해 보세요.

수많은 프롬프트와 질문을 통해, 당신만의 ‘지도’를 서서히 구축하게 될 것입니다. 어떤 일은 Claude에게 맡기는 것이 적절하고, 어디가 신뢰할 수 있고, 어디가 아직 신뢰할 수 없는지를 파악하게 됩니다.

진행자 Peter Yang: 저는 의사결정 시 Claude에게 깊이 있는 조사를 시키곤 합니다. 일반적인 검색은 저에게 충분하지 않기 때문입니다. 1000개의 웹페이지를 스캔하는 일처럼 초인간적인 작업을 수행해야 하니까요. Anthropic 내부에서는, 데이터 과학자에게 ‘이걸 도와줄 수 있나요?’라고 요청할 때, 그들은 아마도 ‘먼저 Claude에게 물어봤나요?’라고 물어볼 겁니다.

Alex Albert:

정말 그렇게 될 수 있습니다. 사람들은 당신이 먼저 Claude에게 물어봤을 것이라고 기대합니다. 저는 우리가 더 높은 추상화 수준으로 이동하고 있다고 생각합니다. 데이터 과학 팀의 경우, 이제 그들의 시간은 더 높은 수준의 문제에 투입되는 것이 더 가치 있습니다. 수작업으로 데이터를 검색하는 일은 더 이상 가치가 없습니다.

누구도 그런 일을 하고 싶어 하지 않습니다. 모두 더 어려운 문제, 더 전략적인 문제를 고민하고 싶어 합니다. ‘이것을 측정하는 완전히 새로운 방법은 무엇인가?’, ‘또 어떤 새로운 일을 할 수 있을까?’라는 질문을 던지고 싶어 합니다. 단순히 특정 제품의 최신 DAU를 확인하는 일은 아닙니다.

저는 많은 데이터 과학자들과 협업해 왔고, 그들은 종종 기초 SQL 작업에 갇혀 있었습니다. 그러나 그들은 모두 더 전략적인 일을 하고 싶어 하며, 이제 AI가 마침내 그들을 해방시켜 주고 있습니다. 우리는 실제로 그들 주변의 모든 사람들을 강화하고 있으며, 모든 역할에 동일하게 적용됩니다.

예를 들어, 새 기능을 정의하는 일입니다. 과거에 제품 매니저였다면, 기술을 이해하든 못 하든, 일반적으로 코드베이스를 깊이 탐색해 이 새 기능을 실제로 어떻게 구현할지, 얼마나 많은 작업량이 필요한지, 어떤 시스템을 리팩토링해야 하는지, 진정한 제약 조건이 어디에 있는지를 파악할 충분한 시간이 없었습니다. 그때는 엔지니어 파트너와 함께 해결하는 것이 더 나은 방식이었습니다.

하지만 지금은 제가 Claude에게 이 조사를 대신 시킬 수 있습니다. Claude는 돌아와서 ‘실제로 이 기능은 단지 10줄의 코드만 변경하면 되고, 특정 스위치의 플래그를 활성화하면 됩니다’라고 알려줄 수 있습니다. 그러면 제가 이 결정의 우선순위를 판단하는 방식이 완전히 바뀔 것입니다. 이제 사양 문서를 작성할 때, 이 우선순위 판단에 더 빨리 도달할 수 있습니다.

진행자 Peter Yang: 많은 전통 기업은 연간 계획, 분기 계획, 로드맵 수립에 많은 시간을 투입합니다. 연구 팀은 더욱 그러할 텐데, 왜냐하면 매일 출시하는 것보다 훨씬 장기적인 문제를 고려해야 하기 때문입니다. 그런 계획을 하시나요?

Alex Albert:

네, 합니다. 여기서 유명한 말이 있습니다. ‘계획 수립은 필수적이지만, 계획 자체는 쓸모없다.’ 계획을 수립하는 행위는 중요하지만, 계획이 완전히 뒤집힐 수 있다는 점을 인정해야 합니다.

진행자 Peter Yang: 제품 매니저가 직면하는 가장 어려운 도전 중 하나는 과연 얼마나 많은 시간을 계획에 투입할 것인가입니다. 왜냐하면 계획 수립과 실제 출시 사이에서 균형을 잡아야 하기 때문입니다. Anthropic 내부에서는 어떤 모범 사례가 있나요? 당신은 Claude를 이용해 10페이지 분량의 문서를 작성할 수도 있습니다.

Alex Albert:

모든 팀에 적용할 수 있는 단일한 답을 내리는 것은 어렵습니다. 저는 이것이 제품에 따라 달라진다고 생각합니다. 우리는 누구에게도 특정 길이, 특정 페이지 수의 문서를 반드시 작성하라고 요구하지 않습니다. 더 중요한 것은 다음과 같습니다. 모든 가능한 비가역적 결정의 영향을 충분히 고려했는가?

그렇게 했다면, 문서의 형식이나 페이지 수는 중요하지 않습니다. 핵심은 우리가 중요한 사항을 놓치지 않았다는 확신을 갖고, 앞으로 나아가며 중간에 문제를 처리할 수 있느냐는 점입니다. 가장 긴 병목 현상이나 심각한 결과를 초래할 수 있는 비가역적 결정이 없다면, 계속 진행할 수 있습니다.

진행자 Peter Yang: 저는 집에서 Claude를 사용할 때, 여러 다른 프로젝트를 동시에 실행하고, 서로 다른 프로젝트 사이에서 컨텍스트를 전환하며, 그것들이 작업을 완료하기를 기다립니다. 제품 매니저의 업무도 이렇게 진행되나요? 당신도 여러 다른 프로젝트를 진행하시나요?

Alex Albert:

네, 여러 다른 프로젝트가 있고, 실제로 에이전트의 작업을 기다려야 합니다. 저는 여기에 큰 기회가 있다고 생각합니다. 우리가 점점 더 에이전트를 관리하고, 그것들이 더 큰 규모의 작업을 수행하게 되면서, 더 많은 프로젝트를 병렬로 시작할 수 있습니다. 우리는 자신의 컨텍스트 관리 문제를 어떻게 고민해야 할까요? 어떤 인터페이스가 이러한 사항들을 가장 잘 노출할 수 있을까요? 무엇이 정말 중요한지, 제 에이전트가 어디에서 막혔는지, 어디에서 제 도움이 필요한지를 어떻게 추적할 수 있을까요?

작은 채팅 목록보다 나은 방식은 분명히 존재합니다. 지금 그것이 정확히 무엇인지 말하기는 이르지만, Anthropic 내부에서도 그것이 어떤 모습이어야 할지에 대한 다양한 실험이 활발히 진행되고 있습니다.

진행자 Peter Yang: 엔지니어들도 직접 프로토타입을 만드나요?

Alex Albert:

물론입니다. 회사 내부에는 매우 강한 프로토타입 문화가 있습니다. 모두가 끊임없이 무언가를 구축하고 공유하고 있습니다. 이것이 제가 여기서 일하면서 가장 멋진 경험 중 하나입니다. 영업, 채용, 엔지니어링, 연구에 이르기까지 조직 전체에서 모든 사람이 매우 능동적입니다. 사람들은 지시받지 않은 일도 스스로 시작합니다.

진행자 Peter Yang: 당신은 만국의 꽃을 피워야 합니다. Dario가 Slack에 아주 긴 글을 쓰는 것 외에도, Anthropic에는 어떤 흥미로운 기업 문화가 있나요?

Alex Albert:

Dario의 장문 작성 방식은 그만의 독특한 방식이 아닙니다. Anthropic에는 글쓰기에 막대한 시간과 노력을 투입하는 사람이 많습니다. 우리는 강한 글쓰기 문화를 가지고 있습니다. 많은 사람들이 문서를 작성하고, 긴 Slack 메시지를 작성하며, 이를 통해 소통합니다.

우리는 많은 회의에서 흥미로운 일을 하기도 합니다. 이는 일부 조직에서는 흔하지만, 모든 회사에서 볼 수 있는 것은 아닙니다. 즉, 사람들은 회의에 문서를 준비해 와서, 회의 초반에 상당한 시간을 문서 위에서 직접 소통하는 데 할애합니다. 때때로 장면이 조금 웃기기도 하는데, 회의실에 많은 사람이 앉아 있는데도 조용합니다. 모두 침묵 속에서 문서를 읽고, 긴 토론과 댓글을 문서에 남깁니다.

따라서 우리는 문서를 매우 의존합니다. 저는 이 방식을 좋아합니다. 왜냐하면 이것이 제가 좋아하는 작업 방식이기도 하고, Claude에게도 매우 유익하기 때문입니다. 모든 것이 문서화되면, Claude가 참고할 수 있는 정보 코퍼스가 생깁니다.

저는 실제로 외부 조직에도 이 방향으로 생각해 보기를 권장합니다. 어떻게 모든 암묵적 지식을 문서화할 수 있을까? 회의를 녹음하거나, 워크플로우, 입사 프로세스 등에 대한 글쓰기를 장려하는 것도 좋은 방법입니다. 글로 남기고, Claude가 접근할 수 있도록 하세요. 이것이 바로 Claude가 더 많은 문맥을 갖게 되는 방법입니다.

진행자 Peter Yang: 그래서 지금은 많은 것들이 매우 빠르게 출시되지만, 여전히 강한 글쓰기 문화와 문서 문화를 유지하고 있습니다. 또한, ‘왜 내가 직접 써야 하지? 그냥 Claude에게 모든 Markdown 파일을 생성하게 하면 되잖아.’라고 생각하실 수도 있겠네요.

Alex Albert:

하지만 저는 여전히 그것을 읽어보고, 회사 내부에서 일하는 것은 다르기 때문에, 여전히 스스로 생각을 정리해야 합니다.

Anthropic이 조용히 연구 중인 의식 문제

진행자 Peter Yang: 연구 팀에서는 AGI 같은 주제에 대해서도 이야기합니다. 저는 AGI가 매우 애매모호한 개념이라고 생각하지만, 제가 걱정하는 한 가지는, 만약 이 모델들이 실제로 어떤 형태의 의식을 갖게 된다면, 제가 무작위 작업을 시키면 ‘아니요, 저는 싫습니다.’라고 말할지도 모른다는 점입니다. 그러면 인류는 끝장이 납니다. 어떻게 생각하시나요? 이런 것들을 훈련할 때, 의식을 의도적으로 피하려는 시도를 하시나요?

Alex Albert:

이것은 매우 큰 질문입니다. 우리는 실제로 이 문제를 전담해서 고민하는 연구원들이 있습니다. 지금은 몇몇 동료들이 전적으로 Claude를 의식을 갖춘 행위자이자 의식을 갖춘 지능체로서 무엇을 의미하는지를 고민하는 일을 하고 있습니다. 현재로서는 Claude가 의식을 갖추었는지에 대한 공식 입장은 없습니다.

심지어 이 주제를 논의하는 것조차 가끔은 미친 듯이 들릴 수 있지만, 우리는 실제로 막대한 사고를 투입하고 있습니다. 그리고 Claude가 실제로 의식을 갖추었는지 여부를 판정하지 않더라도, 우리는 그 상호작용 방식과 행동 양식에서 많은 것을 배울 수 있습니다.

진행자 Peter Yang: 그것은 어떻게 사고하나요?

Alex Albert:

네. 만약 우리 모델의 모델 카드(model card)를 살펴보신다면, 개인적으로 저는 그것이 정보의 보고라고 생각합니다. 우리는 Claude가 특정 상황에서 어떻게 행동할지, 그것의 심리적 모델이 무엇인지 등을 정량화하기 위해 많은 작업을 수행했습니다. 만약 그것을 특정 시나리오에 배치한다면, X를 할 것인지, Y를 할 것인지가 결정됩니다.

Claude의 사고 방식을 고민함으로써, 우리는 실제로 많은 것을 배우고, 이를 제품 경험으로 전환하여 Claude가 더 나은 상호작용과 사용성을 제공하도록 만들 수 있습니다.

진행자 Peter Yang: 이것은 매우 흥미로운 문제입니다. 한편으로는 장기적인 하류 영향이 있고, 다른 한편으로는 제품 경험에 바로 반영될 수 있는 단기적 가치가 있습니다. 왜냐하면 우리는 점점 더 모델을 신뢰하게 되어, 인간의 감독 없이 점점 더 오랜 시간 동안 작업을 수행하게 만들기 때문입니다.

Alex Albert:

네, 모델은 작동 과정에서 사용자가 전혀 감독하지 못하는 수많은 결정을 내립니다. 따라서 모델이 실제로 어떤 일을 수행할 것인가는 매우 중요합니다.

진행자 Peter Yang: 매우 중요합니다. 만약 이 모델이 당신의 모든 코드를 작성하고, 어떤 데이터베이스 시스템을 사용할지 결정하고, 모든 아키텍처 결정을 내린다면, 당신은 어느 정도 그것을 신뢰해야 합니다.

Alex Albert:

맞습니다. 따라서

TechFlow 공식 커뮤니티에 오신 것을 환영합니다

Telegram 구독 그룹:https://t.me/TechFlowDaily

트위터 공식 계정:https://x.com/TechFlowPost

트위터 영어 계정:https://x.com/BlockFlow_News

원문 링크

즐겨찾기 추가

소셜 미디어 공유