
OpenAI 첫 번째 개발자 회의: 생태계 구축을 선점하라, 누구나 자신만의 GPT를 만들 수 있다
최초의 AI 춘절로 불리는 OpenAI DevDay가 샌프란시스코에서 개최되었다. 일련의 신제품과 신기능 발표와 함께 OpenAI는 대규모 모델 시대의 생태계 구조를 처음으로 선보였다.
발표회 초반에 앨트먼은 OpenAI 플랫폼 및 제품의 몇 가지 데이터를 발표했다. 주간 사용량이 1억 명에 달하고, 개발자 수는 200만 명에 이르며, 포춘지 선정 글로벌 500대 기업 중 92%가 OpenAI 제품을 사용하고 있다.
가격 인하 더 저렴하고 빠른 GPT-4 Turbo
OpenAI는 새로운 GPT-4 Turbo를 발표했는데, 현재의 GPT-4보다 더 강력한 성능을 갖추고 있다.
-
2023년 4월까지의 인터넷 지식을 반영한다.
-
128K의 컨텍스트 윈도우를 제공하여 300페이지 이상의 텍스트를 처리할 수 있다.
-
가격 인하: 기존 GPT-4보다 저렴하며, 입력 비용은 GPT-4의 1/3, 출력 비용은 GPT-4의 절반 수준이다.
-
함수 호출 기능이 강화되어 여러 함수를 한 번에 호출할 수 있으며 정확도도 향상되었다. 또한 새로운 JSON 출력 모드도 지원한다.
-
GPT-4 Turbo는 채팅 중 이미지 입력을 지원하며, 이는 현재 BeMyEyes가 사용하는 기술이다. 개발자는 API를 통해 이 기능을 활용할 수 있으며, gpt-4-vision-preview의 가격은 입력된 이미지 크기에 따라 결정된다. 예를 들어, 1080×1080픽셀 이미지를 GPT-4 Turbo에 전달하는 비용은 0.00765달러이다.
-
파인튜닝(Fine-Tune) 기능을 공개하여 모델 학습 과정의 모든 단계를 수정할 수 있도록 하였으며, 학습 완료 후 모델은 해당 기업 전용으로 된다.
-
출력 속도가 빨라졌으며, 분당 출력 속도가 두 배로 증가하였다.

Assistants API / 어시스턴트 API
OpenAI가 발표한 에이전트 유사 응용 프로그램로, 개발자는 Assistants API를 사용해 특정 지시사항 수행, 추가 지식 베이스 읽기, 모델 및 도구 호출 등을 통해 작업을 완료할 수 있다. 코드 인터프리터, 검색 기능, 함수 호출 등의 도구를 포함한다.
-
어시스턴트 API는 영구적이며 무제한 길이의 스레드를 보유하고 있어, 개발자가 스레드 상태 관리를 OpenAI에 위임할 수 있고 컨텍스트 윈도우 제약 문제를 해결할 수 있다.
-
코드 인터프리터: 샌드박스 실행 환경에서 Python 코드를 작성하고 실행할 수 있으며, 그래프와 차트 생성, 다양한 데이터와 형식의 파일 처리가 가능하다. 이를 통해 어시스턴트는 복잡한 코드 문제나 수학 문제 해결을 위해 반복적으로 코드를 실행할 수 있다.
-
검색 기능: 모델 외부의 지식을 활용하여 어시스턴트를 강화할 수 있다. 예를 들어, 특정 분야 데이터, 제품 정보 또는 사용자가 제공한 문서 등을 활용할 수 있다. 즉, 사용자는 문서 임베딩 계산 및 저장, 청크 분할 및 검색 알고리즘 구현 등을 할 필요가 없다.
-
함수 호출: 어시스턴트가 정의된 함수를 호출하고 그 응답을 메시지에 통합할 수 있도록 한다.
16K 컨텍스트의 GPT-3.5 Turbo
OpenAI는 동시에 GPT-3.5 Turbo도 업그레이드하여 컨텍스트 윈도우를 16K 길이로 확장했다.
-
입력 가격은 기존 GPT-3.5 16K의 1/3 수준이며, 출력 가격은 GPT-3.5 16K 수준이고, 파인튜닝 가격도 동일하게 인하되었다.
-
향상된 명령 추적, JSON 모드 및 병렬 함수 호출 기능을 지원한다.
DALL·E 3, TTS API 공개, 개발자 연동 가능
Snap, 코카콜라 등 기업들은 DALL·E 3의 API를 활용해 고객을 위한 이미지를 생성하고 있으며, 이 API는 내장 심사 기능을 통해 개발자가 프로그램 오용을 방지할 수 있도록 한다.
개발자는 TTS API를 쉽게 활용해 텍스트를 인간 음성으로 변환할 수 있으며, TTS 모델은 6가지 사전 설정 음성과 2가지 성별 옵션을 제공한다.
Whisper v3 및 Consistency Decoder 오픈소스 공개
Whisper는 음성-텍스트 변환 소프트웨어의 대표작으로 이번에 v3 버전을 오픈소스로 공개했으며, 곧 Whisper v3 API도 공개할 예정이다. Consistency Decoder는 Stable Diffusion VAE의 대체 제품으로, Stable Diffusion 1.0+ VAE와 호환되는 모든 이미지에서 텍스트, 얼굴, 직선 표현 등에서 현저한 개선을 보여준다.
생태계 구축 누구나 참여 가능한 GPTs 및 GPT 스토어
이번 발표에서 가장 인상 깊었던 것은 GPTs 기능의 출시였다. 누구나 ChatGPT의 맞춤형 버전을 만들어 일상생활, 업무 또는 가정에서 활용할 수 있게 된 것이다. 사용자는 자신이 만든 GPT를 다른 사람과 공유하거나, 개인 또는 회사 내부 전용으로 사용할 수도 있다.
생성 과정은 코딩 없이 자연어로 상호작용하며, 간단한 지시사항과 추가적인 지식 베이스 텍스트만으로도 웹 검색, 이미지 제작, 데이터 분석이 가능한 GPT를 빠르게 만들 수 있다.
더욱 중요한 것은, OpenAI가 나중에 GPT 스토어를 출시할 예정이라는 점이다. 앱 스토어처럼, 검증된 사용자가 제작한 GPT 작품들이 스토어에 등록되어 검색될 수 있으며, 생산성, 교육, 재미 등 다양한 카테고리의 우수 작품들이 추천될 것이다. 또한 창작자는 자신의 GPT 사용자 수에 따라 일정한 수익 분배를 받을 수 있다.
플러그인 기능과 마찬가지로, 사용자가 만든 GPTs는 외부 데이터 통합, 인터넷 연결 등의 기능을 지원하며, 데이터베이스, 메일, 쇼핑 어시스턴트 등에 연결할 수 있다. Zapier를 활용하면 사용자가 구축한 GPTs는 캘린더 구독, 동기화, 문자 메시지 기능 등을 쉽게 구현할 수 있다.
ChatGPT 기업 사용자는 내부 전용 GPTs를 구축할 수 있다.
진정한 OpenAI 개발자 생태계가 눈앞에 다가온 것 같다.

개발자에게 도구를 주고 세상을 바꾸게 하라
개발자 컨퍼런스 기조연설의 마지막에 샘 알트먼은 개발자들에게 하고 싶은 말을 전했다.
"마지막으로, 이 모든 것을 만들어낸 팀들에게 감사의 시간을 갖고 싶습니다. OpenAI는 매우 높은 인재 밀도를 자랑하지만, 그럼에도 불구하고 현실로 이루어지기 위해서는 막대한 노력과 협업이 필요했습니다. 저는 진심으로 세상에서 가장 훌륭한 동료들을 가지고 있다고 믿으며, 그들과 함께 일할 수 있어 큰 영광입니다.
우리가 이렇게 모든 일을 하는 이유는, AI가 기술과 사회의 혁명이 될 것이라 믿기 때문입니다. 그것은 많은 측면에서 세상을 변화시킬 것입니다. 또한 저희가 여러분께 가치를 제공하고, 여러분이 다시 우리 모두를 위해 더 많은 가치를 창출하도록 도울 수 있다는 사실에 매우 기쁩니다.
예전에 말씀드렸듯이, 사람들에게 도구를 주면 그들은 세상을 바꿀 수 있습니다. 저희는 AI가 개인과 기관에 전례 없는 규모로 새로운 능력을 부여할 것이며, 이는 전 인류를 전례 없는 수준으로 끌어올릴 것이라 믿습니다.
우리는 더 많은 일을 할 수 있고, 더 많이 창조하며, 더 많이 누릴 수 있게 될 것입니다. 지능이 어디서나 존재하게 되면, 우리 모두가 원하는 것을 바로 얻을 수 있는 초능력을 갖게 될 것입니다."
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News













