TechFlow 소식에 따르면, 4월 2일 지푸(智谱)는 시각 프로그래밍을 위한 다중모달 코딩 기반 모델 ‘GLM-5V-Turbo’를 공개했다. 이 모델은 이미지, 동영상, 디자인 원고, 문서 레이아웃 등 다양한 모달리티 입력을 네이티브로 이해하며, 사각형 그리기, 스크린샷 캡처, 웹페이지 읽기 등 다양한 모달리티 도구 호출을 지원한다. 또한 컨텍스트 윈도우는 200K로 확장되었다.(금십)
즐겨찾기 추가
소셜 미디어 공유
TechFlow 소식에 따르면, 4월 2일 지푸(智谱)는 시각 프로그래밍을 위한 다중모달 코딩 기반 모델 ‘GLM-5V-Turbo’를 공개했다. 이 모델은 이미지, 동영상, 디자인 원고, 문서 레이아웃 등 다양한 모달리티 입력을 네이티브로 이해하며, 사각형 그리기, 스크린샷 캡처, 웹페이지 읽기 등 다양한 모달리티 도구 호출을 지원한다. 또한 컨텍스트 윈도우는 200K로 확장되었다.(금십)
지푸는 시각 프로그래밍을 위해 설계된 다중 모달리티 코딩 기반 모델인 GLM-5V-Turbo를 발표했다. 이 모델은 이미지, 동영상, 디자인 원고, 문서 레이아웃 등 다양한 모달리티 입력을 네이티브로 이해하며, 박스 그리기, 스크린샷 캡처, 웹페이지 읽기 등 다양한 모달리티 도구 호출을 지원한다. 컨텍스트 윈도우는 20만 토큰으로 확장되었다. (금십)