TechFlow 소식에 따르면, 1월 27일 DeepSeek이 새로운 DeepSeek-OCR 2 모델을 공개했다. 이 모델은 혁신적인 DeepEncoder V2 방법을 채택해 AI가 이미지의 의미에 따라 이미지 구성 요소를 동적으로 재배열할 수 있도록 하며, 기존처럼 단순히 좌에서 우로 기계적으로 스캔하는 방식에서 벗어났다. 이 방식은 인간이 장면을 관찰할 때 따르는 논리적 흐름을 시뮬레이션한 것이다. 결과적으로 이 모델은 문서나 차트와 같이 레이아웃이 복잡한 이미지를 처리할 때 전통적인 비전-언어 모델보다 우수한 성능을 보이며, 보다 지능적이고 인과 추론 능력을 갖춘 시각 이해를 실현하였다. (Jinshi)
Web3 심층 보도에 집중하고 흐름을 통찰
기고하고 싶어요
보도 요청
위험 고지: 본 사이트의 모든 콘텐츠는 투자 조언이 아니며, 어떠한 매매 신호·거래 유도 서비스도 제공하지 않습니다. 인민은행 등 10개 부처의 「가상화폐 거래·투기 위험 방지 및 처리에 관한 통지」에 따라 투자자 여러분의 리스크 인식을 높이시기 바랍니다. 문의 / support@techflowpost.com 琼ICP备2022009338号




