深潮 TechFlow 消息,01 月 27 日,DeepSeek 發佈全新 DeepSeek-OCR 2 模型,採用創新的 DeepEncoder V2 方法,讓 AI 能夠根據圖像的含義動態重排圖像的各個部分,而不再只是機械地從左到右掃描。這種方式模擬了人類在觀看場景時所遵循的邏輯流程。最終,該模型在處理佈局複雜的圖片(如文檔或圖表)時,表現優於傳統的視覺-語言模型,實現了更智能、更具因果推理能力的視覺理解。(金十)
添加收藏
分享社交媒體
深潮 TechFlow 消息,01 月 27 日,DeepSeek 發佈全新 DeepSeek-OCR 2 模型,採用創新的 DeepEncoder V2 方法,讓 AI 能夠根據圖像的含義動態重排圖像的各個部分,而不再只是機械地從左到右掃描。這種方式模擬了人類在觀看場景時所遵循的邏輯流程。最終,該模型在處理佈局複雜的圖片(如文檔或圖表)時,表現優於傳統的視覺-語言模型,實現了更智能、更具因果推理能力的視覺理解。(金十)
DeepSeek 發佈全新 DeepSeek-OCR 2 模型,採用創新的 DeepEncoder V2 方法,讓 AI 能夠根據圖像的含義動態重排圖像的各個部分,而不再只是機械地從左到右掃描。這種方式模擬了人類在觀看場景時所遵循的邏輯流程。最終,該模型在處理佈局複雜的圖片(如文檔或圖表)時,表現優於傳統的視覺-語言模型,實現了更智能、更具因果推理能力的視覺理解。(金十)