深潮 TechFlow 消息,01 月 27 日,DeepSeek 发布全新 DeepSeek-OCR 2 模型,采用创新的 DeepEncoder V2 方法,让 AI 能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式模拟了人类在观看场景时所遵循的逻辑流程。最终,该模型在处理布局复杂的图片(如文档或图表)时,表现优于传统的视觉-语言模型,实现了更智能、更具因果推理能力的视觉理解。(金十)
添加收藏
分享社交媒体
深潮 TechFlow 消息,01 月 27 日,DeepSeek 发布全新 DeepSeek-OCR 2 模型,采用创新的 DeepEncoder V2 方法,让 AI 能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式模拟了人类在观看场景时所遵循的逻辑流程。最终,该模型在处理布局复杂的图片(如文档或图表)时,表现优于传统的视觉-语言模型,实现了更智能、更具因果推理能力的视觉理解。(金十)
DeepSeek 发布全新 DeepSeek-OCR 2 模型,采用创新的 DeepEncoder V2 方法,让 AI 能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式模拟了人类在观看场景时所遵循的逻辑流程。最终,该模型在处理布局复杂的图片(如文档或图表)时,表现优于传统的视觉-语言模型,实现了更智能、更具因果推理能力的视觉理解。(金十)