TechFlowの報道によると、1月27日、DeepSeekは新たにDeepSeek-OCR 2モデルを発表しました。本モデルは革新的なDeepEncoder V2手法を採用しており、AIが画像の意味に基づいてその構成要素を動的に再配置できるようになります。これは、従来のように単に左から右へと機械的にスキャンするのではなく、人間がシーンを観察する際に踏む論理的プロセスを模倣したものです。その結果、本モデルは文書やグラフなどレイアウトが複雑な画像の処理において、従来の視覚・言語モデルを上回る性能を発揮し、より知的で因果推論能力に優れた視覚理解を実現しました。(金十)
お気に入りに追加
SNSで共有




