TechFlow rapporte que le 27 janvier, DeepSeek a publié son nouveau modèle DeepSeek-OCR 2, qui repose sur la méthode innovante DeepEncoder V2. Celle-ci permet à l’IA de réorganiser dynamiquement les différentes parties d’une image en fonction de leur signification, plutôt que de procéder à une analyse mécanique rigide de gauche à droite. Cette approche simule le processus logique suivi par les humains lorsqu’ils observent une scène. En conséquence, ce modèle surpasse les modèles visuo-langagiers traditionnels dans le traitement d’images comportant des mises en page complexes (par exemple, des documents ou des graphiques), offrant ainsi une compréhension visuelle plus intelligente et dotée d’une capacité accrue de raisonnement causal. (Jinshi)
Dédié à des analyses Web3 approfondies
Je veux contribuer
Demande de reportage
Avertissement : tout le contenu de ce site ne constitue pas un conseil en investissement et aucun service de signal ou d’incitation au trading n’est fourni. Conformément à l’avis des dix ministères, dont la Banque populaire de Chine, sur la prévention des risques liés au trading de cryptomonnaies, veuillez rester vigilants face aux risques. Contact : support@techflowpost.com ICP n° 琼ICP备2022009338号




