OCR模型

共 2 篇文章

排序

发布更新浏览点赞

GOT-OCR-2.0模型：专为识别和处理各种字符而设计的OCR模型

GOT-OCR-2.0模型：专为识别和处理各种字符而设计的OCR模型

GOT-OCR 模型是一个参数量达 580M 的OCR系统，专为识别和处理各种字符而设计。该模型配备了高压缩编码器和长上下文解码器，能够精准处理各种场景和文档风格的图像。它支持多页和动态分辨率的 OC...

多模态模型 # GOT-OCR-2.0 # OCR模型

1年前

04670

DeepSeek-OCR-V2：用 LLM 替代 CLIP，让 OCR 学会“像人一样阅读”

DeepSeek-OCR-V2：用 LLM 替代 CLIP，让 OCR 学会“像人一样阅读”

DeepSeek 发布 OCR-V2，这不是一次常规升级，而是一次架构级革新：彻底弃用 CLIP 视觉编码器，改用小型 LLM（Qwen2-0.5B）作为视觉编码器，并引入 “视觉因果流”（Visua...

多模态模型 # DeepSeek-OCR-V2 # OCR模型

2个月前

0630