GOTOCR

  • AIGCLINK
  • 2024-09-14 22:35:17
阶跃星辰联合推出了一款端到端的通用OCR模型:GOT-OCR2.0

GOT-OCR2.0是一款多语言、多模态的OCR模型,采用端到端的架构,能够直接从图像中识别和提取文本,无需复杂的预处理

特点:
1、除了文本识别外,还支持识别数学公式、分子式、图表、乐谱、几何图形等

2、支持多种输入格式: 照片、文档、切片等; 支持多种输出格式: 除纯文本外,还能生成比如Markdown、TikZ、SMILES、Kern等

3、解码器支持8K最大长度的token,可以处理长文本场景

4、交互式OCR功能、动态分辨率策略、多页OCR技术支持

github:OCRGOTOCR
GOTOCRGOTOCRGOTOCR