推荐 GitHub 上一款开源且强大的文档...
- GitHubDaily
- 2024-10-24 13:35:00
推荐 GitHub 上一款开源且强大的文档 OCR 工具:Surya。
专注于文档图像的处理和分析,能够准确的逐行文本检测和识别,并且支持任何语言。
GitHub:github.com/VikParuchuri/surya
主要功能:
- 支持 90+ 种多语言,包括中文、英文、日语、阿拉伯语等;
- 支持任何语言的行级文本检测,准确识别文档中的每一行文字;
- 支持文档布局分析,包括表格、图像、标题等;
- 支持复杂排版阅读顺序检测,如左右两列,它能知道先读哪里,再读哪里;
- 支持精确识别表格中的行与列内容。
#AI创造营#
专注于文档图像的处理和分析,能够准确的逐行文本检测和识别,并且支持任何语言。
GitHub:github.com/VikParuchuri/surya
主要功能:
- 支持 90+ 种多语言,包括中文、英文、日语、阿拉伯语等;
- 支持任何语言的行级文本检测,准确识别文档中的每一行文字;
- 支持文档布局分析,包括表格、图像、标题等;
- 支持复杂排版阅读顺序检测,如左右两列,它能知道先读哪里,再读哪里;
- 支持精确识别表格中的行与列内容。
#AI创造营#