开源的多语言文档OCR工具包Surya

7次阅读
没有评论

共计 219 个字符,预计需要花费 1 分钟才能阅读完成。

Surya 是一个开源的多语言文档 OCR 工具包,它能够实现准确的逐行文本检测和识别。

  • 逐行文本检测:能够自动识别文档里的每一行文字在哪里。
  • 文本识别功能读取并转换文档上的文字,即把图片上的文字变成可以编辑的文本。(即将推出)
  • 表格和图表检测:识别文档中表格和图表的功能。(即将推出)
  • 支持多种语言:可以处理不同语言的文档,支持英语、中文、日文、印地语等语言

GitHub 地址:https://github.com/VikParuchuri/surya

开源的多语言文档 OCR 工具包 Surya

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2024-01-17发表,共计219字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。
评论(没有评论)
验证码