刚发现umi-OCR是一个很好的离线OCR工具,可以从图片或文件(pdf)中识别文字,并且支持中文。作为一个PC软件测试一下,效果很好,比论坛里其它的工具感觉都好。
该工具还有一个强大的功能,可以支持 http 调用,调用接口说明如下
https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_ocr.md#/api/ocr/get_options
哪位老师可以写用Foxtable 调用http 解析图片的实例?
谢谢
参考:http://www.foxtable.com/bbs/dispbbs.asp?boardid=2&Id=139788
大概
Dim hc As New HttpClient("http://127.0.0.1:1224/api/ocr")
hc.ContentType = "application/json"
Dim jo As New JObject
Dim data() As Byte = System.IO.File.ReadAllBytes("D:\问题\1.png")
jo("base64") = Convert.ToBase64String(data)
jo("options") = New JObject
jo("options")("data.format") = "text"
hc.Content = jo.ToString()
Dim ret As String = hc.GetData()
MessageBox.Show(ret)
有点蓝老师,上述是图片文件的OCR,如果是PDF则API会有差异。能帮再写一个文档解析的示例吗?谢谢!
https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_doc.md#/api/doc
pdf api 即“文档被别” 如图。
api 的链接如下:
此主题相关图片如下:pdf_api.png
https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_doc.md#/api/doc
非常棒的东西,我一直用手机自动识别图片来识别一些单据和表格转换成文字或是表格,虽然免费,但无法识别红色背景的图片,只能识别白色背景的,
就是不知,这个能不能识除白色背景外的图片或是PDF,然后转成表格