以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.net/bbs/index.asp)
--  专家坐堂  (http://foxtable.net/bbs/list.asp?boardid=2)
----  Tesseract-OCR图文识别开源,老师是否可以写个代码  (http://foxtable.net/bbs/dispbbs.asp?boardid=2&id=187798)

--  作者:xluoping
--  发布时间:2023/8/11 22:52:00
--  Tesseract-OCR图文识别开源,老师是否可以写个代码
Tesseract-OCR图文识别开源,比MODI好用,老师是否可以写个代码。

以下这段代码,不知哪里出了问题?

Dim dlg As New OpenFileDialog \'定义一个新的OpenFileDialog
dlg.Filter= "pdf文件|*.pdf" \'设置筛选器
If dlg.ShowDialog = DialogResult.Ok Then \'如果用户单击了确定按钮
    Dim Creat As Object = CreateObject("Tesseract.Application")
    With Creat
        .Init("C:\\Program Files\\Tesseract-OCR\\tessdata", "eng", "chi_sim") \' 设置Tesseract的数据目录和语言
        .SetVariable("tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz") \' 设置字符白名单
        .SetVariable("tessedit_create_files", "false") \' 禁用创建临时文件
        .SetVariable("tessedit_page_description", "false") \' 禁用页面描述
        .SetVariable("tessedit_psm", "1") \' 设置识别模式为第一行
        .SetVariable("tessedit_untrained", False) \' 禁用未训练模式
        .SetVariable("tessedit_lang", "eng|chi_sim") \' 设置语言为英语和简体中文
        .Recognize(dlg.FileName) \' 识别图像中的文本
        Dim res As String = .GetText() \' 获取识别结果
        MessageBox.Show(res)
    End With
End If

--  作者:有点蓝
--  发布时间:2023/8/12 9:17:00
--  
网上搜了一下,这玩意还要训练才能用的,如果下载别人的训练库,还得看这个训练库的质量怎么样。这种建议先到vs里测试,然后做成dll给Foxtable调用。不过不知道这么新潮的AI应用还支持不支持.net 4.0