Foxtable(狐表)用户栏目专家坐堂 → Tesseract-OCR图文识别开源,老师是否可以写个代码


  共有3113人关注过本帖树形打印复制链接

主题:Tesseract-OCR图文识别开源,老师是否可以写个代码

帅哥哟,离线,有人找我吗?
xluoping
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:368 积分:3759 威望:0 精华:0 注册:2016/4/2 12:11:00
Tesseract-OCR图文识别开源,老师是否可以写个代码  发帖心情 Post By:2023/8/11 22:52:00 [只看该作者]

Tesseract-OCR图文识别开源,比MODI好用,老师是否可以写个代码。

以下这段代码,不知哪里出了问题?

Dim dlg As New OpenFileDialog '定义一个新的OpenFileDialog
dlg.Filter= "pdf文件|*.pdf" '设置筛选器
If dlg.ShowDialog = DialogResult.Ok Then '如果用户单击了确定按钮
    Dim Creat As Object = CreateObject("Tesseract.Application")
    With Creat
        .Init("C:\Program Files\Tesseract-OCR\tessdata", "eng", "chi_sim") ' 设置Tesseract的数据目录和语言
        .SetVariable("tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz") ' 设置字符白名单
        .SetVariable("tessedit_create_files", "false") ' 禁用创建临时文件
        .SetVariable("tessedit_page_description", "false") ' 禁用页面描述
        .SetVariable("tessedit_psm", "1") ' 设置识别模式为第一行
        .SetVariable("tessedit_untrained", False) ' 禁用未训练模式
        .SetVariable("tessedit_lang", "eng|chi_sim") ' 设置语言为英语和简体中文
        .Recognize(dlg.FileName) ' 识别图像中的文本
        Dim res As String = .GetText() ' 获取识别结果
        MessageBox.Show(res)
    End With
End If

 回到顶部
帅哥哟,离线,有人找我吗?
有点蓝
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:110443 积分:562081 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2023/8/12 9:17:00 [只看该作者]

网上搜了一下,这玩意还要训练才能用的,如果下载别人的训练库,还得看这个训练库的质量怎么样。这种建议先到vs里测试,然后做成dll给Foxtable调用。不过不知道这么新潮的AI应用还支持不支持.net 4.0



 回到顶部