Dim dlg As New OpenFileDialog '定义一个新的OpenFileDialog
dlg.Filter= "pdf文件|*.pdf" '设置筛选器
If dlg.ShowDialog = DialogResult.Ok Then '如果用户单击了确定按钮
Dim Creat As Object = CreateObject("Tesseract.Application")
With Creat
.Init("C:\Program Files\Tesseract-OCR\tessdata", "eng", "chi_sim") ' 设置Tesseract的数据目录和语言
.SetVariable("tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz") ' 设置字符白名单
.SetVariable("tessedit_create_files", "false") ' 禁用创建临时文件
.SetVariable("tessedit_page_description", "false") ' 禁用页面描述
.SetVariable("tessedit_psm", "1") ' 设置识别模式为第一行
.SetVariable("tessedit_untrained", False) ' 禁用未训练模式
.SetVariable("tessedit_lang", "eng|chi_sim") ' 设置语言为英语和简体中文
.Recognize(dlg.FileName) ' 识别图像中的文本
Dim res As String = .GetText() ' 获取识别结果
MessageBox.Show(res)
End With
End If