以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.net/bbs/index.asp)
--  专家坐堂  (http://foxtable.net/bbs/list.asp?boardid=2)
----  如何将PDF格式里的信息提取到狐表中?  (http://foxtable.net/bbs/dispbbs.asp?boardid=2&id=83249)

--  作者:xluoping
--  发布时间:2016/4/5 12:50:00
--  如何将PDF格式里的信息提取到狐表中?
如何将PDF格式里的信息提取到狐表中?
--  作者:大红袍
--  发布时间:2016/4/5 15:10:00
--  

参考,读取pdf内容

 

Dim reader As New iTextSharp.text.pdf.PdfReader("d:\\test.pdf")

Dim n As Integer = reader.NumberOfPages
Dim str As String = ""
For i As Integer = 1 To n
    Dim strategy As object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy()
    Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy)
   
    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText)))
    str &= currentText
   
Next
msgbox(str)
reader.Close()


--  作者:大红袍
--  发布时间:2016/4/5 15:10:00
--  

2楼的代码,你要先引用dll

 

下载信息  [文件大小:1.3 MB  下载次数:5]
图片点击可在新窗口打开查看点击浏览该文件:itextsharp.zip


--  作者:xluoping
--  发布时间:2016/4/5 17:54:00
--  编译错误:未定义类型“iTextSharp.text.pdf.PdfReader”
编译错误:未定义类型“iTextSharp.text.pdf.PdfReader”
--  作者:大红袍
--  发布时间:2016/4/5 17:57:00
--  

看3楼,引用

 

http://www.foxtable.com/help/topics/1936.htm

 


--  作者:xluoping
--  发布时间:2016/4/5 17:59:00
--  
可以了,学习到了,已经引用
--  作者:黄训良
--  发布时间:2017/1/22 16:06:00
--  
引用了,还是
编译错误:未定义类型“iTextSharp.text.pdf.PdfReader”  ?

--  作者:有点色
--  发布时间:2017/1/22 18:09:00
--  
以下是引用黄训良在2017/1/22 16:06:00的发言:
引用了,还是
编译错误:未定义类型“iTextSharp.text.pdf.PdfReader”  ?

 

关闭项目,重新打开看看。


--  作者:chen3728060
--  发布时间:2017/3/16 16:53:00
--  
为啥我一引用代码,就整个屏幕闪黑一下,然后就软件里的窗口都只剩下框?


图片点击可在新窗口打开查看此主题相关图片如下:1.png
图片点击可在新窗口打开查看

 


 

 我要读取的PDF

 

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:test.zip

[此贴子已经被作者于2017/3/16 16:56:02编辑过]

--  作者:有点色
--  发布时间:2017/3/16 17:05:00
--  
回复9楼。我测试没有问题。