Foxtable(狐表)用户栏目专家坐堂 → 如何将PDF格式里的信息提取到狐表中?


  共有12705人关注过本帖树形打印复制链接

主题:如何将PDF格式里的信息提取到狐表中?

帅哥哟,离线,有人找我吗?
xluoping
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:373 积分:3811 威望:0 精华:0 注册:2016/4/2 12:11:00
如何将PDF格式里的信息提取到狐表中?  发帖心情 Post By:2016/4/5 12:50:00 [只看该作者]

如何将PDF格式里的信息提取到狐表中?

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/5 15:10:00 [只看该作者]

参考,读取pdf内容

 

Dim reader As New iTextSharp.text.pdf.PdfReader("d:\test.pdf")

Dim n As Integer = reader.NumberOfPages
Dim str As String = ""
For i As Integer = 1 To n
    Dim strategy As object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy()
    Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy)
   
    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText)))
    str &= currentText
   
Next
msgbox(str)
reader.Close()


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/5 15:10:00 [只看该作者]

2楼的代码,你要先引用dll

 

下载信息  [文件大小:1.3 MB  下载次数:5]
图片点击可在新窗口打开查看点击浏览该文件:itextsharp.zip


 回到顶部
帅哥哟,离线,有人找我吗?
xluoping
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:373 积分:3811 威望:0 精华:0 注册:2016/4/2 12:11:00
编译错误:未定义类型“iTextSharp.text.pdf.PdfReader”  发帖心情 Post By:2016/4/5 17:54:00 [只看该作者]

编译错误:未定义类型“iTextSharp.text.pdf.PdfReader”

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/5 17:57:00 [只看该作者]


 回到顶部
帅哥哟,离线,有人找我吗?
xluoping
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:373 积分:3811 威望:0 精华:0 注册:2016/4/2 12:11:00
  发帖心情 Post By:2016/4/5 17:59:00 [只看该作者]

可以了,学习到了,已经引用

 回到顶部
帅哥哟,离线,有人找我吗?
黄训良
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1100 积分:8985 威望:0 精华:0 注册:2014/3/15 14:36:00
  发帖心情 Post By:2017/1/22 16:06:00 [只看该作者]

引用了,还是
编译错误:未定义类型“iTextSharp.text.pdf.PdfReader”  ?

 回到顶部
帅哥哟,离线,有人找我吗?
有点色
  8楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:13837 积分:69650 威望:0 精华:0 注册:2016/11/1 14:42:00
  发帖心情 Post By:2017/1/22 18:09:00 [只看该作者]

以下是引用黄训良在2017/1/22 16:06:00的发言:
引用了,还是
编译错误:未定义类型“iTextSharp.text.pdf.PdfReader”  ?

 

关闭项目,重新打开看看。


 回到顶部
帅哥哟,离线,有人找我吗?
chen3728060
  9楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:二尾狐 帖子:388 积分:5098 威望:0 精华:0 注册:2013/11/2 0:01:00
  发帖心情 Post By:2017/3/16 16:53:00 [只看该作者]

为啥我一引用代码,就整个屏幕闪黑一下,然后就软件里的窗口都只剩下框?


图片点击可在新窗口打开查看此主题相关图片如下:1.png
图片点击可在新窗口打开查看

 


 

 我要读取的PDF

 

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:test.zip

[此贴子已经被作者于2017/3/16 16:56:02编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
有点色
  10楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:13837 积分:69650 威望:0 精华:0 注册:2016/11/1 14:42:00
  发帖心情 Post By:2017/3/16 17:05:00 [只看该作者]

回复9楼。我测试没有问题。

 回到顶部
总数 25 1 2 3 下一页