Foxtable(狐表)用户栏目专家坐堂 → 如何将PDF转成Excel或读取里面的文本信息


  共有3876人关注过本帖树形打印复制链接

主题:如何将PDF转成Excel或读取里面的文本信息

帅哥哟,离线,有人找我吗?
有点甜
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2019/1/6 20:57:00 [显示全部帖子]


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2019/1/7 10:35:00 [显示全部帖子]

需要换一种方法。

 

引用pdfbox https://pan.baidu.com/s/1i5FpQvV

 

执行代码,如

 

Dim doc As org.apache.pdfbox.pdmodel.PDDocument = Nothing
Try
    doc = org.apache.pdfbox.pdmodel.PDDocument.load("d:\test2.pdf")
    Dim pages = doc.getDocumentCatalog().getAllPages()
    Dim pdfStripper = new org.apache.pdfbox.util.PDFTextStripper
    Dim text = pdfStripper.getText(doc)
    msgbox(text)
catch ex As exception
    msgbox(ex.message)
Finally
    If doc IsNot Nothing Then
        doc.close()
    End If
End Try


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2019/1/8 10:57:00 [显示全部帖子]

1、把dll全部拷贝到安装目录下;

 

2、在foxtable里面引用三个dll。


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2019/1/8 11:09:00 [显示全部帖子]

以下是引用gareny在2019/1/8 11:02:00的发言:
ok,数据可以读取了,但现在问题是读出来的数据很多本来PDF上有空格的,但是现在连在一起了,没办法分割。

而且发现 少了一栏 Branch Plant 对应的数据
[此贴子已经被作者于2019/1/8 11:05:14编辑过]

 

没办法。只能这样了。

 

不然,你可以尝试一些【付费】的pdf控件,如 https://www.foxitsoftware.cn/products/sdk/NETsdk/

 


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2019/1/25 11:28:00 [显示全部帖子]

测试了一下,这个版本的pdfbox不能直接print。

 

参考

 

Dim Proc As New Process
Proc.File = "C:\test.xls"
Proc.Verb = "Print" '指定动作
Proc.Start()

 

或者,转换成图片后打印

 

http://www.foxtable.com/bbs/dispbbs.asp?BoardID=2&ID=77213&skin=0

 

 


 回到顶部