Foxtable(狐表)用户栏目专家坐堂 → 请问fox能读取pdf文件的内容吗?


  共有3027人关注过本帖树形打印复制链接

主题:请问fox能读取pdf文件的内容吗?

帅哥哟,离线,有人找我吗?
有点色
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:13837 积分:69650 威望:0 精华:0 注册:2016/11/1 14:42:00
  发帖心情 Post By:2017/3/8 10:56:00 [显示全部帖子]


 回到顶部
帅哥哟,离线,有人找我吗?
有点色
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:13837 积分:69650 威望:0 精华:0 注册:2016/11/1 14:42:00
  发帖心情 Post By:2017/3/8 11:34:00 [显示全部帖子]

比较麻烦,你把你的pdf文件发上来看看。

 回到顶部
帅哥哟,离线,有人找我吗?
有点色
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:13837 积分:69650 威望:0 精华:0 注册:2016/11/1 14:42:00
  发帖心情 Post By:2017/3/8 13:08:00 [显示全部帖子]

只能按照格式获取了,参考代码

 

Dim reader As New iTextSharp.text.pdf.PdfReader("d:\test.pdf")

Dim n As Integer = reader.NumberOfPages
Dim str As String = ""
For i As Integer = 1 To n
    Dim strategy As object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy()
    Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy)
   
    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText)))
    str &= currentText
Next
str = str.replace("审批通过", "").replace(chr(10), vbcrlf)
output.show(str)
Dim mc = System.Text.RegularExpressions.Regex.Matches(str, "/.+?.jpg")
output.show("验货报告:" & mc(9*4).value)
output.show("货物2:")
For i As Integer = 9*3-1 To 9*2 Step -1
    output.show(mc(i).value)
Next

Dim mc1 = System.Text.RegularExpressions.Regex.Matches(str, "(?<=申请人部门).+")
output.show("申请人部门:" &mc1(0).value)

reader.Close()


 回到顶部
帅哥哟,离线,有人找我吗?
有点色
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:13837 积分:69650 威望:0 精华:0 注册:2016/11/1 14:42:00
  发帖心情 Post By:2017/3/8 13:50:00 [显示全部帖子]

看懂8楼的代码,就是获取jpg的内容啊。

 回到顶部
帅哥哟,离线,有人找我吗?
有点色
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:13837 积分:69650 威望:0 精华:0 注册:2016/11/1 14:42:00
  发帖心情 Post By:2017/3/8 14:14:00 [显示全部帖子]

 看8楼

 回到顶部