Foxtable(狐表)用户栏目专家坐堂 → pdf中获取内容包括表格内容


  共有1193人关注过本帖树形打印复制链接

主题:pdf中获取内容包括表格内容

帅哥哟,离线,有人找我吗?
qaz17909
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:三尾狐 帖子:795 积分:9037 威望:0 精华:0 注册:2017/1/26 14:38:00
pdf中获取内容包括表格内容  发帖心情 Post By:2024/3/15 21:36:00 [显示全部帖子]

有个业务需要将pdf中的内容提取出来,pdf中有些字段内容比如编号、时间等,然后pdf中还有表格,需要将表格中的内容也提取出来。

 回到顶部
帅哥哟,离线,有人找我吗?
qaz17909
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:三尾狐 帖子:795 积分:9037 威望:0 精华:0 注册:2017/1/26 14:38:00
  发帖心情 Post By:2024/3/17 11:07:00 [显示全部帖子]

可以提取了,但是发现有些pdf提取后的中文是乱码,这个应该如何解码?上传的两个pdf文档一个正常,一个中文乱码
 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:pdf.rar



 回到顶部
帅哥哟,离线,有人找我吗?
qaz17909
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:三尾狐 帖子:795 积分:9037 威望:0 精华:0 注册:2017/1/26 14:38:00
  发帖心情 Post By:2024/3/18 9:10:00 [显示全部帖子]

去掉这句也是不行的,我改了加粗的地方,但是还是不行
pagetext = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(pagetext)))

 回到顶部
帅哥哟,离线,有人找我吗?
qaz17909
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:三尾狐 帖子:795 积分:9037 威望:0 精华:0 注册:2017/1/26 14:38:00
  发帖心情 Post By:2024/5/9 13:19:00 [显示全部帖子]

三楼的这个附件是我原先上传的,为什么现在下载下来不能用了?
[此贴子已经被作者于2024/5/9 13:19:40编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
qaz17909
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:三尾狐 帖子:795 积分:9037 威望:0 精华:0 注册:2017/1/26 14:38:00
  发帖心情 Post By:2024/5/9 13:42:00 [显示全部帖子]

好像又可以了,还有问题,可否用代码将pdf格式的文件,另存为txt文本文件?

 回到顶部