以文本方式查看主题 - Foxtable(狐表) (http://foxtable.net/bbs/index.asp) -- 专家坐堂 (http://foxtable.net/bbs/list.asp?boardid=2) ---- 如何更准确提取PDF对应位置的信息? (http://foxtable.net/bbs/dispbbs.asp?boardid=2&id=83421) |
-- 作者:xluoping -- 发布时间:2016/4/8 14:57:00 -- 如何更准确提取PDF对应位置的信息? foxtable确实是一个不错的开发软件。 我已经知道在 PDF中提取信息: Dim reader As New iTextSharp.text.pdf.PdfReader("D:\\HJ160329ME1006+空白6+非甲烷总烃.pdf") Dim n As Integer = reader.NumberOfPages Dim str As String = "" For i As Integer = 1 To n Dim strategy As object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy() Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy) currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText))) str &= currentText Next msgbox(str) reader.Close() 但是,如附件的PDF中,我应该如何准确的提取 9790Ⅱ 、JC-01-002、2016-03-30 08:59、以及 1 总烃 5.6820,2 甲烷 1.7391 ,或者还有 3 某物质 0.0000 ......到表中! 以上,请求帮助 |
-- 作者:大红袍 -- 发布时间:2016/4/8 15:16:00 -- 先想办法提取出来,然后再根据内容截取需要的数据,不同的内容需要做不同的分析。请上传实例。 |
-- 作者:hanxuntx -- 发布时间:2016/4/10 17:13:00 -- mark 可以读取表格内容吗?
|
-- 作者:大红袍 -- 发布时间:2016/4/10 22:02:00 -- 以下是引用hanxuntx在2016/4/10 17:13:00的发言:
mark 可以读取表格内容吗?
不是只要是文字都能提取出来吗? |
-- 作者:FOTOER -- 发布时间:2021/11/7 14:05:00 -- 学习了 |