Foxtable(狐表)用户栏目专家坐堂 → iTextSharp pdf转文本 有没有办法实现保持原有文本格式不变呢?


  共有3665人关注过本帖树形打印复制链接

主题:iTextSharp pdf转文本 有没有办法实现保持原有文本格式不变呢?

帅哥哟,离线,有人找我吗?
cnsjroom
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:七尾狐 帖子:1571 积分:11238 威望:0 精华:0 注册:2021/1/17 17:06:00
iTextSharp pdf转文本 有没有办法实现保持原有文本格式不变呢?  发帖心情 Post By:2022/2/21 18:01:00 [只看该作者]

当前代码如下:【运行之后得到的文本是全部在一行,有没有办法修正如下代码,实现文本段落格式和原pdf格式一样呢?】

 

Dim t1 As WinForm.TextBox = e.Form.Controls("TextBox1")
Dim reader As New iTextSharp.text.pdf.PdfReader("D:\2021工作资料\会议须知.pdf")
Dim n As Integer = reader.NumberOfPages
Dim str As String = ""
For i As Integer = 1 To n
    Dim strategy As object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy()
    Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy)
    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText)))
    str &= currentText 
Next
output.show(str)
reader.Close()
t1.text=str

 

所需引用的dll

 下载信息  [文件大小:   下载次数: ]
点击浏览该文件:itexshappdf.rar


[此贴子已经被作者于2022/2/21 18:02:04编辑过]

 回到顶部
帅哥,在线噢!
有点蓝
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:111409 积分:567115 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2022/2/21 20:19:00 [只看该作者]

这我也不懂,也没有时间研究这些第三方组件。

 回到顶部