Foxtable(狐表)用户栏目专家坐堂 → 关于提取PDF的内容


  共有2574人关注过本帖树形打印复制链接

主题:关于提取PDF的内容

帅哥哟,离线,有人找我吗?
ap9709130
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1472 积分:11478 威望:0 精华:0 注册:2013/11/24 22:10:00
关于提取PDF的内容  发帖心情 Post By:2018/10/8 13:41:00 [只看该作者]

老师,
我用论坛上的方法,代码如下:
Dim doc As org.apache.pdfbox.pdmodel.PDDocument = Nothing
doc = org.apache.pdfbox.pdmodel.PDDocument.load("d:\1.pdf")
Dim pdfStripper = new org.apache.pdfbox.util.PDFTextStripper
Dim text = pdfStripper.getText(doc)

If text > "" Then
Output.show(text)
End If

有的内容可以提取出来,是中文的没有问题,但有的中文内容提取出来的都是这种问号:“??” 是不是字体的编码问题?


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2018/10/8 14:15:00 [只看该作者]

如果无法提取,那就没办法了,不是所有都可以提取的。


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2018/10/8 14:19:00 [只看该作者]

你可以用别的控件,比如 FoxitReader_AX_Pro.ocx

 

https://www.foxitsoftware.cn/

 


 回到顶部