Foxtable(狐表)用户栏目专家坐堂 → 关于提取PDF的内容


  共有2576人关注过本帖树形打印复制链接

主题:关于提取PDF的内容

帅哥哟,离线,有人找我吗?
ap9709130
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1472 积分:11478 威望:0 精华:0 注册:2013/11/24 22:10:00
关于提取PDF的内容  发帖心情 Post By:2018/10/8 13:41:00 [显示全部帖子]

老师,
我用论坛上的方法,代码如下:
Dim doc As org.apache.pdfbox.pdmodel.PDDocument = Nothing
doc = org.apache.pdfbox.pdmodel.PDDocument.load("d:\1.pdf")
Dim pdfStripper = new org.apache.pdfbox.util.PDFTextStripper
Dim text = pdfStripper.getText(doc)

If text > "" Then
Output.show(text)
End If

有的内容可以提取出来,是中文的没有问题,但有的中文内容提取出来的都是这种问号:“??” 是不是字体的编码问题?


 回到顶部