Foxtable(狐表)用户栏目专家坐堂 → PDFbox中的中文乱码的问题。


  共有2337人关注过本帖树形打印复制链接

主题:PDFbox中的中文乱码的问题。

帅哥哟,离线,有人找我吗?
newsun2k
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1499 积分:11175 威望:0 精华:0 注册:2014/8/13 16:19:00
PDFbox中的中文乱码的问题。  发帖心情 Post By:2021/1/8 15:37:00 [只看该作者]

求解。。。


引用pdfbox,执行下面代码

 

http://www.foxtable.com/bbs/dispbbs.asp?BoardID=2&ID=104162&skin=0

 

Dim doc As org.apache.pdfbox.pdmodel.PDDocument = Nothing
Try
    doc = org.apache.pdfbox.pdmodel.PDDocument.load("d:\abc.pdf")
    Dim pages = doc.getDocumentCatalog().getAllPages()
    Dim pdfStripper = new org.apache.pdfbox.util.PDFTextStripper
    Dim text = pdfStripper.getText(doc)
    msgbox(text)                                           ‘中文会出现乱码(问号),数字和字母则没问题。
catch ex As exception
    msgbox(ex.message)
Finally
    If doc IsNot Nothing Then
        doc.close()
    End If
End Try


 回到顶部
帅哥,在线噢!
有点蓝
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:110773 积分:563797 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2021/1/8 16:00:00 [只看该作者]

第三方的应用您要自行去研究他们的文档了,看看什么地方可以设置编码的:https://pdfbox.apache.org/docs/2.0.2/javadocs/org/apache/pdfbox/pdmodel/package-summary.html


 回到顶部