Foxtable(狐表)用户栏目专家坐堂 → PDFbox中的中文乱码的问题。


  共有2162人关注过本帖平板打印复制链接

主题:PDFbox中的中文乱码的问题。

帅哥哟,离线,有人找我吗?
newsun2k
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1480 积分:10999 威望:0 精华:0 注册:2014/8/13 16:19:00
PDFbox中的中文乱码的问题。  发帖心情 Post By:2021/1/8 15:37:00 [只看该作者]

求解。。。


引用pdfbox,执行下面代码

 

http://www.foxtable.com/bbs/dispbbs.asp?BoardID=2&ID=104162&skin=0

 

Dim doc As org.apache.pdfbox.pdmodel.PDDocument = Nothing
Try
    doc = org.apache.pdfbox.pdmodel.PDDocument.load("d:\abc.pdf")
    Dim pages = doc.getDocumentCatalog().getAllPages()
    Dim pdfStripper = new org.apache.pdfbox.util.PDFTextStripper
    Dim text = pdfStripper.getText(doc)
    msgbox(text)                                           ‘中文会出现乱码(问号),数字和字母则没问题。
catch ex As exception
    msgbox(ex.message)
Finally
    If doc IsNot Nothing Then
        doc.close()
    End If
End Try


 回到顶部