老师,我用论坛上的方法,代码如下:
Dim doc As org.apache.pdfbox.pdmodel.PDDocument = Nothing
doc = org.apache.pdfbox.pdmodel.PDDocument.load("d:\1.pdf")
Dim pdfStripper = new org.apache.pdfbox.util.PDFTextStripper
Dim text = pdfStripper.getText(doc)
If text > "" Then
Output.show(text)
End If
有的内容可以提取出来,是中文的没有问题,但有的中文内容提取出来的都是这种问号:“??” 是不是字体的编码问题?