以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.com/bbs/index.asp)
--  专家坐堂  (http://foxtable.com/bbs/list.asp?boardid=2)
----  pdf文件读取内容  (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=195836)

--  作者:ycs5801
--  发布时间:2025/3/12 22:58:00
--  pdf文件读取内容
Dim pdfFile = O2S.Components.PDFRender4NET.PDFFile.Open("e:\\1.pdf")      
Output.Show(currentText)

下载并在程序中引用了itextSharp控件,怎样读取指定pdf文件的内容(所有页面)?

--  作者:有点蓝
--  发布时间:2025/3/13 8:55:00
--  
没有时间研究,只能自行去研究itextSharp的开发文档
--  作者:ycs5801
--  发布时间:2025/3/13 19:16:00
--  
Dim reader As New iTextSharp.text.pdf.PdfReader("E:\\1.pdf")

Dim n As Integer = reader.NumberOfPages
Dim str As String = ""
For i As Integer = 1 To n
    Dim strategy As Object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy()
    Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy)
    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText)))
    str &= currentText
    
Next
output.show(str)

reader.Close()


图片点击可在新窗口打开查看此主题相关图片如下:rewe.png
图片点击可在新窗口打开查看

已经找到代码,但是运行报错,这个错误是什么呢?

--  作者:有点蓝
--  发布时间:2025/3/13 20:03:00
--  
把用到的第三方dll复制到Foxtable安装目录。如果是直接用到的要添加引用:http://www.foxtable.com/webhelp/topics/1936.htm

另外注意这些dll必须要是.net framework 4.0的
[此贴子已经被作者于2025/3/13 20:04:02编辑过]

--  作者:ycs5801
--  发布时间:2025/3/13 22:24:00
--  
还是老师厉害,确实是版本太高问题,最后用低版本的解决了。