Foxtable(狐表)用户栏目专家坐堂 → 要全文查找上传的pdf文件中的关键词,该怎么做?


  共有2923人关注过本帖树形打印复制链接

主题:要全文查找上传的pdf文件中的关键词,该怎么做?

帅哥哟,离线,有人找我吗?
fytea
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:三尾狐 帖子:787 积分:6175 威望:0 精华:0 注册:2015/7/25 19:14:00
要全文查找上传的pdf文件中的关键词,该怎么做?  发帖心情 Post By:2015/11/3 17:50:00 [只看该作者]

要全文查找上传的pdf文件中的关键词,该怎么做?

 


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2015/11/3 18:39:00 [只看该作者]

呃,pdf比较麻烦的,要有第三方dll才能读取内容。

 

mark 读取pdf内容

 

Dim reader As New iTextSharp.text.pdf.PdfReader("d:\test.pdf")

Dim n As Integer = reader.NumberOfPages
Dim str As String = ""
For i As Integer = 1 To n
    Dim strategy As object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy()
    Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy)
   
    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText)))
    str &= currentText
   
Next
msgbox(str)
reader.Close()

 

 

 

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:itextsharp.zip


 回到顶部
帅哥哟,离线,有人找我吗?
fytea
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:三尾狐 帖子:787 积分:6175 威望:0 精华:0 注册:2015/7/25 19:14:00
  发帖心情 Post By:2015/11/4 9:28:00 [只看该作者]

大红袍:在一个固定的文件夹中,查找所有的pdf文件中的关键字怎么改上面的代码

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2015/11/4 9:35:00 [只看该作者]

你去参考一下c# pdf的知识吧,2楼的代码,是读取pdf的所有内容而已。

 回到顶部