以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.com/bbs/index.asp)
--  专家坐堂  (http://foxtable.com/bbs/list.asp?boardid=2)
----  如何更准确提取PDF对应位置的信息?  (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=83421)

--  作者:xluoping
--  发布时间:2016/4/8 14:57:00
--  如何更准确提取PDF对应位置的信息?
foxtable确实是一个不错的开发软件。

我已经知道在 PDF中提取信息:

Dim reader As New iTextSharp.text.pdf.PdfReader("D:\\HJ160329ME1006+空白6+非甲烷总烃.pdf")
Dim n As Integer = reader.NumberOfPages
Dim str As String = ""
For i As Integer = 1 To n
    Dim strategy As object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy()
    Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy)
    
    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText)))
    str &= currentText
    
Next
msgbox(str)
reader.Close()

但是,如附件的PDF中,我应该如何准确的提取 9790Ⅱ  、JC-01-002、2016-03-30 08:59、以及  1  总烃    5.6820,2  甲烷   1.7391  ,或者还有  3  某物质   0.0000 ......到表中!


以上,请求帮助



--  作者:大红袍
--  发布时间:2016/4/8 15:16:00
--  
先想办法提取出来,然后再根据内容截取需要的数据,不同的内容需要做不同的分析。请上传实例。
--  作者:hanxuntx
--  发布时间:2016/4/10 17:13:00
--  
mark
可以读取表格内容吗?

--  作者:大红袍
--  发布时间:2016/4/10 22:02:00
--  
以下是引用hanxuntx在2016/4/10 17:13:00的发言:
mark
可以读取表格内容吗?

 

不是只要是文字都能提取出来吗?


--  作者:FOTOER
--  发布时间:2021/11/7 14:05:00
--  
学习了图片点击可在新窗口打开查看