Foxtable(狐表)用户栏目专家坐堂 → 有没 pdf 转 excel 的方法


  共有3474人关注过本帖树形打印复制链接

主题:有没 pdf 转 excel 的方法

帅哥哟,离线,有人找我吗?
大红袍
  11楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/7/14 11:08:00 [只看该作者]

 没办法。

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  12楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/7/14 11:12:00 [只看该作者]

 或者把dll发上来看看可不可以用。

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  13楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/7/14 11:15:00 [只看该作者]

或者是,换一种方式读取,不一定要用这个

 

http://www.baidu.com/baidu?wd=c%23+PDFBox&tn=monline_4_dg

 


 回到顶部
帅哥哟,离线,有人找我吗?
ljh29206
  14楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1359 积分:12028 威望:0 精华:0 注册:2012/3/5 11:32:00
  发帖心情 Post By:2016/7/14 11:16:00 [只看该作者]

6楼 就是 久的那个文件 袍哥帮忙看看 谢谢咯

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  15楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/7/14 11:17:00 [只看该作者]

 看13楼。

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  16楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/7/14 11:26:00 [只看该作者]

以下是引用ljh29206在2016/7/14 11:16:00的发言:
6楼 就是 久的那个文件 袍哥帮忙看看 谢谢咯

 

6楼看了一下,没有这个功能。那是新版独有的。你要换一种获取pdf文本的方式。百度一下。


 回到顶部
帅哥哟,离线,有人找我吗?
ljh29206
  17楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1359 积分:12028 威望:0 精华:0 注册:2012/3/5 11:32:00
  发帖心情 Post By:2016/7/14 11:48:00 [只看该作者]

再找到了例子说明

实在菜鸟 袍哥在帮忙指点下

二、引用动态链接库

    解压缩下载的PDFBox,找到其中的Bin目录,需要在项目中添加引用的dll文件有:
    IKVM.GNU.Classpath.dll
    PDFBox-0.7.3.dll
    FontBox-0.1.0-dev.dll
    IKVM.Runtime.dll


将以上4个文件引用到项目中,在文件中需要引入以下2个命名空间:
    using org.pdfbox.pdmodel;
    using org.pdfbox.util;


第一步 已经 进行了文件的引用

第二步 是在  命名空间了 写入

    using org.pdfbox.pdmodel;
    using org.pdfbox.util;

这2个内容 ?


第三步

c#  转 vb。net    已在网站哪里进行转换 ,但还是看不懂  改怎么改呢?


  1. using org.pdfbox.pdmodel;  
  2. using org.pdfbox.util;  

Public Sub pdf2txt(file As FileInfo, txtfile As FileInfo)
Dim doc As PDDocument = PDDocument.load(file.FullName)
Dim pdfStripper As New PDFTextStripper()
Dim text As String = pdfStripper.getText(doc)
Dim swPdfChange As New StreamWriter(txtfile.FullName, False, Encoding.GetEncoding("gb2312"))
swPdfChange.Write(text)
swPdfChange.Close()
End Sub


直接 第一步后 

Dim aa = "C:\Users\aaa\Desktop\工作簿1.pdf"

Dim doc As PDDocument = PDDocument.load(aa)

Dim pdfStripper As New PDFTextStripper()

Dim text As String = pdfStripper.getText(doc)

提示未声明


教程

http://blog.csdn.net/wangqiuyun/article/details/8548779


这个的命名空间怎么弄呢?


[此贴子已经被作者于2016/7/14 12:13:05编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  18楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/7/14 12:54:00 [只看该作者]

需要的dll

 

http://pan.baidu.com/s/1i5FpQvV

 

 

调用代码

 

Dim doc As org.apache.pdfbox.pdmodel.PDDocument = Nothing
Try
 doc = org.apache.pdfbox.pdmodel.PDDocument.load("d:\test.pdf")
 Dim stripper As New org.apache.pdfbox.util.PDFTextStripper()
 Return stripper.getText(doc)
Finally
 If doc IsNot Nothing Then
  doc.close()
 End If
End Try

 

参考资料

 

http://www.squarepdf.net/how-to-convert-pdf-to-text-in-net

 



 回到顶部
帅哥哟,离线,有人找我吗?
ljh29206
  19楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1359 积分:12028 威望:0 精华:0 注册:2012/3/5 11:32:00
  发帖心情 Post By:2016/7/14 13:42:00 [只看该作者]

点个赞!

袍哥 , 这个是怎么找到的 

找资料有什么好的方法 指导下!

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  20楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/7/14 14:21:00 [只看该作者]

 找库找dll之类的,一般要去找官网。

 回到顶部
总数 21 上一页 1 2 3 下一页