Foxtable(狐表)用户栏目专家坐堂 → 关于读取PDF文件的问题2


  共有143人关注过本帖树形打印复制链接

主题:关于读取PDF文件的问题2

帅哥,在线噢!
hongye
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:470 积分:3166 威望:0 精华:0 注册:2011/3/15 12:49:00
关于读取PDF文件的问题2  发帖心情 Post By:2024/12/18 12:29:00 [只看该作者]

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:问题代码.txt

这个是我写的PDF读取的代码


图片点击可在新窗口打开查看此主题相关图片如下:提问图片1.jpg
图片点击可在新窗口打开查看


我想把图片中圈出的文本变成一行(如下图所示)请问怎么写这个代码


图片点击可在新窗口打开查看此主题相关图片如下:提问图片2.jpg
图片点击可在新窗口打开查看




 回到顶部
帅哥哟,离线,有人找我吗?
碾作尘
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:幼狐 帖子:51 积分:471 威望:0 精华:0 注册:2017/1/10 19:25:00
  发帖心情 Post By:2024/12/18 13:51:00 [只看该作者]

告诉你一个比较沮丧的事,你这种做法并不好,可能你能识别处理某个指定的fa piao,可是fa piao有很多种,每个省生成的电子fa piao格式都未必一致,而想通过文本来处理、识别的话,用过一段时间你就会发现有不兼容的电子fa piao出现。
我也做了一个识别电子fa piao的功能,但是只能保证主要信息的正确。电子fa piao的明细识别有一些场景会出现误差(重复)。
我的做法是通过电子fa piao中的二维码识别来获得fa piao的主要信息,其他信息通过文本来获取验证与补充。(电子fa piao主要三种格式PDF\XML\OFD格式都可以支持)
图片点击可在新窗口打开查看

 回到顶部
帅哥,在线噢!
有点蓝
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:111325 积分:566671 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2024/12/18 14:07:00 [只看该作者]

试试把回车和括号一起替换掉,大概

dim s as string = "解析出来的文本"
s = s.replace(vbcrlf & "(","(").replace(")" & vbcrlf,")")

 回到顶部
帅哥,在线噢!
hongye
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:470 积分:3166 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2024/12/18 14:37:00 [只看该作者]

dim s as string = "解析出来的文本"
s = s.replace(vbcrlf & "(","(").replace(")" & vbcrlf,")")
这个不行,首先并不知道是什么字符后或前换行,第二点有时是三行怎么办?

二楼的碾作尘可以分享一下你做识别fa piao的经验和代码吗?

 回到顶部
帅哥,在线噢!
有点蓝
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:111325 积分:566671 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2024/12/18 14:40:00 [只看该作者]

没有规律的东西无法使用代码控制

 回到顶部
帅哥,在线噢!
hongye
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:470 积分:3166 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2024/12/18 15:03:00 [只看该作者]

规律其实也有,就是vbcrlf &“*”,到下一组vbcrlf &“*”,常规fa piao就是8列数据,由空格隔开的
也就是有几个vbcrlf &“*”,就有几行数据
[此贴子已经被作者于2024/12/18 15:05:11编辑过]

 回到顶部
帅哥,在线噢!
有点蓝
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:111325 积分:566671 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2024/12/18 15:06:00 [只看该作者]

那就搜索*号,把2个*号之间的回车符去掉:IndexOfSubStringhttp://www.foxtable.com/webhelp/topics/1338.htm

 回到顶部
帅哥,在线噢!
hongye
  8楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:470 积分:3166 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2024/12/18 15:09:00 [只看该作者]

不会,写一个例子看看吧

 回到顶部
帅哥,在线噢!
有点蓝
  9楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:111325 积分:566671 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2024/12/18 15:19:00 [只看该作者]

不对,1楼字符里服装前后都有*号,如果【服装】这2个字不是固定的,这种仍然不属于有规律

 回到顶部
帅哥,在线噢!
hongye
  10楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:470 积分:3166 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2024/12/18 16:57:00 [只看该作者]

唯一算规律的只有vbcrlf &“*”和这个后7个空格

 回到顶部
总数 24 1 2 3 下一页