告诉你一个比较沮丧的事,你这种做法并不好,可能你能识别处理某个指定的fa piao,可是fa piao有很多种,每个省生成的电子fa piao格式都未必一致,而想通过文本来处理、识别的话,用过一段时间你就会发现有不兼容的电子fa piao出现。
我也做了一个识别电子fa piao的功能,但是只能保证主要信息的正确。电子fa piao的明细识别有一些场景会出现误差(重复)。
我的做法是通过电子fa piao中的二维码识别来获得fa piao的主要信息,其他信息通过文本来获取验证与补充。(电子fa piao主要三种格式PDF\XML\OFD格式都可以支持)