以文本方式查看主题 - Foxtable(狐表) (http://foxtable.com/bbs/index.asp) -- 专家坐堂 (http://foxtable.com/bbs/list.asp?boardid=2) ---- Tesseract-OCR图文识别开源,老师是否可以写个代码 (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=187798) |
-- 作者:xluoping -- 发布时间:2023/8/11 22:52:00 -- Tesseract-OCR图文识别开源,老师是否可以写个代码 Tesseract-OCR图文识别开源,比MODI好用,老师是否可以写个代码。 以下这段代码,不知哪里出了问题? Dim dlg As New OpenFileDialog \'定义一个新的OpenFileDialog dlg.Filter= "pdf文件|*.pdf" \'设置筛选器 If dlg.ShowDialog = DialogResult.Ok Then \'如果用户单击了确定按钮 Dim Creat As Object = CreateObject("Tesseract.Application") With Creat .Init("C:\\Program Files\\Tesseract-OCR\\tessdata", "eng", "chi_sim") \' 设置Tesseract的数据目录和语言 .SetVariable("tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz") \' 设置字符白名单 .SetVariable("tessedit_create_files", "false") \' 禁用创建临时文件 .SetVariable("tessedit_page_description", "false") \' 禁用页面描述 .SetVariable("tessedit_psm", "1") \' 设置识别模式为第一行 .SetVariable("tessedit_untrained", False) \' 禁用未训练模式 .SetVariable("tessedit_lang", "eng|chi_sim") \' 设置语言为英语和简体中文 .Recognize(dlg.FileName) \' 识别图像中的文本 Dim res As String = .GetText() \' 获取识别结果 MessageBox.Show(res) End With End If |
-- 作者:有点蓝 -- 发布时间:2023/8/12 9:17:00 -- 网上搜了一下,这玩意还要训练才能用的,如果下载别人的训练库,还得看这个训练库的质量怎么样。这种建议先到vs里测试,然后做成dll给Foxtable调用。不过不知道这么新潮的AI应用还支持不支持.net 4.0 |