以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.com/bbs/index.asp)
--  专家坐堂  (http://foxtable.com/bbs/list.asp?boardid=2)
----  [求助]网页源代码数据提取求助  (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=86654)

--  作者:浙江仔
--  发布时间:2016/6/22 16:47:00
--  [求助]网页源代码数据提取求助
要处理网页源代码中的数据
要准考证号和身份证号,该怎么处理?望指点

网页代码贴不进来,只好用附件

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:新建文本文档.txt


[此贴子已经被作者于2016/6/22 16:47:00编辑过]

--  作者:大红袍
--  发布时间:2016/6/22 16:55:00
--  

参考代码

 

Dim trs As object = web.Document.GetElementsByTagName("tr")
Dim m As Integer = 0
For Each tr As object In trs
    If tr.InnerHtml.contains("准考证号") Then
        msgbox(tr.GetElementsByTagName("td")(1).InnerText)
    End If
    If tr.InnerHtml.contains("身份证号") Then
        msgbox(tr.GetElementsByTagName("td")(3).InnerText)
    End If
Next


--  作者:浙江仔
--  发布时间:2016/6/22 17:23:00
--  

我这网页不能用狐表直接打开,只能从其他业务系统里面把网页源代码复制到文本框处理

 

所以现在的处理就是一字符串的处理

 

是不是不能按照这个处理方式?


--  作者:大红袍
--  发布时间:2016/6/22 17:41:00
--  

参考代码

 

Dim str As String = FileSys.ReadAllText("d:\\test.txt", Encoding.Default)
output.show(str)
Dim mc = System.Text.RegularExpressions.Regex.Matches(str, "(?<=<td colspan=""2"">)[0-9]{18}")
If mc.count > 0 Then
    msgbox(mc(0).value)
End If

mc = System.Text.RegularExpressions.Regex.Matches(str, "(?<=<td>)[0-9]{12}")
If mc.count > 0 Then
    msgbox(mc(0).value)
End If


--  作者:浙江仔
--  发布时间:2016/6/23 8:14:00
--  
谢谢,实现了,太好了