以文本方式查看主题 - Foxtable(狐表) (http://foxtable.com/bbs/index.asp) -- 专家坐堂 (http://foxtable.com/bbs/list.asp?boardid=2) ---- [求助]如何提取网页数据中的文字,请大神指教 (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=91809) |
-- 作者:智友软件工作室 -- 发布时间:2016/10/19 14:45:00 -- [求助]如何提取网页数据中的文字,请大神指教 网址:http://task.zbj.com/t-rjkf/?t=5 显示数据样式: 需要提取标题和标题下面的详细内容两项。 主要是看不懂下面的网页结构
[此贴子已经被作者于2016/10/19 14:49:17编辑过]
|
-- 作者:智友软件工作室 -- 发布时间:2016/10/19 15:23:00 -- 自己顶一下吧,在线等 |
-- 作者:有点蓝 -- 发布时间:2016/10/19 15:46:00 -- 先学学http://www.w3school.com.cn/h.asp |
-- 作者:智友软件工作室 -- 发布时间:2016/10/19 16:03:00 -- 您的网址中的内容正是我想学习好了解的内容,很感谢,我会好好学习。这是一个漫长的过程。 针对我提出的问题,您能否抛砖引玉给我写一段代码呢,我参考比照学习,先把这个迫切需要解决的问题,解决好,接下来我在系统学习网页中的内容。
|
-- 作者:有点蓝 -- 发布时间:2016/10/19 16:41:00 -- 这里就有:http://www.foxtable.com/bbs/dispbbs.asp?boardid=2&id=32808 |
-- 作者:智友软件工作室 -- 发布时间:2016/10/20 1:23:00 -- Dim url As String = "http://task.zbj.com/t-rjkf/?t=6" Dim web As new System.Windows.Forms.WebBrowser web.ScriptErrorsSuppressed = True web.Navigate(url) Do While web.ReadyState <> 4 Application.DoEvents Loop Dim biaoti As String Dim neirong As Single Dim trs = web.Document.GetElementsByTagName("table")(0).GetElementsByTagName("tr") For j As Integer = 1 To trs.count - 1 Dim tr = trs(j) Dim tds = tr.GetElementsByTagName("td")(0).GetElementsByTagName("p") Dim tds1 = tds(0).GetElementsByTagName("a") biaoti = biaoti & "标题:" & tds1.innerText & vbcrlf biaoti = biaoti & "内容:" & tds(1).innerhtml & vbcrlf Next e.Form.Controls("TextBox1").value = biaoti 搞了一个晚上只能突出内容,不会读取标题,还请指教
|
-- 作者:智友软件工作室 -- 发布时间:2016/10/20 1:25:00 -- Dim url As String = "http://task.zbj.com/t-rjkf/?t=6" Dim web As new System.Windows.Forms.WebBrowser web.ScriptErrorsSuppressed = True web.Navigate(url) Do While web.ReadyState <> 4 Application.DoEvents Loop Dim biaoti As String Dim neirong As Single Dim trs = web.Document.GetElementsByTagName("table")(0).GetElementsByTagName("tr") For j As Integer = 1 To trs.count - 1 Dim tr = trs(j) Dim tds = tr.GetElementsByTagName("td")(0).GetElementsByTagName("p") Dim tds1 = tr.GetElementsByTagName("td")(0).GetElementsByTagName("p")(0).GetElementsByTagName("a") biaoti = biaoti & "标题:" & tds1(0).innerText & vbcrlf biaoti = biaoti & "内容:" & tds(1).innerhtml & vbcrlf Next e.Form.Controls("TextBox1").value = biaoti 可以了 |