以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.com/bbs/index.asp)
--  专家坐堂  (http://foxtable.com/bbs/list.asp?boardid=2)
----  [求助]如何提取网页数据中的文字,请大神指教  (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=91809)

--  作者:智友软件工作室
--  发布时间:2016/10/19 14:45:00
--  [求助]如何提取网页数据中的文字,请大神指教
网址:http://task.zbj.com/t-rjkf/?t=5
显示数据样式:

图片点击可在新窗口打开查看此主题相关图片如下:qq截图20161019144346.jpg
图片点击可在新窗口打开查看


需要提取标题和标题下面的详细内容两项。


主要是看不懂下面的网页结构

图片点击可在新窗口打开查看此主题相关图片如下:qq截图20161019144839.jpg
图片点击可在新窗口打开查看

[此贴子已经被作者于2016/10/19 14:49:17编辑过]

--  作者:智友软件工作室
--  发布时间:2016/10/19 15:23:00
--  
自己顶一下吧,在线等
--  作者:有点蓝
--  发布时间:2016/10/19 15:46:00
--  
先学学http://www.w3school.com.cn/h.asp
--  作者:智友软件工作室
--  发布时间:2016/10/19 16:03:00
--  
您的网址中的内容正是我想学习好了解的内容,很感谢,我会好好学习。这是一个漫长的过程。
针对我提出的问题,您能否抛砖引玉给我写一段代码呢,我参考比照学习,先把这个迫切需要解决的问题,解决好,接下来我在系统学习网页中的内容。

--  作者:有点蓝
--  发布时间:2016/10/19 16:41:00
--  
这里就有:http://www.foxtable.com/bbs/dispbbs.asp?boardid=2&id=32808
--  作者:智友软件工作室
--  发布时间:2016/10/20 1:23:00
--  
Dim url As String = "http://task.zbj.com/t-rjkf/?t=6"
Dim web As new System.Windows.Forms.WebBrowser
web.ScriptErrorsSuppressed = True
web.Navigate(url)
Do While web.ReadyState <> 4
    Application.DoEvents
Loop
Dim biaoti As String
Dim neirong As Single
Dim trs = web.Document.GetElementsByTagName("table")(0).GetElementsByTagName("tr")
For j As Integer = 1 To trs.count - 1
    Dim tr = trs(j)
    Dim tds = tr.GetElementsByTagName("td")(0).GetElementsByTagName("p")
    Dim tds1 = tds(0).GetElementsByTagName("a")
    biaoti = biaoti & "标题:" & tds1.innerText & vbcrlf
    biaoti = biaoti & "内容:" & tds(1).innerhtml & vbcrlf
Next

e.Form.Controls("TextBox1").value = biaoti


搞了一个晚上只能突出内容,不会读取标题,还请指教

--  作者:智友软件工作室
--  发布时间:2016/10/20 1:25:00
--  
Dim url As String = "http://task.zbj.com/t-rjkf/?t=6"
Dim web As new System.Windows.Forms.WebBrowser
web.ScriptErrorsSuppressed = True
web.Navigate(url)
Do While web.ReadyState <> 4
    Application.DoEvents
Loop
Dim biaoti As String
Dim neirong As Single
Dim trs = web.Document.GetElementsByTagName("table")(0).GetElementsByTagName("tr")
For j As Integer = 1 To trs.count - 1
    Dim tr = trs(j)
    Dim tds = tr.GetElementsByTagName("td")(0).GetElementsByTagName("p")
    Dim tds1 = tr.GetElementsByTagName("td")(0).GetElementsByTagName("p")(0).GetElementsByTagName("a")
    biaoti = biaoti & "标题:" & tds1(0).innerText & vbcrlf
    biaoti = biaoti & "内容:" & tds(1).innerhtml & vbcrlf
Next

e.Form.Controls("TextBox1").value = biaoti

可以了