以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.com/bbs/index.asp)
--  专家坐堂  (http://foxtable.com/bbs/list.asp?boardid=2)
----  官方能不能出个采集网页的教程  (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=115424)

--  作者:bohe
--  发布时间:2018/3/7 10:10:00
--  官方能不能出个采集网页的教程
目前都是根据不同需求出的解答,能不能汇集说明一下采集问题,如何采集网页表格数据、网页文章等,没办法,我等不是专业的,只好求救了。
--  作者:有点甜
--  发布时间:2018/3/7 11:24:00
--  

1、下载一个firefox或者chrome浏览器,然后调出【查看元素】的调试器;

 

2、采集网页,首先要分析网页的结构,根据id名、name名、元素名,逐步获取;

 

3、参考代码

 

Dim web As New System.Windows.Forms.WebBrowser()
web.ScriptErrorsSuppressed = True
web.Navigate("http://www.cninfo.com.cn/information/financialreport/szmb000651.html")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop

Dim tb As object = web.Document.GetElementsByTagName("table")(2)
Dim trs = tb.GetElementsByTagName("tr")
For i As Integer = 0 To trs.count-1
    Dim tds As object =  trs(i).GetElementsByTagName("td")
    For j As Integer = 0 To tds.count-1
        output.show(i & "行" & j & "列:" & tds(j).innerText)
    Next
Next

 


--  作者:bohe
--  发布时间:2018/3/7 11:42:00
--  
采集文章也跟表格数据一样?
--  作者:bohe
--  发布时间:2018/3/7 11:47:00
--  
文章中还有图片
--  作者:有点甜
--  发布时间:2018/3/7 11:54:00
--  
以下是引用bohe在2018/3/7 11:47:00的发言:
文章中还有图片

 

一样。你需要先分析网页结构,然后读取图片链接,得到链接以后再下载图片即可。

 

不会做请上传实例具体你的问题。