Foxtable(狐表)用户栏目专家坐堂 → 官方能不能出个采集网页的教程


  共有2502人关注过本帖树形打印复制链接

主题:官方能不能出个采集网页的教程

帅哥哟,离线,有人找我吗?
bohe
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1077 积分:9923 威望:0 精华:0 注册:2008/9/2 11:34:00
官方能不能出个采集网页的教程  发帖心情 Post By:2018/3/7 10:10:00 [只看该作者]

目前都是根据不同需求出的解答,能不能汇集说明一下采集问题,如何采集网页表格数据、网页文章等,没办法,我等不是专业的,只好求救了。

 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2018/3/7 11:24:00 [只看该作者]

1、下载一个firefox或者chrome浏览器,然后调出【查看元素】的调试器;

 

2、采集网页,首先要分析网页的结构,根据id名、name名、元素名,逐步获取;

 

3、参考代码

 

Dim web As New System.Windows.Forms.WebBrowser()
web.ScriptErrorsSuppressed = True
web.Navigate("http://www.cninfo.com.cn/information/financialreport/szmb000651.html")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop

Dim tb As object = web.Document.GetElementsByTagName("table")(2)
Dim trs = tb.GetElementsByTagName("tr")
For i As Integer = 0 To trs.count-1
    Dim tds As object =  trs(i).GetElementsByTagName("td")
    For j As Integer = 0 To tds.count-1
        output.show(i & "行" & j & "列:" & tds(j).innerText)
    Next
Next

 


 回到顶部
帅哥哟,离线,有人找我吗?
bohe
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1077 积分:9923 威望:0 精华:0 注册:2008/9/2 11:34:00
  发帖心情 Post By:2018/3/7 11:42:00 [只看该作者]

采集文章也跟表格数据一样?

 回到顶部
帅哥哟,离线,有人找我吗?
bohe
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1077 积分:9923 威望:0 精华:0 注册:2008/9/2 11:34:00
  发帖心情 Post By:2018/3/7 11:47:00 [只看该作者]

文章中还有图片

 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2018/3/7 11:54:00 [只看该作者]

以下是引用bohe在2018/3/7 11:47:00的发言:
文章中还有图片

 

一样。你需要先分析网页结构,然后读取图片链接,得到链接以后再下载图片即可。

 

不会做请上传实例具体你的问题。

 

 


 回到顶部