Foxtable(狐表)用户栏目专家坐堂 → [讨论]关于抓取网页~~~~~~~~(一直跟帖讨论,希望有此需要的朋友关注!)


  共有4945人关注过本帖树形打印复制链接

主题:[讨论]关于抓取网页~~~~~~~~(一直跟帖讨论,希望有此需要的朋友关注!)

帅哥哟,离线,有人找我吗?
大红袍
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/20 9:11:00 [显示全部帖子]

 

[此贴子已经被作者于2016/4/20 9:16:47编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/20 9:17:00 [显示全部帖子]

Dim web As new windows.forms.webbrowser
web.Navigate("https://isuddenlysneezed.taobao.com/search.htm?spm=2013.1.0.0.mJJPKY&search=y")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop
'output.show(web.document.body.innerhtml)


For Each dl As object In web.Document.GetElementsByTagName("dl")
    If dl.GetAttribute("ClassName") Like "item*"
        Dim a = dl.GetElementsByTagName("a")
        Dim img = dl.GetElementsByTagName("img")
       
        output.show(a(0).GetAttribute("href"))
        output.show(img(0).GetAttribute("alt"))
        output.show(img(0).GetAttribute("href"))
    End If
Next


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/20 15:25:00 [显示全部帖子]

Dim web As new windows.forms.webbrowser
web.Navigate("https://isuddenlysneezed.taobao.com/search.htm?spm=2013.1.0.0.mJJPKY&search=y")
Do Until web.ReadyState = 4 AndAlso web.Document.GetElementsByTagName("dl").count > 0
    Application.DoEvents
Loop

For Each dl As object In web.Document.GetElementsByTagName("dl")
    If dl.GetAttribute("ClassName") Like "item*"
        Dim a = dl.GetElementsByTagName("a")
        Dim img = dl.GetElementsByTagName("img")
       
        output.show(a(0).GetAttribute("href"))
        output.show(img(0).GetAttribute("alt"))
        output.show(img(0).GetAttribute("href"))
    End If
Next


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/20 15:36:00 [显示全部帖子]


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/20 16:03:00 [显示全部帖子]

https://isuddenlysneezed.taobao.com/search.htm?spm=2013.1.0.0.mJJPKY&search=y&pageNo=2

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/20 16:25:00 [显示全部帖子]

Dim web As new windows.forms.webbrowser
web.Navigate("https://isuddenlysneezed.taobao.com/search.htm?spm=2013.1.0.0.mJJPKY&search=y")
Do Until web.ReadyState = 4 AndAlso web.Document.GetElementsByTagName("dl").count > 0
    Application.DoEvents
Loop

For Each dl As object In web.Document.GetElementsByTagName("div")
    If dl.GetAttribute("ClassName") Like "pagination"
        Dim a = dl.GetElementsByTagName("a")
        msgbox(a(a.count-2).innertext)
    End If
Next

 


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/21 9:30:00 [显示全部帖子]

For Each dl As object In web.Document.GetElementsByTagName("ul")
    If dl.GetAttribute("ClassName") = "attributes-list"
        Dim lis = dl.GetElementsByTagName("li")
        For Each li As object In lis
            output.show(li.GetAttribute("Title"))
        Next
    End If
Next

 回到顶部