Foxtable(狐表)用户栏目专家坐堂 → 采集问题


  共有2619人关注过本帖树形打印复制链接

主题:采集问题

美女呀,离线,留言给我吧!
qianqian1530
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:三尾狐 帖子:746 积分:5567 威望:0 精华:0 注册:2013/12/4 8:56:00
采集问题  发帖心情 Post By:2014/4/23 9:31:00 [只看该作者]

<a href="/url?sa=t&amp;rct=j&amp;q=&amp;esrc=s&amp;source=web&amp;cd=1&amp;cad=rja&amp;uact=8&amp;ved=0CCcQFjAA&amp;url=https%3A%2F%2Ftwitter.com%2Fqianqian1530&amp;ei=yRZXU5LmDNXg8AWUuYKQDA&amp;usg=AFQjCNES11WK2hesooh-A1SPS_cas9xI9w" data-href="https://twitter.com/qianqian1530">qianqian1530 on Twitter</a>



我想采集的是    data-href="内容" 的
 
但 每次 我都采集到  qianqian1530 on Twitter

怎么解决呢?



'''
Dim web As New System.Windows.Forms.WebBrowser
Dim ide As Integer
For ide= 0 To 1 Step 1
    Dim ides As Integer
    e.Form.Controls("Label15").text = ide
    ides = ide *10
    web.Navigate("https://www.google.co.jp/#filter=0&q=%E5%9C%B0%E7%90%83&start=" & ides)
    Do Until web.ReadyState = 4
        Application.DoEvents
    Loop
    Dim elems As System.Windows.Forms.HtmlElementCollection
    Elems = web.Document.GetElementsByTagName("OL")   '根据标签得到数据集合
    For Each elem As System.Windows.Forms.Htmlelement In elems
        Dim sa As Integer
        If elem.GetAttribute("Id") Like "rso" Then
            For sa= 0 To 100 Step 1
                If elem.GetElementsByTagName("H3").Count  =sa  Then
                    Exit For
                Else
                    Dim e_Info As System.Windows.Forms.HtmlElement = elem.GetElementsByTagName("H3")(sa)
                    Dim e1 As System.Windows.Forms.HtmlElement = e_Info.GetElementsByTagName("A")(0)
                    Dim e_Info1 As System.Windows.Forms.HtmlElement = elem.GetElementsByTagName("A")(sa)
                    Dim r As Row = Tables("表A").AddNew
                    r("网页名") = e1.InnerText
                    r("URL") = e_Info1.InnerText
                End If
            Next
        End If
    Next
Next

 回到顶部
帅哥哟,离线,有人找我吗?
Bin
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:35433 积分:178524 威望:0 精华:3 注册:2013/3/30 16:36:00
  发帖心情 Post By:2014/4/23 9:35:00 [只看该作者]

r("URL") = e_Info1.GetAttribute("data-href")

 回到顶部