以文本方式查看主题 - Foxtable(狐表) (http://foxtable.com/bbs/index.asp) -- 专家坐堂 (http://foxtable.com/bbs/list.asp?boardid=2) ---- [求助]如何提取网页中的数据及图片 (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=90765) |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:188802386 -- 发布时间:2016/9/21 12:13:00 -- [求助]如何提取网页中的数据及图片 最近在升级之前的系统需要获取网页中的数据,但没有学过,请大侠帮帮忙。 首先有个网址栏可以自己输入网址进去(页面相同,内容不同),用变量老是报错 然后就是哪个网址的内容提取 编号 户型 面积 售价 单价 楼层 类型 装修 年代 小区 图片1 to 10 张 还有一个实际上就是网址最后的一串数字3603988 在源代码里面有个 fyid=3603988 不知能否提取得出来,图片要是不能在表中显示,看能否提取出网址也行
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:188802386 -- 发布时间:2016/9/21 12:13:00 -- 例子
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:188802386 -- 发布时间:2016/9/21 12:29:00 --
[此贴子已经被作者于2016/9/21 12:29:50编辑过]
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:188802386 -- 发布时间:2016/9/21 12:29:00 -- <div class="fyxxybox2" style="padding-top:0.5rem; padding-bottom:0.5rem; padding-left:0rem; padding-right:0rem;"><span style="float:left; width:10.5rem; border-right: solid 0.1rem #d9d9d9; text-align:center; line-height:2rem;"><strong>售价</strong><br><span style="color:#FF0000; font-size:1.4rem;">75万</span></span><span style="float:left; width:10.5rem; border-right: solid 0.1rem #d9d9d9; text-align:center; line-height:2rem;"><strong>面积</strong><br><span style="color:#FF0000; font-size:1.4rem;">120.68平米</span></span><span style="float:left; width:10.5rem; text-align:center; line-height:2rem;"><strong>户型</strong><br><span style="color:#FF0000; font-size:1.4rem;">3室2厅</span></span></div><div class="fyxxybox2" style="padding-bottom:0rem; padding-top:0rem; color:#8b8b8b; margin-bottom:0rem; border-bottom:none;"><span style="float:left; line-height:3.3rem; ">单价:<span style="color:#FF0000; font-size:1.4rem;">6214.78元/㎡</span></span><span style="float:right; margin-top:0.7rem;"><a href="/232621561/jsq/anjie"><img src="/asset/images/jsq.png" style="width:2.5rem; "></a></span></div><div class="fyxxybox2_n"><span style="float:left; width:15rem; ">编号:<span style="color:#000">D-16-33472</span></span><span style="float:left;">朝向:<span style="color:#000">西</span></span></div><div class="fyxxybox2_n"><span style="float:left; width:15rem; ">楼层:<span style="color:#000">7层/18层</span></span><span style="float:left;">装修:<span style="color:#000">精装</span></span></div><div class="fyxxybox2_n"><span style="float:left; width:15rem; ">类型:<span style="color:#000">商品房</span></span><span style="float:left;">年代:<span style="color:#000">2008</span></span></div><div class="fyxxybox2" style="padding-bottom:0rem; padding-top:0rem; color:#8b8b8b; margin-bottom:0rem; border-bottom:none; line-height:3.3rem; "><span style="float:left;">小区:<span style="color:#000">新城丽景</span></span><span style="float:right;"><a href="/232621561/mmfy/mmfylist/disid=419451516" style="color:#FF6600; text-decoration:underline;">更多该小区房源</a></span></div> |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:188802386 -- 发布时间:2016/9/21 17:00:00 -- 哪位大侠帮帮忙,好吗 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:有点蓝 -- 发布时间:2016/9/21 17:16:00 -- 参考:http://www.foxtable.com/bbs/dispbbs.asp?boardid=2&id=49278 http://www.foxtable.com/bbs/dispbbs.asp?boardid=2&id=32808
自己学会分析网页结构 [此贴子已经被作者于2016/9/21 17:15:56编辑过]
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:188802386 -- 发布时间:2016/9/21 18:44:00 -- 参考的一个是自动录入和打开,,现在是可以打开, 后面个是获取表格类的数据,但我这个不是表格类数据,所以不知道从那开始分析
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:188802386 -- 发布时间:2016/9/21 19:38:00 -- Dim web As new windows.forms.webbrowser web.ScriptErrorsSuppressed = True web.Navigate("http://weidian.eallcn.com/232621561/mmfy/mmfydetail/id=3603988") Do Until web.ReadyState = 4 Application.DoEvents Loop For Each dl As object In web.Document.GetElementsByTagName("fyxxybox2") If dl.GetAttribute("strong") = "售价" Dim lis = dl.GetElementsByTagName("fyxxybox2") For Each li As object In lis output.show(li.GetAttribute("style")) Next End If Next 麻烦老师帮我看下,怎么没有反应呢
[此贴子已经被作者于2016/9/21 19:59:24编辑过]
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:有点蓝 -- 发布时间:2016/9/21 20:42:00 -- Dim web As new windows.forms.webbrowser web.ScriptErrorsSuppressed = True web.Navigate("http://weidian.eallcn.com/232621561/mmfy/mmfydetail/id=3603988") Do Until web.ReadyState = 4 Application.DoEvents Loop \'Functions.Execute("logs",web.Document.body.outerhtml) For Each dl As object In web.Document.GetElementsByTagName("DIV") If dl.GetAttribute("classname") = "fyxxybox1" OrElse dl.GetAttribute("classname") = "fyxxybox2" Then msgbox(dl.Innertext) \'Dim lis = dl.GetElementsByTagName("fyxxybox2") \'For Each li As object In lis \'output.show(li.GetAttribute("style")) \'Next End If Next
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
-- 作者:188802386 -- 发布时间:2016/9/22 9:46:00 -- 获取数据信息成功了,能获取所有文字信息,但我想获取图片的网址,请问该如何操作呢
|