Foxtable(狐表)用户栏目专家坐堂 → [求助]请教一下高手,如何从网站上采集数据


  共有9197人关注过本帖树形打印复制链接

主题:[求助]请教一下高手,如何从网站上采集数据

帅哥哟,离线,有人找我吗?
zhuzhi
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:476 积分:4039 威望:0 精华:0 注册:2011/11/2 8:55:00
[求助]请教一下高手,如何从网站上采集数据  发帖心情 Post By:2012/11/22 9:37:00 [只看该作者]

记得有一位高手用狐表做过一个数据采集系统。下载使用后,可以对中国银行等网站上的数据进行采集,并自动将采集后的内容生成狐表数据表。不过这个示例看不到具体是怎么做的

现在,我想采集这个网站的数据:http://www.ddmap.com/map/27----%CA%E9%B5%EA---1-1/

 

想把书店的名称,地址,网点分别采集下来,列在一张数据表里。

 

不知道怎样来做?求指点!


 回到顶部
帅哥哟,离线,有人找我吗?
temblar
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:313 积分:2913 威望:0 精华:0 注册:2012/7/20 16:04:00
  发帖心情 Post By:2012/11/22 11:58:00 [只看该作者]

 我是上网找了个采集软件 好像叫 小蜜蜂 设置好后生成access 再用狐表导入  ,方法比较笨,但对程序不是很熟练的还是能达到想要的功能的,想检测多少网站就检测多少哈

 回到顶部
帅哥哟,离线,有人找我吗?
lin_hailun
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:狐神 帖子:6708 积分:34304 威望:0 精华:11 注册:2012/8/18 23:10:00
  发帖心情 Post By:2012/11/22 13:42:00 [只看该作者]

 大概这样,读取的时候,有点慢。

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:读取网络数据.table



 回到顶部
帅哥哟,离线,有人找我吗?
muhua
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:等待验证 帖子:3855 积分:20692 威望:0 精华:5 注册:2012/6/21 14:03:00
  发帖心情 Post By:2012/11/22 14:21:00 [只看该作者]

用户已被锁定

 回到顶部
帅哥哟,离线,有人找我吗?
hanxuntx
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:九尾狐 帖子:2609 积分:16926 威望:0 精华:11 注册:2011/9/20 16:13:00
  发帖心情 Post By:2012/11/22 15:10:00 [只看该作者]

好贴收藏

 回到顶部
帅哥哟,离线,有人找我吗?
zhuzhi
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:476 积分:4039 威望:0 精华:0 注册:2011/11/2 8:55:00
  发帖心情 Post By:2012/11/23 17:56:00 [只看该作者]

以下是引用lin_hailun在2012-11-22 13:42:00的发言:
 大概这样,读取的时候,有点慢。

 下载信息  [文件大小:312.0 KB  下载次数:34]
图片点击可在新窗口打开查看点击浏览该文件:读取网络数据.table


想不到真的能做到!简直无所不能了都!非常感谢!


 回到顶部
帅哥哟,离线,有人找我吗?
zhuzhi
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:476 积分:4039 威望:0 精华:0 注册:2011/11/2 8:55:00
  发帖心情 Post By:2012/11/23 18:38:00 [只看该作者]

以下是引用lin_hailun在2012-11-22 13:42:00的发言:
 大概这样,读取的时候,有点慢。

 下载信息  [文件大小:312.0 KB  下载次数:42]
图片点击可在新窗口打开查看点击浏览该文件:读取网络数据.table


想请教您!网页地址http://www.ddmap.com/map/27----%CA%E9%B5%EA---1-1/为什么要处理成http://www.ddmap.com/map/27----%CA%E9%B5%EA---" & 1 & "-1/呢?是不是仅仅是要狐表识别这段网址,和后面的代码设置没有多大关系?我如果想换数据采集的网址,只要直接替换就好了呢?

您代码中的数据集合ul,是来自于网页源代码的么?是不是任何网页都使用这个ul?还有id,hotel_detail,H3等等,这些好象都是网页源代码的,我如果换一个网页,是不是沿袭呢?

 

能稍稍解释一下么,这些东西代表的意义……太麻烦就算了!总之也很感谢!

 

 


 回到顶部
帅哥哟,离线,有人找我吗?
szp2012
  8楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:童狐 帖子:202 积分:1683 威望:0 精华:0 注册:2011/6/17 16:07:00
  发帖心情 Post By:2012/11/23 19:40:00 [只看该作者]

好像是16进制,IE自动转化的

 回到顶部
帅哥哟,离线,有人找我吗?
lin_hailun
  9楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:狐神 帖子:6708 积分:34304 威望:0 精华:11 注册:2012/8/18 23:10:00
  发帖心情 Post By:2012/11/23 19:41:00 [只看该作者]

 回答楼上,我这样做是为了方便你的修改,比如,你修改成2,3,4,5,6,就可以继续读取了。

 每一个网站的网页的模板都是不同的,不能通用的。需要分析网页的结构。

 但是,对于这个网站,只要是 “这种” 页面,你替换一下网址就可以读取到信息了,因为它们的源码都一样。
[此贴子已经被作者于2012-11-23 19:41:32编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
qq34658788
  10楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:童狐 帖子:221 积分:1712 威望:0 精华:0 注册:2013/3/3 21:16:00
  发帖心情 Post By:2014/1/26 12:45:00 [只看该作者]

顶上去

 回到顶部
总数 14 1 2 下一页