以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.com/bbs/index.asp)
--  专家坐堂  (http://foxtable.com/bbs/list.asp?boardid=2)
----  考虑设计个通用网页数据采集工具,征集思路  (http://foxtable.com/bbs/dispbbs.asp?boardid=2&id=74739)

--  作者:ycli368
--  发布时间:2015/9/17 22:45:00
--  考虑设计个通用网页数据采集工具,征集思路
通过配置数据节点和表结构,实现网页数据通用采集
--  作者:ycli368
--  发布时间:2015/9/18 19:42:00
--  
没人吗
--  作者:sloyy
--  发布时间:2015/9/18 22:16:00
--  
没有思路,你设计什么,而且,目前狐表获取网页数据,都是在明确知道网页结构的情况下才能抓取的,你想设计通用的,那是不可能的
[此贴子已经被作者于2015/9/19 9:01:14编辑过]

--  作者:大红袍
--  发布时间:2015/9/19 9:33:00
--  

不可能通用。

 

1、网页的结构是不确定的,而且有可能编写不规范;

 

2、获取的方式是多样的,要根据结构而确定代码;

 

3、如果你要做,就智能分析html代码呗,反正我人工匹配的时候都觉得麻烦了。