以文本方式查看主题 - Foxtable(狐表) (http://foxtable.net/bbs/index.asp) -- 专家坐堂 (http://foxtable.net/bbs/list.asp?boardid=2) ---- [求助]请教一下高手,如何从网站上采集数据 (http://foxtable.net/bbs/dispbbs.asp?boardid=2&id=26012) |
||||
-- 作者:zhuzhi -- 发布时间:2012/11/22 9:37:00 -- [求助]请教一下高手,如何从网站上采集数据 记得有一位高手用狐表做过一个数据采集系统。下载使用后,可以对中国银行等网站上的数据进行采集,并自动将采集后的内容生成狐表数据表。不过这个示例看不到具体是怎么做的 现在,我想采集这个网站的数据:http://www.ddmap.com/map/27----%CA%E9%B5%EA---1-1/
想把书店的名称,地址,网点分别采集下来,列在一张数据表里。
不知道怎样来做?求指点! |
||||
-- 作者:temblar -- 发布时间:2012/11/22 11:58:00 -- 我是上网找了个采集软件 好像叫 小蜜蜂 设置好后生成access 再用狐表导入 ,方法比较笨,但对程序不是很熟练的还是能达到想要的功能的,想检测多少网站就检测多少哈 |
||||
-- 作者:lin_hailun -- 发布时间:2012/11/22 13:42:00 -- 大概这样,读取的时候,有点慢。
|
||||
-- 作者:hanxuntx -- 发布时间:2012/11/22 15:10:00 -- 好贴收藏 |
||||
-- 作者:zhuzhi -- 发布时间:2012/11/23 17:56:00 -- 以下是引用lin_hailun在2012-11-22 13:42:00的发言:
大概这样,读取的时候,有点慢。
想不到真的能做到!简直无所不能了都!非常感谢! |
||||
-- 作者:zhuzhi -- 发布时间:2012/11/23 18:38:00 -- 以下是引用lin_hailun在2012-11-22 13:42:00的发言:
大概这样,读取的时候,有点慢。
想请教您!网页地址http://www.ddmap.com/map/27----%CA%E9%B5%EA---1-1/为什么要处理成http://www.ddmap.com/map/27----%CA%E9%B5%EA---" & 1 & "-1/呢?是不是仅仅是要狐表识别这段网址,和后面的代码设置没有多大关系?我如果想换数据采集的网址,只要直接替换就好了呢? 您代码中的数据集合ul,是来自于网页源代码的么?是不是任何网页都使用这个ul?还有id,hotel_detail,H3等等,这些好象都是网页源代码的,我如果换一个网页,是不是沿袭呢?
能稍稍解释一下么,这些东西代表的意义……太麻烦就算了!总之也很感谢!
|
||||
-- 作者:szp2012 -- 发布时间:2012/11/23 19:40:00 -- 好像是16进制,IE自动转化的 |
||||
-- 作者:lin_hailun -- 发布时间:2012/11/23 19:41:00 -- 回答楼上,我这样做是为了方便你的修改,比如,你修改成2,3,4,5,6,就可以继续读取了。 每一个网站的网页的模板都是不同的,不能通用的。需要分析网页的结构。 但是,对于这个网站,只要是 “这种” 页面,你替换一下网址就可以读取到信息了,因为它们的源码都一样。 [此贴子已经被作者于2012-11-23 19:41:32编辑过]
|
||||
-- 作者:qq34658788 -- 发布时间:2014/1/26 12:45:00 -- 顶上去 |
||||
-- 作者:lsy -- 发布时间:2014/1/26 13:20:00 -- 看到了好东西,就得顶。 |