以文本方式查看主题

-  Foxtable(狐表)  (http://foxtable.net/bbs/index.asp)
--  专家坐堂  (http://foxtable.net/bbs/list.asp?boardid=2)
----  [求助]请教一下高手,如何从网站上采集数据  (http://foxtable.net/bbs/dispbbs.asp?boardid=2&id=26012)

--  作者:zhuzhi
--  发布时间:2012/11/22 9:37:00
--  [求助]请教一下高手,如何从网站上采集数据

记得有一位高手用狐表做过一个数据采集系统。下载使用后,可以对中国银行等网站上的数据进行采集,并自动将采集后的内容生成狐表数据表。不过这个示例看不到具体是怎么做的

现在,我想采集这个网站的数据:http://www.ddmap.com/map/27----%CA%E9%B5%EA---1-1/

 

想把书店的名称,地址,网点分别采集下来,列在一张数据表里。

 

不知道怎样来做?求指点!


--  作者:temblar
--  发布时间:2012/11/22 11:58:00
--  
 我是上网找了个采集软件 好像叫 小蜜蜂 设置好后生成access 再用狐表导入  ,方法比较笨,但对程序不是很熟练的还是能达到想要的功能的,想检测多少网站就检测多少哈

--  作者:lin_hailun
--  发布时间:2012/11/22 13:42:00
--  
 大概这样,读取的时候,有点慢。

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:读取网络数据.table



--  作者:hanxuntx
--  发布时间:2012/11/22 15:10:00
--  
好贴收藏
--  作者:zhuzhi
--  发布时间:2012/11/23 17:56:00
--  
以下是引用lin_hailun在2012-11-22 13:42:00的发言:
 大概这样,读取的时候,有点慢。

 下载信息  [文件大小:312.0 KB  下载次数:34]
图片点击可在新窗口打开查看点击浏览该文件:读取网络数据.table


想不到真的能做到!简直无所不能了都!非常感谢!


--  作者:zhuzhi
--  发布时间:2012/11/23 18:38:00
--  
以下是引用lin_hailun在2012-11-22 13:42:00的发言:
 大概这样,读取的时候,有点慢。

 下载信息  [文件大小:312.0 KB  下载次数:42]
图片点击可在新窗口打开查看点击浏览该文件:读取网络数据.table


想请教您!网页地址http://www.ddmap.com/map/27----%CA%E9%B5%EA---1-1/为什么要处理成http://www.ddmap.com/map/27----%CA%E9%B5%EA---" & 1 & "-1/呢?是不是仅仅是要狐表识别这段网址,和后面的代码设置没有多大关系?我如果想换数据采集的网址,只要直接替换就好了呢?

您代码中的数据集合ul,是来自于网页源代码的么?是不是任何网页都使用这个ul?还有id,hotel_detail,H3等等,这些好象都是网页源代码的,我如果换一个网页,是不是沿袭呢?

 

能稍稍解释一下么,这些东西代表的意义……太麻烦就算了!总之也很感谢!

 

 


--  作者:szp2012
--  发布时间:2012/11/23 19:40:00
--  
好像是16进制,IE自动转化的
--  作者:lin_hailun
--  发布时间:2012/11/23 19:41:00
--  
 回答楼上,我这样做是为了方便你的修改,比如,你修改成2,3,4,5,6,就可以继续读取了。

 每一个网站的网页的模板都是不同的,不能通用的。需要分析网页的结构。

 但是,对于这个网站,只要是 “这种” 页面,你替换一下网址就可以读取到信息了,因为它们的源码都一样。
[此贴子已经被作者于2012-11-23 19:41:32编辑过]

--  作者:qq34658788
--  发布时间:2014/1/26 12:45:00
--  
顶上去
--  作者:lsy
--  发布时间:2014/1/26 13:20:00
--  

看到了好东西,就得顶。