Foxtable(狐表)用户栏目专家坐堂 → 如何获取网页的数据


  共有3602人关注过本帖树形打印复制链接

主题:如何获取网页的数据

帅哥哟,离线,有人找我吗?
lihe60
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:狐神 帖子:6885 积分:43595 威望:0 精华:0 注册:2009/3/2 14:07:00
如何获取网页的数据  发帖心情 Post By:2016/4/11 15:04:00 [只看该作者]

这是企业信用系统的界面,如何获取网页中的数据,如通信地址等。
图片点击可在新窗口打开查看此主题相关图片如下:未命名.bmp
图片点击可在新窗口打开查看

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 15:07:00 [只看该作者]

参考

 

Dim web As new windows.forms.webbrowser
web.Navigate("https://bbqueen.taobao.com/search.htm?spm=a1z10.1-c.w5002-6367770394.1.h68GhT&search=y")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop
'output.show(web.document.body.innerhtml)

For Each dl As object In web.Document.GetElementsByTagName("dl")
    If dl.GetAttribute("ClassName") Like "item*"
        output.show(dl.outerhtml)
    End If
Next
 


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 15:13:00 [只看该作者]

具体代码

 

Dim web As new windows.forms.webbrowser
web.Navigate("http://gsxt.gdgs.gov.cn/aiccips/GSpublicity/GSpublicityList.html?service=entInfo_vxLoK6d31BzSpCO2LxJuHYJWhx18g9+7oPZv2zQbbWWE8HNhUeJDoSaBVhp1yo50-7kW54gFL28iQmsO8Qn3cTA==")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop
'output.show(web.document.body.innerhtml)

For Each tr As object In web.Document.GetElementsByTagName("tr")
    If tr.innertext.contains("经营场所") Then
        msgbox(tr.GetElementsByTagName("td")(0).InnerText)
    End If
Next

 


 回到顶部
帅哥哟,离线,有人找我吗?
lihe60
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:狐神 帖子:6885 积分:43595 威望:0 精华:0 注册:2009/3/2 14:07:00
  发帖心情 Post By:2016/4/11 15:41:00 [只看该作者]


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 15:48:00 [只看该作者]

 不明白你什么意思,我无法打开,获取参考3楼代码。

 回到顶部
帅哥哟,离线,有人找我吗?
lihe60
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:狐神 帖子:6885 积分:43595 威望:0 精华:0 注册:2009/3/2 14:07:00
  发帖心情 Post By:2016/4/11 15:59:00 [只看该作者]

以下是引用大红袍在2016/4/11 15:48:00的发言:
 不明白你什么意思,我无法打开,获取参考3楼代码。

4楼的网址打开的是这个截图(浙江的)。3楼的代码可以打开广东的,但不能打开浙江的。我的意思是如何获取浙江省的网址数据。


图片点击可在新窗口打开查看此主题相关图片如下:未命名.bmp
图片点击可在新窗口打开查看

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 16:01:00 [只看该作者]

我打不开浙江的。那你参考代码写啊,你要看懂代码啊

 

    If tr.innertext.contains("经营场所") Then
        msgbox(tr.GetElementsByTagName("td")(0).InnerText)
    End If

 


 回到顶部
帅哥哟,离线,有人找我吗?
lihe60
  8楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:狐神 帖子:6885 积分:43595 威望:0 精华:0 注册:2009/3/2 14:07:00
  发帖心情 Post By:2016/4/11 16:10:00 [只看该作者]

For Each tr As object In web.Document.GetElementsByTagName("tr")

从这个代码开始不执行了。


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  9楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 16:11:00 [只看该作者]

 执行以下

 

output.show(web.document.body.innerhtml)


 回到顶部
帅哥哟,离线,有人找我吗?
lihe60
  10楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:狐神 帖子:6885 积分:43595 威望:0 精华:0 注册:2009/3/2 14:07:00
  发帖心情 Post By:2016/4/11 16:24:00 [只看该作者]

截图是这样的,不知后面如何写代码。

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:未命名.rar

[此贴子已经被作者于2016/4/11 16:25:39编辑过]

 回到顶部
总数 13 1 2 下一页