Foxtable(狐表)用户栏目专家坐堂 → 如何获取网页的数据


  共有3604人关注过本帖树形打印复制链接

主题:如何获取网页的数据

帅哥哟,离线,有人找我吗?
大红袍
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 15:07:00 [显示全部帖子]

参考

 

Dim web As new windows.forms.webbrowser
web.Navigate("https://bbqueen.taobao.com/search.htm?spm=a1z10.1-c.w5002-6367770394.1.h68GhT&search=y")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop
'output.show(web.document.body.innerhtml)

For Each dl As object In web.Document.GetElementsByTagName("dl")
    If dl.GetAttribute("ClassName") Like "item*"
        output.show(dl.outerhtml)
    End If
Next
 


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 15:13:00 [显示全部帖子]

具体代码

 

Dim web As new windows.forms.webbrowser
web.Navigate("http://gsxt.gdgs.gov.cn/aiccips/GSpublicity/GSpublicityList.html?service=entInfo_vxLoK6d31BzSpCO2LxJuHYJWhx18g9+7oPZv2zQbbWWE8HNhUeJDoSaBVhp1yo50-7kW54gFL28iQmsO8Qn3cTA==")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop
'output.show(web.document.body.innerhtml)

For Each tr As object In web.Document.GetElementsByTagName("tr")
    If tr.innertext.contains("经营场所") Then
        msgbox(tr.GetElementsByTagName("td")(0).InnerText)
    End If
Next

 


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 15:48:00 [显示全部帖子]

 不明白你什么意思,我无法打开,获取参考3楼代码。

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 16:01:00 [显示全部帖子]

我打不开浙江的。那你参考代码写啊,你要看懂代码啊

 

    If tr.innertext.contains("经营场所") Then
        msgbox(tr.GetElementsByTagName("td")(0).InnerText)
    End If

 


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 16:11:00 [显示全部帖子]

 执行以下

 

output.show(web.document.body.innerhtml)


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 16:25:00 [显示全部帖子]

贴出网页源码

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/4/11 17:14:00 [显示全部帖子]

Dim web As new windows.forms.webbrowser
web.Navigate("http://gsxt.zjaic.gov.cn/appbasicinfo/doViewAppBasicInfo.do?corpid=14FDA926DAE115ADE880A6797A51E2668A5F054CCCFEA9DAF7A91A03259D0D66")
Do Until web.ReadyState = 4 AndAlso web.Document.Window.Frames(0).Document.Body IsNot Nothing AndAlso web.Document.Window.Frames(0).Document.Body.innerText > ""
    Application.DoEvents
Loop

output.show(web.Document.Window.Frames(0).Document.body.innerhtml)

For Each tr As object In web.Document.Window.Frames(0).Document.GetElementsByTagName("tr")
    Dim th  = tr.GetElementsByTagName("th")
    If th.count > 0 AndAlso th(0).InnerText = "住所" Then
        msgbox(tr.GetElementsByTagName("td")(0).InnerText)
    End If
Next


 回到顶部