Foxtable(狐表)用户栏目专家坐堂 → 网页数据采集问题?


  共有4187人关注过本帖树形打印复制链接

主题:网页数据采集问题?

帅哥哟,离线,有人找我吗?
有点甜
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2014/5/25 17:50:00 [显示全部帖子]

 你这个简单,直接用id去取值即可,比如

 

Dim o As Object = e.form.controls("WebBrowser1").basecontrol.Document.GetElementById("registerInfo.hospitalCardid")

msgbox(o.GetAttribute("value"))

 

 


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2014/5/25 17:55:00 [显示全部帖子]

 比如,完整代码

 

Dim web As New System.Windows.Forms.WebBrowser()
web.ScriptErrorsSuppressed = True
web.Navigate("d:\临床医生工作平台 ( GD-CWP ).htm")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop


'取数据
Dim o As Object = web.Document.GetElementById("registerInfo.hospitalCardid")

msgbox(o.GetAttribute("value"))


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2015/2/12 23:45:00 [显示全部帖子]

如果可以直接访问服务器的htm文件,就可以。

 

比如 http://192.168.1.9/xxx.htm

 

或者局域网 \\192.168.1.9\共享文件夹\xxx.htm


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2015/2/13 14:21:00 [显示全部帖子]

 你给的例子无法测试。

 

 试试把这句代码去掉 web.Navigate("M:\临床医生工作平台 ( GD-CWP )333.htm")

 


 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2015/2/13 15:44:00 [显示全部帖子]

 回复10楼,不明白你的意思,做例子上来。

 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2015/2/13 16:30:00 [显示全部帖子]

参考代码

 

Dim web As New System.Windows.Forms.WebBrowser()
web.ScriptErrorsSuppressed = True
web.Navigate("http://www.foxtable.com")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop


'取数据
Dim ls As Object = web.Document.getElementsByTagName("a")
For Each l As object In ls
    output.show(l.GetAttribute("href"))
Next



 回到顶部