Foxtable(狐表)用户栏目专家坐堂 → [求助]网页源代码数据提取求助


  共有2464人关注过本帖树形打印复制链接

主题:[求助]网页源代码数据提取求助

帅哥哟,离线,有人找我吗?
浙江仔
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1326 积分:9603 威望:0 精华:1 注册:2010/7/21 14:20:00
[求助]网页源代码数据提取求助  发帖心情 Post By:2016/6/22 16:47:00 [只看该作者]

要处理网页源代码中的数据
要准考证号和身份证号,该怎么处理?望指点

网页代码贴不进来,只好用附件

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:新建文本文档.txt


[此贴子已经被作者于2016/6/22 16:47:00编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/6/22 16:55:00 [只看该作者]

参考代码

 

Dim trs As object = web.Document.GetElementsByTagName("tr")
Dim m As Integer = 0
For Each tr As object In trs
    If tr.InnerHtml.contains("准考证号") Then
        msgbox(tr.GetElementsByTagName("td")(1).InnerText)
    End If
    If tr.InnerHtml.contains("身份证号") Then
        msgbox(tr.GetElementsByTagName("td")(3).InnerText)
    End If
Next


 回到顶部
帅哥哟,离线,有人找我吗?
浙江仔
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1326 积分:9603 威望:0 精华:1 注册:2010/7/21 14:20:00
  发帖心情 Post By:2016/6/22 17:23:00 [只看该作者]

我这网页不能用狐表直接打开,只能从其他业务系统里面把网页源代码复制到文本框处理

 

所以现在的处理就是一字符串的处理

 

是不是不能按照这个处理方式?


 回到顶部
帅哥哟,离线,有人找我吗?
大红袍
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:贵宾 帖子:39310 积分:196782 威望:0 精华:1 注册:2015/4/25 9:23:00
  发帖心情 Post By:2016/6/22 17:41:00 [只看该作者]

参考代码

 

Dim str As String = FileSys.ReadAllText("d:\test.txt", Encoding.Default)
output.show(str)
Dim mc = System.Text.RegularExpressions.Regex.Matches(str, "(?<=<td colspan=""2"">)[0-9]{18}")
If mc.count > 0 Then
    msgbox(mc(0).value)
End If

mc = System.Text.RegularExpressions.Regex.Matches(str, "(?<=<td>)[0-9]{12}")
If mc.count > 0 Then
    msgbox(mc(0).value)
End If


 回到顶部
帅哥哟,离线,有人找我吗?
浙江仔
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:六尾狐 帖子:1326 积分:9603 威望:0 精华:1 注册:2010/7/21 14:20:00
  发帖心情 Post By:2016/6/23 8:14:00 [只看该作者]

谢谢,实现了,太好了

 回到顶部