Foxtable(狐表)用户栏目专家坐堂 → [求助]提取word文档字符串


  共有4463人关注过本帖树形打印复制链接

主题:[求助]提取word文档字符串

帅哥哟,离线,有人找我吗?
天一生水
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
[求助]提取word文档字符串  发帖心情 Post By:2018/3/1 16:07:00 [显示全部帖子]

文件列  [裁判文书] 添加文件时,能否自动提取word文档内  标志性文字后的字符串?

1、将“判决”或“裁定”两个字符提取到  [裁判类型];

2、将“判决如下:”或“裁定如下:”后面的内容提取到   [裁判内容];

见下图: 

 

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:提取文档内容.rar

 


图片点击可在新窗口打开查看此主题相关图片如下:image 1.jpg
图片点击可在新窗口打开查看

*************************************

图片点击可在新窗口打开查看此主题相关图片如下:image 2.jpg
图片点击可在新窗口打开查看  

*************************************


图片点击可在新窗口打开查看此主题相关图片如下:image 3.jpg
图片点击可在新窗口打开查看
[此贴子已经被作者于2018/3/1 16:12:37编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/1 17:44:00 [显示全部帖子]

谢谢甜老师!

能不能只出现一次文件打开窗口,因为在添加列文件时已经选过一次文件了,在事件里又要重选一次文件。


 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/1 18:45:00 [显示全部帖子]

路径改为:

Dim doc = app.Documents.Open(ProjectPath & "裁判文书\" & e.DataRow("承办人") & "\" & e.DataRow("案号") & ".doc" )

 

感觉没有错,但是弹出,未找到文件。

我的存放文件路径代码是:

DataTables("数据表").DataCols("裁判文书").DefaultFolder = ProjectPath & "裁判文书\" & e.DataRow("承办人") & "\"

 

列属性的存放地址没有设置,是空的,添加文件后变成“C:\Users\Administrator\Desktop\提取文档内容\裁判文书\AAA\

怎么改?

[此贴子已经被作者于2018/3/1 18:53:44编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/1 20:50:00 [显示全部帖子]

还是提示:

 


图片点击可在新窗口打开查看此主题相关图片如下:image 4.jpg
图片点击可在新窗口打开查看

 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/1 23:08:00 [显示全部帖子]

请教老师一个问题,上面的代码哪一句是把添加的文件放入“裁判文书”里的,一直没看出来。

这句:Dim file = e.SourceFolder & "\" & e.filename,是来源目录吗?起什么作用?

 

要是局域网路径怎么改?

[此贴子已经被作者于2018/3/1 23:09:03编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/6 20:34:00 [显示全部帖子]

八楼的代码,下图中如果提取倒数第3,4,5段落文字,并显示为:“审判长于XX,审判员孙XX,人民陪审员张XX”,怎样修改?谢谢!

 

 


图片点击可在新窗口打开查看此主题相关图片如下:1520143960_48842.jpg
图片点击可在新窗口打开查看

 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/7 8:25:00 [显示全部帖子]

但是这样不能排除倒数第二行的日期。

如果以自然段作为识别方式的话,可以作为上面方法的补充。对固定格式的文档有很强的通用性。

因此,希望老师能够再提供下面的代码:

1、正数或倒数第几段(自然段);

2、连续正数几段或连续倒数几段(段落之间用“换行符”分隔,就是我上面的问题)

谢谢!

[此贴子已经被作者于2018/3/7 8:33:18编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  8楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/7 16:01:00 [显示全部帖子]

甜老师,因为要提取的字符,开头和结尾的标志字符不固定,所以想用段落来识别提取。

不知可行不?


 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  9楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/7 18:29:00 [显示全部帖子]

谢谢甜老师!

上边的代码怎么去掉段落为空的行,就是去掉只有回车符的行。

因为有的人用回车代替行间距,造成按照段落数提取数据不准确。


 回到顶部
帅哥哟,离线,有人找我吗?
天一生水
  10楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:五尾狐 帖子:1141 积分:11272 威望:0 精华:0 注册:2017/9/26 16:30:00
  发帖心情 Post By:2018/3/8 11:21:00 [显示全部帖子]

甜老师,楼上的代码,怎样:

1、显示段落开头字符为“本院认为”的段落;

2、显示段落中包含字符为“AAA”的段落。

谢谢!


 回到顶部
总数 16 1 2 下一页