收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

油气资源网络信息采集与分析方法研究

李博涵  
【摘要】:随着网络上海量油气资源信息的增长,如何从纷繁复杂的海量信息中精准的提取出满足用户需求的信息显得尤为重要。采集、提取网络上各大石油类门户网站的油气资源信息,并对这些信息进行存储和分析,最后按用户的需求兴趣以个性化定制的方式及时高效的呈现给用户,是油气行业发展的需要。针对油气资源网络信息采集过程中,用户对采集的信息具有深度聚焦、信息完备的要求,本文在以下三方面分别进行了研究:1)本文从时间精确性、内容抽取精准性与获取信息完备性三个方面分别进行分析,通过对开源爬虫Heritrix进行扩展性研究,并结合jsoup和Lucene,提出了一套关于行业动态信息采集中个性化定制的策略和方法;2)为了能按用户的需求,聚焦提供用户感兴趣的信息,采取构建完善的油气资源信息专业词库,辅助分词提高用户检索信息聚焦度的策略;3)为了构建更新油气资源信息专业词库,需要能够发现识别行业信息中不断涌现的领域新词,本文就此展开了基于改进的Prefixspan算法进行中文文本新词提取的方法研究。尝试将序列模式挖掘相关算法Prefixspan应用于中文文本的新词提取中,针对Prefixspan算法挖掘出的序列模式不连续、挖掘出的序列模式项相互间存在包含关系等问题,对算法进行改进,采用语义特征与统计相结合的方法,实现了从中文语料中有效提取新词。本文将以上研究成果应用到了国土资源部的油气网络信息动态采集系统建设项目中,应用结果表明:1)本文改进的中文文本新词提取方法对于专业领域新词的识别具有较高的准确性;2)本文提出的行业动态信息采集策略与分析方法能够较好满足用户对个性化定制行业动态信息采集的要求,既能保证采集网站上指定时间区间内的兴趣信息能够全部抓取,又能按用户的需求,聚焦提供用户感兴趣的信息,提高了行业动态信息采集系统的效能;节省了行业人员获取信息的时间。本文提出的行业动态信息采集策略和分析方法具有普适性,能够用于其它行业网络信息动态采集系统的构建。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨玉霞;汤金金;;太阳能农机发动机监测系统设计—基于智慧农业物联网信息采集[J];农机化研究;2018年05期
2 张丽娜;范兴丰;李珂灵;;大数据下图书馆信息采集编撰整合研究[J];无线互联科技;2018年06期
3 本刊编辑部;;江苏启动知识产权质押融资需求信息采集工作[J];河南科技;2018年08期
4 张帅亮;马鹏博;张向磊;;农业信息采集与开发及信息资源开发利用模式探讨[J];山东工业技术;2016年23期
5 方晖;;大数据时代网络下云信息采集方法的改进与研究[J];电子技术与软件工程;2016年21期
6 ;山东推进“多表合一”信息采集[J];农村电气化;2017年09期
7 熊先青;钱文婷;方露;庞小仁;吴智慧;赵雅洁;;大规模定制家具销售过程中的信息采集与处理[J];林业工程学报;2016年01期
8 刘青;刘钊;;美国管理预算局对政府信息采集的影响及启示[J];图书馆论坛;2014年12期
9 夏南强;胥伟岚;;嵌入性视角下信息采集学课程“翻转课堂”教学模式研究[J];现代情报;2015年01期
10 王军;;浅谈“互联网+”时代的数字化校园建设[J];吉林教育;2016年43期
11 刘燕德;周衍华;赵文星;刘德力;;数字化果园信息采集方法的研究进展[J];中国农机化学报;2014年02期
12 陈文兴;;全员人口信息采集机制创新的实践与思考[J];人口与计划生育;2013年01期
13 舒通;;关于公安基层基础工作中信息采集应用问题的思考[J];公安研究;2012年08期
14 魏翠妮;;职业信息采集与大学就业指导[J];创新与创业教育;2012年04期
15 黄喜刚;于威;;高校毕业生就业信息采集工作探析[J];中国大学生就业;2009年10期
16 ;信息采集是所有应用系统功能发挥的基础环节——专访上海睿豪商贸有限公司向前总经理[J];城市轨道交通研究;2009年11期
17 常天庆;张波;王钦钊;;坦克嵌入式训练系统信息采集与处理技术[J];装甲兵工程学院学报;2008年06期
18 李力;任婕;杜彩凤;辛意;王天芳;;证候研究使用围绝经期综合征临床信息采集表的评价和优化[J];中医研究;2007年10期
19 章新川;汛情信息采集网络建设探讨[J];水电自动化与大坝监测;2004年05期
20 史宗伟;;黄河下游防汛信息采集体系建设[J];防汛与抗旱;2003年02期
中国重要会议论文全文数据库 前10条
1 李静;张建;李淼;胡泽林;杨巍;张浩东;;便携式农田信息采集与管理系统的设计[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
2 周洪清;;客户动销信息采集工作的思考[A];湖北省烟草学会2007年学术年会论文集[C];2007年
3 汤众;;空间信息采集中三维激光扫描技术应用[A];2006年全国高等学校建筑院系建筑数字技术教学研讨会论文集[C];2006年
4 刘丽丽;;一种用于加油站信息采集的中控机设计[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
5 张庆毛;李矿;;基于互联网思维的市场信息采集研究[A];中国烟草学会学术年会优秀论文集[C];2017年
6 吴传宇;方文熙;;精准农业中的土壤信息采集和平衡施肥[A];福建省农业机械学会2004年学术年会论文集[C];2004年
7 李广义;王瑜;赵溪;;防汛应急移动信息采集处理系统研究[A];2018(第六届)中国水利信息化技术论坛论文集[C];2018年
8 郑爱华;陈晓强;吴晓刚;叶伟康;杜倩昀;;水调系统信息采集优化[A];浙江省电力学会2013年度优秀论文集[C];2013年
9 柯俊帆;;物联网射频识别技术应用在棉包信息采集工作的研究[A];第十五届中国标准化论坛论文集[C];2018年
10 陈渝光;施海;游四海;廖仕利;;基于车载网络的多模态信息采集[A];四川省电工技术学会第九届学术年会论文集[C];2008年
中国博士学位论文全文数据库 前7条
1 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年
2 张卫正;基于视觉与图像的植物信息采集与处理技术研究[D];浙江大学;2016年
3 许金普;农产品市场信息采集的语音识别鲁棒性方法研究[D];中国农业科学院;2015年
4 周真;云平台下运行环境感知的虚拟机异常检测策略及算法研究[D];重庆大学;2015年
5 李琦;面向行人群信息提取的视频图像目标跟踪算法研究[D];北京交通大学;2013年
6 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年
7 舒昌俊;建设工程造价信息管理系统集成研究[D];武汉理工大学;2013年
中国硕士学位论文全文数据库 前10条
1 徐兴丰;语音/传真系统信息采集优化方法的研究[D];山东师范大学;2018年
2 杨红立;垂直分类信息采集及推荐系统的设计与实现[D];中国科学院大学(中国科学院沈阳计算技术研究所);2018年
3 李博涵;油气资源网络信息采集与分析方法研究[D];长江大学;2018年
4 乔静轩;基于HITS算法的微博采集系统设计与实现[D];山东师范大学;2018年
5 张丽;基于信息采集与监控的车联网服务系统的设计与实现[D];沈阳师范大学;2017年
6 汪思光;居民社区信息采集管理系统的设计与实现[D];湖北工业大学;2017年
7 郭会;基于有源RFID的高校人员信息采集与传输系统设计[D];河北大学;2017年
8 何宇南;深圳市龙岗区政府信息采集问题研究[D];广西民族大学;2016年
9 张刚;农业信息采集机器人结构及控制系统设计[D];东北林业大学;2016年
10 王小强;基于农业信息采集嵌入式系统的设计与实现[D];电子科技大学;2011年
中国重要报纸全文数据库 前10条
1 王海 蓝勇;一次信息采集 补发一笔涉军优待金[N];中国国防报;2018年
2 记者 马燕 通讯员 李茜茜;云南部署“一标三实”信息采集运用工作[N];人民公安报;2017年
3 廖雪莹;强化信息采集 摸清真实需求[N];东方烟草报;2018年
4 本报记者 阮仕喜 通讯员 康志峰;佳县白云山派出所信息采集“五项指标”全部达标[N];人民公安报;2018年
5 程小刚 蔡忠和;山阳全面完成党组织和党员信息采集[N];商洛日报;2018年
6 见习记者 张慧膑 记者 赵庆山;三亚将实现流动人口和出租屋信息采集全覆盖[N];三亚日报;2018年
7 记者 樊未晨;北京“幼升小”不参加信息采集不能入学[N];中国青年报;2014年
8 孙敬国;全方位采集 规范化应用[N];东方烟草报;2018年
9 记者 赵静;切实增强责任感使命感 按时保质完成信息采集工作[N];青海日报;2018年
10 曹钰华;南通:鲜活数据成为精确打防的源头活水[N];人民公安报;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978