收藏本站
收藏 | 论文排版

基于Web信息提取的企业竞争情报获取研究

何云钢  
【摘要】:随着互联网的迅速发展和普及,网络已成为人们生活中不可缺少的一部分。网络中存在着各式各样的信息,这些信息以网页为载体,呈现在用户面前。网页中蕴含的丰富信息为企业竞争情报系统提供了新的情报信息来源。本论文的目的就是研究一种通用的企业竞争情报获取方式。在研究现有的Web信息提取技术的基础上,本文提出了基于DOM树和DBSCAN算法的Web信息提取算法,接着研究并构建了基于Web信息提取的企业竞争情报获取模型。首先,本论文全面系统的阐述了Web信息提取和企业竞争情报的研究现状,介绍了企业竞争情报系统和企业竞争情报获取的理论基础,并依次介绍了本论文将使用的几种网页数据处理技术,包括网络爬虫技术、Jsoup网页解析技术、DOM和DBSCAN算法。接下来详细介绍了Web信息提取的基本概念、技术分类和评价标准。其次,本论文针对互联网中网页结构多样、易变等因素,通过研究网页结构中存在的一般规律,并结合DOM树和DBSCAN聚类算法提出了新的Web信息提取算法。并详细介绍了算法中的几个环节,包括Web页面预处理、构建DOM树及分段文本内容获取、基于DBSCAN算法的网页内容提取。最后通过实验证明该算法能有效地获取网页中的正文文本信息,不依赖于网页结构,具有较强的通用性。最后,针对某一行业内的企业,基于网络爬虫技术、网页解析技术和Web信息提取算法构建企业竞争情报获取模型。该模型首先根据预留的网站网址,通过网络爬虫获取该网址下的所有链接。然后通过网页标题来判断网页是否与行业领域相关,初步筛选网页。对筛选后的网页进行网页主要内容获取,即获取该网页的正文文本信息。再根据预留的企业关注信息,提取网页正文文本中的企业竞争情报信息。最后基于该模型设计并实现了企业竞争情报获取原型系统,通过实验验证基于Web信息提取的企业竞争情报获取模型的正确性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 叶晨晖;企业竞争情报的获取与保护[J];图书情报知识;2001年01期
2 陈峰;企业竞争情报管理系统的构建研究[J];现代图书情报技术;2001年05期
3 柳宏坤;企业竞争情报的成本—效益分析[J];情报杂志;2002年11期
4 李建明;论企业竞争情报意识及其培育提高[J];科技情报开发与经济;2002年06期
5 佟慧敏;浅析企业竞争情报的保护[J];情报探索;2003年02期
6 周静怡,周琪;浅析企业竞争与企业竞争情报[J];现代情报;2003年01期
7 李建明;论企业竞争情报意识的培育[J];现代情报;2003年03期
8 刁松龄;国外企业竞争情报合法获取十八法[J];现代情报;2003年10期
9 张敏;企业竞争情报的保护[J];中国信息导报;2003年06期
10 陈飔;企业竞争情报:边缘的尴尬[J];软件工程师;2003年12期
11 王哲,陈清华;企业竞争情报的特征及作用[J];情报杂志;2004年01期
12 陈飔;企业竞争情报的服务模式[J];软件工程师;2004年06期
13 彭靖里,尚朝秋,杨斯迈;企业竞争情报需求调查的对象、内容和方法研究[J];情报杂志;2004年08期
14 陈飔;当代中国的企业竞争情报[J];软件工程师;2004年09期
15 陈飔;企业竞争情报真相羊皮卷(三)[J];信息空间;2004年10期
16 赵培云;;企业竞争情报专业队伍的状况与改进[J];图书馆杂志;2004年06期
17 龙雄,罗爱静;新环境下我国企业竞争情报的发展策略[J];科技情报开发与经济;2005年15期
18 杨蜀;我国企业竞争情报的现状、问题及对策[J];情报探索;2005年01期
19 沙淑欣;基于知识管理的企业竞争情报构建[J];图书与情报;2005年01期
20 岳凌云;;1989-2005年我国企业竞争情报论文的计量分析[J];情报科学;2006年04期
中国重要会议论文全文数据库 前5条
1 李南生;;国内外企业竞争情报现状分析[A];中国核科学技术进展报告——中国核学会2009年学术年会论文集(第一卷·第10册)[C];2009年
2 王湘武;李诰家;;试论企业竞争情报管理体系[A];信息时代——科技情报研究学术论文集(第二辑)[C];2006年
3 种振普;王秀芬;张申昌;韩晓;;谈企业竞争情报的技术应用[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
4 赵洁;;基于关系抽取的企业竞争情报获取与融合框架[A];国家自然科学基金委员会管理科学部宏观管理与政策学科青年基金获得者交流研讨会论文集[C];2010年
5 田文香;刘琳琳;张莉;蔡馨燕;;论我国技术创新型企业竞争情报体系的建立[A];信息时代——科技情报研究学术论文集(第二辑)[C];2006年
中国博士学位论文全文数据库 前3条
1 郑荣;企业竞争情报能力增长机理及其评价研究[D];吉林大学;2008年
2 乔林;基于多关键词检索的企业竞争情报搜集方法研究[D];中国科学技术大学;2006年
3 赵洁;面向Web的企业竞争情报获取研究[D];中国科学技术大学;2013年
中国硕士学位论文全文数据库 前10条
1 陶瑛;我国企业竞争情报体系建设研究[D];黑龙江大学;2008年
2 李军舰;企业竞争情报安全问题研究[D];南华大学;2008年
3 邓崇友;企业竞争情报的生产、技术与对策研究[D];中国海洋大学;2006年
4 桑朝君;企业竞争情报管理系统建设研究[D];天津大学;2006年
5 何云钢;基于Web信息提取的企业竞争情报获取研究[D];曲阜师范大学;2015年
6 赵纯;我国企业竞争情报发展的动力机制与实施机制研究[D];吉林大学;2009年
7 廖球辉;民营企业竞争情报发展战略研究[D];苏州大学;2010年
8 胡进;企业竞争情报推送服务研究[D];华东师范大学;2007年
9 柴斌峰;企业竞争情报能力的评价与培育机制研究[D];吉林大学;2007年
10 郭妍;企业竞争情报与知识管理的整合研究[D];黑龙江大学;2007年
中国重要报纸全文数据库 前8条
1 刘延彤;利用企业竞争情报 培养核心竞争力[N];青岛日报;2008年
2 北京易地平方信息技术有限公司总裁 王振强;用知识管理思想建设企业竞争情报[N];计算机世界;2002年
3 王琦 张旭;中国企业竞争情报现状调查[N];中国信息报;2007年
4 本报记者 田建军;竞争博弈技术 弥补企业竞争情报实战的缺憾[N];中国贸易报;2008年
5 仲继银;企业生存的第四种理由[N];中华工商时报;2002年
6 马力;企业竞争情报让企业“耳聪目明”[N];中国企业报;2009年
7 九三学社云南省委;关于进一步增强云南省企业技术创新能力的建议[N];云南政协报;2001年
8 采访人:本报记者 吴小莉;杨少锋:高校教育停留在计划经济时代[N];中国图书商报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978