收藏本站
《中国科学技术大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

面向web的企业竞争情报获取

陈艳  
【摘要】: 随着互联网的高速发展,越来越多的企业把信息发布在互联网上,企业竞争情报的获取也逐步由传统的方式向面向Web的获取转变。如何从Web中获取企业竞争情报已成为目前Web信息抽取和企业竞争情报研究中的热点问题。 本文以Web网页为研究对象,主要探讨了利用Web信息抽取与关系抽取等技术从Web网页中采集企业竞争情报的相关问题,重点研究了基于本体的企业竞争情报获取方法,并以汽车领域网页为抽取对象,研究了产品名,出售价格和产品名,上市时间等企业竞争情报的抽取方法。在大规模网页集上的实验表明,本论文提出的基于本体的企业竞争情报抽取方法为企业竞争情报的获取提供了统一的参考模式,可以有效地抽取出Web网页中蕴含的竞争情报,具有减少后续情报分析的工作量、提高企业竞争情报生成的准确性等优点。 本论文的主要贡献如下: 1、提出了基于本体的企业竞争情报获取框架,采用统一的结构化方法描述网页中的企业竞争情报,从而为企业情报的获取提供了领域本体参考,通过本体的实例化即可实现企业竞争情报的构建。论文首先详细分析了引入本体作为面向Web竞争情报信息获取的数据模型的原因;然后详细描述企业竞争情报本体的构建过程。 2、提出了一种基于DOM树和两层角色HMM标注的产品命名实体识别算法,实验表明该算法具有较好的识别效果。在该算法中,我们首先利用DOM树去掉HTML标记,对叶子节点内容在分词词性标注基础上引入两层角色HMM识别产品命名实体,第一层角色HMM标注品牌、型号、系列实体,第二层标注产品实体。采用Viterbi算法标注概率最大的角色序列,然后在角色序列的基础上,定义模式识别出命名实体。 3、提出并实现了一种基于模式匹配的中文网页中目标实体关系实例抽取的算法,该算法具有普适性,可对不同类型实体关系做抽取,并加入模式和实体对的可信度计算,实验表明该算法对中文自由文本中的实体关系抽取具有较好的效果。在实体关系实例抽取中,我们将产品网页内容分为表格文本和自由文本。表格文本信息的处理主要采用了表格的上下位置关系。自由文本的处理采用基于模式匹配的方法,运用自举循环方法生成模式集合,并且在模式和目标实体关系实例生成过程中加入可信度计算以控制生成的模式和目标实体关系实例的质量。
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP399-C2

【引证文献】
中国期刊全文数据库 前1条
1 拓晓瑞;;连锁企业竞争情报工作的风险识别与防范对策[J];企业活力;2012年05期
中国硕士学位论文全文数据库 前1条
1 刘翌阳;饮料包装行业SD公司竞争情报系统构建研究[D];河北大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 李向阳,苗壮;自由文本信息抽取技术[J];情报科学;2004年07期
3 马静;倪辉峰;;基于模式匹配抽取技术的网上产品情报获取[J];情报理论与实践;2007年02期
4 王昊;苏新宁;;基于模式匹配的中文通用本体概念抽取模型[J];情报理论与实践;2008年02期
5 陈琼,赵燕平;基于Internet的企业竞争情报系统研究综述[J];情报杂志;2003年10期
6 毕蕾;沈洁;徐法艳;魏榴花;朱燕;孙荣霜;;领域本体指导的Web商品信息抽取[J];计算机工程与设计;2008年24期
7 陈峰;竞争情报概念及相关因素分析[J];图书情报知识;2003年01期
8 陈静;朱巧明;贡正仙;;基于Ontology的信息抽取研究综述[J];计算机技术与发展;2007年10期
9 鞠可一;葛世伦;;基于数据挖掘技术创建企业本体[J];微计算机信息;2006年18期
10 邓尚民;孙玉伟;;信息抽取系统的研究现状[J];现代图书情报技术;2006年03期
【共引文献】
中国期刊全文数据库 前10条
1 ;[J];;年期
2 ;基于Agent技术的语义网服务模型[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 黄洪;刘增良;余达太;周绍华;;[J];兵工学报;2010年12期
中国重要会议论文全文数据库 前10条
1 李贵;张兆鑫;李征宇;韩子洋;;WEB环境下基于领域本体的语义匹配技术研究[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年
2 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 王建州;李廉;汪映海;;面向Ontology的电力信息系统的研究[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
5 刘耀;穗志方;胡永伟;冀铁亮;;领域Ontology自动构建研究[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
6 郑笈;李思昆;陆筱霞;;大规模场景绘制的存储数据调度组织研究[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
7 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
8 杨昆;王军;彭双云;;基于Ontology的空间信息互操作初步研究[A];中国地理信息系统协会第八届年会论文集[C];2004年
9 范志煜;肖兵;沈薇薇;;基于概率本体的态势估计应用研究[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
10 贾凌燕;陆一平;;浅谈ontology方法及其发展[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 卜志国;海洋生态环境监测系统数据集成与应用研究[D];中国海洋大学;2010年
2 熊晶;海洋生态本体的建模方法研究及应用[D];中国海洋大学;2010年
3 张俐;面向概念设计方案选择的协同决策方法研究[D];华中科技大学;2010年
4 韩赟;高技术虚拟企业(HTVE)知识管理模式研究[D];哈尔滨理工大学;2009年
5 王亚萍;需求驱动的个性化产品配置设计方法研究[D];哈尔滨理工大学;2010年
6 吴礼龙;基于信息生态的竞争情报系统构建研究[D];南开大学;2010年
7 王强;空间信息服务聚合的关键技术研究[D];解放军信息工程大学;2010年
8 游颖;客车信息集成控制系统配置设计中的分解技术研究[D];武汉理工大学;2010年
9 连莉;本体中非分类关系的理论体系研究[D];山东大学;2010年
10 魏巍;定制产品智能重组设计关键技术与方法研究及其应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 厉颖;基于本体的服装领域知识表示的建模研究[D];山东科技大学;2010年
2 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年
3 吕媛媛;基于本体的物流信息集成系统的研究[D];山东科技大学;2010年
4 白冰;基于数据处理中心的企业竞争情报系统研究[D];山东科技大学;2010年
5 许坤;基于本体的应急信息管理系统的研究与设计[D];郑州大学;2010年
6 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
7 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
8 刘海娇;基于魔力平台的需求分析系统的研究与实现[D];哈尔滨工程大学;2010年
9 杜娟;基于语义网格的知识地图资源组织研究与应用[D];哈尔滨工程大学;2010年
10 赵阳耀;基于本体的数据源映射方法与策略[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 刘玉照,刘建准,范志雯;基于C/S与B/S集成模式的企业竞争情报系统构建研究[J];情报科学;2005年03期
2 化柏林;郑彦宁;;情报转化理论(下)——从信息到情报的转化[J];情报理论与实践;2012年04期
3 孙明军,杨建林;竞争情报工具现状分析[J];情报杂志;2004年12期
4 江汶,邱晓琳,佘诗武;竞争情报决策的信息风险分析及控制研究[J];情报杂志;2005年04期
5 夏晨曦;;一种关键情报课题管理模型[J];图书情报工作;2009年24期
6 陈峰;竞争情报概念及相关因素分析[J];图书情报知识;2003年01期
7 韩福荣;;《卓越绩效评价准则》标准的理论视角[J];标准科学;2012年05期
8 雷晨;;经济情报泛谈[J];现代商业;2008年08期
9 贺桂和;谭春辉;;中国竞争情报专业组织成立以来国内竞争情报研究轨迹一瞥——基于1994-2005年国内核心期刊载文的计量分析[J];现代情报;2007年06期
10 卞长云;;基于网络时代的高校图书馆竞争情报服务模式的探析[J];现代情报;2009年06期
中国硕士学位论文全文数据库 前5条
1 赵春玲;LT省公司竞争情报管理研究[D];哈尔滨工程大学;2011年
2 郭妍;企业竞争情报与知识管理的整合研究[D];黑龙江大学;2007年
3 李春锋;大型制造企业竞争情报系统构建及评价研究[D];吉林大学;2008年
4 陈小芳;基于数据挖掘的企业竞争情报系统应用研究[D];合肥工业大学;2008年
5 孙晓军;政府竞争情报系统的构建与运行研究[D];苏州大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 李向阳,苗壮;自由文本信息抽取技术[J];情报科学;2004年07期
2 汪方胜,侯立文,蒋馥;领域本体建立的方法研究[J];情报科学;2005年02期
3 李超;王兰成;;应用领域本体的Web信息知识集成研究[J];情报科学;2007年03期
4 苗杰,倪波;集成环境下的竞争情报系统设计研究[J];情报理论与实践;2000年05期
5 丁晟春;李岳盟;甘利人;;基于顶层本体的领域本体综合构建方法研究[J];情报理论与实践;2007年02期
6 包昌火;开展竞争情报研究 促进我国信息服务业的发展[J];情报理论与实践;1995年01期
7 邹涛,黄源,张福炎;基于WWW的文本信息挖掘[J];情报学报;1999年04期
8 谢新洲,李娜,黄绍起;我国企业信息化与竞争情报的实态调查(上)[J];情报学报;2001年03期
9 苗杰,倪波;面向集成竞争情报系统的数据挖掘应用研究[J];情报学报;2001年04期
10 秦铁辉,李艳,任小伟;企业竞争中Internet上信息的获取和利用[J];情报学报;2002年06期
中国博士学位论文全文数据库 前1条
1 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
中国硕士学位论文全文数据库 前3条
1 张绍华;基于实例的Web信息抽取[D];河北大学;2001年
2 李跃进;基于Internet的信息抽取技术研究[D];大连理工大学;2005年
3 张全力;面向产品设计的中文web文本信息处理研究[D];西北工业大学;2005年
【相似文献】
中国博士学位论文全文数据库 前4条
1 ;[D];;2011年
2 ;[D];;2011年
3 ;[D];;2011年
4 ;[D];;2011年
中国硕士学位论文全文数据库 前10条
1 ;[D];;IY年
2 ;[D];;IY年
3 ;[D];;IY年
4 ;[D];;IY年
5 ;[D];;IY年
6 ;[D];;IY年
7 ;[D];;IY年
8 ;[D];;IY年
9 ;[D];;IY年
10 张磊;[D];吉林大学;盻_?年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026