收藏本站
《北京邮电大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于索引的web服务发现研究

李常宝  
【摘要】:web服务作为SOA有效的实现技术已经取得了很大的发展。与传统网页相比,web服务领域存在更加严重的信息孤岛问题。在Internet上,特定功能的web服务不仅淹没在web服务库中,同时也淹没在普通网页库中。因此,对web服务进行快速、准确的查找成为web服务领域亟待解决的问题,从而促生了人们对web服务发现领域的研究。 本文结合国家973计划“一体化可信网络与普适服务体系基础研究——普适服务的基础理论、模型与关键技术”项目,以面向服务的架构(Service Oriented Architecture, SOA)为基础,对web服务发现领域中的问题进行了研究,并取得了一定的成果。论文中的工作主要集中在以下几个方面: 1.选择一个恰当的形式化模型是web服务发现的基础。目前的web服务的形式化模型相对于原始的web服务描述文件,存在信息丢失或者信息强加现象。信息丢失主要表现在对web服务进行形式化时丢失了web服务描述文件中的大量有用信息,这种现象多出现在传统的基于关键词匹配的web服务发现方法中,这导致了在后续的web服务匹配中缺少依据,难以支持高准确性的查找;信息强加主要表现在形式化模型中包含了web基本服务描述文件中不存在、且难以获取或无从获取的信息,多出现在基于语义本体的web服务发现方法中,这导致后续的web服务匹配所依赖的信息在许多web服务中不存在,从而导致这类方法在Internet上推广困难。本文设计了一种web服务形式化模型。该模型基于web服务(组合)基本的描述文件,如wsdl文件、bpel文件等。较传统的基于关键词的web服务形式化模型,可以包含更丰富的语义信息;较基于语义本体的web服务形式化模型,其所有信息都可以由web服务(组合)的基本描述文件中获取。从而使得此形式化模型所支持的web服务发现系统能够更好的处理Internet上的web服务,从而具备更强的可推广性。 2.作为web服务发现的核心组件——web服务匹配,其准确性极大的影响着web服务发现的准确性。目前能够提供高准确性匹配的web服务匹配引擎绝大部分都依赖于本体库,借助于本体对象完善的描述信息实现更加准确的匹配。然而,目前并没有出现权威的本体库,web服务发现系统的本体库多是由服务发现系统创建者自己创立的,不同创建者创建的本体库难于一致、或兼容,这使得匹配失去了公认的基准,直接导致了理论上的完美与实践中难于的实现的矛盾。本文提出了一种能够支持高准确性匹配并不依赖于本体库的web服务匹配引擎。在自然语言描述匹配中设置了同义词扩展、本体库扩展接口(可选),本体库扩展接口是否引入不会对自然语言匹配引擎的准确性起到很大影响;web服务多数有效信息包含在在由多语义片段组成的多词拼接体命名中,处理由多语义片段组成的拼接体命名时,在并发使用概率的监督下,依次对命名体进行了同义词扩展、缩写词扩展、本体概念关系扩展(可选)、命名语义体归纳,在针对自然语言匹配引擎难于处理的多词拼接体命名的匹配中,取得了很高的准确率。整个匹配引擎表现出了高查准率和查全率,同时脱离了对本体的依赖。 3. Internet上的web服务性能差别很大。有的web服务描述信息与所提供的实体严重不符;有的web服务虽然服务描述与所提供的实体能够一致,但使用时响应时间太长,或者有的使用界面很不友好,使用起来很不方便。而这些web服务所提供的描述信息差别不大,如果仅仅基于这些描述信息的匹配结果进行服务查找,难以辨别这些性能不同的服务。本文提出了一种基于用户体验的web服务性能评估方法。借助于目前普通web网页的评估工具和理论,结合web服务本身的特点,我们提出了一种高可行性、低开销的web服务性能评估方法。通过对web服务信息与功能方面的评估来实现对web服务的整体性能评估。我们将该方法作为一个组件加入到web服务发现系统中,显著提高了web服务发现系统的查准率。 4查询准确性与查询请求处理时间是web服务发现系统最重要的两个衡量标准。目前的研究成果中存在低请求处理时间与高查询效率不可兼得的问题。低请求处理时间多出现在基于传统关键词匹配和索引架构的web服务发现系统中,它们能够保证低请求处理时间但查询准确性却难于保证;由于传统的关键词匹配在处理多词拼接体命名时准确性很低,从而导致了完成同一功能、被表达成不同形式的web服务查找不到,或查找到的结果中包含许多与用户需求不相关的web服务。高查询准确性多出现在基于语义本体的web服务发现系统中,这些方法通过引入语义本体来完善web服务描述,通过明确描述目标的各个属性达到精确匹配的目标;然而他们引入语义本体描述的同时也引入了本体推理机制,这些推理机制多基于自动机,需要进行服务间两两匹配;关键词被扩展成本体类,每个类的匹配需要进行多个属性的匹配,从而在完善关键词描述的同时也增大了关键词匹配的规模;这些使得基于语义本体的web服务发现系统在进行服务查找时的时间复杂度扩展到O(n2)(其中n为服务库中的属性总数)规模,当web服务库规模增大时,进行web服务发现的请求处理时间急速增大。本文提出了一种基于索引库的web服务发现架构。此架构基于索引库,有效的降低了服务发现时的查找空间,从而使得服务发现的处理时间可以控制在合理的范围内;在建立索引库的过程中,引入了语义挖掘,很大程度上克服了传统的不依赖本体库的索引架构查准率低的缺点;架构中引入了对web服务潜在组合方案的查找,进一步提高了查全率;增加了web服务性能评估组件用以优化匹配结果,提高了web服务发现的查准率。整个架构在实验评估时表现出了很高的查全率和查准率。解决了低请求处理时间与高查询效率不可兼得问题。
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP393.09

【相似文献】
中国期刊全文数据库 前10条
1 赵丽娜;周吉顺;;基于WEB的高校网上选课系统的设计与实现[J];电脑知识与技术;2011年18期
2 米新英;;基于Web的通用商品报价系统的研究与实现[J];北华航天工业学院学报;2011年03期
3 朱启英;李明霞;穆玉明;张源明;;基于WEB的考试系统在医学远程教育中的应用[J];中国高等医学教育;2011年06期
4 段静波;潘惠苹;;基于WEB的学院教务管理系统设计与应用[J];电脑知识与技术;2011年17期
5 范毅君;马永威;;浅谈门户网站的设计与在油田中的应用[J];中国石油和化工标准与质量;2011年07期
6 潘生;;基于WEB的人力资源管理专业亲验式教学资源库系统设计[J];电脑知识与技术;2011年23期
7 杜婷;陶克斌;夏勤;;基于Web的无刷新即时通讯设计与实现[J];重庆科技学院学报(自然科学版);2011年04期
8 王玉华;;Unix平台下的数据库查询开发工具(Web-DTools)的设计与实现[J];信息与电脑(理论版);2011年06期
9 张爱军;;电子商务技术的创新发展趋势[J];电脑知识与技术;2011年26期
10 钟寿福;吴伟信;;中学研究性学习网络支撑平台的设计与实现[J];福建电脑;2011年07期
中国重要会议论文全文数据库 前10条
1 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
3 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
8 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
10 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
中国重要报纸全文数据库 前10条
1 赵晓涛;Web安全 服务为王[N];网络世界;2008年
2 本报特约撰稿 张娟;用Web 2.0提升知识管理效率[N];计算机世界;2008年
3 厉民;金融风暴冲击Web2.0产业[N];人民邮电;2008年
4 电脑商报记者 周雪;Web安全市场须冷却慎行[N];电脑商报;2008年
5 郭川;Web2.0:新花样层出不穷[N];人民邮电;2008年
6 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
7 本报记者 李飞虎;Web 2.0[N];中国计算机报;2008年
8 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
9 商报记者 吴辰光;Web2.0凸显空洞概念[N];北京商报;2009年
10 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
中国博士学位论文全文数据库 前10条
1 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
2 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
3 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
4 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
5 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年
6 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
7 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
8 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
9 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年
10 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 张囡;基于概念的语义Web服务匹配算法的研究及其在配送中心系统的应用[D];华南理工大学;2010年
2 张敏;面向Web应用的测试适配技术研究[D];山东师范大学;2010年
3 涂丘;一种基于Web界面的协同文档管理系统的部署与实施[D];电子科技大学;2010年
4 崔宏亮;面向Web服务体系的协同办公系统的设计与实现[D];电子科技大学;2010年
5 高洁;基于Web信息的内容及其特征提取方法的研究[D];电子科技大学;2010年
6 李鹏;基于信誉度的Web服务选择研究[D];湖南工业大学;2009年
7 马丽莎;基于WEB操作平台下的办公自动化系统[D];电子科技大学;2009年
8 向剑峰;基于OWL-S的语义Web服务组合模型的研究[D];湖北工业大学;2011年
9 文星;基于位置感知的Web文本搜索技术研究[D];大连海事大学;2011年
10 郭清军;P2P语义web服务研究与实现[D];广东工业大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026