收藏本站
《重庆大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

面向药品安全领域的Web信息采集研究与应用

刁维康  
【摘要】:近年来,药品安全突发事件频繁发生,中国连续出现了“齐二药”、“欣弗”等药品安全事件,这些事件暴露出药品监管工作中存在的一些不足。随着经济的发展、经营条件的放开,药品经营企业的数量日益增加,传统的监管模式已无法适应动态监管和主动监管的需要。为此我们设计开发了药品流通监控系统,为药品监督局的药品监管工作提供有力的支撑,提供详细全面的药品流通信息和问题药品信息。 本文从药品流通监控系统的关键子系统:问题药品信息采集子系统开发中所遇到的问题出发,研究了问题药品信息的来源的特征和内容结构,并针对Web信息采集所要使用的WebCrawler的爬行策略和Web信息抽取策略进行了研究,讨论了最适合本系统的WebCrawler中的爬行策略:基于模式匹配的链接筛选策略,并详细介绍了这种链接筛选策略所要采用的多模式特征匹配算法Wu_Manber94;讨论了基于DOM解析的Web表格信息抽取策略,并对表格信息抽取策略中的表格定位、数据表格发现、表格数据抽取3个关键问题进行了研究。在需求分析、总体设计和链接筛选策略和内容抽取策略探讨的基础上,对系统进行了总体设计和详细设计,并成功将基于模式匹配的链接筛选策略和基于DOM的Web表格信息抽取策略运用到系统实现中。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP393.09

【参考文献】
中国期刊全文数据库 前8条
1 张帆;林建;;智能搜索引擎信息过滤机制研究[J];图书与情报;2007年04期
2 孙立伟;何国辉;吴礼发;;网络爬虫技术的研究[J];电脑知识与技术;2010年15期
3 骆庆;;中文搜索引擎中的网络蜘蛛[J];福建电脑;2006年12期
4 陈灶芳 ,黄国涛;用于互联网信息搜索系统的网络蜘蛛设计与实现[J];广东科技;2005年01期
5 林海霞;原福永;陈金森;刘俊峰;;一种改进的主题网络蜘蛛搜索算法[J];计算机工程与应用;2007年10期
6 李盛韬;余智华;程学旗;白硕;;Web信息采集研究进展[J];计算机科学;2003年02期
7 邵斐;孙济庆;;一种适用于动态网页的网络蜘蛛爬行策略研究[J];情报杂志;2007年05期
8 贾林川;;互联网中文搜索引擎存在的问题与发展趋势探析[J];武警学院学报;2007年07期
中国硕士学位论文全文数据库 前5条
1 刘洁清;网站聚焦爬虫研究[D];江西财经大学;2006年
2 蒋科;基于领域概念定制的主题爬虫系统的设计与实现[D];西安电子科技大学;2007年
3 王旭东;基于Web的信息抽取技术研究[D];西南交通大学;2008年
4 潘小燕;半结构化文本中的表格信息抽取技术的研究[D];哈尔滨工业大学;2007年
5 金岳富;Web信息采集与信息抽取技术的研究[D];哈尔滨理工大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 朱华;浅谈网络信息资源采集技术[J];国家图书馆学刊;2004年02期
2 葛宇;梁静;陈晓敏;;搜索引擎系统中热点问题的探讨[J];成都电子机械高等专科学校学报;2009年04期
3 周静;;《系统建模语言UML》教学探讨[J];重庆电子工程职业学院学报;2009年04期
4 赵洋;滕桂法;张玉新;何冬梅;;基于Internet的农业信息垂直搜索引擎的设计[J];河北农业大学学报;2009年06期
5 宋思然;姜德录;王丽莉;郭丹阳;翟文杰;;辽宁省地震灾害快速评估系统设计与开发[J];东北地震研究;2009年01期
6 肖捷,肖正新,袁华强;MVC多层Web系统优化分层模型设计与应用[J];东莞理工学院学报;2005年05期
7 杨家伟;姚进;李涛;;改进的UML活动图在建模中的研究与实现[J];电子科技大学学报;2009年01期
8 徐留平;陈秉均;;基于UML的坦克分队C~3I系统建模[J];电脑开发与应用;2006年11期
9 陈洪猛;;基于垂直搜索技术的搜索引擎解决方案[J];电脑应用技术;2008年01期
10 夏忠华;张东亮;;网络登陆系统的UML设计[J];电脑知识与技术;2008年23期
中国重要会议论文全文数据库 前7条
1 王旭;杜军平;;质检总局互联网舆情监控系统中聚焦爬虫的研究[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
2 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年
3 邹永斌;陈兴蜀;王文贤;;一个高性能Web资源收集系统的设计与实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 李盛韬;吴丽辉;于满泉;潘文锋;余智华;王斌;程学旗;;主题Web信息采集的研究与设计[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 张凯;李魁;张刚;王斌;;基于站点的Web信息采集器研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 张凯;丁国栋;张刚;;GatherCore:一种面向采集系统的工具集[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 丁永慧;辛阳;;XSS漏洞动态扫描系统的设计与实现[A];2011年亚太智能电网与信息工程学术会议论文集[C];2011年
中国博士学位论文全文数据库 前3条
1 曾钦志;基于Multi-Agent的林产品配送中心建模与仿真[D];南京林业大学;2007年
2 刘强;基于样式的教学设计方法研究[D];南京师范大学;2008年
3 许红静;复杂产品数字样机集成分析建模方法研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前10条
1 冯效栋;垂直搜索引擎技术在网络舆情巡控中的研究与应用[D];中国海洋大学;2010年
2 宋保江;网络舆情检测与控制关键技术研究[D];哈尔滨工业大学;2010年
3 袁吕;基于话题检测与跟踪的话题搜索技术研究[D];哈尔滨工业大学;2010年
4 杨海宁;基于Struts/J2EE的网络教学评价系统的设计与实现[D];天津师范大学;2005年
5 王斌;基于SVG的电力图形平台研究[D];南京工业大学;2005年
6 卢莉莉;面向任务的人机交互模型研究及应用[D];重庆大学;2005年
7 刘雪飘;机器人足球比赛中的动态路径规划研究与系统软件设计[D];西北工业大学;2006年
8 李宁;联通传输综合网管系统的设计与电路调度子系统的实现[D];东北大学;2006年
9 赵佳鹤;基于语义分析的网络信息采集算法研究与应用[D];大连理工大学;2006年
10 陶新利;矿井局部通风设备故障诊断信息系统研究[D];西安科技大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 张魁麟,邵春福,王力劭;基于分布式并行算法的动态交通流分配研究[J];北方交通大学学报;2002年05期
2 胡凯;网络分布式并行计算的负载平衡[J];北京航空航天大学学报;2004年11期
3 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
4 吴相智,刘卫国,费洪晓;一种基于栈结构的HTML到XML的转换方法[J];长沙交通学院学报;2004年02期
5 闵洁;蒋廷耀;王敏;;基于Web2.0的XML数据交换技术[J];电脑知识与技术;2008年35期
6 彭绪富,邹友宽,邓荣华;INTERNET搜索引擎探解[J];高等函授学报(自然科学版);2001年01期
7 王桂云;基于Robot搜索引擎的信息检索技术[J];甘肃科技;2002年11期
8 张绍华,徐林昊,杨文柱,薛文玲,李天柱;基于样本实例的Web信息抽取[J];河北大学学报(自然科学版);2001年04期
9 陈少飞,郝亚南,李天柱,徐林昊,杨文柱;Web信息抽取技术研究进展[J];河北大学学报(自然科学版);2003年01期
10 刘林,汪涛,樊孝忠;主题爬虫的解决方案[J];华南理工大学学报(自然科学版);2004年S1期
中国博士学位论文全文数据库 前1条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
中国硕士学位论文全文数据库 前4条
1 陈鑫;中文智能搜索引擎[D];四川大学;2004年
2 贺智平;Web信息自动抽取技术研究[D];西安电子科技大学;2006年
3 陈佳;基于XML的Web信息抽取技术的应用研究[D];武汉理工大学;2007年
4 轩艳艳;基于XML的Web信息抽取研究与实现[D];武汉理工大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 程传鹏;郑源;;基于元搜索的主题式WebCrawler的研究[J];中原工学院学报;2006年02期
2 朱蓓;简评WebCrawler与MetaCrawler[J];情报杂志;1999年05期
3 唐波;;网络爬虫的设计与实现[J];电脑知识与技术;2009年11期
4 赵燕平,朱东华;科技信息的网络动态监测和信息自动获取技术研究[J];科学学研究;2003年S1期
5 赖福军 ,王彦锋;网络世界的指南针——Internet搜索引擎[J];中国计算机用户;1997年05期
6 吴华香,钟少丹;网络计量学的应用分析[J];图书情报工作;2003年08期
7 邱均平;陈敬全;段宇锋;;中国大学网站链接分析及网络影响因子探讨[J];中国软科学;2003年06期
8 董江山,胡吉祥,邱均平;链接分析法及其应用[J];情报科学;2004年09期
9 陈太洋;;我国大学图书馆网站链接的实证分析——以中国“211工程”高校为例[J];图书馆杂志;2007年03期
10 周涛;陈向东;;基于链接分析的网站评价[J];广西教育学院学报;2008年04期
中国重要会议论文全文数据库 前7条
1 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 任海果;张淼;;基于站内搜索的分布式主题爬虫的研究与设计[A];2011年亚太智能电网与信息工程学术会议论文集[C];2011年
3 梁勇;张文;;网络舆情采集系统的设计[A];2011年全国通信安全学术会议论文集[C];2011年
4 白光平;李伟;;楚文化地图系统的建立[A];江苏省测绘学会2011年学术年会论文集[C];2011年
5 A.C.M.Fong;;An intelligent offline filtering agent for website analysis and content rating[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
6 孙周军;肖文名;;基于组合策略网页防篡改系统实现方法研究[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年
7 程登发;;Internet上植物保护信息资源的获取与发布[A];“植物保护21世纪展望”——植物保护21世纪展望暨第三届全国青年植物保护科技工作者学术研讨会文集[C];1998年
中国重要报纸全文数据库 前10条
1 湖北 冯晓玲;快速调用记事本编辑网页文件[N];电脑报;2003年
2 王晓峰;随时更新的校园信息板[N];中国电脑教育报;2003年
3 迈巴赫 编译;搜索引擎20年[N];计算机世界;2010年
4 海浪轻风;一二三说变就变[N];中国电脑教育报;2005年
5 ;网站安全必不可少的保护神[N];中国计算机报;2005年
6 天涯;利用卡巴斯基删除顽固文件[N];电脑报;2007年
7 邹本堃;“磁碟机”与“熊猫烧香”谁比谁更毒[N];中国消费者报;2008年
8 刘成富;编辑网页有妙法[N];计算机世界;2004年
9 何咏明 尹有仁;用VFP管理网页文件[N];中国计算机报;2001年
10 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 段宇锋;网络链接分析与网站评价研究[D];武汉大学;2004年
2 褚武英;三种石首鱼紧密连锁的α-和β-珠蛋白基因的克隆及其顺式调控元件的分析[D];浙江大学;2006年
3 黄华军;网页信息隐藏与隐秘信息检测研究[D];湖南大学;2007年
4 刘洪波;INTERNET中的信息网络提取分析及Rank相关研究[D];清华大学;2007年
5 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年
6 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
7 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
8 吴刚;RDF图数据管理的关键技术研究[D];清华大学;2008年
9 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年
10 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 刁维康;面向药品安全领域的Web信息采集研究与应用[D];重庆大学;2010年
2 张宁;面向农业信息的主题爬虫的研究与设计[D];北京邮电大学;2010年
3 屠辉;中文重复网页的检测算法研究[D];北京邮电大学;2010年
4 易方昶;基于网页后门木马监测系统的研究和设计[D];北京化工大学;2010年
5 黄伟光;网页木马的防御与检测技术研究[D];北京交通大学;2011年
6 尹力;网页防篡改系统在校园网中的应用研究[D];河北科技大学;2011年
7 史晶晶;基于CRF的Web机构实体信息抽取系统[D];吉林大学;2011年
8 孔辉;一种网页防篡改系统的设计与实现[D];北京邮电大学;2011年
9 王征;基于布隆过滤器算法的网页消重技术的实现与应用[D];北京交通大学;2010年
10 孙鹏;网页水印技术研究[D];上海交通大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026