收藏本站
《武汉工程大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

面向互联网的中文地址语义解析方法研究

谢婷婷  
【摘要】:随着互联网技术的发展,网页中所涉及的地理信息也越来越多,成为地理信息获取和更新的重要途径。网页中的地址信息是以文本化的形式存在,由于中文之间没有分隔符,大大妨碍了计算机直接理解此地址信息所描述的地理位置语义,使得这些地址信息无法转换为空间坐标映射到地图上,为人们提供精确的定位。因此,为了使计算机能够理解中文地址的位置语义信息,建立非空间信息到空间信息的映射,研究从互联网上获取的中文地址的语义解析方法具有重要的应用价值。本文以从互联网上通过网络爬虫获取的中文地址作为研究对象。针对文本化的中文地址的语义解析,本文采用基于统计的中文地址分词方法,该方法不依赖于地名词典,主要是先通过统计从互联网上爬取得的25万条地址数据构成的语料库的词频,计算相邻词语之间的互信息,词语的信息熵,然后对地名地址串进行全切分处理,得到所有分词方案,通过计算选择弧段开销最小的分词方案,最后通过置信度计算得到分词结果。在该基础上,本文采用了基于贝叶斯模型的中文地址要素语义标注方法对切分出来的中文地址进行语义标注,该方法通过构建中文地址要素的标注体系表,统计地址标注语料中每种地址表达模式的概率,并以标注状态作为节点构建一个地址表达模式树,记录经过每个节点的次数,然后计算出每个地址要素在某一个地址标注状态的费用和前一个地址要素最有可能的地址标注状态,通过回溯得到中文地址的语义标注序列。本文的中文地址语义解析方法采用来自于互联网的不同数量的中文地址数据进行实验,对不同数量的地址语料库的实验结果进行了深入的分析,并与其他方法进行对比分析。实验结果分析表明,在没有地名词典的条件下,本文方法对于中文地址的分词具有较好的效果,且能够对切分出的地址要素进行语义标注,使得文本化的中文地址能够直接被计算机应用于地理位置信息服务。
【学位授予单位】:武汉工程大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 朱飞;;IPv6:等待还是采用[J];互联网周刊;1998年08期
2 薛咏;;移动自组网地址配置问题的研究[J];信息技术;2006年10期
3 裴志利,邱晓丹,张智丰;对动态IP地址进行捕获和应用的一般方法[J];内蒙古民族大学学报(自然科学版);2005年02期
4 风帆;;交换机的FDB地址[J];网络与信息;2009年06期
5 杜振华;齐建东;解冲锋;吴燕;;下一代互联网IPv6客户业务地址的研究[J];计算机应用;2009年S1期
6 蒋友;罗惠琼;;二层交换机中MAC地址的学习、查找和老化方法[J];软件导刊;2005年20期
7 刘化召;;IBSS地址标准化实现策略[J];电信技术;2007年07期
8 喻勇;;地址与资源匹配模式的探讨[J];江苏通信;2010年06期
9 虞军伟;浅谈IPv6地址的无状态自动发现[J];电脑知识与技术;2005年24期
10 ;MSN中的错误地址如何删除?[J];计算机与网络;2007年14期
中国重要会议论文全文数据库 前7条
1 李莉;朱秀丽;朱雪征;;地址与地址标准化研究[A];地理学核心问题与主线——中国地理学会2011年学术年会暨中国科学院新疆生态与地理研究所建所五十年庆典论文摘要集[C];2011年
2 宗宏亮;;信息产业部ICP/IP地址信息备案管理系统应用分析[A];通信发展战略与管理创新学术研讨会论文集[C];2006年
3 王秀清;于祯;;应用DSP的扩展地址处理中断的方法[A];第二届全国信息获取与处理学术会议论文集[C];2004年
4 孙琼;解冲锋;冯明;;下一代互联网轻量级过渡技术及应用[A];下一代互联网与应用研讨会论文集[C];2011年
5 安宁;;IP地址盗用接口的快速定位模型[A];河南省通信学会2005年学术年会论文集[C];2005年
6 于淼;吕雅娟;苏劲松;李贤华;;规则和统计相结合的中文地址翻译方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 周佳庆;李晓燕;陈珂;胡天磊;陈刚;;一种自学习的中文地址判重算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
中国重要报纸全文数据库 前10条
1 张曦;帮你了解邮政基础地址库[N];中国邮政报;2004年
2 ;常德局地址库喜迎第一单[N];中国邮政报;2005年
3 本报记者 王翌;“团购”IPv6[N];计算机世界;2004年
4 ;互联网IP地址备案管理办法[N];人民邮电;2005年
5 河北 吴培森;巧取IP地址信息[N];电脑报;2003年
6 安徽 高飞;网络沟通的桥梁[N];中国电脑教育报;2004年
7 小渔;MSN中的错误地址如何删除[N];中国电脑教育报;2005年
8 汪敏;谈IP地址自动修改的 功能移植[N];中国电脑教育报;2003年
9 汉风唐韵;用MAC地址拴住“你”[N];电脑报;2005年
10 郑木昌;如何提高名址匹配率[N];中国邮政报;2007年
中国博士学位论文全文数据库 前1条
1 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 谢婷婷;面向互联网的中文地址语义解析方法研究[D];武汉工程大学;2017年
2 边浩江;ARP欺骗的侦测及防御方法的研究与实现[D];昆明理工大学;2015年
3 窦凤虎;移动网络数据资源管理系统设计与实现[D];北京工业大学;2015年
4 汪禺;杭州下沙公安分局入户访查系统的设计与实现[D];电子科技大学;2014年
5 李震宇;IPv6技术应用及Windows平台下的通信测试[D];西安工业大学;2012年
6 梁东阳;中文地址名称识别算法设计和实现[D];天津大学;2015年
7 傅玉欣;地址簇转换测试方案设计与实现[D];华中科技大学;2016年
8 姚心宇;中文地址识别系统中的地址表达与匹配[D];华东师范大学;2012年
9 江礼根;中文歌曲在泰国高校中文选修课中的应用研究[D];云南师范大学;2017年
10 李卫娜;IPv6节点地址的分配模式研究与管理实现[D];北京交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026