收藏本站
《北京邮电大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

面向手机短信的命名实体识别研究

刘海鹏  
【摘要】: 命名实体识别(Named Entity Recognition:NER)是自然语言处理(Natural Language Processing:NLP)的基础任务之一,它在信息检索和抽取、机器翻译、问答系统等许多任务中都有十分重要的应用。本文面向手机短信,研究其中的命名实体识别问题。主要工作包括: 1、面向手机短信的命名实体识别知识库构建。 在充分研究手机短信以及其中命名实体的语言及构词特点之后,提取了大量的手机短信中人名、地名、组织机构名的特点,针对这些特点,分别为人名识别、地名识别和组织机构名识别建立了相应的专家知识。 2、混合运用专家知识和条件随机场模型进行手机短信的命名实体识别。 根据实体类型的不同,分别采用不同的识别方法,人名、地名识别采用依次运用专家知识和条件随机场模型的方式;而组织机构名识别采用规则的方法进行识别。 实验表明,本文的方法在对手机短信进行命名实体识别时具有较好的识别结果。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.4

【引证文献】
中国期刊全文数据库 前1条
1 吴中彪;刘椿年;;面向中文短信的信息抽取方法[J];计算机工程;2011年21期
中国重要会议论文全文数据库 前1条
1 毛存礼;余正涛;线岩团;郭剑毅;雷雄丽;;基于短信的旅游景点酒店问答系统研究[A];中国自动化学会控制理论专业委员会A卷[C];2011年
中国博士学位论文全文数据库 前2条
1 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
中国硕士学位论文全文数据库 前1条
1 毛存礼;基于短信的旅游领域实体问答系统研究[D];昆明理工大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
2 宇缨;王晓龙;刘秉权;;一种基于SVM/RS的中文机构名称自动识别方法[J];电子与信息学报;2006年05期
3 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
4 余祖波;高庆狮;马建军;;基于多级阈值的中文人名识别[J];计算机工程与应用;2007年33期
5 贾宁;张全;;基于最大熵模型和规则的中文姓名识别[J];计算机工程与应用;2007年35期
6 邓擘;樊孝忠;杨立公;;用语义模式提取实体关系的方法[J];计算机工程;2007年10期
7 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
8 向晓雯,史晓东,曾华琳;一个统计与规则相结合的中文命名实体识别系统[J];计算机应用;2005年10期
9 孟伟涛;张蕾;张晓孪;李海军;;一种基于位置概率模型的中文人名识别方法[J];计算机应用与软件;2008年04期
10 王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的识别[J];中文信息学报;2002年02期
中国重要会议论文全文数据库 前1条
1 张云涛;龚玲;王永成;;识别中文文本中的未登录专有名词的类别[A];2007年中国智能自动化会议论文集[C];2007年
【共引文献】
中国期刊全文数据库 前10条
1 于江德;王希杰;;词位标注汉语分词技术详解[J];安阳师范学院学报;2010年05期
2 葛文英;吕靖;;基于条件随机场的中文人名识别[J];安阳师范学院学报;2010年05期
3 段建勇;李俊;张梅;马礼;;限定领域的自动问答系统研究[J];北方工业大学学报;2010年01期
4 杨尔弘;;媒体5年词语使用情况调查分析[J];北华大学学报(社会科学版);2011年04期
5 刘文华;康海燕;;领域问答系统生成器的研究[J];北京信息科技大学学报(自然科学版);2009年03期
6 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
7 李玉森;张雪英;袁正午;;面向GIS的地理命名实体识别研究[J];重庆邮电大学学报(自然科学版);2008年06期
8 史永刚;左志宏;;决策树在中文姓名信息提取中的应用研究[J];成都信息工程学院学报;2006年02期
9 窦嵘;加羊吉;黄伟;;统计与规则相结合的藏文人名自动识别研究[J];长春工程学院学报(自然科学版);2010年02期
10 李建平;王慧强;卢爱平;郝洪亮;冯光升;;基于条件随机场的网络安全态势量化感知方法[J];传感器与微系统;2010年10期
中国重要会议论文全文数据库 前10条
1 李金;宋阳;梁洪;;语言残障患者医疗辅助系统设计[A];第九届全国信息获取与处理学术会议论文集Ⅱ[C];2011年
2 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 何正焱;王厚峰;;商品品牌名称挖掘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
7 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
8 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
9 侯敏;侯敞;;汉英机译系统译文质量的评测[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
10 熊文新;宋柔;;信息检索查询语句的表述分析[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
2 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
3 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
4 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
5 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
6 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
7 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
8 张浩;视频运动人体行为识别与分类方法研究[D];西安电子科技大学;2011年
9 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
10 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
中国硕士学位论文全文数据库 前10条
1 罗义兵;领域文本相似度计算方法研究[D];山东科技大学;2010年
2 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年
3 张燕丽;基于Winnow算法和CAPTCHA的垃圾短信过滤研究[D];郑州大学;2010年
4 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
5 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
6 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
7 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
8 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
9 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
10 季元叶;语言学特征在中文命名实体间语义关系抽取中的应用研究[D];苏州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张小平;周雪忠;黄厚宽;冯奇;陈世波;焦宏官;;一种改进的LDA主题模型[J];北京交通大学学报;2010年02期
2 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
3 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
4 李蕾;周延泉;王菁华;;基于全信息的中文信息抽取系统及应用[J];北京邮电大学学报;2005年06期
5 闫瑞;曹先彬;李凯;;面向短文本的动态组合分类算法[J];电子学报;2009年05期
6 王娜;李霞;;基于监督信息特性的主动半监督谱聚类算法[J];电子学报;2010年01期
7 孔万增;孙志海;杨灿;戴国骏;孙昌思核;;基于本征间隙与正交特征向量的自动谱聚类[J];电子学报;2010年08期
8 钱鹏江;王士同;邓赵红;徐华;;基于最小包含球的大数据集快速谱聚类算法[J];电子学报;2010年09期
9 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
10 王凤林;余正涛;毛存礼;郭剑毅;;利用问句语义结构构建旅游领域数据库查询[J];广西师范大学学报(自然科学版);2009年01期
中国重要会议论文全文数据库 前1条
1 苏祺;孙斌;;面向观点挖掘的产品评价特征词识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
2 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
3 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
4 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
5 李景;领域本体的构建方法与应用研究[D];中国农业科学院;2009年
6 寇广增;基于意见挖掘通用框架的情感极性强度模糊性研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前7条
1 张校乾;基于Lucene的全文检索系统的研究与应用[D];大连理工大学;2005年
2 陈建;领域本体的创建和应用研究[D];对外经济贸易大学;2006年
3 郭嘉琦;领域本体的构建及其在信息检索中的应用研究[D];北京邮电大学;2007年
4 彭其伟;基于统计方法的中文文本情感倾向分类研究[D];山西大学;2007年
5 张志刚;领域本体构建方法的研究与应用[D];大连海事大学;2008年
6 曹斌;互联网上旅游评论的情感分析及其有用性研究[D];哈尔滨工业大学;2008年
7 杨靖;领域本体自动构建的关键技术研究[D];哈尔滨工业大学;2008年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 杨志海;台风灾害信息抽取及动态可视化研究[D];福建师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
3 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
4 李元祥,丁晓青,吴佑寿;一种基于字词结合的汉字识别上下文处理新方法[J];计算机研究与发展;2002年07期
5 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
6 黄磊,刘昌平;信函自动分拣软件系统[J];计算机工程与应用;2003年19期
7 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
8 余祖波;高庆狮;方淼;;中文姓名自动识别系统的设计与实现[J];计算机工程与应用;2006年10期
9 谭红叶,郑家恒,刘开瑛;中国地名自动识别系统的设计与实现[J];计算机工程;2002年08期
10 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
中国重要会议论文全文数据库 前3条
1 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 罗春华;张继勇;郑方;徐明星;;一种基于HTK的词图搜索算法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 吴友政;赵军;段湘煜;徐波;;构建汉语问答系统评测平台[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【相似文献】
中国期刊全文数据库 前10条
1 何玉兰;实用修辞在手机短信中的运用[J];河北工程技术职业学院学报;2004年02期
2 ;手机趣闻多[J];数字生活;2006年08期
3 郝晓云;;短信在人际传播中的优势与缺陷[J];今传媒;2007年05期
4 沈保华;;浅议手机短信的著作权问题[J];科协论坛(下半月);2007年12期
5 张素香;高国洋;戚银城;;基于条件随机场的中国人名识别方法[J];郑州大学学报(理学版);2009年02期
6 彭斐;;没完没了的“信骚扰”[J];记者观察(上半月);2009年07期
7 包毅;;手机短信在广播节目中的作用[J];现代视听;2009年S2期
8 ;保驾护航 手机安全全防护[J];电脑迷;2010年10期
9 唐达鹏;;商务通短信王8836[J];电子测试;2002年03期
10 小光;手机短信为虎作伥 网络黄毒大肆蔓延[J];网络与信息;2003年06期
中国重要会议论文全文数据库 前10条
1 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
2 李渝勤;孙丽华;;面向互联网舆情的热词分析技术[A];第六届全国信息检索学术会议论文集[C];2010年
3 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
4 倪桓;;手机短信传播中的新型人际关系[A];第五届全国新闻与传播心理研讨会暨中国心理学会新闻与传播心理专业委员会第二届年会论文集[C];2005年
5 齐振宇;赵军;杨帆;;一种开放式中文命名实体识别的新方法[A];第五届全国信息检索学术会议论文集[C];2009年
6 李定平;常晓明;姚世选;;自动雨量站信息GSM短信服务系统的设计与实现[A];信息技术在气象领域的开发应用论文集(二)[C];2006年
7 黄春燕;;家校通让师爱闪光[A];国家教师科研基金十一五阶段性成果集(广西卷)[C];2010年
8 翟海军;郭嘉丰;王小磊;许洪波;;基于用户查询日志的命名实体挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 毛力群;;“拇指文化”演绎语言新时尚——手机短信的语体分析[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
10 曾海清;谌剑波;;论手机短信交际中的语言艺术[A];江西省语言学会2006年年会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 本报记者 邹愚;公安部督战 泉州“紧急戒备”手机短信诈骗[N];21世纪经济报道;2004年
2 本报记者 :周文林;春节手机短信120亿条 “拇指经济”能量凸显[N];经济参考报;2006年
3 冯晓芳;春节手机短信凸显“拇指经济”能量[N];民营经济报;2006年
4 周文林;春节手机短信凸显“拇指经济”[N];人民日报海外版;2006年
5 记者  闫莹莹 通讯员  谭政;发个手机短信 寄去“亲情汇款”[N];中山日报;2007年
6 南辰;燃油涨价谣言兴风作浪,应追查到底[N];新华每日电讯;2008年
7 于忠庆;手机短信诈骗到底该如何防范?[N];科技日报;2005年
8 黄金兰;短信文学火得起来吗?[N];工人日报;2005年
9 大龙;遥控电脑手机短信也可以![N];中国计算机报;2005年
10 汤啸天 刘英明 魏宇清;手机短信传播功能的法学思考[N];人民法院报;2005年
中国博士学位论文全文数据库 前10条
1 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
2 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
3 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
4 许云红;基于网络方法的专家知识推荐[D];中国科学技术大学;2010年
5 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
6 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
7 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
8 许若宁;基于模糊信息处理的组合投资决策方法研究[D];华中科技大学;2005年
9 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
10 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
中国硕士学位论文全文数据库 前10条
1 刘海鹏;面向手机短信的命名实体识别研究[D];北京邮电大学;2009年
2 周昆;基于规则的命名实体识别研究[D];合肥工业大学;2010年
3 孙静;基于组合分类器的生物命名实体识别[D];大连理工大学;2010年
4 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
5 万鑫;基于文本分类的命名实体识别系统[D];北京邮电大学;2009年
6 江超男;面向社会网络应用的关系抽取研究[D];南京理工大学;2010年
7 陈扬;基于命名实体识别的学科智能答疑模型研究[D];东北师范大学;2010年
8 殷悦;173条拟误型手机短信的幽默生成机制[D];四川外语学院;2010年
9 张培君;从传播学的角度解读手机短信的媒体角色[D];郑州大学;2005年
10 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026