收藏本站
《哈尔滨工业大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Android的语句级智能汉字输入法研究

刘峰  
【摘要】: 汉字输入技术一直是中文自然语言处理研究的热点问题之一,具有广泛的应用前景。本课题主要研究智能移动平台下的语句级智能汉字输入技术,并在新出现的移动平台操作系统—Android下,提出了一套新的解决方案。该输入法具有较高的音字转换准确率和智能性,为智能移动设备用户提供了一种高效的中文输入方式。本文主要介绍其设计和实现两个方面: 首先,针对移动设备存储空间有限的特点,结合现有的信息检索和数据压缩技术,利用Trie-tree在检索速度和存储空间方面的优势,设计了一套新的数据压缩存储格式,使得查找拼音和词语的组合能在线性时间内完成。在拼音音节切分问题上,提出了一种新的音节切分算法—最短路径音节切分算法,该方法不仅在处理全拼切分时具有完备性,而且为简拼输入提供了很好的支持。在音字转换问题上,采用N元文法语言模型,并利用N-best剪枝技术进行优化。优化后的模型,在基本不降低音字转换率的同时,具有更少的计算开销,为输入法能在移动平台上流畅运行提供了保障。选用三万常用词作为词库,用2007年人民日报作为训练语料来建立模型。经评测,该输入法拥有完备的音节切分功能,音字转换准确率为86.92%。 输入法软件实现时,采用基于Android系统的IMM/IME(Input Method Manager/Input Method Editor)框架技术开发输入法,并多次对代码进行优化。 基于上述模型和算法,本文实现了一个可在资源相对有限的移动平台上流畅运行的语句级智能汉字输入法。该系统以语句为输入单位,支持简拼和词语级联想功能,输入效率高。支持Android 1.5和OMS 1.5操作系统,平台兼容性好,适用范围广。该输入法在多普达A3288手机上运行稳定,并通过了中国移动MMarket严格的―商用发布前测试‖,已于2010年05月17日在该平台进行―商用发布‖。与此同时,在各个输入法相关论坛的推广也在进行中。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.14

【引证文献】
中国硕士学位论文全文数据库 前2条
1 官连军;智能容错英文输入引擎的研究与应用[D];西南交通大学;2012年
2 王岳;Android平台中文输入法的设计和实现[D];苏州大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 刘秉瀚,王伟智;自适应汉字输入方法实现工具[J];兵工自动化;2000年01期
2 赵以宝,孙圣和;一种基于单字统计二元文法的自组词音字转换算法[J];电子学报;1998年10期
3 徐志明,王晓龙,姜守旭;一种语句级汉字输入技术的研究[J];高技术通讯;2000年01期
4 刘秉权,王晓龙;一种面向用户的语言模型及其机器学习方法[J];哈尔滨工业大学学报;2004年02期
5 刘秉权,王晓龙,王宇颖;一种多知识源汉语语言模型的研究与实现[J];计算机研究与发展;2002年02期
6 高升,王晓龙;语句级汉字输入系统中语义规则研究[J];计算机工程与应用;2003年04期
7 王晓龙,王开铸,孙希文,王英伟;音字转换中的机器学习研究[J];计算机学报;1993年05期
8 章森;;基于混合字词网格的汉语音字转换问题的求解[J];计算机学报;2007年07期
9 王晓龙;拼音语句汉字输入系统InSun[J];中文信息学报;1993年02期
10 汤步洲;王晓龙;王轩;张强;;语句级汉字拼音输入技术评估方法的研究[J];中文信息学报;2008年05期
中国重要会议论文全文数据库 前1条
1 朱丹青;常宝宝;;一种基于N-Best结果组合优选的词语对齐方法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国重要报纸全文数据库 前3条
1 林丽真;[N];电子资讯时报;2007年
2 中国工程院院士 蔡吉人 周仲义 魏正耀 全国信息技术标准化技术委员会秘书长 王立建 中国科技大学研究生院教授 吕述望;[N];光明日报;2008年
3 本报记者  王鹤;[N];经济参考报;2006年
【共引文献】
中国期刊全文数据库 前10条
1 章森;刘磊;刁麓弘;;基于混合语言模型的中文智能输入技术[J];北京工业大学学报;2007年09期
2 江朝勇;邓亚平;余磊;;一种基于Cross-Product与HashTree的IP分类算法[J];重庆邮电学院学报(自然科学版);2006年05期
3 张多英;伍伟池;焦文华;;基于数据挖掘的CDMA2000移动网络防盗用技术[J];电讯技术;2012年02期
4 赵春红;高希龙;王柠;赵威;刘国华;;一种应用分治策略的中文分词方法[J];燕山大学学报;2009年05期
5 杨晓江;李丽娟;田俊华;李艺;;面向基础教育的Web资源垂直服务体系研究[J];中国远程教育;2006年07期
6 郭涛;曲宝胜;郭勇;;自然语言处理中的模型[J];电脑学习;2011年02期
7 尚凤军;;一种IP数据包快速分类算法[J];东南大学学报(自然科学版);2006年S1期
8 伊力亚尔;古丽拉·阿东别克;;哈萨克文转化系统的研究与实现[J];电脑知识与技术(学术交流);2007年20期
9 刘远超;王晓龙;徐志明;刘秉权;;基于粗集理论的中文关键词短语构成规则挖掘[J];电子学报;2007年02期
10 赵继印;郑蕊蕊;吴宝春;李敏;;脱机手写体汉字识别综述[J];电子学报;2010年02期
中国重要会议论文全文数据库 前10条
1 李帅;王精业;王丽娟;;基于马尔可夫模型的文本信息提取算法概述[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
2 李玉良;王良松;李晶;;图像中数字字符识别技术概览[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
3 尚凤军;;一种IP数据包快速分类算法[A];第十七届全国过路控制会议论文集[C];2006年
4 余磊;邓亚平;王江波;李钦;陈云;;一种多维IP包分类算法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
5 ;Study on An Absolute Non-Collision Hash and Jumping Table IP Classification Algorithms[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
6 吴勇军;唐红;;高速网络中基于特定业务流的流量测量方法研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
7 尚凤军;唐红;潘英俊;;一种串行IP分类算法研究[A];第九届全国青年通信学术会议论文集[C];2004年
8 陈一凡;朱亮;;汉字键盘输入智能处理软件综述[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
9 龚媛;李蕾;;语音识别后文本纠错处理[A];第三届学生计算语言学研讨会论文集[C];2006年
10 张玮;孙乐;冯元勇;吕元华;;一种结合分类模型的中文输入法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
2 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
3 吴戈;基于数字水印的文本信息隐藏方法的研究[D];长春理工大学;2011年
4 王迈;语言形式化原理[D];上海外国语大学;2011年
5 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
6 尚凤军;基于边缘测量的高速网络链路流量测量系统研究[D];重庆大学;2005年
7 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年
8 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 宗成庆;音字转换与句子规范化处理研究[D];中国科学院研究生院(计算技术研究所);1998年
中国硕士学位论文全文数据库 前10条
1 黄勇杰;基于统计NLP技术的甲骨卜辞的分析研究[D];华东师范大学;2010年
2 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
3 史迎馨;建筑图中有限自然语言的分析与理解的研究[D];长春工业大学;2010年
4 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
5 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
6 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
7 曹亚辉;非结构文本最佳近似匹配系统的研究与实现[D];东华大学;2011年
8 朱培焱;汉英跨语言网址搜索引擎的设计与实现[D];西安电子科技大学;2010年
9 徐绮楠;面向web文本挖掘的中文文本自动摘要关键技术研究[D];西安电子科技大学;2009年
10 任林涛;PDF格式中文科技论文的有效信息提取方法及分类研究[D];吉林大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 李艳丽;;Android事件处理过程剖析[J];长春理工大学学报(自然科学版);2010年03期
2 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
3 流行语;;带你认识手机输入法[J];电脑爱好者(普及版);2007年12期
4 赵亮;张维;;基于Android技术的界面设计与研究[J];电脑知识与技术;2009年29期
5 李平新;;Android系统插件式输入法程序的设计[J];电脑知识与技术;2009年35期
6 赵宏伟;;Android NDK开发环境实现与应用[J];电脑知识与技术;2010年35期
7 陈钦梧;张鹏;刘秀峰;;几种手机汉字输入法的测评[J];电子产品世界;2010年06期
8 刘功申,王永成,许欢庆;基于字频的单模式匹配算法[J];电子学报;2002年S1期
9 胡伟;;Android系统架构及其驱动研究[J];广州广播电视大学学报;2010年04期
10 刘秉权,王晓龙;一种面向用户的语言模型及其机器学习方法[J];哈尔滨工业大学学报;2004年02期
中国硕士学位论文全文数据库 前8条
1 刘瑞顺;基于Android平台的智能手机输入法研究与设计[D];汕头大学;2011年
2 朱晓旭;手持设备汉字输入法自动生成技术研究与实现[D];苏州大学;2005年
3 周克兰;汉字数码输入法评价体系研究[D];苏州大学;2005年
4 刘必强;基于Smartphone的智能手机输入法的研究与实现[D];哈尔滨工业大学;2006年
5 曲卫华;手机中文输入法的设计与实现[D];中国地质大学(北京);2007年
6 郝元礼;基于Windows Mobile下的智能手机输入法研究与实现[D];汕头大学;2008年
7 熊刚;基于Android的智能手机的设计与实现[D];武汉理工大学;2010年
8 李纲;PocketPC手机输入法软件设计与实现[D];北京邮电大学;2010年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 袁廷磊;基于Android平台维吾尔文联想整句输入法的研究与实现[D];新疆大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 王伟智,刘秉瀚,朱敏琛;基于智能技术的汉字输入[J];兵工自动化;1999年02期
2 王晓龙;汉字编码方案的择优、统一和发展[J];电子学报;1987年01期
3 赵以宝,孙圣和;一种基于单字统计二元文法的自组词音字转换算法[J];电子学报;1998年10期
4 徐志明,王晓龙,姜守旭;一种语句级汉字输入技术的研究[J];高技术通讯;2000年01期
5 王轩,李巍,王晓龙,赵淑香;大标记集汉语字(词)Markov 语言模型的建立[J];哈尔滨工业大学学报;1997年05期
6 杨长生;何志钧;;汉语同音词汇的辨析[J];计算机研究与发展;1987年01期
7 高升,贾文举,王晓龙,姜亚学;一个基于互信息的规则量化方法[J];计算机研究与发展;2000年08期
8 王轩,王晓龙;大规模文本计算机音字相互转换技术的研究[J];计算机研究与发展;1998年05期
9 关毅,王晓龙,张凯;基于转移的音字转换纠错规则获取技术[J];计算机研究与发展;1999年03期
10 胡宇晓,马少平,夏莹;基于IMM-IME输入法接口的实现方法[J];计算机工程与应用;2002年01期
中国硕士学位论文全文数据库 前1条
1 周克兰;汉字数码输入法评价体系研究[D];苏州大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 谢晓民;;揭开汉字输入绝密——信息市场争夺战将再起风云[J];科技经济市场;2000年03期
2 Freshspace;;Windows输入法技巧荟萃[J];软件导刊;2003年06期
3 李滨江;用数据库技术实现汉字输入法词组自动编码[J];中南民族学院学报(自然科学版);1999年02期
4 王俊峰;汉字输入法类控件在VFP下的实现及应用[J];电脑开发与应用;2000年03期
5 赵全新;Windows简体中文版汉字输入法的制作[J];中国计算机用户;1994年03期
6 韩瑞雪;LM汉字输入法易学好用[J];中文信息;1995年05期
7 姚鹏;姚东;;在中文WINDOWS中增加一种新的汉字输入法[J];现代计算机;1996年03期
8 王奕玲;;纵横汉字输入法与教学内容相结合[J];中国信息技术教育;2010年17期
9 ;“五分钟码”汉字输入法[J];中文信息;1994年06期
10 ;中国自主知识产权手机汉字输入法通过国家检测[J];中国新通信;2006年24期
中国重要会议论文全文数据库 前10条
1 林端森;;汉字输入法的研究与应用[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
2 陆晓先;;整体汉字输入法[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
3 金洁;张琳;;基于Android平台的校园街景的研究和实现[A];2010年通信理论与信号处理学术年会论文集[C];2010年
4 金结室;黄文;;交点式汉字输入法[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
5 符易阳;周丹平;;Android安全机制分析[A];第26次全国计算机安全学术交流会论文集[C];2011年
6 郑岩松;;纯数字编码的汉字输入法将是今后键盘汉字输入法的主流——谈左右数码汉字电脑输入法及其键盘[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
7 张小衡;;为何汉字形码输入法难以走出“难”的困境?——谈谈一些技术上的欠妥观点[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 徐万胥;;数字统一码原理与实践[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
9 高峰;毕经平;郭景峰;刘建航;;汽车状态感知系统的Android客户端设计与实现[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
10 丁晓安;徐伯夏;;基于智能搜索功能的Android平台手机拼车系统设计[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
中国重要报纸全文数据库 前10条
1 本报记者 史芳;搜狗输入法成为活的汉语库[N];中国经济导报;2011年
2 本报记者 李秀玲;自主汉字输入法何时走入百姓手机[N];工人日报;2008年
3 通讯员 杨明剑 本报记者 朱彤;小手机大名堂[N];科技日报;2006年
4 本报记者 陈伟 实习生 吕亚茹;手机汉字输入法为何长期“受制于人”[N];经济参考报;2008年
5 彭新征;汉字输入法教学要多元化[N];中国电脑教育报;2003年
6 杨谷;我国每年为进口汉字输入法花费数亿元[N];光明日报;2006年
7 中文信息学会课题组;如何提高国产手机汉字输入法的市场竞争力[N];光明日报;2007年
8 徐涵;我国将推广手机汉字输入国标[N];经济日报;2008年
9 沙舟;汉字输入法的革命——鼠标输入法[N];厂长经理日报;2001年
10 北京 袁楚;Android联盟的“毁灭竞争”[N];电脑报;2010年
中国博士学位论文全文数据库 前5条
1 李宁;认知发展:汉字输入中信息代码加工的理论与实践[D];华东师范大学;2009年
2 龚爱平;基于嵌入式机器视觉的信息采集与处理技术研究[D];浙江大学;2013年
3 肖镜辉;非时齐语言建模技术研究及实践[D];哈尔滨工业大学;2007年
4 崔展齐;若干软件非功能属性相关的设计和实现技术研究[D];南京大学;2011年
5 魏代敏;中年女性体内雄激素水平的变化及与机体脂肪含量、脂肪分布的相关性研究[D];北京协和医学院;2012年
中国硕士学位论文全文数据库 前10条
1 刘峰;基于Android的语句级智能汉字输入法研究[D];哈尔滨工业大学;2010年
2 刘瑞顺;基于Android平台的智能手机输入法研究与设计[D];汕头大学;2011年
3 王岳;Android平台中文输入法的设计和实现[D];苏州大学;2012年
4 叶炳发;Android操作系统移植及关键技术研究[D];暨南大学;2010年
5 岳传真;Android系统移植和应用程序开发[D];复旦大学;2010年
6 刘敏;移动终端的Android移植与应用程序设计[D];西安电子科技大学;2011年
7 王蕾;哈尔滨招行Android手机银行汇率换算模块的设计与实现[D];吉林大学;2011年
8 胡思捷;基于Android平台的触摸屏系统设计及实现[D];南开大学;2011年
9 施金兰;基于Android平台的网络共享研究与实现[D];华东师范大学;2011年
10 郭凯敏;基于Android平台的维吾尔文智能输入法研究与实现[D];新疆大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026