收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于电子商务用户行为的同义词识别

张书娟  
【摘要】:随着互联网的发展,电子商务逐步发展起来,因此为个人和企业提供网上交易的电子商务平台应运而生。电子商务平台需要准确理解买方的搜索意图,并展现出相应的商品。为达到这个目标,电子商务平台逐步转入语义关系的研究,而同义关系是语义关系不可或缺的一部分。 电子商务领域的同义词是指对同一事物或者概念的不同表达,即在商品描述检索中可以相互替换的词,有新词多、错别字多、定义严格的特点。这些特点使得现有同义词识别方法在电子商务领域效果不显著,同时给同义词的识别带来更大的困难。 本文重点研究电子商务中卖方用户和买方用户行为特点,提出了基于电子商务用户行为的候选同义词集合产生方法,包括候选集合的获取和过滤两部分。一方面通过并列关系的符号切分标题从标题中获取候选集合,另一方面通过SimRank思想聚集查询从查询中获取候选集合。之后将候选集合分为中文-中文词对和英文-中文词对两大类。最后对中文-中文词对运用一系列的规则进行过滤,对英文-中文词对运用同义概率进行过滤。 在候选集合生成之后,就进行同义词的识别。根据电子商务中英文-中文同义词的特点,提出了读音相似度法、谷歌翻译法、同义概率法等三种识别英文-中文同义词的方法。并重点研究了用于机器学习方法的特征提取,特别是标题、查询、点击等体现用户行为的特征的提取,并运用梯度下降决策树模型和支持向量机模型来进行同义词的识别。 实验表明,读音相似度法可以有效识别音译的英文-中文同义词,谷歌翻译法可以有效识别意译的英文-中文同义词,同义概率法可以有效识别高频出现的英文-中文同义词。在梯度下降决策树模型中,加入标题、查询、点击等用户行为特征比单独使用字面特征准确率提高了约25%,召回率提高了约24%,F值提高了约30%。对比梯度下降决策树模型和支持向量机模型发现前者在各个方面效果都好于后者。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 章成志,侯汉清;基于知识库的网络信息概念挖掘(英文)[J];情报理论与实践;2004年05期
2 朱毅华,侯汉清,沙印亭;计算机识别汉语同义词的两种算法比较和测评[J];中国图书馆学报;2002年04期
3 陆勇,侯汉清;用于信息检索的同义词自动识别及其进展[J];南京农业大学学报(社会科学版);2004年03期
4 刘政;朱杰;吴树芳;曹振;;信息检索中的同义词[J];电脑知识与技术;2009年09期
5 凌志辉,翟玉庆;描述用户行为的数字权限时序描述逻辑系统[J];计算机工程;2005年19期
6 沈健;图书馆读者抱怨行为研究[J];图书情报知识;2005年05期
7 李纲;王毅彦;;数字环境下的用户研究[J];图书情报知识;2005年06期
8 任淑婷;吴志美;顾国昌;;宽带接入系统中的用户行为、网络价格及网络行为[J];小型微型计算机系统;2006年06期
9 向坚持;刘相滨;徐选华;;基于用户行为的Web使用挖掘数据采集技术研究[J];计算机与现代化;2007年12期
10 侯丽;;Web2.0的特性及对信息服务的创新性思考[J];图书馆建设;2008年01期
11 王庆稳;邓小昭;;网络数据库历史记录界面设计[J];情报科学;2008年05期
12 王攀;张顺颐;陈雪娇;;基于DBP的Web用户行为分析关键技术[J];电信快报;2008年08期
13 徐刚;孙高岭;;面向网络用户的个性化推荐服务实现[J];情报杂志;2008年08期
14 唐才文;;WAP业务用户行为模型分析[J];电脑知识与技术;2008年27期
15 刘璇;张凤荔;叶李;;基于NetFlow的用户行为挖掘算法设计[J];计算机应用研究;2009年02期
16 周涛;鲁耀斌;张金隆;;整合TTF与UTAUT视角的移动银行用户采纳行为研究[J];管理科学;2009年03期
17 彭耶萍;;个性化信息检索系统中用户兴趣模型的建立[J];电脑知识与技术;2009年20期
18 巩玉玺;罗容;;基于deep web数据库的个性化推荐系统[J];煤炭技术;2009年08期
19 唐才文;梁建武;;WAP业务用户行为模型分析[J];信息与电脑(理论版);2009年09期
20 詹骞;;视频分享网站的大学生受众研究[J];新闻爱好者;2010年14期
中国重要会议论文全文数据库 前10条
1 张书娟;董喜双;关毅;;基于电子商务用户行为的同义词识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 章成志;章成敏;王萍;;基于语义的同义词识别算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 吴法洲;苏昊;周明;李春平;;利用英文搜索日志建立中文新词同义词词表[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 曹建勋;刘奕群;岑荣伟;马少平;茹立云;;基于用户行为的色情网站识别[A];第六届全国信息检索学术会议论文集[C];2010年
7 陈都;郑玲;;基于反馈学习的自适应搜索机制的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
8 梁平;;笔记本电脑无线上网行为与宽带无线通信网络初期部署[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
9 武小年;周胜源;;数据挖掘在用户行为可信研究中的应用[A];第十一届保密通信与信息安全现状研讨会论文集[C];2009年
10 雷悦春;;PHS网络主要呼损分析[A];武汉市第二届学术年会、通信学会2006年学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 陈亚睿;云计算环境下用户行为认证与安全控制研究[D];北京科技大学;2012年
2 郭陟;可视化入侵检测研究[D];清华大学;2004年
3 贾晋康;基于探测和仿真的P2P用户和网络行为分析建模及安全性研究[D];北京交通大学;2009年
4 郑毅;P2P应用中的用户行为与系统性能研究[D];北京交通大学;2012年
5 罗鑫;访问控制技术与模型研究[D];北京邮电大学;2009年
6 田新广;基于主机的入侵检测方法研究[D];国防科学技术大学;2005年
7 任淑婷;宽带IP网络中基于QoS的计费研究[D];哈尔滨工程大学;2005年
8 曾剑平;基于模糊集的自适应伪装入侵检测算法及其在ASP服务安全中的应用研究[D];厦门大学;2006年
9 李军;基于用户行为挖掘的数据流管理技术研究[D];北京邮电大学;2012年
10 赖祥伟;面向用户行为模型的软件可用性研究[D];西南大学;2007年
中国硕士学位论文全文数据库 前10条
1 张书娟;基于电子商务用户行为的同义词识别[D];哈尔滨工业大学;2011年
2 宋宇轩;基于搜索日志和点击日志的同义词挖掘的研究和实现[D];北京交通大学;2011年
3 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
4 李敏;基于用户行为研究的地下商业空间的商业推广研究[D];上海交通大学;2007年
5 章月兵;图书馆用户的多媒体资源使用行为分析[D];南京师范大学;2008年
6 潘拓宇;融入用户行为上下文的个性化推荐模型[D];湘潭大学;2010年
7 刘凯;企业搜索引擎营销效果评估体系之研究[D];华东师范大学;2007年
8 肖立英;基于INTERNET的用户个性化兴趣模型的研究[D];中南大学;2003年
9 袁嘉;基于用户行为的笔记本电脑输入模式研究及设计[D];湖南大学;2008年
10 赵文华;基于用户的个性化搜索引擎研究[D];首都师范大学;2008年
中国重要报纸全文数据库 前10条
1 裴维玲;网上商务的当务之急:培养用户行为[N];中国石油报;2001年
2 裴维玲;网上商务的当务之急:培养用户行为[N];中国石油报;2001年
3 李中朝通讯员 黄伟;重庆电信建成宽带用户行为分析系统[N];人民邮电;2007年
4 于沿波 佟彤 记者  张鸣霄;哈市供热服务规范拟于月末实施[N];哈尔滨日报;2006年
5 ;用户行为是业务创新之源[N];人民邮电;2007年
6 肖扬;网银用户成倍增长[N];金融时报;2006年
7 ;危险的用户行为让网络面临风险[N];网络世界;2007年
8 王兴佳;规范用户行为确保校园网通畅[N];中国教育报;2008年
9 本报记者 赵明;垂直SNS成趋势 风行试水SNS影视社区[N];中国经济时报;2008年
10 逄丹;瞻博:变化与专注并不相悖[N];通信产业报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978