收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向含用户生成内容个性化搜索的交互式分布估计算法研究

暴琳  
【摘要】:高效精准的个性化搜索、服务、推荐等可为人们生产生活带来极大便利,而随着用户生成内容(User Generated Contents,UGCs)如:交互行为、评分数据、项目类别标签、用户文本评论、社交网络关系、图像或视频信息等的“信息过载”,变得日益复杂。含UGCs的个性化搜索是当前大数据分析及个性化服务领域的研究热点,该问题难以建立明确定义的数学模型和目标函数,其分析、评价决策过程具有主观性、不一致性和模糊性,是一类复杂定性指标优化问题。融合用户交互和智能进化优化算法的交互式进化算法(Interactive Evolutionary Computations,IECs)是一类解决定性指标优化问题的有效途径。然而,对于个性化搜索,如何在交互式进化优化中有效融合UGCs中多源、多模态、异质、非结构化数据,进而设计高效的交互式进化优化策略,是利用IECs解决含UGCs个性化搜索任务面临的严峻挑战。为此,本文研究了面向含用户生成内容的个性化搜索交互式分布估计算法(Estimation of distribution algorithms,EDA),主要内容包括如下四点:(1)用户行为驱动的RBM偏好代理交互式分布估计算法:含用户生成内容的个性化搜索为一类典型的定性指标离散变量优化问题,当采用智能优化算法求解时,需首先设计用户偏好和评价代理模型。为此,利用受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)强大的特征提取能力联合分布估计算法的寻优性能,给出了基于RBM代理模型和概率模型的分布估计算法;将该算法进行拓展,设计考虑用户历史交互行为和项目类别标签的RBM偏好代理模型,即基于用户交互行为筛选具有较长交互时间或较高用户评价的项目集合,构成含用户偏好信息的训练样本;对项目类别进行二进制编码,作为RBM偏好认知模型的输入,基于训练样本抽取用户偏好特征;根据RBM偏好模型,构建面向偏好特征分布的EDA概率模型和基于RBM能量函数的适应值估计代理模型;构建融合RBM偏好代理模型的交互式分布估计算法,并对其进行了复杂性分析。算法在复杂离散函数和Movie Lens个性化搜索中的应用,证明了融合RBM代理模型分布估计算法和用户交互行为驱动RBM偏好代理模型交互式分布估计算法的有效性。(2)基于UGCs用户隐式偏好的双RBM代理交互式分布估计算法:研究内容(1)虽然利用了用户交互行为、评分和项目类别信息改进交互式分布估计算法,但是,没有充分利用用户的社交网络信息,以及用户评价隐含的积极和消极偏好特征,鉴于此,基于研究内容(1),进一步研究了基于积极和消极偏好拟合的双RBM代理模型的交互式分布估计算法。根据UGCs中用户交互行为如交互时长和评分数据等,获取显式偏好和隐式偏好信息,筛选优势群体和劣势群体,构建同步识别积极和消极偏好的双RBM用户偏好模型,以更精细的抽取用户偏好特征;利用积极RBM偏好模型特征的边际概率分布,给出EDA算法概率模型,并基于社交网络信息和加权积极消极RBM偏好模型的能量函数构造适应值估计模型,设计了高效交互式分布估计算法;在亚马逊数据集中的大量实验表明所提算法不但能够有效加强个性化搜索的性能,而且能够减轻用户评价负担,提高用户的交互式搜索体验。(3)融合多源异构UGCs的RBM偏好代理交互式分布估计算法:上述研究仅考虑了用户生成内容中的用户交互行为、项目类别标签和社交网络信息,未考虑用户生成内容中大量存在的用户评论文本数据,而这些用户评论中包含大量用户隐式偏好。鉴于此,在研究内容(2)的基础了,提出了面向多源异构UGCs数据的RBM偏好代理IEDA算法。考虑UGCs中用户评分、标签类别、用户评价文本以及社交关系,给出其数学描述,并采用doc2vec实现多源异构文本数据的向量化表示;基于搜索对象类别标签和用户评价文本向量,构建同时含有离散类别特征和连续语义特征的RBM并行双输入层用户偏好模型;设计基于RBM用户偏好和多相似用户社交关系的代理模型,估计可行解的个体适应值;动态更新RBM偏好模型参数、概率模型和适应度估计函数,实现具有精准跟踪用户偏好和提高个性化搜索效率的交互式分布估计算法;算法在亚马逊数据集的应用结果表明所提算法能够更好地预测用户偏好,动态跟踪用户兴趣变化,有效减轻用户评价负担并提高个性化搜索的精度和效率。(4)融合多源异构UGCs和注意力机制的RBM偏好代理交互式分布估计算法:研究内容(3)融合了多源异构数据后,决策变量既包含了项目类别特征又包含了评价文本的隐含特征,显然,这些特征对用户偏好具有不同程度的影响,对基于RBM的偏好代理模型就具有不同的贡献度,为此,进一步研究了基于注意力机制提取决策变量重要度的RBM偏好代理交互式分布估计算法。根据UGCs中多源异构的项目类别、文本评论和协同信息,采用doc2vec以及multi-hot编码机制对数据进行融合,设计基于RBM的注意力权重获取模块;融合用户偏好特征注意力权重,构建多角度描述搜索对象的RBM用户偏好模型;在IEDA框架下,设计基于偏好特征注意力权重的EDA算法分布估计概率模型和基于RBM的用户偏好代理模型;根据新增用户交互行为和UGCs数据,利用模型管理机制,更新融合多源异构数据和AM的RBM用户偏好模型,动态跟踪用户偏好;算法在亚马逊数据集的应用表明所提交互式分布估计算法进一步提高了对用户偏好的拟合能力和个性化搜索的精准性。上述研究内容针对含用户生成内容的个性化搜索,采用智能优化算法,从不同角度利用UGCs数据,层层推进,构建了多种反映用户偏好的RBM认知模型,并基于RBM模型对偏好特征的概率分布和能量函数,给出不同场景下基于RBM偏好模型的EDA概率模型和适应度代理模型构建机制,进而设计高效的交互式分布估计算法,以解决含用户生成内容的个性化搜索问题。在复杂函数和实际亚马逊个性化搜索问题的应用证明了所提算法的有效性。本文总共有图31幅,表22张,参考文献221篇。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 徐儒;;基于动态分割算法的个性化泡茶偏好特征提取[J];电脑知识与技术;2020年19期
2 陈作汉;曹洁;赵付青;张建林;;基于搜索偏好知识的复杂多模差分进化算法[J];电子科技大学学报;2020年06期
3 张铭皓;;掌控还是被掌控——大数据时代有关算法分发的忧患与反思[J];新媒体研究;2020年04期
4 孙逸啸;郑浩然;;算法治理的域外经验与中国进路[J];信息安全研究;2021年01期
5 孙微巍;;浅谈算法革命与网上书店业务发展[J];全国新书目;2020年12期
6 魏远山;;算法透明的迷失与回归:功能定位与实现路径[J];北方法学;2021年01期
7 王君然;;从技术视角看算法推荐的认知困境[J];青年记者;2021年02期
8 胡月星;;“算法焦虑”的生成机理及纾解之道[J];人民论坛;2021年Z1期
9 黄晓伟;李育慧;;算法偏见问题的技术—权力互构论解析[J];理论与现代化;2021年01期
10 康福柱;田孟龙;;数据公开:让算法守法[J];新闻传播;2021年03期
11 姚前;;算法经济与算法监管[J];清华金融评论;2021年01期
12 王会举;李孟萱;黄卫卫;周秋怡;;基于隐马尔可夫模型的多真值发现算法[J];计算机工程与科学;2021年03期
13 许松;;从“算法纠偏”到“党媒纠偏”——地方党媒如何融入算法社会[J];城市党报研究;2021年05期
14 彭兰;;如何实现“与算法共存”——算法社会中的算法素养及其两大面向[J];探索与争鸣;2021年03期
15 王鑫;;算法批判与人-机社会想象[J];探索与争鸣;2021年03期
中国重要会议论文全文数据库 前20条
1 徐一;杨静;任志刚;杨迅幸;;基于学习的烟花算法[A];2018中国自动化大会(CAC2018)论文集[C];2018年
2 姚雪;;基于算法多样化培养学生思维习惯和创新精神[A];2019年“区域优质教育资源的整合研究”研讨会论文集[C];2019年
3 熊薇薇;吴怀宇;;一种改进的角点检测算法[A];中国计量协会冶金分会2009年年会论文集[C];2009年
4 陶丽;张自力;丁晓明;;一种适用于动态重构的联盟形成算法[A];2008年计算机应用技术交流会论文集[C];2008年
5 张兰平;;谈小学一年级算法多样化的优化[A];中华教育理论与实践科研论文成果选编(下)[C];2007年
6 杨红斌;;计划量算法的优化[A];第四届全国医院药剂科建设与管理学术研讨会论文集[C];2012年
7 林克旺;;基于分层网络实现高效的自稳定的选举算法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册)[C];2006年
8 高尚;;背包问题的分布估计算法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
9 徐英钟;高震;李波;;基于禁忌搜索的蚁群算法求解旅行商问题[A];第四届中国智能计算大会论文集[C];2010年
10 叶衍;楼荣生;何永保;;自然联结的优化算法[A];第十二届全国数据库学术会议论文集[C];1994年
11 赵唯;;晶粒度评级的改进算法[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
12 许伦辉;傅惠;徐建闽;;基于分形维数的交通流预测模型及算法研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
13 王树西;白硕;王斌;;模式推理中的“图检索”算法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
14 覃频频;许登元;姚起宏;黄大明;;基于表决融合的高速公路事件检测算法融合[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年
15 杨娜;付强;贺延国;;蚁群算法在水土资源中的应用研究进展[A];农业系统工程理论与实践研究——全国农业系统工程学术研讨会论文集[C];2006年
16 王亚钊;周永华;刘毅;高睿;;人工生命算法的研究进展[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
17 王永华;詹宜巨;余松森;杨健;;一种密集RFID读写器环境下信道分配算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
18 杨盘洪;朱军祥;赵建安;杨静;;机动目标跟踪的模糊变结构交互多模算法[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
19 王亚奇;王静;李金;;一种改进的RFID系统反碰撞算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
20 王晓明;陈学荣;;2500+交叉优化算法详解及典型案例分析[A];《内蒙古通信》2012年第1-4期[C];2012年
中国博士学位论文全文数据库 前20条
1 暴琳;面向含用户生成内容个性化搜索的交互式分布估计算法研究[D];中国矿业大学;2020年
2 王冰;人工蜂群算法的改进及相关应用的研究[D];北京理工大学;2015年
3 浮婷;算法“黑箱”与算法责任机制研究[D];中国社会科学院研究生院;2020年
4 王艳娇;人工蜂群算法的研究与应用[D];哈尔滨工程大学;2013年
5 李美安;普适分布式互斥算法及应用[D];电子科技大学;2007年
6 王小根;粒子群优化算法的改进及其在图像中的应用研究[D];江南大学;2009年
7 刘婷;改进人工蜂群算法及其在多用户检测中的应用[D];天津大学;2013年
8 邱剑锋;人工蜂群算法的改进方法与收敛性理论的研究[D];安徽大学;2014年
9 肖建元;保几何结构算法在等离子体物理中的应用[D];中国科学技术大学;2017年
10 盛歆漪;粒子群优化算法及其应用研究[D];江南大学;2015年
11 张冬丽;人工蜂群算法的改进及相关应用研究[D];燕山大学;2014年
12 孔翔宇;几类优化问题的人工蜂群算法[D];西安电子科技大学;2016年
13 谭跃;具有混沌局部搜索策略的粒子群优化算法研究[D];中南大学;2013年
14 赵进慧;膜计算仿生优化算法及应用研究[D];浙江大学;2010年
15 张松;人工蜂群算法研究及其应用[D];西安电子科技大学;2019年
16 薛菲;基于蝙蝠算法的启发式智能优化研究与应用[D];北京工业大学;2016年
17 张超群;混合爆炸式人工蜂群算法及应用研究[D];东华大学;2015年
18 王翔;混合蚁群算法及其在管理优化中的应用[D];东华大学;2012年
19 杨世品;P系统优化算法及应用研究[D];浙江大学;2013年
20 高卫峰;人工蜂群算法及其应用的研究[D];西安电子科技大学;2013年
中国硕士学位论文全文数据库 前20条
1 曹学群;改进分布估计算法及其在化工过程中的应用[D];华东理工大学;2015年
2 宋尼克;大数据背景下政府算法治理的风险研究[D];中国矿业大学;2020年
3 曾小鹏;监管科技算法歧视法律问题研究[D];北方工业大学;2020年
4 贾红;烟花爆炸优化算法及其改进研究[D];华中科技大学;2010年
5 王书勤;车辆路径问题的蚁群算法研究[D];重庆大学;2008年
6 王丹丹;基于进化规划的分布估计算法[D];南京理工大学;2010年
7 周燚儒;人工智能时代算法歧视与平等权保护研究[D];山东大学;2020年
8 陈政;人工蜂群算法的研究与应用[D];江苏科技大学;2020年
9 章滔;价格算法合谋的反垄断法规制研究[D];华东师范大学;2020年
10 徐一春;浅析大数据算法歧视的法律规制[D];苏州大学;2019年
11 邹游;快速傅里叶变换裁剪算法[D];华南理工大学;2017年
12 何子旷;蝙蝠算法的改进与应用[D];广东工业大学;2016年
13 丁亚英;基于局部搜索和二进制的改进人工蜂群算法[D];南京师范大学;2016年
14 韩宏业;基于人工蜂群算法的软硬件划分算法研究[D];天津大学;2014年
15 孟凡明;基于共享因子的人工蜂群算法的研究与应用[D];兰州交通大学;2016年
16 胡庆生;烟花算法及其应用[D];陕西师范大学;2016年
17 杜荣浩;针对大规模时间序列数据的改进聚类算法[D];北京交通大学;2017年
18 黄媛媛;一种改进的人工蜂群算法及其在k均值聚类中的应用[D];安徽大学;2015年
19 李枝勇;蝙蝠算法及其在函数优化中的应用研究[D];上海理工大学;2013年
20 罗琨;人工蜂群算法的改进研究[D];广西师范学院;2014年
中国重要报纸全文数据库 前20条
1 何勇海;别被偏好算法带偏了[N];重庆日报;2020年
2 眉间尺;比算法推荐更重要的是确认眼神[N];科技日报;2018年
3 数字经济学家、商汤智能产业研究院主任 刘志毅;今天我们被算法“控制”了吗[N];经济观察报;2020年
4 本报记者 武晓莉;给冰冷的算法注入温暖[N];中国消费者报;2021年
5 深圳商报记者 袁斯茹;用“算法”防止老人跌跤[N];深圳商报;2021年
6 本报记者 马成涛;算法推荐 如何打破“信息茧房”[N];安徽日报;2020年
7 记者 任震宇;强化算法实施方的举证责任[N];中国消费者报;2021年
8 见习记者 陈友敏;消保委呼吁尽快出台算法规制[N];上海法治报;2021年
9 刘振;给算法滥用套上“马辔头”[N];安徽日报;2021年
10 郑磊;当算法操控人类[N];21世纪经济报道;2020年
11 吴明曦 马伯乐;以智驭能 算法制胜[N];解放军报;2020年
12 赵熙熙;科学家开发出纠错新算法[N];中国科学报;2017年
13 实习生 高行健;新算法助力人类“解梦”[N];科技日报;2020年
14 重庆市第四中级人民法院 艾庆平;赛博世界的算法规制[N];人民法院报;2020年
15 北京大学法学院教授 北京大学电子商务法研究中心主任 薛军;数字时代应高度关注算法规制[N];中国市场监管报;2020年
16 陈广江;别让算法“算计”了孩子[N];海南日报;2020年
17 陈广江;别让算法“算计”了孩子[N];中国消费者报;2020年
18 任然;拒绝投喂:赋予消费者关闭算法的权利[N];中国青年报;2020年
19 龙敏飞;每个消费者都应有“关闭算法”的权利[N];珠海特区报;2020年
20 陈航辉;切勿陷入算法迷信[N];解放军报;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978