收藏本站
《北京交通大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于分布式逻辑回归模型的广告点击率预估系统

吴文伟  
【摘要】:一直以来,广告都是互联网公司一个非常重要的收入来源,像国外的谷歌、雅虎,国内的百度、微博等,这些走在互联网领域的领头羊,都是以广告为主要收入。尤其是在机器学习、人工智能的驱动下,越来越多的公司投入到如何提高广告变现能力的研究当中。与传统的广告相比,移动广告用户所处的环境更加复杂,所以需要更准确的投放技术。因此,研究如何从时刻都在变化的流量中,实时地从平台的广告库中选取合适的广告,精准投放给用户是一个巨大的挑战。本文正是基于这样一个复杂环境,考虑如何设计并实现一个能对候选广告库中的每个候选广告都尽可能计算出准确点击率的系统。广告点击率(Click-Through-Rate,CTR)系统需要合理使用用户的基本信息和浏览记录,预估出广告被用户点击的可能性大小。从而结合广告点击率和竞价因子对广告排序,选取最靠前的N个广告投送给用户,这就是系统所要完成的主要工作。以广告点击率的预估值为依据,对候选广告排序,从用户的角度,用户看到自己感兴趣广告的可能性更高了;从广告主的角度,广告能达到更好的传播效果;从平台的的角度,平台用户留存率提高,平台效益自然会更好。为了达到这三者的利益最大化,作者基于分布式逻辑回归模型,设计和实现了文中的广告点击率预估系统。具体的:首先,对广告点击率预估系统的相关技术和评价指标进行了介绍;接着,阐述了系统的功能和非功能性需求分析;然后,通过需求分析得出的结果,划分系统模块和功能,确定所有模块的功能点;紧接着,根据之前阶段得到的结果,对各个功能模块进行详细的设计,编写出高质量的代码;最后,对系统进行功能性测试和非功能性测试。在测试中通过对SGD、Ftrl、Adam和Adagrad四个梯度下降算法对比实验,选出了最适合分布式逻辑回归模型的学习算法,并对训练模块的逻辑回归算法的计算方式加以改进,使本文实现的广告点击率系统的训练速度得以明显提升。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O212.1

【参考文献】
中国期刊全文数据库 前8条
1 万冬娥;;基于云计算的大数据信息检索技术[J];电子技术与软件工程;2018年03期
2 王守相;刘天宇;;计及用电模式的居民负荷梯度提升树分类识别方法[J];电力系统及其自动化学报;2017年09期
3 赵坤鹏;吴龙胜;马徐瀚;陈庆宇;;一种基于矩阵的并行CRC校验算法[J];电子设计工程;2017年03期
4 张立;王渊民;;基于核函数的非线性支持向量机[J];科技展望;2017年01期
5 汪云云;陈松灿;;基于AUC的分类器评价和设计综述[J];模式识别与人工智能;2011年01期
6 赵军圣;庄光明;王增桂;;极大似然估计方法介绍[J];长春理工大学学报;2010年06期
7 张伟;薛一波;周宗伟;汪东升;;一种面向大规模特征集的高效特征匹配算法[J];高技术通讯;2009年06期
8 张媛,张燕平;一种PCA算法及其应用[J];微机发展;2005年02期
中国硕士学位论文全文数据库 前2条
1 董书超;基于逻辑回归模型的广告点击率预估系统的设计与实现[D];哈尔滨工业大学;2016年
2 朱晨杰;MapReduce作业组合系统的研究与实现[D];上海交通大学;2013年
【共引文献】
中国期刊全文数据库 前10条
1 邓术兴;叶芝祥;欧阳峰;张罡;芦英俊;;南充市城区冬季大气细颗粒物化学组成特征及来源解析[J];环境工程;2018年06期
2 杨豪;张俊然;蒋小梅;刘飞;;基于深度信念网络脑电信号表征情绪状态的识别研究[J];生物医学工程学杂志;2018年02期
3 姜朱楠;左洪福;李利荣;高鑫磊;;后缘襟翼位置传感器故障预测方法研究[J];航空计算技术;2018年02期
4 王渊;;最小二乘配置在推估重力异常上的应用[J];江苏科技信息;2018年06期
5 杨飞;;浅谈云计算在电信领域的应用研究[J];电子测试;2018年04期
6 柳丁;张东;;改进的分水岭算法在超声肿瘤图像分割中的应用[J];半导体光电;2017年06期
7 郝蓓;杨大利;;基于改进KNN-SVM的车辆图像光照检测模型[J];计算机工程与应用;2017年24期
8 莫朗;朱建良;薄煜明;;基于TDC-GP22的室内定位系统的设计及实现[J];电子设计工程;2017年18期
9 吴忠诚;朱家明;邓卓航;;基于PDE模型对我国人口总量的研究与预测[J];哈尔滨师范大学自然科学学报;2017年04期
10 范铭升;吴汉枢;;基于年龄变化的人脸识别[J];科技风;2017年13期
中国硕士学位论文全文数据库 前9条
1 吴文伟;基于分布式逻辑回归模型的广告点击率预估系统[D];北京交通大学;2018年
2 张体;基于Hadoop分布式网络爬虫系统的优化研究[D];北京工业大学;2017年
3 彭世锦;大数据模型调度系统的关键问题研究[D];电子科技大学;2017年
4 陶昌云;面向大数据的模型解释系统关键技术研究[D];电子科技大学;2017年
5 董书超;基于逻辑回归模型的广告点击率预估系统的设计与实现[D];哈尔滨工业大学;2016年
6 李顺东;云平台下电网短期负荷预测算法的研究与实现[D];华北电力大学;2016年
7 耿令宝;分布式环境下的网络爬虫系统研究与优化[D];北京邮电大学;2015年
8 张文军;基于MapReduce的可视化数据处理平台的设计与实现[D];西安电子科技大学;2014年
9 王寅田;基于Hadoop的交通物流大数据处理系统设计与实现[D];上海交通大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 陈鸿川;刘博;栾文鹏;李秋硕;;用于非侵入式电力负荷监测的改进Viterbi算法[J];电力系统及其自动化学报;2017年02期
2 黄晓清;;基于云计算分析大数据信息检索技术[J];科学中国人;2016年33期
3 吴谋硕;;基于云计算的Web信息收集与检索过程分析[J];信息与电脑(理论版);2016年15期
4 祁兵;程媛;武昕;;基于Fisher有监督判别的非侵入式居民负荷辨识方法[J];电网技术;2016年08期
5 马相东;卢占庆;谭永彦;王秀英;;基于支持向量机的分类辨识方法及应用[J];控制工程;2016年05期
6 蔡世清;周杰;;基于支持向量机的多传感器数据融合算法[J];计算机工程与设计;2016年05期
7 庄池杰;张斌;胡军;李秋硕;曾嵘;;基于无监督学习的电力用户异常用电模式检测[J];中国电机工程学报;2016年02期
8 刘月;;探究云计算下大数据的信息检索技术应用[J];数字技术与应用;2015年07期
9 郝永健;张团善;周文胜;孙盟盟;徐坤;;动态纱线张力传感器弹簧片的有限元模态分析[J];西安工程大学学报;2015年03期
10 邓红元;王春军;;基于蒙特卡罗仿真的CRC检错能力验证[J];铁路通信信号工程技术;2014年06期
中国硕士学位论文全文数据库 前9条
1 孙万龙;基于GBDT的社区问题标签推荐技术研究[D];哈尔滨工业大学;2015年
2 邵迪;在线广告中高层特征表示及点击率预测方法研究[D];哈尔滨工业大学;2014年
3 王兵;一种基于逻辑回归模型的搜索广告点击率预估方法的研究[D];浙江大学;2013年
4 朱晨杰;MapReduce作业组合系统的研究与实现[D];上海交通大学;2013年
5 刘丛山;基于Hadoop的文本分类研究[D];上海交通大学;2012年
6 刘猛;云计算平台下神经网络方法研究[D];电子科技大学;2011年
7 梁维铿;基于Hadoop的分布式文本聚类研究[D];华南理工大学;2011年
8 白云龙;基于Hadoop的数据挖掘算法研究与实现[D];北京邮电大学;2011年
9 朱珠;基于Hadoop的海量数据处理模型研究和应用[D];北京邮电大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 李秋敏;肖雯心;;基于有序逻辑回归模型的成都地区流动人口幸福感分析[J];经贸实践;2016年15期
2 李元祥;丁晓青;;一种利用逻辑回归模型的候选字可信度估计方法[J];模式识别与人工智能;2002年02期
3 刘渊泽;史雯慧;;关于西安市大学生落户意愿的调查分析——基于逻辑回归法的研究分析[J];现代交际;2018年13期
4 徐征;刘遵雄;;上市公司财务预警的T逻辑回归模型[J];井冈山大学学报(自然科学版);2015年02期
5 王艳龙;杜立志;何赛;蔡伟嘉;;逻辑回归模型在边坡稳定性分析中的应用[J];世界地质;2018年03期
6 江润生;;基于逻辑回归的“拍照赚钱”任务分析模型[J];中国高新区;2018年03期
7 周国清;陈昆华;何素楠;岳涛;黄景金;;基于逻辑回归模型的来宾市岩溶塌陷敏感性评价[J];安全与环境工程;2014年06期
8 郑晓霞;刘超;邹钰;;基于逻辑回归模型的中文垃圾短信过滤[J];黑龙江工程学院学报(自然科学版);2010年04期
9 李战江;;基于分层逻辑回归的小企业信用评价模型[J];统计与决策;2016年07期
10 王振飞;刘凯莉;郑志蕴;李钝;;基于逻辑回归模型的微博转发预测[J];小型微型计算机系统;2016年08期
中国重要会议论文全文数据库 前9条
1 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 张汉洋;朱颖饶;周婷婷;;育龄人员二胎生育意愿调查——以成本与效用角度研究[A];2017年(第五届)全国大学生统计建模大赛获奖论文选[C];2017年
3 卢馨;陈睿;;高管强制性变更与董事会特征实证分析[A];中国会计学会2011学术年会论文集[C];2011年
4 邱智莉;彭文波;;农村老年人主观幸福感影响因素探索[A];第十八届全国心理学学术会议摘要集——心理学与社会发展[C];2015年
5 张道军;;空间加权逻辑回归技术及其在成矿预测信息综合中的应用[A];中国地质学会2015学术年会论文摘要汇编(中册)[C];2015年
6 袁媛;李珊;;中国大城市社会剥夺的邻里差异和形成原因——基于个体数据的分析[A];地理学核心问题与主线——中国地理学会2011年学术年会暨中国科学院新疆生态与地理研究所建所五十年庆典论文摘要集[C];2011年
7 张骏;姬慧;;逻辑回归模型在医疗设备报废评估辅助决策系统中的应用设想[A];中华医学会医学工程学分会第十五次全国学术年会论文汇编[C];2015年
8 何莉;林鸿飞;;基于主题划分的分布式检索混合结果合并技术研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 孙芳;乔颖丽;;现代农牧业经营模式选择影响因素实证分析——基于农牧交错带部分县的调查[A];技术创新与现代农业发展[C];2009年
中国重要报纸全文数据库 前3条
1 本报记者 徐伟平;北京望道投资王杰:投资逻辑回归 参与主题轮动[N];中国证券报;2015年
2 成都市社会科学院社会学与法制研究所副所长 副研究员 博士 明亮;共建美丽城市 共享美好生活[N];成都日报;2018年
3 中债资信评估有限责任公司 孙嘉 杨帅;个人住房抵押贷款支持证券评级思路[N];金融时报;2014年
中国博士学位论文全文数据库 前4条
1 张道军;逻辑回归空间加权技术及其在矿产资源信息综合中的应用[D];中国地质大学;2015年
2 张利军;大规模机器学习理论研究与应用[D];浙江大学;2012年
3 木瑞塔(Murtada Khalafallah Elbashir Elfaki);基于机器学习和统计方法的蛋白质结构特征预测[D];中南大学;2013年
4 Ehsan Elahi(恩杉);污水对水牛养殖的发病率、牛奶生产和经济损失的影响分析[D];中国农业大学;2017年
中国硕士学位论文全文数据库 前10条
1 吴文伟;基于分布式逻辑回归模型的广告点击率预估系统[D];北京交通大学;2018年
2 刘哲;逻辑回归模型在小额信贷企业中风控环节的应用研究[D];首都经济贸易大学;2018年
3 赵浩天;带有L_((1/2)+2)正则项的稀疏线性与逻辑回归问题的模型及算法研究[D];北京交通大学;2018年
4 KHEANG POV;铁路旅客列车市场竞争力提升问题研究[D];北京交通大学;2018年
5 朱鹏飞;基于逻辑回归选股和股指波动择时的量化投资产品设计[D];上海师范大学;2018年
6 常奇;基于多组学数据的癌症患者生存期预测研究[D];大连海事大学;2017年
7 郑桂荣;面向类不平衡问题的逻辑回归分类学习算法研究[D];信阳师范学院;2017年
8 刘力银;基于逻辑回归的推荐技术研究及应用[D];电子科技大学;2013年
9 胡骏;支持向量机理论及其应用[D];武汉科技大学;2011年
10 胡俊;基于多元逻辑回归和邻域信息的高光谱遥感影像半监督分类[D];中国矿业大学;2015年
中国知网广告投放
相关机构
>中国地质大学
相关作者
>张道军
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026