收藏本站
《云南大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于XGBoost与线性模型的在线广告点击率(CTR)预测

胡涛  
【摘要】:广告点击率预估是互联网计算广告中的关键环节,点击率预估的准确性直接影响着互联网公司的广告收入。在广告推荐系统中使用机器学习算法能有效提高广告点击转化率,实现用户的个性化广告推荐,有效提高互联网公司的收益。现在有部分互联网公司还是以逻辑回归作为他们的点击率预估的主要工具,但逻辑回归的非线性表达能力较弱,为了捕捉到数据之间的非线性关系,我们需要大量人工经验特征,该过程需要花费大量时间,但人工能力有限,很难对非线性关系完全挖掘充分。同样的点击率预估问题,换一个场景就很难推广,并且依靠人工特征的方式也不够智能,因此在业界出现了对模型改进的尝试。本文从逻辑回归开始,依次介绍了XGBoost、因子分解机与场感知分解机。本文借鉴了Facebook在论文中提出的GBDT与逻辑回归的融合模型的思路,利用GBDT的非线性拟合能力,来充分学习各个特征之间的非线性关系,将叶节点作为逻辑回归的输入来增强逻辑回归的拟合能力。本文创新点在于对这一方法进行进一步改进,使用GBDT模型的改进版本XGBoost,以增加模型的精度与运算速度。同时本文使用逻辑回归的改进模型因子分解机与场感知分解机以进一步加强模型的非线性拟合能力,这样大大增加模型的非线性拟合能力,并且在一定程度上节省人工经验特征的工作。同时本文对ID特征提出使用自然语言处理中词向量的表示方法来让模型学习,大大提高模型精度。在本次某旅行网站点击预测数据集上,采用的XGBoost与因子分解机的融合方式在AUC指标上超过任意单一模型,取得较好效果,验证了该方法的有效性与可行性。
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F713.8;F224

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 李秋敏;肖雯心;;基于有序逻辑回归模型的成都地区流动人口幸福感分析[J];经贸实践;2016年15期
2 李元祥;丁晓青;;一种利用逻辑回归模型的候选字可信度估计方法[J];模式识别与人工智能;2002年02期
3 刘渊泽;史雯慧;;关于西安市大学生落户意愿的调查分析——基于逻辑回归法的研究分析[J];现代交际;2018年13期
4 徐征;刘遵雄;;上市公司财务预警的T逻辑回归模型[J];井冈山大学学报(自然科学版);2015年02期
5 江润生;;基于逻辑回归的“拍照赚钱”任务分析模型[J];中国高新区;2018年03期
6 周国清;陈昆华;何素楠;岳涛;黄景金;;基于逻辑回归模型的来宾市岩溶塌陷敏感性评价[J];安全与环境工程;2014年06期
7 郑晓霞;刘超;邹钰;;基于逻辑回归模型的中文垃圾短信过滤[J];黑龙江工程学院学报(自然科学版);2010年04期
8 王振飞;刘凯莉;郑志蕴;李钝;;基于逻辑回归模型的微博转发预测[J];小型微型计算机系统;2016年08期
9 李学峰;王军;;基于广义有序逻辑回归的沥青路面使用性能评价[J];厦门理工学院学报;2018年05期
10 朱丽颖;贾春华;;基于逻辑回归的“但见一证便是”探讨[J];中华中医药杂志;2017年11期
中国重要会议论文全文数据库 前10条
1 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 吴宇怀;叶葳;王峰;吴小龙;陈甲新;;用户动态性能需求转化模型研究[A];2019中国汽车工程学会年会论文集(5)[C];2019年
3 张汉洋;朱颖饶;周婷婷;;育龄人员二胎生育意愿调查——以成本与效用角度研究[A];2017年(第五届)全国大学生统计建模大赛获奖论文选[C];2017年
4 卢馨;陈睿;;高管强制性变更与董事会特征实证分析[A];中国会计学会2011学术年会论文集[C];2011年
5 邱智莉;彭文波;;农村老年人主观幸福感影响因素探索[A];第十八届全国心理学学术会议摘要集——心理学与社会发展[C];2015年
6 张道军;;空间加权逻辑回归技术及其在成矿预测信息综合中的应用[A];中国地质学会2015学术年会论文摘要汇编(中册)[C];2015年
7 赵晓萌;蔡新玲;雷向杰;;降雨型滑坡的逻辑回归预测模型[A];第35届中国气象学会年会 S10 水文气象灾害形成机理、预报预测预警与风险评估新技术[C];2018年
8 袁媛;李珊;;中国大城市社会剥夺的邻里差异和形成原因——基于个体数据的分析[A];地理学核心问题与主线——中国地理学会2011年学术年会暨中国科学院新疆生态与地理研究所建所五十年庆典论文摘要集[C];2011年
9 李凯;许冲;谭明;陈建波;李帅;罗炬;吴国栋;;基于GIS和逻辑回归模型的2012年和静地震滑坡危险性评价[A];2019年全国工程地质学术年会论文集[C];2019年
10 张骏;姬慧;;逻辑回归模型在医疗设备报废评估辅助决策系统中的应用设想[A];中华医学会医学工程学分会第十五次全国学术年会论文汇编[C];2015年
中国重要报纸全文数据库 前6条
1 本报记者 黄淑慧;基金配置逻辑回归基本面[N];中国证券报;2019年
2 本报记者 徐伟平;北京望道投资王杰:投资逻辑回归 参与主题轮动[N];中国证券报;2015年
3 成都市社会科学院社会学与法制研究所副所长 副研究员 博士 明亮;共建美丽城市 共享美好生活[N];成都日报;2018年
4 本报评论员;如何保持“城市让生活更美好”的初心之源?[N];成都日报;2019年
5 本报评论员;平安社区依靠“你”“我”“他”[N];成都日报;2019年
6 中债资信评估有限责任公司 孙嘉 杨帅;个人住房抵押贷款支持证券评级思路[N];金融时报;2014年
中国博士学位论文全文数据库 前4条
1 张道军;逻辑回归空间加权技术及其在矿产资源信息综合中的应用[D];中国地质大学;2015年
2 张利军;大规模机器学习理论研究与应用[D];浙江大学;2012年
3 木瑞塔(Murtada Khalafallah Elbashir Elfaki);基于机器学习和统计方法的蛋白质结构特征预测[D];中南大学;2013年
4 Ehsan Elahi(恩杉);污水对水牛养殖的发病率、牛奶生产和经济损失的影响分析[D];中国农业大学;2017年
中国硕士学位论文全文数据库 前10条
1 胡涛;基于XGBoost与线性模型的在线广告点击率(CTR)预测[D];云南大学;2018年
2 秦诚;逻辑回归算法改进及基于TensorFlow并行化研究[D];吉林大学;2019年
3 张士辉;基于逻辑回归的后勤水电管理研究及应用[D];西北师范大学;2017年
4 余德美;一种新的处理非均衡数据的非迭代核逻辑回归方法[D];中国科学技术大学;2019年
5 梁学芳;基于逻辑回归模型的汽车评论挖掘研究[D];天津商业大学;2019年
6 王晓宇;新闻自动推荐配图的方法研究[D];内蒙古大学;2019年
7 邓介一;大数据环境下的多分类逻辑回归算法研究与应用[D];武汉工程大学;2018年
8 白婧怡;基于经典评分卡与机器学习的金融风险识别模型及其应用[D];天津商业大学;2019年
9 赵浩天;带有L_((1/2)+2)正则项的稀疏线性与逻辑回归问题的模型及算法研究[D];北京交通大学;2018年
10 吴文伟;基于分布式逻辑回归模型的广告点击率预估系统[D];北京交通大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026