收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于特征抽取和分步回归算法的资金流入流出预测模型

曹璨  
【摘要】:商业公司的金融平台往往拥有千万乃至上亿位服务会员,公司的金融业务场景每天必然会涉及大量的资金流入和流出,面对如此庞大的金融数据,资金管理压力会非常大。在既保证资金流动性风险最小,又满足日常业务运转的情况下,精准地预测资金的流入流出情况显得尤为重要。但金融数据的变动往往受社会,政治,经济,重大事件等多方面因素影响,数据趋势不稳定而且包含多噪声,给资金流量的预测带来了困难。本文以金融平台用户的资金流量预测为研究背景,旨在构建一个准确、有效的资金流入流出的预测模型,以最大程度上贴近资金流量的真实值,便于资金管理。本文的主要研究内容与成果如下:1.本文针对资金流入流出数据集初始特征不明显的特点,利用特征抽取方法挖掘出相关特征,并采取特征选择策略选出最优特征子集。主要是从时间、用户、利率三个不同角度构造与目标值相关的多个特征,再利用皮埃尔相关系数法进行初步筛选出最为相关的特征。随后用特征选择策略进一步筛选,剔除次相关特征和冗余特征,形成最优特征子集。实验结果表明,特征抽取方法所选的特征子集对不同回归算法的预测效果的影响不同,在最终申购值的12列特征、赎回值的10列特征时达到最佳子集,对大多数不同的回归算法可以得到较好的预测效果。因此可以确定此特征子集作为下一步算法预测的最优特征子集。2.为解决数据集不稳定,多噪声的问题,采用分步回归算法对特征子集进行训练学习,提高回归预测准确率。本文提出的是两步特征预测方法,即单步特征预测是运用灰度预测、时间序列算法对未来时间的未知特征进行预测,将预测的特征添加到未来时段的已知特征子集中。随后结合BP神经网络对所有特征集合进行训练建模,得到最终的预测结果。将该算法与集成学习方法对比,运用基于Adaboost的梯度提升回归树和基于Bagging的随机森林回归算法分别对数据集进行训练。由实验结果分析,发现两步特征预测算法较其他算法减小了预测误差,部分算法比集成学习方法的预测效果更佳。3.本文对离散类型的特征子集进行one-hot稀疏编码,考虑因子分解机算法在处理稀疏数据集时作用显著,运用该算法进行回归预测。由于因子分解机算法可以较好地表达变量间的相互作用,相当于在原有特征变量的基础上还增加了二次交叉特征,更好地刻画数据集的特点。此外,因子分解机的算法复杂度不太高,且运行效率高。实验表明,因子分解机算法在一定程度上可以提高资金流入流出量的预测准确率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 万嘉若,章明;教学模式的特征抽取与自动分类[J];信息与控制;1985年01期
2 梁逸曾,俞汝勤,董有方;特征抽取的一个新算法[J];湖南大学学报;1989年02期
3 周春光;味觉信号的特征抽取[J];吉林大学自然科学学报;1994年02期
4 张学如,袁石夫,赵世杰,陈历学,李淳飞;多重不变图象特征抽取器[J];应用激光;1995年02期
5 黄修武,郭跃飞,杨静宇;基于代数方法的图像特征抽取和识别[J];南京理工大学学报;1998年01期
6 周剑;王晓军;杨明珠;;中文文本的特征抽取和分类算法[J];科技信息(科学教研);2007年28期
7 冯嘉礼;从属性量检测到质特征定性的感觉特征抽取模型[J];广西师范大学学报(自然科学版);2001年02期
8 马俊莉,莫玉龙,王明祥;基于有效鉴别特征抽取的有限汉字集识别[J];上海大学学报(自然科学版);2002年01期
9 李天牧,李学群;基于神经网络的自动特征抽取[J];云南大学学报(自然科学版);1991年03期
10 常迪,周春光,刘小华,梁艳春,徐杰;人像识别中的特征抽取[J];吉林大学自然科学学报;2000年02期
11 孙祥;倪勇;;核特征抽取的反馈神经网络的探索及应用[J];合肥工业大学学报(自然科学版);2008年03期
12 符保龙;;文本特征抽取中基于基因集编码的遗传退火算法[J];广西科学院学报;2012年01期
13 杨书远,岳兵;人脸识别的一种新方法[J];高师理科学刊;1999年02期
14 徐勇,杨强,杨静宇;基于核的快速特征抽取及识别方法[J];解放军理工大学学报(自然科学版);2005年02期
15 龚裕,张宪荣;关于汉字视觉心理尺度评价的有效特征抽取[J];上海大学学报(自然科学版);1999年06期
16 石敏;康耀红;;一种联合的文本分类特征抽取函数[J];海南大学学报(自然科学版);2005年04期
17 陈鲁林;用于不变特征抽取的MADALINE网络的改进和硬件实现[J];红外与毫米波学报;1993年05期
18 吴陈;模式多特征抽取识别的形式化研究[J];华东船舶工业学院学报;1998年06期
19 吴镇扬;HRIR的空间特征抽取与特征分析[J];东南大学学报;1996年S1期
20 任克强;张国萍;赵光甫;;基于向量空间模型的特征抽取技术分析[J];科技广场;2007年09期
中国重要会议论文全文数据库 前5条
1 邓中亮;;雕刻型面的特征抽取机制与自动辩识[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
2 郭宗睿;郑义;;彩色图象中人脸自动检测定位和特征抽取[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
3 曹三省;黄祥林;刘剑波;吕锐;;基于Gaussian模糊隶属的媒体内容对象特征抽取[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
4 孙萌;姚建民;吕雅娟;刘群;姜文斌;;基于最大熵短语重排序模型的特征抽取算法改进[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 陈才扣;侯钰;;自适应监督鉴别投影分析[A];中国自动化学会控制理论专业委员会A卷[C];2011年
中国博士学位论文全文数据库 前10条
1 王丹丹;文本宏特征抽取与基于质心的自动分类方法研究[D];哈尔滨工业大学;2014年
2 黄锴;远程心电张量特征抽取与分析[D];上海交通大学;2015年
3 杨万扣;人脸识别中的部分特征抽取技术研究[D];南京理工大学;2009年
4 赵才荣;基于图嵌入与视觉注意的特征抽取[D];南京理工大学;2011年
5 万鸣华;基于图嵌入的特征抽取与人脸识别研究[D];南京理工大学;2011年
6 陈伏兵;人脸识别中鉴别特征抽取若干方法研究[D];南京理工大学;2006年
7 吴小俊;图象特征抽取与识别理论及其在人脸识别中的应用[D];南京理工大学;2002年
8 杨茂龙;相关投影分析在特征抽取中的应用研究[D];南京理工大学;2011年
9 严慧;线性特征抽取研究及其在人脸识别中的应用[D];南京理工大学;2011年
10 徐洁;基于子空间分析的特征抽取及分类方法研究[D];南京理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 丁宇;基于核范数的特征抽取与人脸识别应用研究[D];扬州大学;2015年
2 张江滨;弹性模糊系统建模研究[D];江南大学;2016年
3 叶开;基于词向量的在线评论话题及其特征抽取研究[D];电子科技大学;2016年
4 王禹;基于线性回归分析的特征抽取及分类应用研究[D];扬州大学;2016年
5 曹璨;基于特征抽取和分步回归算法的资金流入流出预测模型[D];中国科学技术大学;2017年
6 丁鑫龙;基于重构的鉴别特征抽取及人脸识别应用研究[D];扬州大学;2013年
7 彭柳艳;中文网络产品评论的特征抽取及观点分类研究[D];武汉纺织大学;2011年
8 范冠杰;基于动态反馈的特征抽取及人脸识别应用研究[D];扬州大学;2014年
9 朱善宗;面向情感分析的特征抽取技术研究[D];哈尔滨工业大学;2009年
10 刘杰;基于特征抽取的企业文本数据索引系统的研究和实现[D];南京邮电大学;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978