购物篮分析中若干问题的研究
【摘要】:本文对购物篮分析中的两个问题进行了深入研究:最有利润的商品选择问题,价格促销利润估计问题。本文对这些问题提出了怎样将数据挖掘直接集成到用户目标中的方法。试验表明,这些方法是有效的。
本文提出MOPIS(MOst Profitable Items Selection)算法来选择出最有利润的商品。MOPIS通过预测多个选择的利润来选取最优的选择,通过预测某选择下新的交易数据库来预测该选择的利润。MOPIS算法准确建模了顾客的购买行为,能预测出买不到期望商品时,顾客选择购买其它商品的概率与数量;又能预测出不可得的商品对顾客的购买行为的影响。MOPIS算法使用了一种新的估计选择利润的有效方法,建立了新的商品选择框架,提出了一种新的通过商品间的距离来预测代替商品的购买数量、购买概率的方法,给出了一种新的计算品种间的交叉销售影响的有效方法,提出了用品种贡献值来排序品种间的交叉销售影响的新方法。本文给出了选取最有利润的商品的启发式算法,同时提出了用遗传算法来解决最有利润的商品选择问题的gaMOPIS算法。
本文提出PEPP算法来估计价格促销中的利润。PEPP根据促销前的交易来预测促销中的交易。PEPP算法准确建模了价格促销中顾客的购买行为,能预测出价格变化时,顾客选择购买其它商品的行为;又能预测出被促销的商品对顾客的购买行为的影响。提出了通过商品间的距离来预测价格促销中商品的购买数量及购买概率的新方法,给出了一种新的用交叉销售影响因子来预测被促销的商品对其它商品的影响的有效算法,提出了一种新的预测未购买被促销商品的顾客购买被促销商品的算法。
本文研究表明:MOPIS算法与gaMOPIS算法是解决最有利润的商品选择问题的有效算法;试验表明,MOPIS算法能快速发现具有高的选择利润率的选择,比MPIS平均要快14倍,对含有大量商品、大量交易的数据集也是有效的;PEPP算法是解决价格促销利润估计问题的有效算法;试验表明,PEPP算法能快速、高效地预测价格促销中的利润,且对具有大量交易、大量商品的数据集也是很有效的。
|
|
|
|
1 |
张新光,王建华;数据仓库信息处理技术研究[J];齐齐哈尔大学学报;2000年03期 |
2 |
丁纪云,蔡春娥;利用构造数据集评定数据挖掘过程的方法[J];湖南广播电视大学学报;2001年02期 |
3 |
任承业,罗伟其;校园信息系统中CRM与数据挖掘的结合和应用[J];计算机工程与应用;2003年13期 |
4 |
王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期 |
5 |
邵红全,赵茜;用SQL Server2000实现数据挖掘的技术与策略[J];电脑开发与应用;2003年04期 |
6 |
耿庆鹏,卢子芳;利用数据挖掘技术实现对电信行业用户欺诈行为的预测[J];电信快报;2003年10期 |
7 |
蒋良孝,蔡之华;基于数据仓库的数据挖掘研究[J];计算技术与自动化;2003年03期 |
8 |
叶静,蔡之华;遥感图像中的数据挖掘应用概述[J];计算机与现代化;2003年10期 |
9 |
黄解军,万幼川,潘和平;银行客户关系管理与数据挖掘的应用[J];计算机工程与设计;2003年07期 |
10 |
崔强,朱卫东;基于数据挖掘的铁路机务段成本控制系统[J];铁路计算机应用;2003年01期 |
11 |
杨思春;基于数据仓库的数据挖掘技术分析研究[J];微机发展;2003年09期 |
12 |
汤效琴,戴汝源;数据挖掘中聚类分析的技术方法[J];微计算机信息;2003年01期 |
13 |
李月芳,孙俊;数据挖掘及其在电网故障诊断中的应用[J];农机化研究;2003年04期 |
14 |
陈勍;数据挖掘技术及其应用[J];医学信息;2004年04期 |
15 |
;中国科学院数据挖掘与知识管理学术研讨会在京举行[J];管理评论;2004年07期 |
16 |
曾贞;数据挖掘在电子商务中的应用[J];甘肃农业;2004年07期 |
17 |
陈钟;基于DSO的数据挖掘应用[J];广西师范学院学报(自然科学版);2004年S1期 |
18 |
柯文德;一种基于数据挖掘的分布式入侵检测模型[J];计算机测量与控制;2004年08期 |
19 |
徐玲;基于案件综合信息分析挖掘的研究[J];广东公安科技;2004年01期 |
20 |
赵明清;蒋昌俊;陶树平;;基于等价相异度矩阵的聚类[J];计算机科学;2004年07期 |
|