基于不完备粗糙集的关键报价影响因素组合提取研究
【摘要】:制造业询价订单信息共享平台的快速发展为制造企业带来了新的机遇和挑战,新的平台带来了比以往更多的潜在客户,面对询价订单量增加,客户订单需求个性化、需求不确定性的增加,传统报价方法的沟通成本、管理成本增加而且报价周期也变的更长。同时由于全程的报价数据来源广,跨部门跨流程,结构复杂,报价影响因素之间还存在着耦合关系,处理起来人力成本和时间成本较高而且由于是跨部门进行处理的,部门之间的度量标准、协调对接的准确性直接影响着最终报价的准确性。因此快速准确地进行产品报价是制造企业当下需要解决的重要问题。本文针对如何从大量包含有不确定性的订单中提取出关键报价影响因素组合的实际问题,引入不完备粗糙集理论,构建了基于不完备粗糙集的关键报价影响因素组合提取模型,首先将报价订单中的产品要求拆解细化到产品全生命周期的各个阶段上,然后将产品全生命周期中涉及到的大量具有耦合性和不确定性的数据整合为一张不完备决策表,其中报价影响因素作为条件属性,价格作为决策属性,最后进行属性约简,得到的约简集即为与价格密切相关的关键报价影响因素组合。通过分析最常用的处理不完备决策表的拓展粗糙集模型,基于容差关系的不完备粗糙集模型的优缺点,其由于无需对决策表进行填补缺值的预处理,可以对于不完备决策表进行直接处理而不会破坏不完备决策表原始数据结构而被广为使用,但是由于其仅从被比较的两个对象的值的角度出发,忽略了对于对象间整体确定值近似程度的考虑,有可能将并没有在某属性上都存在确定属性值且属性值相等的对象错误的划分到同一容差类中,因此造成近似精度的低下,影响属性约简的精度。通过分析基于容差关系的不完备粗糙集模型的局限性,本文提出了基于对象近似度改进的容差关系,增加对象近似度的衡量约束,对于被划入某对象容差类中的对象进行二次筛选,能够减少容差类中被错误归类的对象个数,提高近似精度。而由于选取不同的对象近似度改进阈值带来的效果是不同的,因此提出基于IDT本身的对象近似度阈值选取算法,从样本数据本身出发来选取不同的阈值。最后应用UCI标准数据集和实际报价数据集对方法进行测试,验证了该模型的有效性和可靠性,可用来进行关键报价影响因素组合的提取,为制造企业报价提供指导意义。