收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

复杂生产过程中若干因果推断问题研究

凌昱弢  
【摘要】: 本文阐明了通过传统数据挖掘方法建立的模型与实际结果不符的原因。对传统分析结果进行了校正,并将研究结果应用在针对复杂大生产过程的控制模型。随着信息存储、处理技术以及计算机性能的飞速发展,数据挖掘已被广泛运用于各个领域中,是各类企业普遍关注的热点技术。对于工业生产型企业,人们普遍对数据挖掘技术寄予厚望,希望能将其应用于生产过程的建模和持续优化。 然而,工业现场数据所具有的高维、高噪、关系复杂等缺点,常见的数据挖掘技术往往无法发现数据之间的本质联系,即因果关系,不利于指导生产过程优化的控制模型的建立。因果推断方法是最近几年发展起来的一种数据分析理论,可以有效结合数据挖掘技术与长期积累的机理知识,通过挖掘结果验证机理知识、挖掘结果启发机理研究,从而获得可靠的、反映变量间因果关系的模型。这种因果模型可用于生产过程控制,从而提高生产效率和产品质量、降低生产过程能耗等。 本文深入探讨了工业过程数据缺点所导致的、建模结果与实际情况不符的假象。研究结果主要包括以下几个方面。一,自变量误差的存在将使得传统最小二乘法得到的模型系数估计有偏。有偏模型不可直接用于生产过程优化。我们在分析有偏原因的基础上,对挖掘结果进行了校正,模型校正结果在一定条件下能基本反映数据间本质的关系,可用于生产过程优化。二,自变量检的测误差可能导致某些用于评估模型可靠性的方法部分失效,用模型预测值的均值与现场实测值的均值之间的偏差作为判断模型是否可靠的简单标准已不适用。本文在充分探讨这种现象产生的原因的基础上进行推导,得出两者之间的偏差估计。三,由于变量间内在的复杂相关性,理论上具有线性关系的变量在数据中可能表现出无关的现象,理论上无关的变量在数据中可能表现出相关的假象,相关系数不可作为判断变量间是否存在相关关系的简单标准。四,对工业数据进行预处理时,简单地将数据分布两侧边缘的数据认作误差导致的数据予以剔除,这种做法改变了数据的分布,引起传统最小二乘法得到的模型系数有偏,模型不可直接应用于生产过程优化。五,因变量数据分布的改变,可能引起线性关系变量的最佳估计呈现非线性关系的现象发生,单从数据的最佳估计结果不能判断是否采用线性或非线性模型。本文研究中的公式推导均已进行了仿真,验证了其正确性。


知网文化
【相似文献】
中国期刊全文数据库 前10条
1 张建平;赵威;戴咏夏;;真空荧光显示器亮度特性的研究[J];液晶与显示;2010年01期
2 黄敏;尤梅芳;;非参数统计方法在房地产价格研究中的应用[J];中国物价;2010年01期
3 吴苏;李芳;朱善林;;基于信息融合技术的交通量检测算法研究[J];仪表技术;2010年03期
4 孙山林;;合作SCC系统的总LS信号检测方法[J];计算机工程与应用;2010年08期
5 范勇;周敬滨;王传珂;董建军;;一种实用的平板高精度摄像机标定方法[J];计算机测量与控制;2010年01期
6 李小磊;吴云刚;;求解c、Φ值的软件开发及试验验证[J];安全与环境工程;2010年01期
7 葛宝臻;李晓洁;邱实;;基于共面点直接线性变换的摄像机畸变校正[J];中国激光;2010年02期
8 王莹莹;刘德平;陈建军;余水晶;;基于曲率均化的B样条曲线能量光顺方法[J];机床与液压;2010年03期
9 陈小毛;梁世波;邓克绪;;一种宽频带模态识别算法的快速实现[J];南京航空航天大学学报;2010年01期
10 方黎勇;戴明宏;雷华堂;李柏林;;基于ICT切片图像的轮廓特征识别和曲线拟合[J];机械设计与制造;2010年01期
中国重要会议论文全文数据库 前10条
1 罗劼;王笑波;刘晔;;宝钢厚板加速冷却系统的在线模型机理分析[A];全国冶金自动化信息网2009年会论文集[C];2009年
2 周静;周海芳;唐玉华;;多模遥感图像高精度配准并行算法研究与实现[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
3 王森;吴春明;;烟草系统卷烟需求预测模型的探讨[A];中国烟草学会2009年年会论文集[C];2009年
4 韩璞;施建中;王东风;焦嵩鸣;;基于模糊聚类神经网络的T-S模糊模型辨识[A];2009国际信息技术与应用论坛论文集(上)[C];2009年
5 朱宝霞;刘波;周建梅;;分光光度法测定土样中总氰化物的测量不确定度评定[A];中国环境科学学会2009年学术年会论文集(第四卷)[C];2009年
6 王春艳;栾小宁;张登英;李文;郑荣儿;;基于浓度参量辅助荧光光谱海洋溢油油种鉴别技术[A];第五届全国环境化学大会摘要集[C];2009年
7 卢燕宇;吴必文;王小林;鲁俊;;基于极值分布的不同重现期下电线积冰标准厚度的求算——以光明顶站为例[A];第26届中国气象学会年会气象灾害与社会和谐分会场论文集[C];2009年
8 张喜亮;邱新法;陈世春;向华;;南太湖湖州地区太阳总辐射的气候学计算及特征分析[A];第26届中国气象学会年会气候资源应用研究分会场论文集[C];2009年
9 刘志军;;矿用气体传感器校验装置[A];中国计量协会冶金分会2009年年会论文集[C];2009年
10 李凤琴;;近5O年来灵武市气温变化特征分析[A];第26届中国气象学会年会气候变化分会场论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 钟祥麟;基于油膜模型的多点喷射汽油机瞬态工况控制研究[D];吉林大学;2007年
2 时艳香;区域地球化学单元的概念、方法与应用研究[D];吉林大学;2006年
3 郭会;几类发展方程的最小二乘有限元方法[D];山东大学;2006年
4 张留柱;水文测量误差研究[D];河海大学;2005年
5 包太;岩体渗流的理论模型及其渗流参数确定[D];重庆大学;2005年
6 张志君;基于光纤陀螺的寻北定向技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2005年
7 胡寅;三维扫描仪与逆向工程关键技术研究[D];华中科技大学;2005年
8 徐习东;电力变压器纵差保护研究[D];浙江大学;2005年
9 黄新波;真空熔覆Ni基合金—碳化钨和Co基合金—碳化钨复合涂层的制备及性能研究[D];西安电子科技大学;2005年
10 王国庆;BaO-TiO_2-ZnO系介质陶瓷及微波测试技术研究[D];天津大学;2005年
中国硕士学位论文全文数据库 前10条
1 李新军;动态流变法测四氟乙烯—六氟丙烯共聚物分子量及分子量分布[D];浙江大学;2010年
2 孙向阳;角点检测及其在纤维识别中的应用研究[D];东华大学;2009年
3 汪瑶;基于相量量测的电力系统谐波状态估计算法研究[D];重庆大学;2009年
4 何苗;外资制药行业教育回报现状[D];华东师范大学;2009年
5 孙永跃;机动车尾气检测仪紫外差分算法研究与软件设计[D];天津理工大学;2009年
6 畅为航;基于网格搜索的圆度误差评定算法研究[D];河南科技大学;2009年
7 竹励萍;金属型铸造凝固过程铸件/铸型界面换热系数的研究[D];天津理工大学;2009年
8 李雷;1500平整机轧制力系统建模与控制研究[D];燕山大学;2009年
9 侯建民;矿用箕斗动态定量称重系统的研究[D];西安科技大学;2009年
10 王冬;采煤机记忆调高试验模型控制系统研究[D];西安科技大学;2009年
中国重要报纸全文数据库 前10条
1 新疆有色地质勘察局测试中心 吴明辉 赵德耘 张华芹;ICP-MS测定矿石中痕量Pb含量测定的不确定度评定[N];新疆科技报(汉);2009年
2 平安期货 罗俊江;利用ETF进行股指期货期现套利[N];证券时报;2008年
3 倪成群;人民币升值背景下中外金价和黄金投资收益关联性研究[N];期货日报;2008年
4 贵州大学资源与环境工程学院地理信息系统041班 成忠;试论工程测量理论方法的发展[N];贵州民族报;2008年
5 徐张立;股票市值管理方案实证分析[N];期货日报;2008年
6 联合证券研究所 金融工程研究团队;用长期均线来寻找A股市场的价值中枢[N];上海证券报;2008年
7 于洋;统计模型参数估计及其应用成功[N];科技日报;2007年
8 张燕;浅析国际原油和玉米期货的相关性[N];期货日报;2007年
9 陈东理;如何把握股指期现套利投资机会[N];期货日报;2007年
10 崔建军;用上证50ETF与沪深300期指进行套利可行[N];期货日报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978