收藏本站
《华北电力大学(北京)》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于强化学习的模糊神经网络控制研究及应用

侯志鹏  
【摘要】: 本文研究了利用强化学习自动调节模糊神经网络的结构问题。应用强化学习算法,可以根据每条规则的推理强度度量其在调节系统中所起的作用,最终确定每条模糊规则的取舍,仿真结果表明,在实时系统中这种方式比模糊K均值聚类和自组织竞争神经网络等传统辨识方法具有更好的适应性。在此基础上,本文提出了两种提高调节品质的方法:在建立规则时,将强化学习的智能试探功能用于模糊控制规则的搜索,提高生成规则的质量;删除无用规则时,采用逐步减少隶属函数宽度的方法加强调节系统的稳定性,最后通过仿真证明算法的有效性。
【学位授予单位】:华北电力大学(北京)
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP183

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 达飞鹏,宋文忠;基于输入输出模型的模糊神经网络滑模控制[J];自动化学报;2000年01期
2 田民乐,刘少民;一种新型的模糊神经网络及其应用[J];模糊系统与数学;1998年04期
【共引文献】
中国期刊全文数据库 前10条
1 郑宇;罗四维;吕子昂;;基于模型的层次化强化学习算法[J];北京交通大学学报;2006年05期
2 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期
3 杨萍;毕义明;孙淑玲;;具有自主决策能力的机动单元智能体研究[J];兵工学报;2007年11期
4 赵晓华;李振龙;于泉;张杰;;基于切换模型的两交叉口信号灯Q学习协调控制[J];北京工业大学学报;2007年11期
5 孙若莹;李忱;赵刚;;基于强化学习的牛鞭效应对策模型[J];北京信息科技大学学报(自然科学版);2011年01期
6 李春贵,吴沧浦,刘永信;一种集成规划的SARSA(λ)强化学习算法[J];北京理工大学学报;2002年03期
7 童亮,陆际联,龚建伟;一种快速强化学习方法研究[J];北京理工大学学报;2005年04期
8 王华;崔晓婷;刘向东;张宇河;;基于Q-学习的卫星姿态在线模糊神经网络控制[J];北京理工大学学报;2006年03期
9 刘向东;崔晓婷;王华;张宇河;;TD再励学习在卫星姿态控制中的应用[J];北京理工大学学报;2006年03期
10 胡光华,吴沧浦;多步 R 学习算法(英文)[J];Journal of Beijing Institute of Technology(English Edition);1999年03期
中国重要会议论文全文数据库 前10条
1 陈泰任;曹卫华;吴敏;雷琪;;一种新的集成模型在焦炉火道温度软测量中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 ;Reinforcement Strategy Using Quantum Amplitude Amplification for Robot Learning[A];第二十六届中国控制会议论文集[C];2007年
3 毛剑琳;向凤红;冯丽辉;;一种改进的IEEE802.15.4自适应实时带宽分配策略[A];第二十七届中国控制会议论文集[C];2008年
4 马丽;刘惟一;;多个交通路口调度博弈模型及其均衡求解的增强学习算法[A];第二十七届中国控制会议论文集[C];2008年
5 ;Complexity Analysis of Quantum Reinforcement Learning[A];第二十九届中国控制会议论文集[C];2010年
6 ;Sample-Based Potentials Estimation for the Optimal Control of Stochastic System[A];中国自动化学会控制理论专业委员会D卷[C];2011年
7 郭成安;李建华;李明伟;;从观测数据学习后验概率函数:一种最佳神经网络模型的设计与分析[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 胡光华;;平均准则TD策略迭代算法[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
9 胡光华;殷英;李世云;;即时差分策略迭代算法[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
10 陈焕文;谢丽娟;谢建平;;TD方法与BP神经网络结合构造预测学习系统的算法分析与实现[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
2 邵宗凯;无刷双馈电机建模及智能控制策略研究[D];华中科技大学;2010年
3 高延增;超小型水下机器人关键性能提升技术研究[D];华南理工大学;2010年
4 詹跃东;质子交换膜燃料电池的综合智能协调控制研究[D];昆明理工大学;2010年
5 黄正行;临床过程分析与优化技术研究[D];浙江大学;2010年
6 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
7 冯奇;POMDP近似解法研究及在中医诊疗方案优化中的应用[D];北京交通大学;2011年
8 孙祥;大学生就业区域流向及引导策略研究[D];合肥工业大学;2011年
9 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
10 蔡军;家电产品市场营销研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 李志强;Q学习在单路口交通信号控制中的应用研究[D];长沙理工大学;2010年
2 姜新丽;基于强化学习的多机器人协作控制方法研究[D];沈阳理工大学;2010年
3 曲剑;可重构路由交换平台构件检索技术研究[D];解放军信息工程大学;2010年
4 乐天助;认知网络路由技术研究[D];西安电子科技大学;2011年
5 张小刚;面向社区服务的联机分析系统研究与实现[D];西安电子科技大学;2009年
6 孙亚光;基于蚁群算法的无线传感器网络路由协议的研究[D];北京交通大学;2011年
7 梁英波;基于ADP的在线学习算法及其在热轧活套中的应用研究[D];武汉理工大学;2011年
8 刘军坡;基于模糊模式识别的碰撞危险度评判方法[D];大连海事大学;2011年
9 肖文;基于QoS的可信Web服务组合及其相关问题研究[D];西南大学;2011年
10 姚艳军;认知无线网络中动态频谱共享的研究[D];北京邮电大学;2011年
【二级参考文献】
中国期刊全文数据库 前5条
1 达飞鹏,徐嗣鑫;基于模糊神经网络的系统辨识[J];控制与决策;1997年04期
2 徐承伟;吕勇哉;;动态系统模糊模型的辨识及自学习[J];自动化学报;1988年02期
3 王春燕;刘少民;;建立动态系统规则模型方法[J];自动化学报;1991年03期
4 睢刚,陈来九;动态系统模糊模型辨识及其自学习算法[J];自动化学报;1995年06期
5 于静江,顾钟文,周春晖;参考模糊集合构造方法及模糊模型辨识[J];信息与控制;1991年03期
【相似文献】
中国期刊全文数据库 前10条
1 阮晓钢;蔡建羡;陈静;;基于强化学习规则的两轮机器人自平衡控制[J];计算机测量与控制;2009年02期
2 达飞鹏,宋文忠;基于模糊神经网络滑模控制器的一类非线性系统自适应控制[J];电子学报;1999年11期
3 周涌,陈庆伟,吴晓蓓,胡维礼;一类非线性系统的模糊神经网络内模控制[J];东南大学学报(自然科学版);2003年S1期
4 吴定会;李真;纪志成;;基于模糊神经网络局部强化学习在Robocup中的应用[J];系统仿真学报;2007年16期
5 李杰星,章云,符曦;一种改进的最近邻聚类学习算法[J];控制理论与应用;2000年05期
6 段勇;徐心和;;基于模糊神经网络的强化学习及其在机器人导航中的应用[J];控制与决策;2007年05期
7 朱智华;;发育学习在足球机器人基本动作技能中的应用[J];科学技术与工程;2010年08期
8 王文玺;肖世德;孟祥印;张卫华;;模糊神经网络下基于强化学习的自主式地面车辆路径规划研究[J];中国机械工程;2009年21期
9 达飞鹏,宋文忠;基于FNN的滑模自适应控制[J];控制与决策;1998年04期
10 吴波;吴科;吕剑虹;;一种补偿递归模糊神经网络及其学习算法[J];中国科学(F辑:信息科学);2009年07期
中国重要会议论文全文数据库 前10条
1 王萧;任思聪;陈洪印;;非线性系统模糊神经网络模型参考自适应控制[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
2 周涌;陈庆伟;吴晓蓓;胡维礼;;基于模糊神经网络模型的非线性内模控制:鲁棒稳定性分析[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 吴飞卡;袁曾任;;用具有BP算法的模糊神经网络的模糊建模及在气象云图中的应用[A];1996年中国智能自动化学术会议论文集(上册)[C];1996年
4 闫俐;;模糊神经元网络非线性自适应控制[A];1999中国控制与决策学术年会论文集[C];1999年
5 李仁发;乜崇义;;一种用模糊神经网络建立模糊模型的新方法[A];1996年中国智能自动化学术会议论文集(上册)[C];1996年
6 姜静;陈雪波;;一种基于神经网络的自组织模糊控制[A];2001中国控制与决策学术年会论文集[C];2001年
7 邢杰;萧德云;;FALCON模糊神经网络及其在铝电解槽阳极效应预报中的应用[A];冶金自动化信息网年会论文集[C];2004年
8 席东民;胡琳静;;模糊神经网络在单元机组协调控制中的应用[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
9 谭思云;李志明;;基于模糊神经网络的水泥回转窑分解炉温度控制[A];中国硅酸盐学会2003年学术年会论文摘要集[C];2003年
10 孙增圻;;模糊神经网络及其在系统建模与控制中的应用[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 俞杰吴胜 董斌;莫要泛化“非线性”[N];中国国防报;2007年
7 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
8 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
9 孟庆刚 王连心;中医药研究别忘了非线性[N];中国中医药报;2006年
10 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
中国博士学位论文全文数据库 前10条
1 刘晓华;非线性系统模糊控制研究[D];大连理工大学;2002年
2 赵峻;基于学习方法的非线性系统主动容错控制研究[D];中国矿业大学;2010年
3 何静;基于观测器的非线性系统鲁棒故障检测与重构方法研究[D];国防科学技术大学;2009年
4 苏亚坤;基于T-S模糊模型的非线性系统的控制与滤波设计[D];青岛大学;2010年
5 陈向坚;微型飞行器姿态的智能控制方法研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
6 刘鹏;非线性时滞系统最优控制器的近似设计研究[D];中国海洋大学;2005年
7 刘继兵;开放量子体系中几何相位的研究[D];华中科技大学;2008年
8 罗秋滨;一类非线性系统预测控制中的建模问题[D];哈尔滨工业大学;2008年
9 张果;基于T-S模型的非线性系统的模糊控制[D];西安电子科技大学;2009年
10 张涛;非线性系统控制策略的研究[D];浙江大学;2001年
中国硕士学位论文全文数据库 前10条
1 侯志鹏;基于强化学习的模糊神经网络控制研究及应用[D];华北电力大学(北京);2007年
2 何谦;基于模糊神经网络的非线性系统建模及其工业应用研究[D];北京化工大学;2000年
3 孟凡华;模糊神经网络在大滞后非线性系统中的应用[D];河北工业大学;2004年
4 刘瑞平;电控汽油机智能故障诊断系统[D];太原理工大学;2011年
5 韩锋;基于模糊神经网络的电力系统短期负荷预测[D];河北农业大学;2011年
6 张克良;基于模糊神经网络的锅炉燃烧控制方法的研究[D];天津大学;2004年
7 高明帅;循环流化床锅炉灰循环系统控制优化研究[D];华北电力大学(北京);2011年
8 曾珞亚;模糊神经网络的应用与研究[D];广西师范大学;2000年
9 刘鑫伟;车辆行驶信息检测与主动避撞安全控制策略的研究[D];湖南大学;2010年
10 李兆福;模糊神经网络及其应用[D];南京理工大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026