2012/3/4

LQR(linearquadraticregulator)即线性二次型调节器,其对象是现代控制理论中以状态空间形式给出的线性系统,而目标函数为对象状态和控制输入的二次型函数。LQR最优设计指设计是出的状态反馈控制器K要使二次型目标函数J取最小值,而K由权矩阵Q与R唯一决定,故此Q、R的选择尤为重要。LQR理论是现代控制理论中发展最早也最为成熟的一种状态空间设计法。特别可贵的是,LQR可得到状态线性反馈的最优控制规律,易于构成闭环最优控制。而且Matlab的应用为LQR理论仿真提供了条件,更为我们实现稳、准、快的控制目标提供了方便。
LQR Linear-quadratic regulator design for state space systems.

[K,S,E] = LQR(SYS,Q,R,N) calculates the optimal gain matrix K
such that:

* For a continuous-time state-space model SYS, the state-feedback
law u = -Kx minimizes the cost function

J = Integral {x'Qx + u'Ru + 2*x'Nu} dt

subject to the system dynamics dx/dt = Ax + Bu

* For a discrete-time state-space model SYS, u[n] = -Kx[n] minimizes

J = Sum {x'Qx + u'Ru + 2*x'Nu}

subject to x[n+1] = Ax[n] + Bu[n].

The matrix N is set to zero when omitted. Also returned are the
the solution S of the associated algebraic Riccati equation and
the closed-loop eigenvalues E = EIG(A-B*K).

[K,S,E] = LQR(A,B,Q,R,N) is an equivalent syntax for continuous-time
models with dynamics dx/dt = Ax + Bu

 

纳什平衡
其经典的例子就是囚徒困境。囚徒困境是一个非零和博弈。 大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。 于是,两人同时陷入招供还是不招供的两难处境。 但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供, 这种情况就称为纳氏均衡点。 这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯甲的博弈矩阵 囚犯甲
招供 不招供
囚犯乙 招供 各判刑两年 甲判刑十年,乙立即释放
不招供 甲立即释放,乙判刑十年 各判刑半年


基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。

四轴飞行器的部分变种darganfly http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=3258454

posted @ 2012-03-04 12:59  老徐Bowie  阅读(191)  评论(0编辑  收藏  举报