「双対性理論」の版間の差分

2007年6月27日 (水) 18:24時点における版

そうついせいりろん}{duality theory}

　双対性理論 (duality theory)は，非線形計画のみならず線形計画，多目的計画，離散凸解析などの分野で主問題とその双対問題の関係，および集合や関数の双対関係を説明する重要な基礎理論である [1, 2, 3, 4]．

　「双対」 (dual) と「共役」 (conjugate) は元々同義語として用いられ，数学の関数解析の分野では，ノルム空間 $X$ 上の有界線形汎関数の全体を$X$ の双対空間 (dual space) または共役空間 (conjugate space) といい，$X^{*}$ と表して，$x\in{X}$ における $x^{*}\in{X^*}$ の値を$\langle x, x^{*}\rangle$ または $x^{*}(x)$ と書く．$X$ が $n$ 次元実ユークリッド空間 $\mathbf{R}^n$ の場合は，$(\mathbf{R}^n)^{*}$ と $\mathbf{R}^n$ は同一視でき，$(\mathbf{R}^n)^{**}=\mathbf{R}^n$ となり，$\langle x, x^{*}\rangle$ は$x$ と $x^{*}$ の内積 $x^{\top}x^{*}$ となる．以下に述べる事柄は，無限次元空間に対しても拡張できるが，ここでは簡単のため $\mathbf{R}^n$ に限定して説明する．　空間 $\mathbf{R}^n$ 上で定義された拡張実数値関数 $f: \mathbf{R}^n\to\bar{\mathbf{R}}$ に対して(ただし，$\bar{\mathbf{R}}=\mathbf{R}\cup \{ \infty , -\infty\}$)，

f^*(\xi):=\sup_{x\in{\mathbf{R}^n}} \{ \, \xi^{\top}x - f(x) \, \}

で定義される関数 $f^*$ を $f$ の共役関数 (conjugate function) という．共役関数 $f^*$ に対して，さらにその共役関数 $f^{**}=(f^*)^{*}$ を考えることができるが，$f$ が下半連続な真凸関数のときには，$f^{**}$ は $f$ に一致する．$f$ に $f^*$ を対応させる写像をルジャンドル--フェンシェル変換 (Legendre-Fenchel transform) と呼ぶ．

　下半連続な真凸関数 $f: \mathbf{R}^n\times{\mathbf{R}^m}\to\bar{\mathbf{R}}$に対して，関数 $\varphi : \mathbf{R}^n \to \bar{\mathbf{R}}$ と $\psi : \mathbf{R}^m \to \bar{\mathbf{R}}$ をそれぞれ $\varphi{(x)}:=f(x,0)$ と $\psi{(y)}:=-f^{*}(0,y)$ で定義し，次の問題(P)と(D)を主問題 (primal problem) とその双対問題 (dual problem) と呼ぶ [1, 4]．

\begin{center} \begin{tabular}{cll} (P) & $\min_{x\in \mathbf{R}^n}$ & \hspace*{-5mm} $\varphi{(x)}$ \\ (D) & $\max_{y\in \mathbf{R}^m}$ & \hspace*{-5mm} $\psi{(y)}$ \end{tabular} \end{center}

また，

U:=\{u\in{\mathbf{R}^m}\,|\:\inf_{x\in{\mathbf{R}^n}}f(x,u)<+\infty\} \quad

V:=\{v\in{\mathbf{R}^n}\,|\:\inf_{y\in{\mathbf{R}^m}}f^{*}(v,y)<+\infty\}

とおくと，$U$ と $V$ は凸集合となる．このとき，以下が成立する．

\medskip \noindent (i) \ $\inf_{x}\varphi{(x)}\ge\sup_{y}\psi{(y)}$ \\ (ii) \ $0\in{\mbox{\rm int}\,U}\; または \; 0\in{\mbox{\rm int}\,V}

       \Longrightarrow\inf_{x}\varphi{(x)}=\sup_{y}\psi{(y)}$

ここで，$\mbox{\rm int}\,U$ は $U$ の内部を表す．(i)を弱双対定理 (weak duality theorem)，(ii)を双対定理 (duality theorem) と呼び，$\inf_{x}\varphi{(x)}=\sup_{y}\psi{(y)}$ が満たされるとき，主問題(P)と双対問題(D)の間に双対性 (duality) が成立するという．(i)により，$\sup_{y}\psi{(y)}=+\infty$ なら主問題(P)は実行可能解を持たないが，$-\infty<\varphi{(\bar{x})}=\psi{(\bar{y})}<+\infty$ となる $\bar{x}$ と $\bar{y}$ が存在すれば，それぞれ(P)と(D)の最適解となり，強い意味の双対性が成立する．一方，$\inf_{x}\varphi{(x)}>\sup_{y}\psi{(y)}$ となるとき，主問題と双対問題の間に双対性のギャップ (duality gap) が存在するという．

　主問題(P)において，$f(x,u):=c^{\top}x+k(x)+h(b-Ax+u)$（ただし，$k: \mathbf{R}^n\to\bar{\mathbf{R}}$ と $h: \mathbf{R}^m\to\bar{\mathbf{R}}$ は下半連続な真凸関数で$A\in{\mathbf{R}^{m\times{n}}}$, $b\in{\mathbf{R}^m}$, $c\in{\mathbf{R}^n}$ ）とすると，$f^{*}(v,y)=-b^{\top}y+h^{*}(y)+k^{*}(A^{\top}y-c+v)$となり \cite{[4]}，主問題(P)と双対問題(D)はそれぞれ

\begin{eqnarray} \mbox{\rm min}_{x\in \mathbf{R}^n} && \hspace*{-5mm} c^{\top}x+k(x)+h(b-Ax)

       \label{A-B-03+siki1}\\

\mbox{\rm max}_{y\in \mathbf{R}^m} && \hspace*{-5mm} b^{\top}y-h^{*}(y)-k^{*}(A^{\top}y-c)

       \label{A-B-03+siki2}

\end{eqnarray}

となる．ここで$b\in\mbox{\rm int}\,(A\mbox{\rm dom}k+\mbox{\rm dom}h)$ または$c\in\mbox{\rm int}\,(A^{\top}\mbox{\rm dom}h^{*}-\mbox{\rm dom}k^{*})$ が成立すれば，(ii)により主問題(\ref{A-B-03+siki1})と双対問題(\ref{A-B-03+siki2})の間に双対性が成立する．（ただし，dom は拡張実数値関数の実効定義域を表す．）これをフェンシェルの双対性 (Fenchel duality) と呼んでいる．通常は，簡略化して $c$ と $b$ を零ベクトル，$-A$ を恒等写像として，新たに$f(x)$ を凸関数 $f_1(x):=k(x)$ と凹関数 $f_2(x):=-h(x)$ の差で表し，主問題 $\min_{x}\{f_1(x)-f_2(x)\}$に対して，$\max_{y}\{f_{2}^{*}(y)-f_{1}^{*}(y)\}$ をフェンシェルの双対問題 (Fenchel dual problem) と呼ぶ．ただし，$f_{2}^{*}(y):=\inf_{x\in{\mathbf{R}^n}}\{y^{\top}x-f_{2}(x)\}$．双対性は $\mbox{\rm int}\,(\mbox{\rm dom}f_1)\,\cap\, \mbox{\rm int}\,(\mbox{\rm dom}f_2)\neq\emptyset$ のとき成立する．また，$k(x):=\sup_{s\le{0}}x^{\top}s$, $h(z):=\sup_{w\ge{0}}z^{\top}w$ とすると，(\ref{A-B-03+siki1})と(\ref{A-B-03+siki2})は線形計画の主問題と双対問題となる \cite{A-B-03-c,[4]}．

\begin{center} \begin{tabular}{clcll} (P$_{LP}$) & min. & $c^{\top}x$ & s. t. & $x\ge{0}, \ Ax\ge{b}.$ \\ (D$_{LP}$) & max. & $b^{\top}y$ & s. t. & $y\ge{0}, \ A^{\top}y\le{c}.$ \end{tabular} \end{center}

次に，ラグランジュ関数 (Lagrangian function) を

\begin{equation} \label{A-B-03+siki3} L(x,y):=\inf_{u\in{\mathbf{R}^m}}\{\, f(x,u)-y^{\top}u \,\} \end{equation}

と定義する．$-L(x,\cdot)=\left(f(x,\cdot)\right)^{*},　f(x,\cdot)=\left(-L(x,\cdot)\right)^{*}$ が成立しているので，

\begin{equation} \label{A-B-03+siki4} \varphi{(x)}=\sup_{y}L(x,y), \quad\quad \psi{(y)}=\inf_{x}L(x,y) \end{equation}

となる．通常，$\inf_{x}L(x,\bar{y})=L(\bar{x},\bar{y})=\sup_{y}L(\bar{x},y)$ すなわち，すべての $x\in{\mathbf{R}^n}$ と $y\in{\mathbf{R}^m}$ に対して$L(x,\bar{y})\ge{L(\bar{x},\bar{y})}\ge{L(\bar{x},y)}$が成り立つとき，$(\bar{x},\bar{y})$ を関数 $L$ の $\mathbf{R}^{n}\times{\mathbf{R}^m}$ 上での鞍点 (saddle point) と呼ぶ．(4) により，

\medskip \noindent (iii) \ $\inf_{x}\varphi{(x)}=\inf_{x}\,[\,\sup_{y}L(x,y)\,]

       \ge\sup_{y}\,[\,\inf_{x}L(x,y)\,]=\sup_{y}\psi{(y)}$ \\

(iv) \ $\varphi{(\bar{x})}=\inf_{x}\varphi{(x)}

       =\sup_{y}\psi{(y)}=\psi{(\bar{y})}$
       $\Longleftrightarrow$ $(\bar{x},\bar{y})$ が $L$ の鞍点
       \\ \hspace*{1cm}
      $\Longleftrightarrow$ $\min_{x}\sup_{y}L(x,y)=\max_{y}\inf_{x}L(x,y)$
       $\Longleftrightarrow$ 
       $\varphi{(\bar{x})}=L(\bar{x},\bar{y})=\psi{(\bar{y})}$

\medskip \noindent

が成立する．(iv)を鞍点定理 (saddle point theorem) と呼ぶ．非線形計画問題

\mbox{(NLP)} \; \; \mbox{min.} \ f_{0}(x) \quad \mbox{s. t.} \; \; g_{i}(x)\le{0} \ (i=1,\ldots, k), \ h_{j}(x)=0 \ (j=1,\ldots,l),

(ただし，$f_0,g_i,h_j$ は $\mathbf{R}^n$ で定義された実数値関数，$k+l=m$)に対して，

\begin{center} \begin{tabular}{r@{}l} $F(x)\,$&$:=(g_{1}(x),\ldots,g_{k}(x),h_{1}(x),\ldots,h_{l}(x))^{\top}$\\ $\theta(w)\,$&$:=\sup_{\lambda,\mu}\{\lambda^{\top}w_{1}+\mu^{\top}w_{2}\,|\,

       (\lambda,\mu)\in{\mathbf{R}^{k}_{+}\times{\mathbf{R}^{l}}},w=(w_1,w_2)^{\top}\}$\\

$f(x,u)\,$&$:=f_{0}(x)+\theta{(F(x)+u)}$ \end{tabular} \end{center}

とおくと，(\ref{A-B-03+siki3})により$L(x,y)=f_{0}(x)+y^{T}F(x)-\theta^{*}(y)$ となり，$y=(\lambda,\mu)=(\lambda_{1},\ldots,\lambda_{k},\mu_{1},\ldots,\mu_{l}) \in{\mathbf{R}^{k}_{+}\times{\mathbf{R}^{l}}}$に対する問題(NLP)のラグランジュ関数は

\begin{equation} \label{A-B-03+siki5} L(x,\lambda,\mu)=f_{0}(x)+\sum_{i=1}^{k}\lambda_{i}g_{i}(x)

               +\sum_{j=1}^{l}\mu_{j}h_{j}(x)

\end{equation}

となる．この $(\lambda,\mu)$ をラグランジュ乗数 (Lagrange multipliers) と呼ぶ．このとき，主問題と双対問題は

\begin{center} \begin{tabular}{cllll} (P$_{L}$) & min.

       & $\displaystyle \sup_{\lambda\ge{0},\mu} L(x, \lambda, \mu)$ 
       & s. t. & $\displaystyle{x \in {\mathbf{R}^n}}$, \\

(D$_{L}$) & max.

       & $\displaystyle \inf_{x} L(x,\lambda,\mu)$
       & s. t. 
       & $\displaystyle{0 \le \lambda \in {\mathbf{R}^{k}}}$, \
         $\displaystyle \mu \in {\mathbf{R}^{l}}$,

\end{tabular} \end{center}

となり，一般に問題(D$_{L}$)をラグランジュの双対問題 (Lagrangian dual problem)と呼ぶ．鞍点定理により，$L$ の鞍点 $(\bar{x},\bar{\lambda},\bar{\mu})$ が存在すれば，つまり

\max_{\lambda\ge{0},\mu}L(\bar{x},\lambda,\mu)=L(\bar{x},\bar{\lambda},\bar{\mu})

       =\min_{x}L(x,\bar{\lambda},\bar{\mu})

が成立すれば，$\bar{x}$ と $(\bar{\lambda},\bar{\mu})$ はそれぞれ問題(P$_{L}$)と(D$_{L}$)の最適解となり最適値が一致する．これをラグランジュの双対性 (Lagrangian duality) と呼ぶ．(iv)により，$\min_{x}\sup_{y}L(x,y)=\max_{y}\inf_{x}L(x,y)$ が成立すれば，この双対性が保証される．この等式に対する十分条件を述べた定理をミニマックス定理(minimax theorem) と呼ぶ [1]．逆に，主問題の目的関数 $f_0$ と制約関数 $g_i$ がすべて凸で，$h_j$ がすべてアフィン関数であるような凸計画問題 (convex programming problem) においては，適当な条件のもとで，問題(P$_{L}$)の最適解 $\bar{x}$ に対して，$\bar{\lambda}\ge{0}$ であるようなラグランジュ乗数 $(\bar{\lambda},\bar{\mu})$ が存在して，$(\bar{x},\bar{\lambda},\bar{\mu})$ がラグランジュ関数 $L$ の鞍点となる．さらに，次のような拡張ラグランジュ関数(augmented Lagrangian function) に基づく双対性も考えられている [2, 3, 4]．

\bar{L}(x,y):=\inf_{u\in{\mathbf{R}^m}}\{\, f(x,u)+r\sigma{(u)}-y^{\top}u\,\}

ただし，$r$ は正定数，$\sigma:\mathbf{R}^{m}\rightarrow\bar{\mathbf{R}}$ は $u\neq{0}$ に対して $0=\sigma{(0)}<\sigma{(u)}$ を満足する下半連続な真凸関数である．関数 $\sigma$ の例としては $\sigma{(u)}:=\frac{1}{2}\|u\|^{2}$ などがある．

[1] I. Ekeland and R. Temam, Convex Analysis and Variational Problems, North-Holland, Amsterdam, 1976.

[2] 福島雅夫,『非線形最適化の基礎』, 朝倉書店, 2001.

[3] 今野浩, 山下浩,『非線形計画法』, 日科技連, 1978.

[4] R.T. Rockafellar and R. J-B. Wets, Variational Analysis, Springer, Berlin, 1998.

「双対性理論」の版間の差分

2007年6月27日 (水) 18:24時点における版

案内メニュー

検索

@@ 26行目: / 26行目: @@
-  U:=\{u\in{\mathbf{R}^m}\,|\:\inf_{x\in{\mathbf{R}^n}}f(x,u)<+\infty\}
+U:=\{u\in{\mathbf{R}^m}\,|\:\inf_{x\in{\mathbf{R}^n}}f(x,u)<+\infty\}
 \quad
-  V:=\{v\in{\mathbf{R}^n}\,|\:\inf_{y\in{\mathbf{R}^m}}f^{*}(v,y)<+\infty\}
+V:=\{v\in{\mathbf{R}^n}\,|\:\inf_{y\in{\mathbf{R}^m}}f^{*}(v,y)<+\infty\}
@@ 42行目: / 42行目: @@
-ここで，$\mbox{\rm int}\,U$ は $U$ の内部を表す．(i)を弱双対定理 (weak duality theorem)，(ii)を[[双対定理]] (duality theorem) と呼び，$\inf_{x}\varphi{(x)}=\sup_{y}\psi{(y)}$ が満たされるとき，主問題(P)と双対問題(D)の間に双対性 (duality) が成立するという．(i)により，$\sup_{y}\psi{(y)}=+\infty$ なら主問題(P)は実行可能解を持たないが，$-\infty<\varphi{(\bar{x})}=\psi{(\bar{y})}<+\infty$ となる $\bar{x}$ と $\bar{y}$ が存在すれば，それぞれ(P)と(D)の最適解となり，強い意味の双対性が成立する．一方，$\inf_{x}\varphi{(x)}>\sup_{y}\psi{(y)}$ となるとき，主問題と双対問題の間に[[双対性のギャップ]] (duality gap) が存在するという．●
+ここで，$\mbox{\rm int}\,U$ は $U$ の内部を表す．(i)を弱双対定理 (weak duality theorem)，(ii)を[[双対定理]] (duality theorem) と呼び，$\inf_{x}\varphi{(x)}=\sup_{y}\psi{(y)}$ が満たされるとき，主問題(P)と双対問題(D)の間に双対性 (duality) が成立するという．(i)により，$\sup_{y}\psi{(y)}=+\infty$ なら主問題(P)は実行可能解を持たないが，$-\infty<\varphi{(\bar{x})}=\psi{(\bar{y})}<+\infty$ となる $\bar{x}$ と $\bar{y}$ が存在すれば，それぞれ(P)と(D)の最適解となり，強い意味の双対性が成立する．一方，$\inf_{x}\varphi{(x)}>\sup_{y}\psi{(y)}$ となるとき，主問題と双対問題の間に[[双対性のギャップ]] (duality gap) が存在するという．
 　主問題(P)において，$f(x,u):=c^{\top}x+k(x)+h(b-Ax+u)$（ただし，$k: \mathbf{R}^n\to\bar{\mathbf{R}}$ と $h: \mathbf{R}^m\to\bar{\mathbf{R}}$ は下半連続な真凸関数で$A\in{\mathbf{R}^{m\times{n}}}$, $b\in{\mathbf{R}^m}$, $c\in{\mathbf{R}^n}$ ）とすると，$f^{*}(v,y)=-b^{\top}y+h^{*}(y)+k^{*}(A^{\top}y-c+v)$となり \cite{[4]}，主問題(P)と双対問題(D)はそれぞれ