めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

モーペルテュイの原理の現代的な導出方法

何の話かと言うと

ラグランジュが歴史的にはじめて最小作用の原理を定式化した際は、ラグランジアンを積分して得られる現代の標準的な作用  S ではなく、次で定義される作用(短縮作用)を用いました。

  \displaystyle W := \int_{t_1}^{t_2} 2T(q,\dot q) \,dt

そして、「等エネルギー領域における(後述する意味での)時間を固定しない任意の微小変位について \Delta W = 0 が成り立つ」という形で最小作用の原理を述べました。これは、初期の提唱者にちなんで、「モーペルテュイの原理」とも呼ばれます。

現代から見ると少し不思議な定式化ですが、当時の考え方としては、「自然の原理としてエネルギー保存則が成り立つが、これだけでは物体の運動は一意に決まらない。何かもう一つ追加の原理が必要だ。」という発想として理解されたものと想像されます。

ここでは、上記の意味での最小作用の原理(モーペルテュイの原理)からでも、きちんとラグランジュ方程式が導かれる(つまり、現代的な最小作用の原理と等価である)ことを2つの方法で示します。

1. 直接計算による証明

一般化座標  q = (q_1,\cdots,q_N) に対して、運動エネルギーを  T(q,\dot q) として、時刻に陽に依存しないポテンシャルを伴うラグランジアン

  L := T(q,\dot q)-U(q,\dot q)

に対する(現代的な)作用は次で定義されます。

  \displaystyle S\left[c\right] := \int_{t_1}^{t_2}L(q,\dot q)\,dt = \int_{t_1}^{t_2}\left\{T(q,\dot q)-U(q,\dot q)\right\}\,dt ---- (1)

ここで、 c は点  A = q(t_1) から点  B = q(t_2) に移動する特定の経路  \left\{q(t)\mid t_1\le t\le t_2\right\} を表します。

そして、標準的な解析力学では、「各時刻ごとに座標を微小変位させる」という考え方をしますが、ここでは、より自由度の高い微小変位(時間を固定しない微小変位)を考えます。

具体的には、経路 c を直積空間の曲線  c = \left\{(q,\,t)\right\} \subset \mathbf R^N \times \mathbf R (連続した点の集合)と考えて、この曲線を構成する各点を連続的に微小変位させた新しい曲線  \overline c = \left\{(\overline q,\,\overline t)\right\} \subset \mathbf R^N \times \mathbf R を考えます。

  (q,\,t) \longrightarrow (\overline q = q + \Delta q,\,\overline t = t + \Delta t)

右項の \left(\Delta q,\,\Delta t\right) は、もともと時刻 t の点  q の変位先として決まるので、暗黙に t の関数 \left(\Delta q(t),\, \Delta t(t)\right) になりますが、始点 A と終点 B は固定するので、

 \Delta q(t_1) = \Delta q(t_2) = 0

とします。(始点と終点の時刻は固定しない、つまり  \Delta t(t_1) \ne 0,\, \Delta t(t_2)\ne 0 である点に注意してください。)

ここであらためて、 \overline q\overline t の関数と見直すと、上記の微小変位は、

  q(t) \longrightarrow \overline q(\overline t) = q(t) + \Delta q(t)

と書けます。(\overline t の範囲が  [t_1,\,t_2] 全体を含まない場合は、曲線 \overline c を任意に延長して、t_1\le\overline t\le t_2\overline q(t) が定義されるものと考えます。最終的に \Delta q\to 0,\,\Delta t\to 0 の極限を取るので、この部分の影響は無視できます。)

次に、\overline q(t)\Delta q,\,\Delta t の一次の範囲で展開します。

 \overline q(\overline t) = \overline q(t) + \dot{\overline q}(t)\Delta t

両辺から q(t) を引くと、

 \delta q(t) := \overline q(t) - q(t)

と置いて、

 \Delta q(t) = \delta q(t) + \dot{\overline q}(t)\Delta t ---- (2)

が得られます。この表式から \delta q(t)\Delta q,\,\Delta t の一次の微小量と分かるので、

 \dot\delta q(t) = \dot{\overline q}(t) - \dot q(t)

も一次の微小量であり、(2) において、 \dot{\overline q}(t)\Delta t = \dot q(t)\Delta t という置き換えができて、

 \Delta q(t) = \delta q(t) + \dot q(t)\Delta t ---- (3)

という関係が成り立ちます。(\Delta t が恒等的に 0 の場合は、「各時刻ごとに座標を微小変位させる」という標準的な場合になります。)

ここで、この自由度の高い微小変位  c\longrightarrow \overline c に伴う、作用 (1) の変化を計算します。まず、経路 \overline c に対する作用は次になります。(作用積分はあくまで実時間 t での積分である点に注意してください。)

  \displaystyle S[\overline c] = \int_{t_1+\Delta t(t_1)}^{t_2+\Delta t(t_2)}L(\overline q(t),\dot{\overline q}(t))\,dt

    \displaystyle = \int_{t_1}^{t_2}L(\overline q(t),\dot{\overline q}(t))\,dt + \left[ L(\overline q(t),\dot{\overline q}(t))\Delta t(t)\right]_{t_1}^{t_2}

    \displaystyle = \int_{t_1}^{t_2}L(\overline q(t),\dot{\overline q}(t))\,dt + \left[ L(q(t),\dot q(t))\Delta t(t)\right]_{t_1}^{t_2}

最後の項には微小量 \Delta t が含まれるので、\overline q(t)q(t) に置き換えられる点に注意します。これより、次が得られます。

  \displaystyle S[\overline c] - S[c] = \int_{t_1}^{t_2}\left\{L(\overline q(t),\dot{\overline q}(t))-L(q(t),\dot q(t))\right\}\,dt + \left[ L(q(t),\dot q(t))\Delta t(t)\right]_{t_1}^{t_2}

ここで、上式の右辺第1項は、作用 S に対する標準的な場合の変分と形式的に一致しており、部分積分を用いて次のように変形できます。

 \displaystyle \int_{t_1}^{t_2}\left\{L(\overline q(t),\dot{\overline q}(t))-L(q(t),\dot q(t))\right\}\,dt 

= \int_{t_1}^{t_2}\left(  \frac{\partial L}{\partial q}\delta q + \frac{\partial L}{\partial \dot q}\frac{d}{dt}\delta q  \right)\,dt

    \displaystyle = \int_{t_1}^{t_2}\left(  \frac{\partial L}{\partial q} - \frac{d}{dt}\frac{\partial L}{\partial \dot q}  \right)\delta q\,dt +\left[   \frac{\partial L}{\partial \dot q}\delta q   \right]_{t_1}^{t_2}

    \displaystyle = \int_{t_1}^{t_2}\left(  \frac{\partial L}{\partial q} - \frac{d}{dt}\frac{\partial L}{\partial \dot q}  \right)\delta q\,dt +\left[   \frac{\partial L}{\partial \dot q}(\Delta q - \dot q \Delta t)  \right]_{t_1}^{t_2}\because (3)

    \displaystyle = \int_{t_1}^{t_2}\left(  \frac{\partial L}{\partial q} - \frac{d}{dt}\frac{\partial L}{\partial \dot q}  \right)\delta q\,dt  - \left[   \frac{\partial L}{\partial \dot q}\dot q \Delta t  \right]_{t_1}^{t_2}\because \Delta q(t_1) = \Delta q(t_2) = 0

従って、作用 (1) の変化  \displaystyle \Delta S := S[\overline c] - S[c] は次になります。

  \displaystyle \Delta S = \int_{t_1}^{t_2}\left(  \frac{\partial L}{\partial q} - \frac{d}{dt}\frac{\partial L}{\partial \dot q}  \right)\delta q\,dt - \left[ \left(\frac{\partial L}{\partial \dot q}\dot q-L\right)\Delta t(t)\right]_{t_1}^{t_2} ---- (4)

標準的な微小変位を考える場合は、\Delta t = 0 が恒等的に成り立つので、右辺第2項が消えて、\Delta S = 0 からラグランジュの運動方程式が導かれます。ただし、今の場合はそのようにはなりません。

実は、この第2項に含まれる \displaystyle \frac{\partial L}{\partial \dot q}\dot q - L は、ハミルトニアン

 \displaystyle H := \frac{\partial L}{\partial \dot q}\dot q - L

の定義に一致しています。本来のハミルトニアンは、独立変数を (q, \dot q) から (p, q) に置き換える必要がありますが、ここでは、そのままにしてあります。この場合でも、ハミルトニアンの値が系のエネルギー  E に一致すると言う事実は成り立ちます。そこで、

  • 恒等的に H(q(t),\dot q(t)) = E となる等エネルギー領域の経路  q(t) に限定する

という拘束条件を加えると、\Delta t_1 := \Delta t(t_1),\,\Delta t_2 := \Delta t(t_2) として、(4) は次のように書き換えられます。

  \displaystyle \Delta S  = \int_{t_1}^{t_2}\left(  \frac{\partial L}{\partial q} - \frac{d}{dt}\frac{\partial L}{\partial \dot q}  \right)\delta q\,dt - E(\Delta t_2-\Delta t_1)

従って、ラグランジュの運動方程式を導くには、従来の作用 S ではなく、次を満たす作用 W を考える必要があります。

  \displaystyle \Delta W = \Delta S + E(\Delta t_2-\Delta t_1)  = \int_{t_1}^{t_2}\left(  \frac{\partial L}{\partial q} - \frac{d}{dt}\frac{\partial L}{\partial \dot q}  \right)\delta q\,dt

そこで、短縮作用 W

 \displaystyle W := \int_{t_1}^{t_2}\left(L+E\right)\,dt = S + E(t_2-t_1)

で定義すると、

  \displaystyle \Delta W = \Delta S + E(\Delta t_2 - \Delta t_1)

が得られます。つまり、「H(q(t),\dot q(t)) = E の等エネルギー領域における(時間を固定しない)任意の微小変位に対して、\Delta W = 0 となる」という条件からラグランジュの運動方程式が導かれます。

さらに、等エネルギー平面上では、恒等的に  L + E = (T - U) + (T + U) = 2T が成り立つので、

  \displaystyle W := \int_{t_1}^{t_2} 2T(q,\dot q) \,dt

と定義しても同じ結論が得られます。

以上の議論を振り返ると、まず、

  • (1) 経路の変分を取る際の境界条件に \Delta t_1 = \Delta t_2=0 を要請しない

という条件を加えた結果、作用の変化 \Delta SH(\Delta t_2-\Delta t_1) という「おつり」が生まれました。そこで、

  • (2) 等エネルギー領域 E に経路を制限する
  • (3) ラグランジアン LL+E = 2T に置き換える

という2つの操作を行うことで、「おつり」の項が消えて、ラグランジュの運動方程式が再現されました。つまり、(1)(2)(3) の3つが「現代的な最少作用の原理とモーペルテュイの原理の違い」ということになります。

この後の議論では、「時刻 t を座標とする同次形式において、ラウシアンを用いて循環座標 t を削減する(系の自由度を削減する)」という操作によって、(1)(2)(3) の操作が再現されることを示します。言い換えると、現代的な解析力学の枠組みにおいては、ラウシアンを用いた自由度削減の操作によってモーペルテュイの原理が再現されることがわかります。

2. ラウシアンを用いた自由度削減による証明

ラウシアンを用いた自由度削減の一般論

ここでは、一般化座標の最後の成分  q_N を除いたものを q = (q_1,\cdots,q_{N-1}) と表記します。ラグランジアン  L(q, q_N,\dot q,\dot q_N) が座標 q_N を陽に含まない、つまり、 L(q, \dot q,\dot q_N) と書ける場合、対応する運動量 \displaystyle p_N := \frac{\partial L}{\partial \dot q_N} は保存量となり、

 \displaystyle \frac{\partial L(q, \dot q, \dot q_N)}{\partial \dot q_N} = C

が成り立ちます。この時、これを \dot q_N について逆解きしたものを \dot q_N = \phi(q,\dot q, C) とします。つまり、\phi(q,\dot q, C) は、恒等的に次の関係を満たす関数になります。

 \displaystyle \left.{\frac{\partial L(q, \dot q, \dot q_N)}{\partial \dot q_N}}\right|_{\dot q_N=\phi(q,\dot q, C)} \equiv C ----- (2.1)

\dot q_N = \phi(q,\dot q, C) は、座標 q_N に対する運動方程式の解である点に注意してください。この後で、他の座標 q に対する運動方程式に \dot q_N = \phi(q,\dot q, C) を代入する操作がありますが、これは、すべての座標に対する運動方程式を一連の連立方程式とみなして、座標 q_N に対する方程式を解いた結果を残りの方程式に代入する操作と考えられます。

そして、ラウシアンを次で定義します。

  R(q,\dot q, C) := L(q,\dot q, \phi(q, \dot q, C)) - C\phi(q,\dot q, C)

この時、ラウシアン R は、一般化座標 q に対する系のラグランジアンとなります。つまり、次の運動方程式が成り立ちます。

 \displaystyle \frac{d}{dt}\frac{\partial R}{\partial \dot q}-\frac{\partial R}{\partial q} = 0 ---- (2.2)

これは、次の直接計算で確認できます。(偏微分する際の独立変数が  R L で異なる点に注意してください。)

まず、

 \displaystyle \frac{\partial R(q,\dot q, C)}{\partial q} = \left.\frac{\partial L(q,\dot q, \dot q_N)}{\partial q}\right|_{\dot q_N=\phi(q, \dot q, C)} + \left.\frac{\partial L(q,\dot q, \dot q_N)}{\partial \dot q_N}\right|_{\dot q_N=\phi(q, \dot q, C)} \frac{\partial \phi(q,\dot q, C)}{\partial q}-C\frac{\partial \phi(q,\dot q, C)}{\partial q}

   \displaystyle = \left.\frac{\partial L(q,\dot q, \dot q_N)}{\partial q}\right|_{\dot q_N=\phi(q,\dot q, C)}\because (2.1)

であり、同様に、

 \displaystyle \frac{\partial R(q,\dot q, C)}{\partial \dot q} = \left.\frac{\partial L(q,\dot q, \phi)}{\partial \dot q}\right|_{\phi=\phi(q,\dot q, C)}

が成り立ちます。これらより、

 \displaystyle \frac{d}{dt} \frac{\partial R(q,\dot q, C)}{\partial \dot q} - \frac{\partial R(q,\dot q, C)}{\partial q}
=  \left.\left(\frac{d}{dt} \frac{\partial L(q,\dot q, \dot q_N)}{\partial \dot q} - \frac{\partial L(q,\dot q, \dot q_N)}{\partial q}\right)\right|_{\dot q_N=\phi(q,\dot q, C)}

が得られます。

この結果は、「ラウシアン  R(q,\dot q, C) に対する運動方程式 (2.2)」と「座標 q に対するラグランジュの運動方程式に \dot q_N=\phi(q,\dot q, C) を代入したもの」が一致することを示しています。先に触れたように、\dot q_N=\phi(q,\dot q, C) は、座標 q_N に対する運動方程式の解ですので、結局の所、ラウシアンに対する運動方程式はラグランジュの運動方程式と等価になります。

また、ラウシアンに含まれない座標 q_N は、運動方程式の解として q が決まった後に、条件 \dot q_N=\phi(q,\dot q,C) を積分して計算します。この時に、運動量保存 (2.1) を満たす解が自動的に構成されます。これは、循環座標 q_N に対するラグランジュの運動方程式の解を求めることと同等の操作です。

以上の結果をラウシアンに対する作用

 \displaystyle S = \int_{t_1}^{t_2}R(q(t),\dot q(t), C)\,dt

における最小作用の原理に言い換えると、「境界条件 \delta q(t_1)=\delta q(t_2)=0 を満たす微小変位 \delta q(t) に対して \delta S=0 となる」ことが、運動方程式 (2.2) と同等になり、これは元の系のラグランジュの運動方程式に一致します。ただし、この議論には循環座標 q_N が含まれないので、循環座標 q_N については境界条件を課す必要はありません。

ここまでは、一般化座標の1つ q_N がラグランジアンに陽に含まれない循環座標になっている際の話でした。一方、エネルギー保存則は、時刻 t がラグランジアンに陽に含まれないことに対応します。そこで、「時刻 t を一般化座標の1つとする同次形式」を導入しておき、これに対してラウシアンの議論を適用します。なお、ここからは、ラグランジアンが L が時刻 t を陽に含まない保存系に限定して議論します。

時刻 t を座標とする同次形式

「1. 直接計算による証明」では、経路 c を直積空間 \mathbf R^N\times \mathbf R 上の曲線とみなして微小変位を考えました。これをより自然に記述するために、この曲線を記述する新しいパラメーター \tau を導入して、物理的な経路を

 q = q(\tau), t=t(\tau)

と表します。\tau による微分を {}' で表すと、

 \displaystyle q'(\tau) = \frac{d q(t)}{dt}\frac{dt(\tau)}{d\tau} = \dot q(t(\tau)) t'(\tau)

もしくは、

 \displaystyle \dot q(t(\tau)) = \frac{q'(\tau)}{t'(\tau)} ---- (2.3)

が成り立ちます。

そこで、拡張ラグランジアン L^*(q,q',t,t')

 \displaystyle L^*(q,q',t,t') := L\left(q, \frac{q'}{t'}\right) \times t'

で定義すると、次が成り立ちます。

  \displaystyle S = \int_{t_1}^{t_2}L(q(t),\dot q(t))\,dt = \int_{\tau_1}^{\tau 2}L^*(q(\tau),q'(\tau),t(\tau),t'(\tau))\,d\tau

つまり、 (q, t) を一般化座標、そして、\tau を形式的な時刻とみなした(仮想的な)物理系 L^*(q,q',t,t') を考えると、この系の運動方程式の解(つまり、作用 S が極致をとる経路)は、元の系の運動方程式の解(つまり、作用 S が極致をとる経路)に一致することになります。

念の為に直接計算で確認すると次のようになります。まず、

 \displaystyle \frac{\partial L^*}{\partial q} = \frac{\partial L}{\partial q}\times t'

また、

 \displaystyle \frac{\partial L^*}{\partial q'} = \frac{\partial L}{\partial \dot q}\frac{\partial}{\partial q'}\left(\frac{q'}{t'}\right) \times t' = \frac{\partial L}{\partial \dot q}

より、

 \displaystyle \frac{d}{d\tau}\frac{\partial L^*}{\partial q'} =  \frac{d}{dt}\frac{\partial L}{\partial \dot q} \times \frac{dt}{d\tau}
= \frac{d}{dt}\frac{\partial L}{\partial \dot q} \times t'

よって、

 \displaystyle \frac{d}{d\tau}\frac{\partial L^*}{\partial q'} - \frac{\partial L^*}{\partial q} =
\left(\frac{d}{dt}\frac{\partial L}{\partial \dot q} - \frac{\partial L}{\partial q}\right)\times t'

であり、系 L^*q に対する運動方程式は、系 L の運動方程式に一致します。

それでは、変数 t(\tau) に関する運動方程式はどうなるでしょうか? まず、

 \displaystyle \frac{\partial L^*}{\partial t} = 0

そして、

 \displaystyle \frac{\partial L^*}{\partial t'} = \frac{\partial L}{\partial \dot q}\frac{\partial(q'/t')}{\partial t'}\times t' + L
= - \frac{\partial L}{\partial \dot q}\frac{q'}{t'}+L = L - \dot q\frac{\partial L}{\partial \dot q} ---- (2.4)

となるので、変数 t(\tau) に関する運動方程式は、

 \displaystyle \frac{d}{d\tau}\left(L - \dot q\frac{\partial L}{\partial \dot q}\right) = 0

となります。これは、系 L のエネルギー \displaystyle\dot q\frac{\partial L}{\partial \dot q}- L が経路上で一定であることを要請しますが、系 L の運動方程式の解は自動的にこの条件を満たすので、これは新しい条件を加えるものではありません。

同次形式における自由度削減操作

ラグランジアン L が時刻 t を陽に含まない保存系の場合、これに対応する、時刻を \tau とする系 L^*(q,q',t,t') は「座標」 t を陽に含みません。そこで、ラウシアンを用いて、座標 t を削減した系を構成します。

まず、 t に対応する「運動量」\displaystyle p_t := \frac{\partial L^*}{\partial t'} = -E は保存量となりますが、これは、(2.4) より、エネルギー保存に対応します。

また、

 \displaystyle \frac{\partial L^*(q,q',t')}{\partial t'} = -E ---- (2.5)

を逆解きしたものを

 t' = \phi(q,q',E) ---- (2.6)

として、対応するラウシアンは、

 \displaystyle R(q,q',E) = L^*(q,q',\phi(q,q',E)) + E\phi(q,q',E) ---- (2.7)

   \displaystyle = L\left(q, \frac{q'}{\phi(q,q',E)}\right)\phi(q,q',E) +  E\phi(q,q',E)

   \displaystyle = \left\{L\left(q, \frac{q'}{\phi(q,q',E)}\right) +  E\right\}\phi(q,q',E)

となります。このラウシアンに対する運動方程式の解 (q(\tau), t(\tau)) を用いて、(2.6) から t(\tau) を求めると等エネルギー E を満たす解が自動的に得られます。

前節の最後に触れた「(2) 等エネルギー領域 E に経路を制限する」という要請がここで満たされます。これは、「まずはじめに、時刻 t への依存性を考えない静的な経路 q(\tau) を決定しておき、その後、(2.6) に従って、エネルギー保存を満たすように時刻への依存性 t(\tau) を調整する」作業と考えられます。また、すぐ後で説明するように、(2.7) によるラグランジアン L^* からラウシアン R への変換は、「 (3) ラグランジアン LL+E = 2T に置き換える」操作に対応します。

この事実を上記のラウシアンを用いた作用

 \displaystyle S = \int_{\tau_1}^{\tau_2}R(q(\tau),q'(\tau),E)\,d\tau

に対する最小作用の原理として言い換えると、「境界条件 \delta q(\tau_1)=\delta q(\tau_2)=0 を満たす微小変位に対して、\delta S=0 となる」という条件から元の系 L における運動方程式が再現されます。この時、循環変数 t(\tau) に対する境界条件は課されない点に注意してください。

ここで、「(1) 経路の変分を取る際の境界条件に \Delta t_1 = \Delta t_2=0 を要請しない」という条件が自然に出現したことになります。

そしてさらに、上記の作用 S は、元の系 L における短縮作用 W に一致することがわかります。次に具体的な計算で示します。

まず、短縮作用は次のように計算されます。短縮作用を計算する際は、等エネルギー領域 E に運動を限定すると言う暗黙の条件がある点に注意してください。

 \displaystyle W = \int_{t_1}^{t_2}\left\{L(q(t),\dot q(t)) + E\right\}\,dt = \int_{\tau_1}^{\tau_2}\left\{L\left(q(t(\tau)),\dot q(t(\tau))\right) + E\right\}t'(\tau)\,d\tau

   \displaystyle =  \int_{\tau_1}^{\tau_2}\left\{L\left(q(\tau),\frac{q'(\tau)}{t'(\tau)}\right) + E\right\}t'(\tau)\,d\tau

   \displaystyle = \int_{\tau_1}^{\tau_2}\left\{L\left(q(\tau),\frac{q'(\tau)}{ \phi(q(\tau),q'(\tau),E)}\right) + E\right\} \phi(q(\tau),q'(\tau),E)\,d\tau

最後の変形では、等エネルギー領域では、(2.5)、すなわち、(2.6) が成り立つことを用いました。これはちょうど、ラウシアンに対する作用

 \displaystyle S = \int_{\tau_1}^{\tau_2}R(q(\tau),q'(\tau),E)\,d\tau

に一致しています。

上記の式変形を見ると、R = (L^*+Et') = (L+E)t' という関係が成り立っており、同次形式に変換するための因子 t' を除いて、ラウシアン R が元の系 L における L+E の役割を果たしていることがわかります。

以上の議論から、「系 L^* において \delta S=0 となる」ことは、「系 L において等エネルギー領域で \Delta W=0 となる」ことと同値になります。(\Delta W は時間を固定しない変分を表します。)

つまり、系 L における短縮作用 W に関する最小作用の原理(モーペルテュイの原理)は、系 L^* における作用 S に関する最小作用の原理と同等であり、結果として、系 L における運動方程式と等価であることが示されました。

あらためて全体をまとめると、時刻 t を陽に含まない系 L を同次形式 L' に変換して、循環変数 t を削減した系 R を構成すると、R に対する最小作用の原理としてモーペルテュイの原理が再現されるという事実が示されました。