投稿者「chapi」のアーカイブ

1. 相対論的量子力学の試み

MathJax.Hub.Config({ tex2jax: { inlineMath: [[‘$’,’$’], [“\\(“,”\\)”]] } }); https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.0/MathJax.js?config=TeX-AMS_CHTML

量子力学と相対論の復習から始める。

量子力学は次のような公理の基で始めることができる。

「系の状態はヒルベルト空間のベクトル、オブザーバブルはそのエルミート演算子、そのオブザーバブルの値はこの演算子の固有値で記述される。」

また、系の状態の時間発展はシュレディンガー方程式

$$i\hbar \frac{\partial}{\partial t}|\psi,t\rangle=H|\psi,t\rangle\tag{1}$$

により行われる。ここで、\(H\)はハミルトニアン演算子である。

スピン0の非相対論的な相互作用のない最もシンプルな系を考える。この系ではハミルトニアンは

$$H=\frac{1}{2m}{\bf{P}}^2\tag{2}$$

である。ここで、\(m\)は粒子の質量で\({\bf{P}}\)は運動量演算子である。座標表示でシュレディンガー方程式を表すと

$$i\hbar \frac{\partial}{\partial t}\psi({\bf{x}},t)=-\frac{\hbar^2}{2m}\nabla^2\psi({\bf{x}},t)\tag{3}$$

と書ける。

これを相対論的なものに拡張したい。単純には相対論的なエネルギー運動量である

$$H=+\sqrt{{\bf{P}}^2c^2+m^2c^4}\tag{4}$$

から始めることである。これを展開すると

\begin{eqnarray} H&=&+\sqrt{{\bf{P}}^2c^2+m^2c^4}\\ &=&mc^2\sqrt{1+\frac{{\bf{P}}^2}{m^2c^2}}\\ &=&mc^2+\frac{1}{2m}{\bf{P}}^2+\cdots \tag{5}\end{eqnarray}

となり、静止エネルギーと非相対論的なエネルギーと補正項の和となる。このハミルトニアンを用いるとシュレディンガー方程式は

$$i\hbar\frac{\partial}{\partial t}\psi({\bf{x}},t)=+\sqrt{-\hbar^2c^2\nabla^2+m^2c^4}\psi({\bf{x}},t)\tag{6}$$

に変わる。しかし、この方程式はいくつかの難点がある。

  • 時間と空間が対称ではない

これは式を見たら明らかである。時間微分は左辺にしかなく、空間微分は右辺のルートの中にしかない。これは相対論の要求を満たしていない。

  • 方程式が局所的でない

右辺のルートを展開すると空間微分が無限回出てくる。これでは、同時刻で異なる2点以上が影響するので因果律を破ってしまう。

これらの問題を解決するためには両辺の波動関数以外を2乗すればよい。つまり、方程式

$$-\hbar^2\frac{\partial^2}{\partial t^2}\psi({\bf{x}},t)=\left(-\hbar^2c^2\nabla^2+m^2c^4\right)\psi({\bf{x}},t)\tag{7}$$

を考える。これはクラインゴルドン方程式と呼ばれるもので先ほどの困難は解消されている。

まず、この方程式が異なる慣性系同士で同じ形式で表されることを確認しよう。そのためにまず、時空の設定から始めよう。この本を通して時空の座標を\((ct,{\bf{x}})\)とする。つまり、\(x^0=ct\)として\(x^{\mu}(\mu=0,1,2,3)\)で時空の一つの点を表すことにする。

さらに下付き添え字で\(x_0=-x^0,x_i=x^i(i=1,2,3)\)という風に\(x_{\mu}\)を定義する。これはミンコフスキー計量

$$g_{\mu\nu}=
\left( \begin{array}{cccc} -1 & & & \\ & +1 & & \\ & & +1& \\ &&&+1 \end{array} \right) \tag{8}$$

(空白部はすべて0)を用いると\(x_{\mu}=g_{\mu\nu}x^{\nu}\)というように表される。ここで、アインシュタインの縮約記法を用いている。

さらに

$$g^{\mu\nu}=
\left( \begin{array}{cccc} -1 & & & \\ & +1 & & \\ & & +1& \\ &&&+1 \end{array} \right) \tag{9}$$

としておく。 こうすることで

$$g^{\mu\nu}g_{\nu\rho}=\delta^{\mu}_{\ \ \rho},\ \ \ x^{\mu}=g^{\mu\nu}x_{\nu}$$

が成り立つとわかる。(つまり、\(g\)により添え字の上げ下げができる。)

さて、話を戻すと二つの慣性系\(x^{\mu},\bar{x}^{\mu}\)はローレンツ変換と並進変換で移りあうから

$$\bar{x}^{\mu}=\Lambda^{\mu}_{\ \ \nu}x^{\nu}+a^{\mu}\tag{10}$$

のような関係である。ここで、\(\Lambda^{\mu}_{\ \ \nu}\)はローレンツ変換を表す行列なので高速度不変の原理から

$$g_{\mu\nu}\Lambda^{\mu}_{\ \ \rho}\Lambda^{\nu}_{\ \ \sigma}=g_{\rho\sigma}\tag{11}$$

が成り立つ。この変換の下で時空の二点間の距離が保存されることが簡単に確認できる。

\begin{eqnarray}(\bar{x}-\bar{x}^{\prime})^2&=&g_{\mu\nu}(\bar{x}-\bar{x}^{\prime})^{\mu}(\bar{x}-\bar{x}^{\prime})^{\nu}\\&=&g_{\mu\nu}\Lambda^{\mu}_{\ \ \rho}\Lambda^{\nu}_{\ \ \sigma}(x-x^{\prime})^{\rho}(x-x^{\prime})^{\sigma}\\&=&g_{\rho\sigma}(x-x^{\prime})^{\rho}(x-x^{\prime})^{\sigma}\\&=&(x-x^{\prime})^2\tag{13}\end{eqnarray}

ここで、差を取っている部分で並進変換が打ち消されていることに注意する。

座標系を変えたらもちろん、波動関数の関数の形も変わる。そこで新たに慣性系\(\bar{x}^{\mu}\)での波動関数を\(\bar{\psi}(\bar{x})=\psi(x)\)と書くことにする。

また、時空による微分を次のように定義することにする。

\begin{eqnarray}\partial_{\mu}&\equiv&\frac{\partial}{\partial x^{\mu}}=\left(+\frac{1}{c}\frac{\partial}{\partial t},\nabla\right),\tag{14}\\ \partial^{\mu}&\equiv&\frac{\partial}{\partial x_{\mu}}=\left(-\frac{1}{c}\frac{\partial}{\partial t},\nabla\right)\tag{15}\end{eqnarray}

もちろんこれは

$$\partial^{\mu}x^{\nu}=g^{\mu\nu}\tag{17}$$

が成り立つように定義している。また、偏微分は次のように変換する。

\begin{eqnarray}\bar{\partial}^{\mu}=\frac{\partial}{\partial \bar{x}_{\mu}}&=&g^{\mu\nu}\frac{\partial}{\partial\bar{x}^{\nu}}\\&=&g^{\mu\nu}(\Lambda^{-1})^{\rho}_{\ \ \nu}\frac{\partial}{\partial x^{\rho}}\\&=&g^{\mu\nu}\Lambda_{\nu}^{\ \ \rho}\frac{\partial}{\partial x^{\rho}}\\&=&\Lambda^{\mu}_{\ \ \rho}\frac{\partial}{\partial x_{\rho}}\\&=&\Lambda^{\mu}_{\ \ \rho}\partial^{\rho}\tag{17}\end{eqnarray}

ここで、

$$\frac{\partial x^{\nu}}{\partial \bar{x}^{\mu}}=(\Lambda^{-1})^{\nu}_{\ \ \mu}$$

に注意する。(4つ目の=は2章を参照)

これらの変換性から

\begin{eqnarray}\bar{\partial}^{\rho}\bar{x}^{\sigma}&=&(\Lambda^{\rho}_{\ \ \mu}\partial^{\mu})(\Lambda^{\sigma}_{\ \ \nu}x^{\nu}+a^{\sigma})\\&=&\Lambda^{\rho}_{\ \ \mu}\Lambda^{\sigma}_{\ \ \nu}(\partial^{\mu}x^{\nu})\\&=&\Lambda^{\rho}_{\ \ \mu}\Lambda^{\sigma}_{\ \ \nu}g^{\mu\nu}=g^{\rho\sigma}\tag{18}\end{eqnarray}

であることが分かる。

さて、ここで定義した微分記号を用いてクラインゴルドン方程式(7)を表すと

$$-\hbar^2c^2\partial^2_0\psi(x)=(-\hbar^2c^2\nabla^2+m^2c^4)\psi(x)\tag{19}$$

となる。さらに\(\partial^2\equiv\partial^{\mu}\partial_{\mu}=-\partial_0^2+\nabla^2\)を用いると

$$\left(-\partial^2+\frac{m^2c^2}{\hbar^2}\right)\psi(x)=0\tag{21}$$

と表すことができる!(このように表した方がより、時間と空間の対称性がよく見える!)

この方程式が異なる慣性系でも同じ形なのは簡単に確かめられる。

\(x^{\mu}\rightarrow \bar{x}^{\mu}\)への変換により

$$\bar{\partial}^2=g_{\mu\nu}\bar{\partial}^{\mu}\bar{\partial}^{\nu}=g_{\mu\nu}\Lambda^{\mu}_{\ \ \rho}\Lambda^{\nu}_{\ \ \sigma}\partial^{\rho}\partial^{\sigma}=g_{\rho\sigma}
\partial^{\rho}\partial^{\sigma} =\partial^2\tag{22}$$

となるので方程式(20)は異なる慣性系に移ると

$$ \left(-\bar{\partial}^2+\frac{m^2c^2}{\hbar^2}\right)\bar{\psi}(\bar{x})=0\tag{22} $$

となり、方程式の形が変わらないことが分かる!これはクラインゴルドン方程式のもっとも素晴らしいところではないだろうか。

しかし、もちろん、この方程式は我々の求めている方程式ではない。なぜなら、クラインゴルドン方程式ではシュレディンガー方程式のように確率解釈ができないのである。

理由は簡単でクラインゴルドン方程式は時間に関して二階微分を含むことによる。つまり、それが原因で確率密度\(\rho\)は時間の一階微分を含むことになる。よって、確率密度が0以上であるという確率解釈の最も基本的なことが壊れてしまうのである。

ディラックはこの問題を解決するために新たな離散変数(スピン変数)を導入することでクラインゴルドン方程式を一階の微分方程式にできないかと考えた。そこで少し強引ではあるが次のような方程式を考える。

$$i\hbar \frac{\partial}{\partial t}\psi_a(x)=\left(-i\hbar c(\alpha ^j)_{ab}+mc^2(\beta)_{ab}\right)\psi_b(x)\tag{24}$$

ここで、\(a,b\)はスピン変数で\(a,b=1,2\)の値を取る。(正確にはスピン変数がいくつかはこの時点ではわからない。)つまり、\(\alpha^j,\beta\)はスピン変数に対する行列である。(24)式からわかるようにハミルトニアンに対応するのは

$$H_{ab}=cP_j(\alpha^j)_{ab}+mc^2(\beta)_{ab}\tag{25}$$

の部分である。この部分が相対論的なエネルギーに対応するように平方してみる。

$$(H^2)_{ab}=c^2P_jP_k(\alpha^j\alpha^k)_{ab}+mc^3P_j(\alpha^j\beta+\beta\alpha^j)_{ab}+(mc^2)^2(\beta^2)_{ab}\tag{26}$$

ここで、\(\alpha^j,\beta\)は互いに交換するとは限らないことに注意しよう。\(P_jP_k\)は\(j,k\)に関して対称なので、\(\alpha^j\alpha^k\)の対称部分のみ残るので、(26)で\(\alpha^j\alpha^k\)は\(\frac{1}{2}\{\alpha^j,\alpha^k\}\)に置き換えてもよい。ここで\(\{A,B\}=AB+BA\)である。

よって、

$$\{\alpha^j,\alpha^k\}_{ab}=2\delta^{jk}\delta_{ab},\ \ \{\alpha^j,\beta\}_{ab}=0,\ \ (\beta^2)_{ab}=\delta_{ab}\tag{27}$$

が成り立つとき、(26)は

$$(H^2)_{ab}=({\bf{P}}^2c^2+m^2c^4)\delta_{ab}\tag{28}$$

となり、相対論的なエネルギーに対応する。つまり、(27)を満たすように\(\alpha^j,\beta\)を取れれば相対論的量子力学の1階微分方程式を得られたのである!方程式(24)はディラック方程式と呼ばれ、行列\(\alpha^j,\beta\)はディラック行列と呼ばれる。

次にディラック行列を具体的に求めてみよう。これまでスピン自由度は2として考えてきたが実は\(2\times2\)行列では(27)を満たす\(\alpha^j,\beta\)を作ることはできない。例えばパウリ行列\(\sigma^i\)は\(\{\sigma^i,\sigma^j\}=2\delta^{ij}\)を満たすので\(\alpha^j\)になりうる。しかし、この三つと反交換関係をみたす\(\beta\)は存在しないのである。(すべての\(2\times 2\)は単位行列とパウリ行列で展開できることから簡単に示せます。)また、Problem1.1より、ディラック行列の次数は偶数次なので2次元の次に小さいのは4次元である。これはスピン状態が2種類存在することを示唆している。

ディラック行列のトレースについて考える。まず、\(\beta^2=I\)なので\(\beta\)の固有値の2乗は\(1\)である。(\(\beta\)を対角化したと考えるとわかる。)つまり、\(\beta\)の固有値は\(\pm 1\)のどちらかである。ここで、ディラック行列の性質とトレースの性質を用いると

$${\rm{Tr}}(\beta)=
{\rm{Tr}} ((\alpha^1)^2\beta)=
{\rm{Tr}} (\alpha^1\beta\alpha^1)=
-{\rm{Tr}} ((\alpha^1)^2\beta)=
-{\rm{Tr}}(\beta) $$

なので、\( {\rm{Tr}} (\beta)=0\)であることがわかる。また、同じ要領で\(
{\rm{Tr}} (\alpha^j)=0\)である。

次に(25)のハミルトニアンに対するエネルギー固有値について考える。固有状態\(\tilde{\psi}_{E}\)を

$$H\tilde{\psi}_{E}=E\tilde{\psi}_{E}$$

のように書いておく。さらに\([H,P]=0\)なので、同時固有状態を取ることができ、それを\(\omega(E,{\bf{p}})\)と置く。つまり、

$$\psi({\bf{x}},t)=\omega(E,{\bf{p}})e^{\frac{-iEt}{\hbar}}e^{\frac{i{\bf{p}}\cdot{\bf{x}}}{\hbar}}$$

とする。このようにすると

\begin{eqnarray} E\omega&=&(c\ {\boldsymbol{\alpha}}\cdot{\bf{p}}+mc^2\beta)\omega\\ E^2&=&c^2{\bf{p}}^2+(mc^2)^2 \end{eqnarray}

(ここでの\({\bf{p}}\)は演算子ではなく、運動量固有値)とできる。よって、\(\alpha^j,\beta\)がトレースレスからハミルトニアンもトレースレスなので\(E({\bf{p}})=+\sqrt{{\bf{p}}^2c^2+m^2c^4}\)とおくとエネルギー固有値は \(+E({\bf{p}}), +E({\bf{p}}) ,- E({\bf{p}}) ,- E({\bf{p}}) \)の4つだとわかる。

この負のエネルギー状態が無限にあることは明らかに問題である。基底状態が定まらないのでこれではすべての状態が不安定という物理的にやばい状態になる。

ディラックはフェルミ粒子についてはディラックの海という解釈により、この問題の解決策を提示した。しかし、これではフェルミ粒子の説明にしかなっていないので満足のいくものではなかった。

実はディラック方程式も我々の求めている方程式ではない。そもそもとして次のような問題がある。量子力学の公理としてオブザーバブルはエルミート演算子で表されるというものがあったが時間\(t\)はこれに当てはまらないのである!また、相対論的にも\({\bf{x}}\)は演算子だが\(t\)が単なるパラメータというのはどうも対等に扱っていないように思える。

これを解決するには二つの方法がある。

  • \(t\)を演算子にする

幸運なことに粒子の運動を考えるとき、時間は二種類存在する。系の時間\(t\)と固有時間\(\tau\)である。よって、運動のパラメータとして\(\tau\)を選択して系の時間\(t\)は演算子にして位置と対等に扱うということだ!!!(ストリングを考えるときに使う。)

  • 位置もパラメータと考える

位置を量子場\(\varphi({\bf{x}})\)のパラメータと考える。\(\varphi({\bf{x}})\)は演算子であり、パラメータとして\(t\)も含むべきだからハイゼンベルグ描像を採用して

$$\phi({\bf{x}},t)=e^{iHT/\hbar}\varphi({\bf{x}},0)e^{-iHt/\hbar}\tag{29}$$

としておく。(今は位置も時間も演算子の固有値などでは決してない!!)

後者の方では粒子数を固定した非相対論的な量子力学ですでに同じようなことをしている。(俗にいう第二量子化)

以下、本では第二量子化での結論を述べていますがあとの章で量子化の計算を丁寧に書いておくのではここでは省略することにします。