めもめも

このブログに記載の内容は個人の見解であり、必ずしも所属組織の立場、戦略、意見を代表するものではありません。

no-signaling と量子論が実現する確率分布の関係

何の話かと言うと

[quant-ph/9508009] Nonlocality as an axiom for quantum theory

上記の論文では、no-signaling と量子論の関係について語られており、ちょっとおもしろかったので、そのポイントを次の記事の文脈におきかえて説明してみます。

enakai00.hatenablog.com

実現不可能な確率分布

上記の記事では、Bell の不等式を確率ゲームに置き換えて説明しましたが、その中で、「Q と R のどちらを選んだかによって、T の確率を変化させる」というチートを用いれば Bell の不等式を破ることができる事を示しました。具体的には、次のような同時分布を設定しました。

・Q を選んだ場合

Q T P(Q,T)
+1 +1 0
+1 -1 1
-1 +1 0
-1 -1 0

・R を選んだ場合

R T P(R,T)
+1 +1 1
+1 -1 0
-1 +1 0
-1 -1 0

それでは、量子スピンのペアーを用いたアリスとボブの実験で、この極端な確率分布を再現することはできるでしょうか?

実は、これは不可能です。上記の確率分布は、「光速度を超えて情報を伝達することはできない」という自然界の根本原理に反しているからです。ボブは、T の観測結果が -1 であれば、アリスは Q を選択した、あるいは、+1 であれば、アリスは R を選択した、ということが分かります。アリスとボブがほぼ同時に観測を行った場合、アリスは、自分がどちらの選択をしたかという情報を光速度を超えて、ボブに伝達することができてしまいます。

no-signaling 原則

それでは、逆に「アリスの選択をボブに伝えることはできない」という条件に従うには、Q と T、および、R と T の同時確率分布は、どのような条件を満たせばよいのでしょうか? これは、確率分布の言葉でいうと、ボブの観測結果、すなわち、T、もしくは、S の周辺確率分布は、アリスの選択に依存しない、と表すことができます。具体的には、T について言うならば、

 \displaystyle P_Q(t) = \sum_{q=\pm 1} P(q, t)

 \displaystyle P_R(t) = \sum_{r=\pm 1} P(r, t)

として、P_Q(t) = P_R(t) が成り立つということです。これであれば、T の観測結果からアリスの選択について何かを予測することは不可能となります。一般にこのような条件を no-signaling と言います。

そして、量子スピンのペアーを用いた実験では、この条件は必ず満たされます。ややカタイ証明は、次のとおりです。

enakai00.hatenablog.com

no-signaling が頑張れる範囲

冒頭に示した極端な確率分布を用いた場合、ゲームのプレーヤーは確実に +1 ポイントを得られます。Bell の不等式で言うと、

 \mathbf E(QS)+\mathbf E(RS)+\mathbf E(RT)-\mathbf E(QT)  = 4 > 2 --- (1)

という等式が成立します。(ここでは、S についても同様の確率分布をセットして、ボブは、T と S のどちらを選んでもよいことにしたと思ってください。)ただし、この確率分布は、no-signaling に反しているという欠点(?)があります。

それでは、no-signaling を満たす確率分布で、(1) を達成することはできないのでしょうか? 実は、次の同時分布を用いれば OK です。

・Q を選んだ場合

Q T P(Q,T)
+1 +1 0
+1 -1 1/2
-1 +1 1/2
-1 -1 0

・R を選んだ場合

R T P(R,T)
+1 +1 1/2
+1 -1 0
-1 +1 0
-1 -1 1/2

この場合、Alice の選択に関わらず、T の確率分布は t=\pm 1 がどちらも 1/2 となり、no-signaling を満たしています。しかしながら、Alice の観測結果と Bob の観測結果には完全な相関があり、必ず +1 ポイントが得られて、(1) が成り立ちます。(先ほどと同様に、S についても同様の確率分布をセットしたものとします。)

やればできるじゃないですか。

量子論と no-signaling の関係

最後に、量子論と no-signaling の関係について補足しておきます。前述のように、量子論にしたがう実験は、no-signaling を満たします。では、一方、no-signaling を満たす上記の同時分布を量子スピンの実験で実現できるかというと、これは、不可能です。なぜなら、量子スピンの実験で Bell の不等式を敗れる上限は、2\sqrt{2} と決まっているからです。

enakai00.hatenablog.com

つまり、量子論が実現する確率分布には、no-signaling だけでは語れない、さらに強い制約が存在するということなのです。

Bell の不等式を破る上限を決定する

何の話かと言うと

enakai00.hatenablog.com

上記の記事では、Bell の不等式を破る例として、次を上げています。

 \mathbf E(QS)+\mathbf E(RS)+\mathbf E(RT)-\mathbf E(QT)  = 2{\sqrt 2} > 2 --- (1)

この結果は、観測演算子 Q,\,R,\,S,\,T を巧妙に選択することで得られたものですが、一般に、観測演算子を自由に選んだ場合、上記の値はどこまで大きくすることができるでしょうか?

これって、数学的には、線形空間における最適化問題として容易に定式化できるような気もするのですが・・・、実はまったくもって一筋縄では計算ができません。

ここでは、下記の論文の手法を利用して、上記の 2\sqrt{2} がまさにその上限であることを示してみたいと思います。

[1306.3805] Designing Bell inequalities from a Tsirelson bound

問題の定式化

まず、解くべき問題を整理します。上記では、観測演算子を自由に選ぶと言いましたが、ここでは、観測対象の状態 {\mid\psi\rangle} も自由に選べるものとします。

いま、Alice が用いる観測演算子を A_a,\,(a=0,1)、Bob が用いる観測演算子を B_b,\,(b=0,1) とすると、Alice と Bob が、それぞれ、A_a,\,B_b を観測した場合、獲得ポイントの期待値(の絶対値)は、

 E_{ab} = {\langle \psi\mid}A_a\otimes B_b{\mid\psi\rangle}

で計算されます。それぞれの観測演算子(Observable、すなわち、エルミート演算子)は、固有値が \pm 1 であるものとします。なお、これらの条件より、

 A_a^\dagger A_a = A_a ^ 2 = 1,\ B_b^\dagger B_b = B_b^2=1

が成り立ちます。つまり、A_a,\,B_b はユニタリ演算子でもあります。

そして、観測演算子の組み合わせが a=1,\,b=1 の場合は、実際のポイントはマイナスになるという条件を付与すると、先ほどの (1) に相当する値は次になります。

 \displaystyle Q = \sum_{a,\,b}E_{ab}g_{ab} --- (2)

ここに、g_{ab} は、行列

  g = \begin{pmatrix} 1 & 1 \\ 1 & -1\end{pmatrix} --- (3)

の成分を表します。

Tsirelson の定理

さあ、これで問題設定は明確になりました。2量子ビットの状態 {\mid \psi\rangle}、および、観測演算子 A_a,\,B_b を変化させた時の (2) の上限を求めればOKです。

・・・・と言っておいて・・・・・

ここでハタと手が止まりますよね。まともにやるなら、2量子ビットの状態と固有値が \pm 1 の任意の観測演算子をパラメトライズするところですが、なかなか大変そうです。ここで利用できるのが、次の Tsirelson の定理(の簡易版)です。

2量子ビットの任意の状態 {\mid\psi\rangle} を固定した時、{\mathbf v_a},\,{\mathbf w_b}\in \mathbf R^4\ (a,\,b=0,\,1)|{\mathbf v_a}| =|{\mathbf w_b}| = 1)が存在して、次が成り立つ。

 E_{ab} = {\langle \psi\mid}A_a\otimes B_b{\mid\psi\rangle} = \mathbf v_a^{\rm T}\mathbf w_b --- (4)

つまり、演算子を組み合わせた期待値を単位ベクトルの内積に置き換えることができます。

証明は次の通りです。まず、

 {\mid v_a\rangle} = (A_a\otimes 1){\mid\psi\rangle},\ {\mid w_b\rangle} = (1\otimes B_b){\mid\psi\rangle}

とおいて、(A_a,\,B_b がエルミート演算子であることに注意して)自明に次が成り立ちます。

 E_{ab}={\langle v_a\mid w_b\rangle}

{\mid v_a\rangle}{\mid w_b\rangle}\mathbf C^4 の要素で、A_a,\,B_b がユニタリ演算子であることから、大きさは 1 (単位ベクトル)になります。ここで、これらの実部と虚部を分けてならべて \mathbf R^8 の要素に変換したものを {\mathbf v_a},\,{\mathbf w_b} とすると、これらもやはり単位ベクトルで、E_{ab} \in \mathbf R であることから、

 {\langle v_a\mid w_b\rangle}= \mathbf v_a^{\rm T}\mathbf w_b

が成り立ちます。また、\{{\mathbf v_a},\,{\mathbf w_b}\} は全部で4個のベクトルなので、基底を取り替えることで、(内積を保ったまま)\mathbf R^4 の要素に変換することができます。■

※ この証明は下記の論文を参考にしました。

[0812.4887] From Bell Inequalities to Tsirelson's Theorem: A Survey

双線型形式の最大値問題に帰着

(4) の関係を用いると、v_{ai}{\mathbf v_a} の第 i 成分、w_{bj}{\mathbf w_b} の第 j 成分として、(2) は次のように書き直すことができます。以下、添字の和については、Einstein の総和の規約を用います。

 \displaystyle Q = v_{ai}g_{ab}\delta_{ij}w_{bj}

ここで、行列  g_{ab} を直交行列 V_{ab},\,W_{ab} で特異値分解したものを

 \displaystyle g_{ab} = V_{ac}\Sigma_{cd}W_{db}\ (\Sigma = {\rm diag}(s_1,\,s_2),\,s_1\ge s_2\ge 0)

とすると、

 \displaystyle Q = v_{ai}V_{ac}\Sigma_{cd}\delta_{ij}W_{db}w_{bj} = v'_{ci}\Sigma_{cd}\delta_{ij}w'_{dj}

  v'_{ci} = v_{ai}V_{ac},\,w'_{dj} = W_{db}w_{bj}

が成り立ちます。

この時、v'_{ci} の2次元の添字を1次元に並べ直して \mathbf R^8 の要素と見直すと、V が直交行列であることから、次のように、大きさ \sqrt{2} のベクトルになることが分かります。w'_{bj} についても同様です。

 |v'_{ci}|^2 = v_{ai}V_{ac} V_{cd}v_{di} = v_{ai}\delta_{ad}v_{di} = 1 + 1 = 2

結局の所、Q は、大きさ \sqrt{2} のベクトル \mathbf v',\,\mathbf w' \in \mathbf R^8 を用いた双線型形式とみなすことが可能で、行列要素 \Sigma_{cd}\delta_{ij} について、(ci), (dj) をそれぞれ1次元の添字に展開すると、次のように書き下すことができます。(I_4 は 4 次の単位行列)

 Q = \mathbf v'^{\rm T}\begin{pmatrix}s_1 I_4 & 0 \\ 0 & s_2 I_4\end{pmatrix}\mathbf w' --- (5)

これを最大にするには、\mathbf v',\,\mathbf w' について、s_1 部分の特定成分(例えば、第1成分)のみが \sqrt{2} で他の成分が 0 とすればよく、これより、次の関係が得られます。

  Q \le 2s_1 --- (6)

ただし、この議論は Q の上界の1つ与えているだけで、達成可能な上限とは限りません。なぜなら、\mathbf v',\,\mathbf w' は、\mathbf R^4 の2個の単位ベクトルを直交行列 V^{\rm T}、もしくは、W で混ぜ合わせたものであり、大きさ \sqrt{2} の任意のベクトルとなるわけではないからです。

g の特異値分解

(3) の行列 g を実際に特異値分解すると次が得られます。(計算は、Mathematica などで・・・)

 \displaystyle g = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}\begin{pmatrix} \sqrt{2} & 0 \\ 0 & \sqrt{2} \end{pmatrix}
\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}

したがって、s_1 = s_2 = \sqrt{2} であり、(6) の結果より、

 Q \le 2\sqrt{2}

が得られます。したがって、冒頭の (1) は、Q の値を最大化する結果を与えており、今の場合、(6) は(結果として)達成可能な上限を与えていたことになります。

ここで、実際に上限を達成する  \mathbf v_a,\,\mathbf w_b を構成してみます。今の場合、s_1=s_2 であることから、(5) を最大化するには、\mathbf v'=\mathbf w' であればよいことになります。さらに、

 \displaystyle V = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix},\, W = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}

という具体的な形を用いると、\displaystyle \mathbf v'_{a} = (V^{\rm T})_{ac}\mathbf v_c,\,\mathbf w'_{b} = W_{bd}\mathbf w_d に注意して、

 \displaystyle \mathbf v'_0 = \frac{1}{\sqrt{2}} \left(\mathbf v_0 - \mathbf v_1\right),\, \mathbf v'_1 = \frac{1}{\sqrt{2}}\left(\mathbf v_0 + \mathbf v_1\right)

 \mathbf w'_0 = \mathbf w_1,\,\mathbf w'_1 = \mathbf w_0

となります。したがって、\mathbf v'=\mathbf w'、すなわち、\mathbf v'_0=\mathbf w'_0,\, \mathbf v'_1 = \mathbf w'_1 という条件から、次の関係が得られます。

  \displaystyle \mathbf w_0 = \frac{1}{\sqrt{2}}\left(\mathbf v_0 + \mathbf v_1\right)

  \displaystyle \mathbf w_1 = \frac{1}{\sqrt{2}} \left(\mathbf v_0 - \mathbf v_1\right)

この時、(4) を用いると、c = \mathbf v_0^{\rm T}\mathbf v_1 として、

 \displaystyle E_{00} = \frac{1}{\sqrt{2}}(1 + c)

 \displaystyle E_{10} = \frac{1}{\sqrt{2}}(1 + c)

 \displaystyle E_{01} = \frac{1}{\sqrt{2}}(1 - c)

 \displaystyle E_{11} = \frac{1}{\sqrt{2}}(-1 + c)

であり、確かに、Q=E_{00}+E_{10}+E_{01}+E_{11}=2\sqrt{2} が成り立ちます。

おまけ

Tsirelson の定理(簡易版)の証明は、下記論文の Theorem 1 を参照しました。

[0812.4887] From Bell Inequalities to Tsirelson's Theorem: A Survey

本記事の議論には影響ありませんが、論文内の証明において、Theorem 1 の条件 (3) と (4) の同値性が触れられておらず、一瞬頭が「???」となったので、簡単に補足しておきます。(割とトリビアルな内容ですが・・・)

・(3) ⇒ (4)

m\ge n の場合、各 {\mid u_i\rangle}\{{\mid v_j\rangle}\}_{j=1}^n が張る部分空間に正射影したものを改めて \{{\mid u_i\rangle}\}_{i=1}^m と定義する。m\le n の場合は、{\mid v_j\rangle} の方を \{{\mid u_i\rangle}\}_{i=1}^m が張る部分空間に正射影する。

・(4) ⇒ (3)

直行する次元を1つ加えて、その方向の値を調整して、各 {\mid u_i\rangle} を単位ベクトルにする。同じく、さらにもう1つ直行する次元を加えて、その方向の値を調整して、各 {\mid v_j\rangle} を単位ベクトルにする。

あとついでに、同証明でちょっと導出に悩んだ点の補足。

・(9) 式の直後

X_iX_j + X_jX_i = 0\ (i\ne j) より、\{X_k\otimes X_k\} が可換になる理由は、次の通り。

 X_iX_j\otimes X_iX_j =(-1)X_jX_i\otimes (-1)X_jX_i = X_jX_i\otimes X_jX_i

・(11) 式の導出

まず、(10) より、

  {\mid\psi\rangle} = (-1)^{a_l}X_l\otimes X_l{\mid\psi\rangle}

が成り立つ。この時、

 \displaystyle {\langle\psi\mid}X_k\otimes X_l{\mid\psi\rangle} = \frac{1}{2}\left({\langle\psi\mid}X_k\otimes X_l{\mid\psi\rangle}+{\langle\psi\mid}X_k\otimes X_l{\mid\psi\rangle}\right)

において、上記の関係を用いて、右辺第1項の {\langle\psi\mid} と第2項の {\mid\psi\rangle} をそれぞれ、(-1)^{a_l}{\langle\psi\mid}X_l\otimes X_l、および、(-1)^{a_l}X_l\otimes X_l{\mid\psi\rangle} に置き換えると、X_l^2 = I を用いて、

 \displaystyle {\langle\psi\mid}X_k\otimes X_l{\mid\psi\rangle} = \frac{1}{2}(-1)^{a_l}\left({\langle\psi\mid}X_lX_k\otimes I{\mid\psi\rangle} + {\langle\psi\mid}X_kX_l\otimes I{\mid\psi\rangle}\right)

  = (-1)^{a_l}\delta_{kl}I