Bell の不等式を破る上限を決定する

何の話かと言うと

enakai00.hatenablog.com

上記の記事では、Bell の不等式を破る例として、次を上げています。

　 $\mathbf E(QS)+\mathbf E(RS)+\mathbf E(RT)-\mathbf E(QT) = 2{\sqrt 2} > 2$ 　--- (1)

この結果は、観測演算子 $Q,\,R,\,S,\,T$ を巧妙に選択することで得られたものですが、一般に、観測演算子を自由に選んだ場合、上記の値はどこまで大きくすることができるでしょうか？

これって、数学的には、線形空間における最適化問題として容易に定式化できるような気もするのですが・・・、実はまったくもって一筋縄では計算ができません。

ここでは、下記の論文の手法を利用して、上記の $2\sqrt{2}$ がまさにその上限であることを示してみたいと思います。

・[1306.3805] Designing Bell inequalities from a Tsirelson bound

問題の定式化

まず、解くべき問題を整理します。上記では、観測演算子を自由に選ぶと言いましたが、ここでは、観測対象の状態 ${\mid\psi\rangle}$ も自由に選べるものとします。

いま、Alice が用いる観測演算子を $A_a,\,(a=0,1)$ 、Bob が用いる観測演算子を $B_b,\,(b=0,1)$ とすると、Alice と Bob が、それぞれ、 $A_a,\,B_b$ を観測した場合、獲得ポイントの期待値（の絶対値）は、

　 $E_{ab} = {\langle \psi\mid}A_a\otimes B_b{\mid\psi\rangle}$

で計算されます。それぞれの観測演算子（Observable、すなわち、エルミート演算子）は、固有値が $\pm 1$ であるものとします。なお、これらの条件より、

　 $A_a^\dagger A_a = A_a ^ 2 = 1,\ B_b^\dagger B_b = B_b^2=1$

が成り立ちます。つまり、 $A_a,\,B_b$ はユニタリ演算子でもあります。

そして、観測演算子の組み合わせが $a=1,\,b=1$ の場合は、実際のポイントはマイナスになるという条件を付与すると、先ほどの (1) に相当する値は次になります。

　 $\displaystyle Q = \sum_{a,\,b}E_{ab}g_{ab}$ 　--- (2)

ここに、 $g_{ab}$ は、行列

　 $g = \begin{pmatrix} 1 & 1 \\ 1 & -1\end{pmatrix}$ 　--- (3)

の成分を表します。

Tsirelson の定理

さあ、これで問題設定は明確になりました。2量子ビットの状態 ${\mid \psi\rangle}$ 、および、観測演算子 $A_a,\,B_b$ を変化させた時の (2) の上限を求めればOKです。

・・・・と言っておいて・・・・・

ここでハタと手が止まりますよね。まともにやるなら、2量子ビットの状態と固有値が $\pm 1$ の任意の観測演算子をパラメトライズするところですが、なかなか大変そうです。ここで利用できるのが、次の Tsirelson の定理（の簡易版）です。

2量子ビットの任意の状態 ${\mid\psi\rangle}$ を固定した時、 ${\mathbf v_a},\,{\mathbf w_b}\in \mathbf R^4\ (a,\,b=0,\,1)$ （ $|{\mathbf v_a}| =|{\mathbf w_b}| = 1$ ）が存在して、次が成り立つ。

　 $E_{ab} = {\langle \psi\mid}A_a\otimes B_b{\mid\psi\rangle} = \mathbf v_a^{\rm T}\mathbf w_b$ 　--- (4)

つまり、演算子を組み合わせた期待値を単位ベクトルの内積に置き換えることができます。

証明は次の通りです。まず、

　 ${\mid v_a\rangle} = (A_a\otimes 1){\mid\psi\rangle},\ {\mid w_b\rangle} = (1\otimes B_b){\mid\psi\rangle}$

とおいて、（ $A_a,\,B_b$ がエルミート演算子であることに注意して）自明に次が成り立ちます。

　 $E_{ab}={\langle v_a\mid w_b\rangle}$

${\mid v_a\rangle}$ と ${\mid w_b\rangle}$ は $\mathbf C^4$ の要素で、 $A_a,\,B_b$ がユニタリ演算子であることから、大きさは 1 （単位ベクトル）になります。ここで、これらの実部と虚部を分けてならべて $\mathbf R^8$ の要素に変換したものを ${\mathbf v_a},\,{\mathbf w_b}$ とすると、これらもやはり単位ベクトルで、 $E_{ab} \in \mathbf R$ であることから、

　 ${\langle v_a\mid w_b\rangle}= \mathbf v_a^{\rm T}\mathbf w_b$

が成り立ちます。また、 $\{{\mathbf v_a},\,{\mathbf w_b}\}$ は全部で4個のベクトルなので、基底を取り替えることで、（内積を保ったまま） $\mathbf R^4$ の要素に変換することができます。■

※ この証明は下記の論文を参考にしました。

・[0812.4887] From Bell Inequalities to Tsirelson's Theorem: A Survey

双線型形式の最大値問題に帰着

(4) の関係を用いると、 $v_{ai}$ を ${\mathbf v_a}$ の第 i 成分、 $w_{bj}$ を ${\mathbf w_b}$ の第 j 成分として、(2) は次のように書き直すことができます。以下、添字の和については、Einstein の総和の規約を用います。

　 $\displaystyle Q = v_{ai}g_{ab}\delta_{ij}w_{bj}$

ここで、行列 $g_{ab}$ を直交行列 $V_{ab},\,W_{ab}$ で特異値分解したものを

　 $\displaystyle g_{ab} = V_{ac}\Sigma_{cd}W_{db}\ (\Sigma = {\rm diag}(s_1,\,s_2),\,s_1\ge s_2\ge 0)$

とすると、

　 $\displaystyle Q = v_{ai}V_{ac}\Sigma_{cd}\delta_{ij}W_{db}w_{bj} = v'_{ci}\Sigma_{cd}\delta_{ij}w'_{dj}$

　 $v'_{ci} = v_{ai}V_{ac},\,w'_{dj} = W_{db}w_{bj}$

が成り立ちます。

この時、 $v'_{ci}$ の2次元の添字を1次元に並べ直して $\mathbf R^8$ の要素と見直すと、 $V$ が直交行列であることから、次のように、大きさ $\sqrt{2}$ のベクトルになることが分かります。 $w'_{bj}$ についても同様です。

　 $|v'_{ci}|^2 = v_{ai}V_{ac} V_{cd}v_{di} = v_{ai}\delta_{ad}v_{di} = 1 + 1 = 2$

結局の所、 $Q$ は、大きさ $\sqrt{2}$ のベクトル $\mathbf v',\,\mathbf w' \in \mathbf R^8$ を用いた双線型形式とみなすことが可能で、行列要素 $\Sigma_{cd}\delta_{ij}$ について、 $(ci), (dj)$ をそれぞれ1次元の添字に展開すると、次のように書き下すことができます。（ $I_4$ は 4 次の単位行列）

　 $Q = \mathbf v'^{\rm T}\begin{pmatrix}s_1 I_4 & 0 \\ 0 & s_2 I_4\end{pmatrix}\mathbf w'$ 　--- (5)

これを最大にするには、 $\mathbf v',\,\mathbf w'$ について、 $s_1$ 部分の特定成分（例えば、第1成分）のみが $\sqrt{2}$ で他の成分が 0 とすればよく、これより、次の関係が得られます。

　 $Q \le 2s_1$ 　--- (6)

ただし、この議論は $Q$ の上界の1つ与えているだけで、達成可能な上限とは限りません。なぜなら、 $\mathbf v',\,\mathbf w'$ は、 $\mathbf R^4$ の2個の単位ベクトルを直交行列 $V^{\rm T}$ 、もしくは、 $W$ で混ぜ合わせたものであり、大きさ $\sqrt{2}$ の任意のベクトルとなるわけではないからです。

$g$ の特異値分解

(3) の行列 $g$ を実際に特異値分解すると次が得られます。（計算は、Mathematica などで・・・）

　 $\displaystyle g = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}\begin{pmatrix} \sqrt{2} & 0 \\ 0 & \sqrt{2} \end{pmatrix} \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}$

したがって、 $s_1 = s_2 = \sqrt{2}$ であり、(6) の結果より、

　 $Q \le 2\sqrt{2}$

が得られます。したがって、冒頭の (1) は、 $Q$ の値を最大化する結果を与えており、今の場合、(6) は（結果として）達成可能な上限を与えていたことになります。

ここで、実際に上限を達成する $\mathbf v_a,\,\mathbf w_b$ を構成してみます。今の場合、 $s_1=s_2$ であることから、(5) を最大化するには、 $\mathbf v'=\mathbf w'$ であればよいことになります。さらに、

　 $\displaystyle V = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix},\, W = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}$

という具体的な形を用いると、 $\displaystyle \mathbf v'_{a} = (V^{\rm T})_{ac}\mathbf v_c,\,\mathbf w'_{b} = W_{bd}\mathbf w_d$ に注意して、

　 $\displaystyle \mathbf v'_0 = \frac{1}{\sqrt{2}} \left(\mathbf v_0 - \mathbf v_1\right),\, \mathbf v'_1 = \frac{1}{\sqrt{2}}\left(\mathbf v_0 + \mathbf v_1\right)$

　 $\mathbf w'_0 = \mathbf w_1,\,\mathbf w'_1 = \mathbf w_0$

となります。したがって、 $\mathbf v'=\mathbf w'$ 、すなわち、 $\mathbf v'_0=\mathbf w'_0,\, \mathbf v'_1 = \mathbf w'_1$ という条件から、次の関係が得られます。

　 $\displaystyle \mathbf w_0 = \frac{1}{\sqrt{2}}\left(\mathbf v_0 + \mathbf v_1\right)$

　 $\displaystyle \mathbf w_1 = \frac{1}{\sqrt{2}} \left(\mathbf v_0 - \mathbf v_1\right)$

この時、(4) を用いると、 $c = \mathbf v_0^{\rm T}\mathbf v_1$ として、

　 $\displaystyle E_{00} = \frac{1}{\sqrt{2}}(1 + c)$

　 $\displaystyle E_{10} = \frac{1}{\sqrt{2}}(1 + c)$

　 $\displaystyle E_{01} = \frac{1}{\sqrt{2}}(1 - c)$

　 $\displaystyle E_{11} = \frac{1}{\sqrt{2}}(-1 + c)$

であり、確かに、 $Q=E_{00}+E_{10}+E_{01}+E_{11}=2\sqrt{2}$ が成り立ちます。

おまけ

Tsirelson の定理（簡易版）の証明は、下記論文の Theorem 1 を参照しました。

・[0812.4887] From Bell Inequalities to Tsirelson's Theorem: A Survey

本記事の議論には影響ありませんが、論文内の証明において、Theorem 1 の条件 (3) と (4) の同値性が触れられておらず、一瞬頭が「？？？」となったので、簡単に補足しておきます。（割とトリビアルな内容ですが・・・）

・(3) ⇒ (4)

$m\ge n$ の場合、各 ${\mid u_i\rangle}$ を $\{{\mid v_j\rangle}\}_{j=1}^n$ が張る部分空間に正射影したものを改めて $\{{\mid u_i\rangle}\}_{i=1}^m$ と定義する。 $m\le n$ の場合は、 ${\mid v_j\rangle}$ の方を $\{{\mid u_i\rangle}\}_{i=1}^m$ が張る部分空間に正射影する。

・(4) ⇒ (3)

直行する次元を1つ加えて、その方向の値を調整して、各 ${\mid u_i\rangle}$ を単位ベクトルにする。同じく、さらにもう1つ直行する次元を加えて、その方向の値を調整して、各 ${\mid v_j\rangle}$ を単位ベクトルにする。

あとついでに、同証明でちょっと導出に悩んだ点の補足。

・(9) 式の直後

$X_iX_j + X_jX_i = 0\ (i\ne j)$ より、 $\{X_k\otimes X_k\}$ が可換になる理由は、次の通り。

　 $X_iX_j\otimes X_iX_j =(-1)X_jX_i\otimes (-1)X_jX_i = X_jX_i\otimes X_jX_i$

・(11) 式の導出

まず、(10) より、

　 ${\mid\psi\rangle} = (-1)^{a_l}X_l\otimes X_l{\mid\psi\rangle}$

が成り立つ。この時、

　 $\displaystyle {\langle\psi\mid}X_k\otimes X_l{\mid\psi\rangle} = \frac{1}{2}\left({\langle\psi\mid}X_k\otimes X_l{\mid\psi\rangle}+{\langle\psi\mid}X_k\otimes X_l{\mid\psi\rangle}\right)$

において、上記の関係を用いて、右辺第1項の ${\langle\psi\mid}$ と第2項の ${\mid\psi\rangle}$ をそれぞれ、 $(-1)^{a_l}{\langle\psi\mid}X_l\otimes X_l$ 、および、 $(-1)^{a_l}X_l\otimes X_l{\mid\psi\rangle}$ に置き換えると、 $X_l^2 = I$ を用いて、

　 $\displaystyle {\langle\psi\mid}X_k\otimes X_l{\mid\psi\rangle} = \frac{1}{2}(-1)^{a_l}\left({\langle\psi\mid}X_lX_k\otimes I{\mid\psi\rangle} + {\langle\psi\mid}X_kX_l\otimes I{\mid\psi\rangle}\right)$