量子力学基础-6

7. 密度算子

当量子系统较为复杂时,例如,自由度(希尔伯特空间的维数)数目很大,我们很难掌握态矢量的全部信息,尤其是它的相位. 我们较易获得并且最关心的信息是量子系统处于各种状态的概率. 对于这种情况,使用密度算符是有好处的.

设系统的基矢是\(|0\rang\)\(|1\rang\), 已知系统处于\(|0\rang\)的概率为\(p_1\), 处于\(|1\rang\)的概率为\(p_2\), 满足上述条件的态矢量可以表示为

\[|\psi\rang=\sqrt{p_1} e^{i\alpha} |0\rang+\sqrt{p_2}e^{i\beta}|1\rang. \]

式中\(\alpha, \beta\) 为任意实数,\(\alpha\)\(\beta\) 可以有无限多个不同的组合,可见\(|\psi\rang\) 可以有无限多个表现形式.

7.1 密度算符的定义

\(|\psi_i\rang\) 是量子系统可能取的各种状态之一, 相应的概率分别为\(p_i\),满足\(\sum_ip_i=1.\) 密度算子表示如下,

\[\rho=\sum_ip_i|\psi_i\rang \lang \psi_i| \]

对于上面的例子,若用密度算符来表示,则有

\[\rho=p_1|0\rang\lang 0|+p_2|1\rang\lang1| \]

从而消除了相位的不确定性.

注意,密度算子并没有规定\(|\psi_i\rang\)\(|\psi_j\rang\)必需正交. 现在仍用上面的例子说明. 定义两个态矢量:

\[|\psi_1\rang=\sqrt{p_1}|0\rang+\sqrt{p_2}|1\rang\\ |\psi_2\rang=\sqrt{p_1}|0\rang-\sqrt{p_2}|1\rang \]

可以得到,

\[|0\rang=\frac{|\psi_1\rang+|\psi_2\rang}{2\sqrt{p_1}}\\ |1\rang=\frac{|\psi_1\rang-|\psi_2\rang}{2\sqrt{p_2}}\\ \]

所以有

\[\begin{align} \rho&=p_1|0\rang\lang 0|+p_2|1\rang\lang1|\\ &=p_1\frac{|\psi_1\rang+|\psi_2\rang}{2\sqrt{p_1}}\frac{\lang\psi_1|+\lang\psi_2|}{2\sqrt{p_1}} + p_2\frac{|\psi_1\rang-|\psi_2\rang}{2\sqrt{p_2}}\frac{\lang\psi_1|-\lang\psi_2|}{2\sqrt{p_2}}\\ &=\Big(\frac{1}{4}|\psi_1\rang\lang\psi_1|+\frac{1}{4}|\psi_2\rang\lang\psi_1|+\frac{1}{4}|\psi_1\rang\lang\psi_2|+\frac{1}{4}|\psi_2\rang\lang\psi_2|\Big)\\ &+ \Big(\frac{1}{4}|\psi_1\rang\lang\psi_1|-\frac{1}{4}|\psi_2\rang\lang\psi_1|-\frac{1}{4}|\psi_1\rang\lang\psi_2|+\frac{1}{4}|\psi_2\rang\lang\psi_2|\Big)\\ &=\frac{1}{2}|\psi_1\rang\lang\psi_1|+\frac{1}{2}|\psi_2\rang\lang\psi_2| \end{align} \]

若以\(|0\rang\)\(|1\rang\) 来描述\(\rho\), 则系统以\(p_1\)的概率处于\(|0\rang\),以 \(p_2\) 的概率处于\(|1\rang\)

若以\(|\psi_1\rang\)\(|\psi_2\rang\) 来描述\(\rho\), 则系统以\(\frac{1}{2}\)的概率为处于\(|\psi_1\rang\), 以\(\frac{1}{2}\)的概率处于\(|\psi_2\rang\)的概率.

  • 可见同一\(\rho\) 可以有完全不同的表现形式. 当\(p_1 \neq p_2\) 时,\(\lang\psi_1|\psi_2\rang\neq0\), 即\(|\psi_1\rang\)\(|\psi_2\rang\) 不正交. 推导如下:

    \[\begin{align} \lang\psi_1|\psi_2\rang &= \Big(\sqrt{p_1}|0\rang+\sqrt{p_2}|1\rang\Big)^\dagger \Big(\sqrt{p_1}|0\rang-\sqrt{p_2}|1\rang\Big)\\ &=\Big(\sqrt{p_1}\lang0|+\sqrt{p_2}\lang1|\Big) \Big(\sqrt{p_1}|0\rang-\sqrt{p_2}|1\rang\Big)\\ &=p_1-p_2 \neq0~~(if~~p_1 \neq p_2) \end{align} \]

  • 如果量子态\(|\psi\rang\)确实发生,或者说\(|\psi\rang\)以概率1出现,则\(\rho=1\cdot|\psi\rang\lang\psi|=|\psi\rang\lang\psi|\), 这样的态称为纯态(pure state).

7.2 密度算符的性质

  • 密度算子的性质与其对应的密度矩阵的迹(trace of matrix)密切相关,首先来看矩阵迹的性质.

    \(tr(A+B)=tr(A)+tr(B)\)

    \(tr(zA)=ztr(A)\)

    \(tr(AB)=tr(BA)\)

    很重要的性质\(tr(A|\psi\rang\lang\psi|)=tr(\lang\psi|A|\psi\rang)=\lang\psi|A|\psi\rang\),详细的证明见这里.

    特殊地,当\(A=I\)时,\(tr(I|\psi\rang\lang\psi|)=tr(|\psi\rang\lang\psi|)=tr(\lang\psi|\psi\rang)=\lang\psi|\psi\rang=1.\)

  • 现在来看密度算子的性质:

    • 密度算子\(\rho\)的迹等于1.

      \(\rho=\sum_ip_i|\psi_i\rang\lang\psi_i|\)

      tr\((\rho)=tr(\sum_ip_i|\psi_i\rang\lang\psi_i|)=\sum_ip_itr(|\psi_i\rang\lang\psi_i|)=\sum_ip_i=1.\)

    • 密度算子是半正定算子. 设\(|\psi\rang\) 是任意态矢,

      \(\lang\psi|\rho|\psi\rang=\lang\psi|\sum_ip_i|\psi_i\rang\lang\psi_i|\psi\rang=\sum_ip_i\lang\psi|\psi_i\rang\lang\psi_i|\psi\rang=\sum_ip_i|\lang\psi|\psi_i|^2 \ge0\)

    • 密度算子\(\rho\) 是厄米算符,本征值是实数.

      \(\rho^\dagger=(\sum_ip_i|\psi_i\rang\lang\psi_i|)^\dagger=\sum_ip_i|\psi_i\rang\lang\psi_i|=\rho\)

    • 密度算子还是正规算子,可以进行谱分解.

      \(\rho=\sum_i\lambda_i|i\rang\lang i|=\sum_ip_i|i\rang\lang i|\)

      式中各\(|i\rang\) 是正交归一基,本征值\(\lambda_i\)是实数,并且同时也是系统在基矢\(|i\rang\) 上出现的概率\(p_i.\)

7.3 密度算子的重要应用

  • 计算可观测量的平均值\(\overline{M}\)

    \(\rho=\sum_ip_i|i\rang\lang i|\)

    \(\overline{M} =\lang\psi|M|\psi\rang=tr(\lang\psi|M|\psi\rang)=tr(\rho M)=tr(M\rho)=\sum_ip_i\lang i|M|i \rang\)

    • 用态矢量来描述.

      \(M=\sum_i\lambda_i|i\rang\lang i|=\sum_i\lambda_iP_i\), 用\(P_i\)测量结果为\(\lambda_i\), 得到\(\lambda_i\)的概率为\(p(i)=\lang\psi|P_i|\psi\rang\)

      \(\overline{M}=\sum_ip(i)\lambda_i=\sum_i\lang\psi|P_i|\psi\rang \lambda_i=\lang\psi|\sum_i\lambda_iP_i|\psi\rang=\lang\psi|M|\psi\rang.\)

    • \(|\psi\rang\) 展开为\(|\psi\rang=\sum_i\sqrt{p_i}|i\rang\), 则

      \(\lang\psi|M|\psi\rang=tr(\lang\psi|M|\psi\rang)=tr(\sum_j\sqrt{p_j}\lang j|M\sum_i\sqrt{p_i}|i\rang)=tr(\sum_i\sum_j\sqrt{p_ip_j}\lang j|M|i \rang)\\=tr(\sum_ip_i\lang i|M|i\rang)=\sum_ip_itr(\lang i|M|i \rang)=\sum_ip_i\lang i|M|i\rang.\)

    • 用密度算子来描述.

      tr\((\rho M)=tr(\sum_ip_i|i\rang\lang i|M)=\sum_ip_itr(|i\rang\lang i|M)=\sum_ip_itr(\lang i|M|i\rang)=\sum_ip_i\lang i|M|i \rang\)

  • \(\cdot\) 诺伊曼(von Neumann)熵

    • 香农熵

      设有随机变量\(X=\{x_1,\cdots,x_i,\cdots,x_n\}\), \(x_i\) 出现的概率为\(p_i\), 香农熵\(H(X)\)

      \[H(X)=-\sum_i^np_i\text{log}_2(p_i) \]

      特别地,约定\(p_i=0,~0\text{log}_20=0.\)

    • von Neumann 熵

      若量子系统的密度矩阵为\(\rho\), 系统的信息熵(von Neumann 熵)\(S(\rho)\)

      \[S(\rho)=-\text{tr}(\rho\text{log}_2\rho) \]

      如果将\(\rho\) 谱分解,\(\rho=\sum_i \lambda_i|i\rang\lang i|\), 各\(|i\rang\) 组成正交归一基系,本征值\(\lambda_i\) 是系统在本征矢\(|i\rang\) 上出现的概率,这时\(\rho\)可以用对角矩阵表示

      \[\rho=\begin{bmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix} \]

      \[\text{log}_2\rho=\begin{bmatrix} \text{log}_2\lambda_1 & 0 & \cdots & 0 \\ 0 & \text{log}_2\lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \text{log}_2\lambda_n \end{bmatrix} \]

      \[\rho\text{log}_2\rho=\begin{bmatrix} \lambda_1\text{log}_2\lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2\text{log}_2\lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n\text{log}_2\lambda_n \end{bmatrix} \]

      所以有

      \[S(\rho)=-\text{tr}(\rho\text{log}_2\rho)=-\sum_{i=1}^{n}\lambda_i\text{log}_2\lambda_i \]

      可见,当\(\rho\) 用正交归一基表示时,von Neumann熵与Shannon 熵是一致的. 特别地,纯态的密度矩阵满足\(\text{tr}(\rho^2)=1\), 若\(\text{tr}(\rho^2)<1\),则称之为混合态.

      推导如下:

      • 第一种解释

        纯态的密度矩阵\(\rho=|\psi\rang\lang\psi|\), \(\rho^2=|\psi\rang\lang\psi|\psi\rang\lang\psi|\)\(\lang\psi|\psi\rang=1\)

        \(\text{tr}(\rho^2)=\text{tr}(|\psi\rang\lang\psi|\psi\rang\lang\psi|)=\lang\psi|\psi\rang\text{tr}(|\psi\rang\lang\psi|)=\lang\psi|\psi\rang\text{tr}(\lang\psi|\psi\rang)=\lang\psi|\psi\rang\lang\psi|\psi\rang=|\lang\psi|\psi\rang|^2=1\)

      • 第二种解释

        纯态的\(\rho=\lambda_i|i\rang\lang i|=1\cdot|i\rang\lang i|=|i\rang\lang i|\), \(\rho^2=|i\rang\lang i|i\rang\lang i|=|i\rang\lang i|\), tr\((\rho^2)=\text{tr}(|i\rang\lang i|)=\text{tr}(\lang i|i\rang)=\lang i|i\rang=1\)

      • 第三种解释

      \[\rho=\begin{bmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix} \]

      \[\rho^2=\begin{bmatrix} \lambda_1^2 & 0 & \cdots & 0 \\ 0 & \lambda_2^2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n^2 \end{bmatrix} \]

      tr\((\rho)=\sum_i\lambda_i\), tr\((\rho^2)=\sum_i\lambda_i^2\)

      如果是纯态,\(\lambda_1,\lambda_2,\cdots,\lambda_n\) 中只有一个为1,其余全为0,所以\(\text{tr}(\rho)=\text{tr}(\rho^2)=1\);

      如果是混合态,\(\lambda_1,\lambda_2,\cdots,\lambda_i,\cdots,\lambda_n\) 中不止一个不为0,假设\(\lambda_1,\lambda_2,\cdots,\lambda_i\) 不为0,其余全为0.又因为\(0\leq\lambda_1,\lambda_2,\cdots,\lambda_n\leq1\), 所以有

      \[\begin{align} \text{tr}(\rho^2)&=\lambda_1^2+\lambda_2^2+\cdots+\lambda_i^2 \\&=\lambda_1^2+\lambda_2^2+\cdots+\lambda_i^2+\cdots+\lambda_n^2\\ &<\lambda_1^2+\lambda_2^2+\cdots+\lambda_i^2+\cdots+\lambda_n^2+交叉乘积项(大于0) \\&=(\lambda_1+\lambda_2+\cdots+\lambda_n)^2=1 \end{align} \]

\(\color{red}{Note}\):博主还写了一篇参考 Nielsn 和 Chuang的《Quantum Computation and Quantum Information》以及赵千川翻译的中文版的关于密度算子的博文 再谈密度算子,理解难度较大,建议先理解本篇文章,再看另一篇.

参考文献

[1] 马瑞霖. 量子密码通信[M]. 北京:科学出版社,2006.

posted @ 2021-11-01 21:48  one2Four  阅读(500)  评论(0编辑  收藏  举报