我将使用一系列量子力学中的概念,尽可能简单的向大家阐明为什么会发生泡利不相容原理:不可能有两个或更多的费米子处于完全相同的量子状态中(中学课本描述为:两个携带相同电荷的电子不能处于同一轨道,当然这个描述并不全面,因为中学并不要求我们掌握什么是费米子,什么是量子状态)。
我会帮助大家拆分涉及到的所有知识点,这些知识点如果要展开讲,基本得涵盖大部分量子力学的内容,所以我会「点到为止」。
读者最好拥有一定线性代数基础,这样能更好的掌握细节,若没有也不太影响整体概念的阅读,如果你看过《上帝掷骰子吗》等科普书籍,对部分名词有一定直观概念,则也能帮助你快速理解以下内容。
为了描述的简便和直观,以下内容(涉及到的方程、函数、算符等)均在「一维」空间下进行描述,这意味着,我们会用一个一维的“数”(本质是一个一维向量) 例如 x 来表示「位置」,而不是一个三维向量 r=(x,y,z)。材料中对涉及「线性代数」相关的概念将不再展开作讲解(例如什么是线性空间等)。
标签为 「补充」(#c 补充)的内容,是对相关概念的补充说明,仅作为了解。
在经典物理中我们可以同时测量两个粒子的位置,所以我们可以跟踪两个粒子的轨迹来区分粒子1和粒子2。
例如,在斯诺克比赛中,只要摄影机的分辨率足够精确, 我们就可以分辨15个红球。故而,无论两个经典粒子如何相似,它们都是可以分辨的。
在微观世界,粒子由一些「固有」属性所「描述」,包括电荷、质量、自旋、宇称等,我们把这些固有属性都相等的粒子称为全同粒子。因此, 全同粒子之间无法像宏观物体那样可以被区分。
例如,电子、光子等基本粒子,就是全同粒子。
我们知道,一个由粒子组成的系统,其微观状态由其组成的粒子状态决定。那么对于一个由全同粒子组成的系统, 交换两个粒子的状态体系的微观状态不变,这就是全同性原理。
全同性原理是量子力学的五大公设之一,我们暂时认为该公设的正确性「不言而喻」。
若把钢琴的所有白键的外壳视作全同粒子,该钢琴的「演奏规律」(弹哪个键对应发出什么音)是它们组成的一个「微观状态」(这里我们暂时忽略黑键),那么任意交换两个白键的外壳,不会影响该钢琴的演奏规律,原本中央C的键和中央A的键交换,交换后现中央C的键弹奏出来仍然发中央C的音。
我们知道,粒子具有波粒二象性,粒子可表现出波的性质。 物质的粒子性由「能量」E和「动量」p刻画,波的特征则由「频率」ν和「波长」λ表达,这两组物理量由「普朗克常数」h联系在一起:
ν=hE,λ=ph 最初由德布罗意正式提出该假设:实物粒子也具有波动性,后由电子衍射实验证实。
只不过德布罗意并未确切给出对波动性的「解释」,后来由波恩提出统计解释:
粒子具有德布罗意物质波的表现,并不是意味存在某个实在的物理量的波动,而是表示粒子在空间分布具有随机性(可通过概率分布来描述)。表现粒子的波动性质的各种实验里得到波动图象只是表示粒子在空间分布的概率。
我们所熟知的一个关于「波」的实验便是「双缝干涉」实验,波会产生干涉条纹,若粒子拥有波的特征,那么将大量粒子通过双缝,则屏幕也会出现干涉条纹,例如著名的电子双缝干涉实验。粒子波动性的统计解释对「干涉条纹」的理解是:电子们并不是像波一样「振动」着通过双缝,而是电子的「分布规律」使得其最终落到屏幕上会出现干涉条纹,换句话说,电子出现在「亮纹」处的概率最大,出现在「暗纹」处的概率最小,这才是电子双缝干涉实验出现干涉条纹的根本原因,这也是粒子波动性的本质。
正是由于该随机性,我们要测量一个粒子的运动状态时,便有了限制,我们称为不确定性原理,即对于一个粒子,要测量其位置和动量,必须满足以下条件:
ΔxΔpx≥ℏ/2=4πh 其中ℏ 为「约化普朗克常数」,Δx表示测量的位置误差,Δpx表示测量的动量误差。 也就是说我们测量的位置和动量的「不精确程度」的乘积必须大于一个常数,那么我们永远无法同时测得粒子的位置和动量的精确值。
普朗克在研究物体热辐射的规律时发现,只有假定电磁波的辐射和吸收的能量是一份一份的,而不是连续的,理论计算的结果才和实验结果是相符的。这样的一份能量称为能量子,每一份能量子等于普朗克常数乘以辐射电磁波的频率。由于普朗克常数在用于计算角动量时,经常会用到 h/2π 这个数(角动量的最小衡量单位),为避免反复写2π 这个数,因此引入另一个常用的量:约化普朗克常数 ℏ=h/2π 。
既然粒子存在不确定性原理,那么要描述一个微观粒子,就不能通过给出它的位置,速度,动量一类的物理量来得到,而只能给出一种概率描述,即对于某个粒子我们在空间的某个位置测量到它存在的「概率」是多少,这便是通过波函数来描述的。可想而知,理论上这个函数的自变量包含「位置」和「时间」,即粒子的时空信息,然后返回该粒子在该「位置」和该「时间」被测量到的「概率」,因此它应该长这样:Ψ(x,t)
这个波函数来自对粒子的波动表现的波动描述,即考虑一个自由粒子,由于它的波动表现,用一个单频平面波的波动方程来描述,然后按照德布罗意物质波的理解,用粒子的动量和能量代替波动方程里的频率和波长,就得到了描述这个微观粒子的波函数:
Ψ(x,t)=A~e−ℏi(Et−p⃗⋅x⃗)
其中A~为 「箱归一化常数」,它将使得波函数满足归一化条件(见后方章节「归一化」)。i 为虚数单位,波函数以复数的形式表示,可以简化计算。以下对「复数可以简化计算」进行简单说明,不对其物理意义展开讨论,有数学基础的同学可以进行参考理解。
平面波的波函数我们可以通过解波动方程得到形如 Ψ(x,t)=Acos(kx−ωt+θ) 的波函数。
由于波动方程是线性的,那么满足这个方程的所有的解构成一个线性空间,你可以由这个线性空间中任何一组「基」通过「线性组合」来得到这个方程所有的通解。因此我们在寻找这组基时,可以考虑实数,也可以考虑复数。例如考虑复函数 z(t)=x(t)+iy(t),假设 z(t) 是方程的解,那么根据线性空间的性质, x(t) 和 y(t) 也都分别满足方程。也就是说,我们要寻找一个方程的实数解,可以通过构造复数解,然后取它的实部即可。
那么,我们也可以将波函数写作 Ψ(x,t)=A(cos(kx−ωt+θ)−isin(kx−ωt+θ)),其同样满足波动方程。根据欧拉公式: cosx−isinx=eix ,我们就可以把波函数写作复函数形式 Ψ(x,t)=Aei(kx−ωt+θ)=Aeiθei(kx−ωt)=A~ei(kx−ωt) ,其中 eiθ 称为相位因子,相位因子与波的叠加相关,本篇文章不展开讨论。
同时,根据波恩对波函数的统计学诠释,我们定义粒子的概率密度函数为 Ψ⋅Ψ∗=∣Ψ∣2,即在时刻 t ,在空间坐标 x 附近单位体积内发现该粒子的概率。
既然波函数的平方 ∣Ψ∣2 表示的是粒子在空间分布的概率密度,也就是说 ∣Ψ∣2 乘一个体积元,得到的是在这个体积元里找到这个粒子的概率。那么在全空间里积分,得到的粒子存在概率就应该是1,这便是波函数的归一化条件。
∫∣Ψ∣2dx=1
我们通常在量子力学的方程中看见「算符」(operator),算符是对某个函数的操作(operate,运算),若某一操作(运算)F^ 将函数 u 变为函数 v ,记为
F^u=v
则将这一操作(运算)的符号称作「算符」。
例如「对某个函数求导」这种操作,就可以定义为一个算符 D^=dxd ,那么对 f(x) 求导,我们就可以用求导算符写作 D^f(x)=dxdf(x)
在量子力学中,可观测量 A 以算符的形式出现,算符作用于波函数,则可表示为该可观测量的表达式。 常用的一个算符就是动量算符 p^=−iℏ∇。这里又出现了一个新的符号 ∇ ,这个倒三角表示求梯度,作用在一个函数上的效果是,对一个多元函数的xyz三个自变量分别求导数再乘以相应的单位向量,得到的是一个矢量
∇f=∂x∂fi+∂y∂fj+∂z∂fk
这里我们只考虑一维的情况,因此我们也可以把动量算符写作p^=−iℏ∂x∂,它作用于波函数,得到粒子动量的函数表达式。
动量算符的推导本身应该从「动量空间波函数」得来,不过这个过程较为复杂,我们可以直接通过波函数简单的进行解释(注意这不是推导,而是解释动量算符「长这个样子」为什么是正确的,相当于「验算」):
还记得我们平面波的波函数吗?Ψ(x,t)=eℏi(px−Et),波函数在空间上的一阶偏导数(对x求偏导数)为:
∂x∂Ψ(x,t)=ℏipeℏi(px−Et)=ℏipΨ(x,t)
我们的目标是使得 p^Ψ=p,这就表明了动量算符可表示为 p^=−iℏ∂x∂ ,因为 −iℏ∂x∂Ψ=−iℏ⋅ℏip=p
获得对于微观粒子的力学描述以后,就可以建立对于微观粒子的运动的一般运动方程。这就是薛定谔方程。
H^Ψ=iℏ∂t∂Ψ 这是最一般的薛定谔方程,方程右边是对时间的导数,刻画了波函数随时间的变化,左边是哈密顿量作用于波函数,表明波函数的演化由系统能量的具体形式决定。薛定谔方程描述了粒子系统的波函数随时间变化的关系,方程的解便是波函数。
薛定谔方程中 H^ 为哈密顿算符,也叫做哈密顿量,类比于经典力学,通常表示为对应于系统的动能和势能的算子之和,形式为
H^=T^+V^。
V^ 为势能算符,我们用势能函数(位势)V^=V(x,t)来表示粒子在时空中不同位置的势能。
T^ 为动能算符,根据动能与动量的关系,直接由动量算符刻画 T^=2mp^2=−2mℏ∇2
因此
哈密顿量作用于波函数,便刻画了物体或系统的能量。
因此,波函数也必须满足薛定谔方程。
全同粒子系统具有交换对称性,交换对称性是指交换两个粒子的状态后,体系的任何可观测量保持不变。交换对称性包括交换对称与交换反对称。
假设我们有N个粒子组成的体系,该体系的波函数应该和所有粒子的坐标和时间有关,即 Ψ=Ψ(q1,q2,⋯,qN;t) 。 我们对全同粒子体系引入交换算符 P^ij ,它的作用是把第i个粒子和第j个粒子交换位置,即:
P^ijΨ(⋯,qi,⋯,qj,⋯;t)=Ψ(⋯,qj,⋯,qi,⋯;t),(i=j) 由全同粒子的不可分辨性(全同原理),交换后的状态(波函数 Ψ )与交换前的状态是不可区分的,也即: P^ijΨ=CΨ,C 为常数,而显然有: P^ijP^ijΨ=Ψ 即我们连续交换两次,那么两个粒子又回到原来的地方,系统状态不变。所以 C2=1,解得 C=+1 或者 −1 。也即 P^ijΨ=+Ψ或者−Ψ.(对任何i=j)
之前提到过,算符是对某个函数进行操作,那是否存在一些算符,它们对函数操作后,等同于函数乘以一个常数?例如:
A^f=af ,其中a为常数。这样的方程,称为算符 A^ 的本征方程, 通过解本征方程,我们可以得到一系列可能的 a 的值,我们称为本征值。因此在上面对交换算符的描述中,C 就是 P^ 的本征值。学过线性代数的朋友,看到这里肯定就非常熟悉了,这跟特征方程、特征值几乎是可以直接类比的。
假如 P^ijΨ=+Ψ ,则称 Ψ 为交换对称波函数;假如 P^ijΨ=−Ψ ,则称 Ψ 为交换反对称波函数。
在量子力学中,交换对称性通常是用算符+态矢进行表示:
P^∣ψ,ϕ⟩≡∣ϕ,ψ⟩
这里我们还是用大家更熟悉的「函数」式的方式来表示。
其中ψ 为量子态,就是粒子或系统的状态,我们在全同性原理中提到过,交换「两个粒子的状态」的这个「状态」,就是指量子态,它可以由波函数描述。态矢又称作狄拉克符号,是对量子态的抽象表达,要理解态矢,我们需要先引入「表象」这个概念。
通常来说,某个矢量在不同的坐标系下,会有不同的「表示」,例如给定一个矢量 A⃗ (这里我们假定它是二维的),其表达式取决于这个矢量的「本质」以及坐标系「基向量」的选择。假设在直角坐标系中,选择一组基向量为 i⃗,j⃗ ,则可以通过它们的线性组合来表示 A⃗=xi⃗+yj⃗。如果我们改变坐标系(例如旋转坐标系)或者另取一组基,则 A⃗ 的表示又会不一样。但无论如何,A⃗ 的「本质」是不会随着坐标系和基的变换而变换的,也即给定坐标系和基,其表达式就是固定的。
或许这样更好理解:我们在一张空白的纸上画一个箭头,声称它就是我们的 A⃗ ,现在我们在纸上随意画上坐标系,并选择基向量,这样我们就确定了 A⃗ 在该坐标系下的表示,我们擦掉这个坐标系,A⃗ 的表示就没了,但 A⃗ 的「本质」(那个箭头)一直在那,没有动。
表象之于量子态,就像坐标系之于矢量(注意,这只是对「表象」这个概念的直观理解方法,而不是定义)。其实除了基于位置的波函数Ψ(x,t) 外,通过傅里叶变换得到另一个可以用来表示粒子状态的函数 Φ(p,t) ,其中p为动量,它们对粒子状态的描述「具有同等地位」,或者说,它们包含的信息是完全一致的,我们把“用 Ψ(x,t) 来描述粒子状态”称为「位置表象」,把“用 Φ(p,t) 来描述粒子状态”称为动量表象,Φ(p,t) 称为动量表象中的「波函数」。
上面介绍的,那种(通过箭头)「不指定具体坐标系」来描述矢量 A⃗ ,也就类似在量子力学中通过一种抽象的、不涉及具体「表象」的形式,来讨论微观粒子的状态和运动规律的描述方法,这就是狄拉克符号想做的事情。我们可以这样说:量子力学可以不涉及具体表象来讨论微观粒子的状态和运动规律,这样一种抽象的描述方法所使用的符号,我们称之为狄拉克符号。
换句话说,∣ψ⟩ 是一个对粒子状态 ψ 的抽象表示,这个表示不依赖于「如何选择描述该状态的波函数」,我只想表示这个「状态」本身,而不想通过选择某个波函数来表示,我们就可以用狄拉克符号。
通常来说,一个全同粒子体系的波函数是解薛定谔方程得到的,原始的解未必有确定的交换对称性,而全同原理要求全同粒子的波函数必须满足交换对称性,所以我们要对它进行对称化或反对称化。这里我们考虑最简单的形式:无耦合体系,即体系的总波函数是单个粒子波函数的乘积:
Ψ(q1,q2,⋯,qN;t)=Ψ1(q1)⋯ΨN(qN)
假设 Ψ1 和 Ψ2 是不同的函数,那么对称化的波函数是:
ΨS(q1,q2)=√21[Ψ1(q1)Ψ2(q2)+Ψ1(q2)Ψ2(q1)] 而反对称化的波函数是:
ΨA(q1,q2)=√21[Ψ1(q1)Ψ2(q2)−Ψ1(q2)Ψ2(q1)] 所以,对于全同粒子,我们只能说体系中“有一个粒子处在状态 Ψ1 ,一个粒子处在状态 Ψ2 ”,而不能说“第一个粒子处在状态 Ψ1 ,第二个粒子处在状态 Ψ2”。
粒子拥有內禀的角动量,使得其可以进行「自旋」。但由于基本粒子(电子、光子、夸克)是不可再分割的点粒子,因此我们无法认为它们是「绕着一个比它们更小的轴旋转」的,只能认为粒子的自旋是一种內禀属性。 在量子力学中,任何体系的角动量都是量子化的,我们称为自旋角动量,其值只能为:
S=ℏ√s(s+1)
s为自旋量子数,它可以是整数也可以是半整数(整数+二分之一,比如 23,25,27⋯ )。
对于像质子、中子及原子核这样的亚原子粒子,自旋通常是指总的角动量,即亚原子粒子的自旋角动量和轨道角动量的总和。亚原子粒子的自旋与其它角动量都遵循同样的量子化条件。通常认为亚原子粒子与基本粒子一样具有确定的自旋,例如,质子是自旋为1/2的粒子,可以理解为这是该亚原子粒子能量量低的自旋态,该自旋态由亚原子粒子内部自旋角动量和轨道角动量的结构决定。
根据自旋统计定理,我们把自旋量子数为整数的粒子称为玻色子,自旋量子数为半整数的粒子称为费米子。因此,由于电子的自旋为 21,电子是费米子。
费米子的波函数需满足交换反对称,而玻色子的波函数需满足交换对称。至于为什么自旋能决定波函数对称性,则需要量子场论进行解释,具体就不展开讲了。简单来说,交换两个费米子,体系的波函数就会产生一个负号,换句话说,只有反对称化能够使得费米子满足交换对称性。
类似的方法可以推广到N个粒子的体系。特别是,N个费米子的反对称化函数是:
ΨA(q1,q2,⋯,qN;t)=√N!1∣∣∣∣∣∣∣∣Ψ1(q1)Ψ2(q1)⋮ΨN(q1)Ψ1(q2)Ψ2(q2)⋮ΨN(q2)⋯⋯⋱⋯Ψ1(qN)Ψ2(qN)⋮ΨN(qN)∣∣∣∣∣∣∣∣ 这便是Slater行列式。根据该行列式容易看出:如果在 Ψ1,⋯,ΨN 当中有任何两个是相同的函数,那么 ΨA(q1,⋯,qN)≡0 。
对于费米子而言,其波函数的反对称化,需考虑Slater行列式。 如果在Slater行列式中有Ψ1=Ψ2 ,也即允许两个费米子具有相同的量子态,那么行列式恒等于0,波函数无法做到归一化。 因此,我们可以得到泡利不相容原理:
不可能有两个或更多的费米子处于完全相同的量子状态中。