第八章 第二节 相对论初步
爱因斯坦环中的蓝色像为一个质量巨大的星系,起到引力透镜的作用,红色环为一个被蓝色巨星系遮挡的星系由于光线偏折而被观测到的部分。具体会在广义相对论的实验验证部分加以说明。
本节从光速是否有限引出狭义相对论的基本原理,通过相对论的基本原理、同时的相对性等基本概念理解相对论的时空观,随后介绍时钟变慢等狭义相对论效应;通过对引力作用方式的描述初步了解弯曲时空,最后介绍水星近日点进动等广义相对论的一些重要实验验证。
19 世纪末,以牛顿力学、热力学和统计物理以及电磁理论为支柱的经典物理学已经形成完整的科学体系,自然界的各种物理现象几乎都能在这一理论框架下得到解释。1900 年,物理学家开尔文勋爵,即 W.汤姆孙(W.Thomson,1824—1907)在回顾了物理学所取得的伟大成就之后,充满自信地宣称,物理学的大厦已经基本完成,剩下的只是一些修饰工作。但他在展望 20 世纪物理学前景时也承认,明朗的天空中还有两朵小小的、令人不安的乌云。正是这两朵乌云,引发了现代物理学的伟大革命,导致了相对论和量子力学的诞生。
19 世纪末,以牛顿力学、热力学和统计物理以及麦克斯韦电磁理论为支柱的经典物理学体系已经基本建立,但同时,黑体辐射问题和迈克耳孙 - 莫雷实验也在困扰着物理学家。正是这两朵小小的乌云,引发了 20 世纪现代物理学的伟大革命,导致了相对论和量子力学的诞生。
迈克尔孙 - 莫雷实验的目的是寻找以太存在的证据。但实验结果表明,不存在相对以太的运动。不同方向的光速没有差异,即真空中的光速在任何参考系下都具有相同的数值,与拳考系的相对速度无关。以太其实并不存在。迈克尔孙 - 莫雷的实验结果与经典物理的观念有很大的冲突。需要思考如下的问题:光是否可以在真空中传播?相对性原理对光是否成立?伽利略速度合成公式对光是否成立?
我们知道,真空中的光速 c = 299 792 458 m/s,但一直到 17 世纪,科学界对光速是否有限还是有争议的,甚至当时的一些著名学者都认为光速是无限的,光的传播不需要时间。伽利略曾提出过测量光速的设想,如图 8–3 所示,两个人分别站在相距数千米的山头,第一个人举起灯笼并开始计时,当第二个人看到第一个人的灯笼后立即举起自己的灯
笼,当第一个人看到第二个人的灯笼后便停止计时,以此来计算出光的速度。
认识到光速的有限性是科学上很重要的进步。如果光速无限大,显然就没有相对论了。伽利略第一个认识到光速是有限的,并最早开始尝试测量光速。显然,以当时的测量精度,用伽利略的方法是不可能测出光速的。
可以想象,以当时的测量精度,这个实验是不可能完成的,因为光传播 3 km 的距离只需要约 10 μs 的时间。1676 年,丹麦天文学家罗默(O. C. Romer,1644—1710)通过对“木卫一”的观测,首次计算出光速为 2.2×108 m/s,这个数值虽然误差较大,但已经是一个很了不起的结果,第一次证明了光速是有限的。19 世纪,法国物理学家菲索(A. H. L. Fizeau,1819—1896)和傅科(J. B. L. Foucault,1819—1868)分别用旋转齿轮和旋转镜面法对光速进行了测量,得到了相当精确的结果。
罗默通过对“木卫一”的观测给出了光速测量的结果。虽然误差较大,但却是第一个光速测量的结果,实际上利用罗默的方法可以得到非常精确的结果。之后布莱德雷利用光行差法,菲索利用旋转齿轮法,傅科利用旋转镜法等,测得了更精确的结果。现代物理利用谐振腔、激光、干涉等方法测量光速,精度大大提高。利用家用微波炉(工作频率 2 450 MHz)也能测得光速。将一块巧克力放在微波炉中加热数十秒后,测出两个相邻熔化点之间的距离,这就是微波的半个波长。将波长(即所测距离的两倍)和微波频率相乘即可得出光速。
1983 年,第十七届国际计量大会作出决定,将真空中的光速 c = 299 792 458 m/s定为精确值,而将 1 m 定义为光在真空中 \(\frac{1}{{299792458}}\) s 内行进的距离。
我们知道,牛顿运动定律成立的参考系称为惯性系,而相对惯性系做匀速直线运动的参考系也是惯性系。伽利略相对性原理告诉我们,力学规律在任何惯性系中都具有相同的形式。伽利略早在 1632 年就指出,在一艘行驶平稳的大船里,无法通过密闭船舱内的力学实验来判断大船是否在行驶。但相对性原理能推广到所有物理规律吗?
相对性原理是物理学的一个重要原理,体现了物理学规律普适性的思想。不同的惯性系之间是平权的,不存在特殊的惯性系,物理规律在不同的惯性系具有相同的形式。爱因斯坦为了解决 20 世纪初经典物理学的困境,打破了传统观念的桎梏,将伽利略的力学相对性原理推广到所有物理规律,包括电磁规律,认为所有物理规律在不同的惯性系都具有相同的形式。爱因斯坦在相对性原理和光速不变原理基础上建立的狭义相对论,不仅驱散了乌云,也形成了对时空观念全新的认识。
从狭义相对论的两条基本原理出发,可以导出两个惯性系之间的变换,即洛伦兹变换(见节后资料链接)。从洛伦兹变换可以很容易得出同时的相对性、时间膨胀及长度缩短的结论。显然,当 v ≪ c 时就回到伽利略变换。洛伦兹变换给出的是时间和空间的变换,时间和空间不再是独直的,而是一个整体,我们将时间和空间统称为四维时空。因此,洛伦兹变换实际上是四维时空的变换。
英国物理学家麦克斯韦(J. C. Maxwell,1831—1879)在 1864 年证明光是电磁波,在真空中的传播速度就是光速 c,且不涉及具体的参考系。那么,光速在哪个参考系正好等于 c?如果在 S 参考系等于 c,那么在另一个以速度 v 相对 S 参考系做匀速直线运动的 Sʹ 参考系中,是否还等于 c(图 8–4)?
如果认为光在所有惯性系中的速度都是 c,那就违反了基于伽利略相对性原理得到的速度合成公式,也就违反了伽利略相对性原理;如果认为伽利略相对性原理对光也成
立,满足速度合成公式,那么光应该只在一个特殊的惯性系中速度为 c。但这样又说明光速不是在所有惯性系中都等于 c,实际上也违反了相对性原理。物理学家们陷入了两难境地。
为了解决这个问题,爱因斯坦(图 8–5)抛弃了传统的思维方式,另辟蹊径,在 1905 年提出了两条基本原理,从而建立了一个全新的理论——狭义相对论。这两条原理可以表述如下:
相对性原理:物理规律包括电磁规律,在所有惯性系中都具有相同的形式。
光速不变原理:真空中的光速在所有惯性系中都是相同的,与光源和观测者的速度无关。
牛顿的时空观认为,空间就是一个可以容纳一切物体而又广阔无边的无限大的箱子,时间则是均匀流逝的长河;没有起点,也没有终点。物体在空间中运动,时间则标记物体运动的延续性。但物体的运动并不会影响时间和空间的性质。你是怎么理解时间和空间的呢?
“大家谈”参考解答:现代物理学认为,时间和空间是不可分割的整体,时间和空间构成四维时空。时空的性质与物质分布和物质运动密切相关。
在狭义相对论中,时间和空间不再是绝对的,而是统一在一个四维时空之中。爱因斯坦相对论的建立,给物理学带来了革命性的变化,彻底抛弃了牛顿的绝对时空观,建立了全新的相对论时空观,对现代科学的发展具有深远的意义。
由洛伦兹变换公式容易得到 t2 – t1 = \(\frac{{{t_2}^\prime - {t_1}^\prime + \frac{{v({x_2}^\prime - {x_1}^\prime )}}{{{c^2}}}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\)。因此,在 S′ 系中同时(t2′ = t1′)发生的两个事件,在 S 系中就不是同时的(t2 ≠ t1),即同时是相对的。
两不同地点在时间上的同时,并不是一个简单的问题,涉及如何使两地的钟同步或校准的问题。爱因斯坦敏锐地发现,只要认为光速不变,利用光信号就可以解决所有惯性系的钟同步问题。
而在一个惯性系中校准同步的两个钟,在另一个惯性系中则一般是不同步的。这就是相对论中同时的相对性的来源。
那么,两个事件发生的顺序有没有可能在不同参考系是相反的呢?实际上,浴伦兹变换保证了所谓的四维间隔是一个不变量,即在不同的惯性系,间隔平方 S2 = (x2 – x1)2 + (y2 – y1)2 + (z2 – z1)2 – c2(t2 – t1)2 是一个不变量。S2 < 0 的间隔称为类时间隔,S2 > 0 称为类空间隔,S2 = 0 则称为类光间隔。由于信号的传递速度不能超过光速,两个具有因果关系的事件一定是类时间隔。对于类时间隔,两个事件发生的顺序在不同的惯性系都是相同的,不会颠倒。而对于类空间隔,两个事件发生的顺序在不同惯性系有可能是相反的。但因为类空间隔的两个事件没有因果关系,即使发生的顺序相反,也不会有任何矛盾。
作为狭义相对论两个基本原理的直接推论,就是同时的相对性,即在一个参考系中同时发生的事件,在另一个参考系中不再同时。假设一列高铁沿直线轨道以匀速 v 向右运动,车厢中央的光源在时刻 t = 0 发出一个闪光,如果车厢长度为 2L,则经过时间 \(\frac{L}{c}\) 后闪光分别到达车厢的前壁和后壁。对于车厢里的观察者来说,车厢是惯性系,光向前及向后的传播速度相同,传播的距离相同,因此闪光同时到达车厢的前壁及后壁,即这两个事件对车上的观察者来说是同时发生的(图 8–6)。
但地面上的观察者不这么认为,因为当闪光向车厢前壁传播时,车厢也在以速度 v 向前运动,因此,闪光到达前壁的距离要此到达后壁的距离长一些,而光速是不变的,所以在地面的观察者看来,闪光先到达车厢后壁,后到达车厢前壁。即对地面上的观察者而言,这两个事件不是同时发生的。
如果有另一列高铁以匀速 v 向左运动,那么这列高铁上的观察者认为第一列高铁上闪光到达车厢前、后壁是同时的,还是不同时的?如果不是同时的,哪个先发生?如果第一列高铁是静止的,情况又如何?
“大家谈”参考解答:第一列高铁以匀速 v 向右运动,第二列高铁以匀速 v 向左运动或者静止,那么在第二列高铁上的观察者看来,第一列高铁都是以一定速度向右运动,所以结论不变,即第一列高铁车厢中央发出的闪光先到达车厢后壁,后到达车厢前壁。
这个结论与我们头脑中的固有观念是冲突的,我们的直觉认为,如果两个事件在一个参考系中是同时的,那在其他参考系中也一定是同时的,这似乎是天经地义的。但如果我们承认爱因斯坦的两条基本原理,则同时的相对性就是自然的结论。但为什么日常生活中我们觉察不到这种相对性?那是因为日常生活中涉及的速度都远远小于光速,这一差异我们是感觉不到的。
牛顿力学认为,两个先后发生的事件,在不同惯性系中观察到的时间间隔都是相同的。但在狭义相对论看来,不同惯性系观察到的时间间隔是不同的(图 8–7)。假设一列高铁沿直线轨道以匀速 v 向右运动,车厢地板上一个光源向上发出一个闪光,被车厢顶部的反射镜反射回车厢地板,并用一个钟记录下光脉冲来回运动经历的时间。假设车厢高度为 h,因为光速为 c,所以车厢里的观察者看到的时间间隔为 Δt′ = \(\frac{{2h}}{c}\)。但在地面上的观察者看来,当光脉冲向上传播和返回时,车厢同时在以匀速 v 向右运动,因此光脉冲的路径是等腰三角形的两条斜边,如果光脉冲来回的时间间隔是 Δt,则有
\[\Delta t = \frac{2}{c}\sqrt {{h^2} + {{\left( {\frac{{v\Delta t}}{2}} \right)}^2}} \]
消去 h 后可得
\[\Delta t = \frac{{\Delta t'}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }} = \gamma \Delta t'\]
其中 γ = \(\frac{1}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\),因为 v < c,所以因子 γ > 1,故 Δt > Δt′。
即在惯性系中,运动的钟(即高铁上的钟)比静止的钟要走得慢。这个结论称为狭义相对论的时间膨胀或钟慢效应,这体现了时间的相对性。我们把在自身静止的参考系内测得的时间称为固有时。显然,固有时的时间间隔是最短的。
对同一地点先后发生的两个事件有 t2 – t1 = \(\frac{{{t_2}^\prime - {t_1}^\prime }}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\)。因此,在 S′ 系中,在同一地点(x2′ = x1′)先后发生的两个事件的时间间隔在不同的参考系也是不同的,即运动的钟会变慢。
运动的钟变慢并不是钟出了问题,而是由相对论的时空性质导致的结果。因此,时间膨胀或钟慢效应也是相对的,两个互相做匀速直线运动的参考系上的观测者都认为对方的钟变慢了。
如果有一对孪生子,甲留在地球上,乙乘坐接近光速的飞船离开地球到太空旅行几十年后再回到地球,那么按照相对论,究竟谁更年轻呢?因为甲留在地球上,乙随着飞船做高速运动,所以回到地球后乙比甲年轻。但从运动的相对性来看,乙也可以认为自己在飞船内静止,甲随着地球做高速运动,所以应当甲比乙年轻。这里似乎存在悖论。
但实际上,甲、乙之间并不是对等的,甲所在的地球可以近似看成惯性系,而乙所在的飞船要经历起飞加速、匀速飞行、减速掉头再加速、匀速飞行、最后减速降落的过程,井不是惯性系。如果忽略加速和减速的过程(假定时间较短),飞船绝大部分时间都是在匀速飞行,可以看成惯性系,那么离开地球和返回地球的旅程也必然是两个不同的惯性系。考虑到这一点,可以证明,无论是以甲为参考系还是以乙为参考系,当乙乘坐飞船完成太空旅行后回到地球,都将会比甲年轻,悖论并不存在。
对于速度 v1 = 300 km/h 的高铁、速度 v2 = 7.9 km/s 的地球同步卫星和速度 v3 = 0.999 c 的高能粒子,计算各自的时间膨胀效应有多大。由 γ 的表达式得
\[{\gamma _1} = \frac{1}{{\sqrt {1 - \frac{{v_1^2}}{{{c^2}}}} }} = \frac{1}{{\sqrt {1 - \frac{{{{\left( {300 \times \frac{{{{10}^3}}}{{3\;600}}} \right)}^2}}}{{{{299\;792\;458}^2}}}} }} \approx 1 + 3.9 \times {10^{ - 14}}\]
\[{\gamma _2} = \frac{1}{{\sqrt {1 - \frac{{v_2^2}}{{{c^2}}}} }} = \frac{1}{{\sqrt {1 - \frac{{{{(7.9 \times {{10}^3})}^2}}}{{{{299\;792\;458}^2}}}} }} \approx 1 + 3.5 \times {10^{ - 10}}\]
\[{\gamma _3} = \frac{1}{{\sqrt {1 - \frac{{v_3^2}}{{{c^2}}}} }} = \frac{1}{{\sqrt {1 - {{0.999}^2}} }} \approx 22.37\]
可见,即使是像同步卫星这样的高速运动物体,时间膨胀效应也是微乎其微的,只有接近光速的高能粒子才会有显著的时间膨胀效应。
必须指出,时间膨胀或钟慢效应并不是钟出了问题,而是由狭义相对论的时空性质导致的。一个静止的观察者会发现匀速运动参考系中所有的物理过程都变缓了,甚至生命进程也变缓了。而在这个运动参考系中的观察者却认为一切正常,并不觉得自己看到的一切在变缓。由于运动是相对的,两个互相做相对运动的参考系中的观察者会认为对方的钟都在变慢。
物体长度的测量和同时性密切相关,如果要测量一个直杆的长度,在相对直杆静止的参考系内,只需测出直杆两端的位置然后求出位置的差即可。因为直杆是静止的,所以两端位置的测量并不要求是同时的。但如果直杆是运动的,要测出直杆的长度,就必须同时测出两端的位置,否则测出的就不是直杆的长度了。既然同时性是相对的,那么长度的测量也一定是相对的。根据同时的相对性可以得出
\[L = {L_0}\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} < {L_0}\]
其中 L 为地面观察者测得的直杆长度,L0 为在相对直杆静止的坐标系内测得的长度,称为固有长度。因此,狭义相对论告诉我们,物体沿运动方向的长度会缩短,这个结果称为狭义相对论的长度收缩或尺缩效应,这就是长度的相对性。
由洛伦兹变换可得 x2′ – x1′ = \(\frac{{{x_2} - {x_1} - v({t_2} - {t_1})}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\)。测量长度要求同时测定两端坐标,即 t2 = t1,因此得到 x2 – x1 = (x2′ − x1′)\({\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }\) → L = L0 \({\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }\),即长度收缩。
相对论的长度收缩也不是因为物体内部结构发生变化造成的,同样是由相对论的时空性质导致的结果。长度收缩也是相对的,高速列车经过隧道时,列车上的观测者认为隧道缩短了,而隧道内的观测者则认为是列车缩短了。
假定高速列车和隧道的静止长度相同,当列车通过隧道时,隧道内的观测者发现当列车完全在隧道内时,隧道两端正好同时掉下两块石头,因为列车比隧道短,所以石头没有砸到列车。但是,在列车上的观测者看来,隧道比列车短,任何时刻列车都不可能完全在隧道内,似乎总有一块石头会砸到列车。仔细分析可以发现,隧道内的现测者认为同时掉下的石头,列车上的观测者看来并不是同时掉下的,而是当车头还未出隧道时出口上方先掉第一块,车尾进入隧道后入口上方再掉第二块,所以石头同样没有砸到列车(为了简化,此处不考虑石头下落速度和掉入铁轨的问题),即隧道内的观测者和列车上的观测者对于石头是否砸到列车的结论是一致的,同样不存在悖论。
可以这样考虑来测量直杆的长度。如图 8–8 所示,在直杆的一端装上激光发射器和接收器,另一端装上反射镜。当发射器发出激光被反射镜反射回接收器,记录下激光往返的时间间隔,即可得到直杆的长度。在直杆静止的参考系内,如果激光往返的时间间隔为 Δtʹ,则直杆的长度为
\[L' = {L_0} = \frac{{c\Delta t'}}{2}\]
其中 L0 为固有长度。假设直杆所在的参考系相对地面观察者以匀速 v 向右运动,如果地面观察者测得的直杆长度为 L,设激光从直杆左端发出到达反射镜的时间为 Δt1,因为在这段时间内直杆向前运动了 vΔt1 的距离,因此有
\[c\Delta {t_1} = L + v\Delta {t_1}\]
\[\Delta {t_1} = \frac{L}{{c - v}}\]
同理,设激光从反射镜返回接收器的时间间隔为 Δt2,在这段时间内直杆向前运动了 vΔt2 的距离,因此有
\[c\Delta {t_2} = L - v\Delta {t_2}\]
\[\Delta {t_2} = \frac{L}{{c + v}}\]
因此,地面观察者测得总的时间间隔为
\[\Delta t = \Delta {t_1} + \Delta {t_2} = \frac{L}{{c - v}} + \frac{L}{{c + v}} = \frac{{2L}}{{c\left( {1 - \frac{{{v^2}}}{{{c^2}}}} \right)}}\]
注意到 Δt 是地面观测者测得的激光从发出到接收的时间间隔,Δt′ 是相对直杆静止的观测者测得的相应的时间间隔。根据前面讨论的时间的相对性,两者满足关系 Δt′ = Δt \(\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} \)。
将这个关系代入上式并与固有长度的表达式比较,即可得到
\[L = \frac{c}{2}\Delta t\left( {1 - \frac{{{v^2}}}{{{c^2}}}} \right) = \frac{c}{2}\Delta t'\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} = {L_0}\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} \]
因为 \(\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} \) < 1,所以 L < L0,即运动的物体沿运动方向的长度会缩短。
应当指出,长度收缩也是相对的,一列高铁过桥时,桥上的观察者认为高铁变短了,而高铁上的观察者认为是桥变短了。另外,长度收缩只发生在平行于运动的方向上,垂直于运动方向的长度没有收缩。
需要注意,测量和看到(或照相)不是一回事,测量要求同时测定两点的坐标,而看到(或照相)是物体上不同的点在不同时刻发出的光同时到达视网膜(或相机的成像元件)上成像,而光的传播是需要时间的。如有一个球从眼前高速飞过,我们看到的还是一个球,并不会看到一个扁球。
自然界中的 μ 子来源于宇宙线,是一种不稳定的粒子,产生后很快就衰变成电子和中微子,平均寿命为 Δtʹ = 2×10−6 s,如果不考虑相对论效应,即使以光速运动,也不可能穿越厚度为 L0 = 9 500 m的大气层被地面的探测器探测到,但事实上,地面的实验室确实观察到了穿越大气层到达地面实验室的 μ 子。下面我们就来分析为何 μ 子可以到达地面。
设 μ 子的速度为 v = 0.998 c,一方面,在 μ 子看来,大气层是以速度 – v 在运动,由于长度收缩,厚度变为
\[L = {L_0}\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} = 9\;500 \times \sqrt {1 - {{0.998}^2}} \;{\rm{m}} \approx 600\;{\rm{m}}\]
而在其平均寿命内可以飞行的距离为
\[v\Delta t' = 0.998 \times 299\;792\;458 \times 2 \times {10^{ - 6}}\;{\rm{m}} \approx 600\;{\rm{m}}\]
另一方面,在地面观察者看来,由于时间膨胀,μ 子的寿命应当是
\[\Delta t = \frac{{\Delta t'}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }} = \frac{{2 \times {{10}^{ - 6}}}}{{\sqrt {1 - {{0.998}^2}} }}\;{\rm{s}} \approx 3.16 \times {10^{ - 5}}\;{\rm{s}}\]
因此,通过的距离为
\[v\Delta t = 0.998 \times 299\;792\;458 \times 3.16 \times {10^{ - 5}}\;{\rm{m}} \approx 9\;500\;{\rm{m}}\]
可见,无论从哪个角度看,μ 子都可以在衰变之前到达地面。
牛顿力学经过修改后可以改写成相对论性力学,即符合狭义相对论的形式,但质量的定义要修改为
牛顿力学是非相对论的,但经过修改后可以改写成相对论的形式,即相对论力学
\[{\bf{F}} = \frac{{d{\bf{p}}}}{{dt}}\]
其中,F 是物体受到的作用力,p 为物体的动量,定义为
\[p = \frac{{{m_0}v}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }} = mv\]
其中,v 为物体运动的速度,m = \(\frac{{{m_0}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\) 称为物体的运动质量,m0 称为静止质量,即物体在自身静止的参考系中的质量。如果将初始静止的物体由于外力对其做功获得的能量定义为该物体的动能,则可以推出(见节后资料链接)
\[{E_k} = \int_0^v {{\bf{F}} \cdot d{\bf{r}} = } \frac{{{m_0}{c^2}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }} - {m_0}{c^2} = m{c^2} - {m_0}{c^2}\]
其中,m0c2 是物体静止时具有的能量,称为静能,而 E = mc2 =Ek + m0c2 为物体具有的总能量,此即爱因斯坦质能关系或质能方程,这表示物体具有一定的质量也就具有与之相联系的一定的能量。质能关系是核能开发利用的理论基础。
由质能关系和动量定义可得
E2 = m2c4 = \(\frac{{{m_0}{c^2}}}{{1 - \frac{{{v^2}}}{{{c^2}}}}}\) = \(\frac{{{m_0}{c^2}\left( {1 - \frac{{{v^2}}}{{{c^2}}} + \frac{{{v^2}}}{{{c^2}}}} \right)}}{{1 - \frac{{{v^2}}}{{{c^2}}}}}\) = \(\frac{{{m_0}{c^2}{v^2}}}{{1 - \frac{{{v^2}}}{{{c^2}}}}}\) + m02c4 = p2c2 + m02c4
这是相对论性的能量动量关系,这与非相对论的能量动量关系 E = \(\frac{{{{\bf{p}}^2}}}{{2m}}\) 很不一样。在相对论情况下,能量守恒和动量守恒依然成立。显然,当 v ≪ c 时就回到通常的表达式。
\[m = \frac{{{m_0}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\]
m 称为物体的运动质量,而 m0 则称为物体的静止质量,即物体在自身静止的参考系中的质量。由上式可见,物体的运动速度越大,相应的运动质量也就越大,并且任何静止质量不为零的物体其运动速度都不可能等于或大于光速,否则运动质量将变成虚数或无限大,这是没有意义的。同时也可以看到,通过外力作用将物体加速到光速也是不可能实现的。
进一步可以推出狭义相对论的另一个重要结论,就是爱因斯坦质能关系
\[E = \frac{{{m_0}{c^2}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }} = m{c^2}\]
即一定质量的物质就具有与之相当的一定的能量。由于光速高达 3×108 m/s,由质能关系可知,即使是 1 g 的物质也蕴藏着巨大的能量。爱因斯坦的质能关系是核能开发利用的理论基础,人类从此就进入了核能利用的新时代。
我们在日常生活中都有这样的经验,坐电梯时如果电梯加速下降,我们会有失重的感觉,当电梯加速上升时又会有超重的感觉。可以想象一下,如果电梯是在地球的引力场中做自由落体运动,那电梯里的人会有什么感觉呢?如果电梯是在空无一物的太空做加速运动,那电梯里的人又会有什么感觉呢?
狭义相对论建立后,爱因斯坦一直在思考如何突破惯性系的限制。事实上,严格的惯性系并不存在,地球只是近似的惯性系。爱因斯坦认为,不应该有特殊的参考系,所有的参考系都应该是平权的。由此,爱因斯坦把狭义相对性原理推广为广义相对性原理:物理规律在任何参考系中都具有相同的形式。
爱因斯坦通过电梯思想实验发现,一个自由下降的密闭电梯轿厢内的观测者无法判断自己是在做匀加速运动还是静止在一个均匀引力场中,也就是说,加速运动与引力场等效。根据这一事实,爱因斯坦提出了广义相对论的另一个重要原理,即等效原理:一个均匀的引力场与一个做匀加速运动的参考系等价,或者说,无法通过在密闭箱子内的实验来判断系统是静止在引力场中还是在无引力场情况下做加速运动。
从这两条基本原理出发,爱因斯坦在 1915 年建立了一个全新的理论,即广义相对论。广义相对论是狭转相对论的推广,也是牛顿引力理论的推广,是我们理解天体物理和宇宙学的重要理论基础。
爱因斯坦在 1915 年建立广义相对论后提出了三大经典验证,即水星公转轨道的近日点进动、光在引力场中的偏折和引力红穆。这三大实验与 20 世纪 60 年代的雷达回波延迟实验、21 世纪的引力探测器 B(GP - B)和引力波的探测等实验,都在很高的精度上与广义相对论的预言一致。
爱因斯坦根据这一事实,提出了广义相对论的第一个基本原理,即等效原理:一个均匀引力场与一个做匀加速运动的参考系等价,或者说,无法通过在密闭箱子内的实验来判断系统是静止在引力场中还是在无引力场情况下做加速运动。
爱因斯坦同时认为,不应该存在特殊的参考系,所有参考系都应该是等价的。由此爱因斯坦提出了广义相对论的另一个基本原理,即广义相对性原理:物理规律在任何参考系中都具有相同的形式。
从这两条基本原理出发,爱因斯坦在 1915 年建立了一个全新的理论——广义相对论。
广义相对论是狭义相对论的推广,也是牛顿引力理论的推广,是我们理解天体物理和
宇宙学的重要理论基础。在广义相对论中,物体之间的万有引力不再是超距作用,而是时空弯曲的结果。即物质分布导致时空弯曲,物体又在弯曲的时空中运动。我们可以用弹性膜上的重球(图 8–9)来形象地理解物质与时空的关系。美国物理学家惠勒(J. A. Wheeler,1911—2008)对此曾有一个形象的说法:物质告诉时空如何弯曲,时空告诉物质如何运动。
广义相对论自从 1915 年建立以来,已经被大量的实验和观测所证实。水星公转轨道的近日点进动,光线经过太阳等大质量天体时的偏折,引力场中的谱线红移和时钟变慢以及引力波的辐射等,都以极高的精度和广义相对论的预言一致。
行星绕太阳的公转轨道是一个椭圆,但观测发现,行星公转一周后近日点较之前的位置会有个偏离,这个现象称为行星公转轨道的近日点进动(图 8–10)。水星的轨道进动值相对较大,其中大部分可以由牛顿力学给予解释,但还剩余一部分,即每世纪 43ʺ 的进动
值无法解释。而广义相对论对水星轨道的计算给出的这个进动值恰为 43.03ʺ,与观测值非常一致,成功地解释了水星近日点的进动,这个进动完全是由空间弯曲造成的。
水星近日点进动的实际观测值为每世纪 5 600.73″,考虑到地轴进动以及金星、地球和木星等行星的影响,牛顿力学给出的水星进动值为每世纪 5 557. 62″,两者相差为 43.11″。而广义相对论对水星轨道的计算给出的进动修正值恰为 43.03″,与观测非常一致,成功地解释了水星近日点的进动,这个进动的修正值完全是由空间弯曲造成的。
按照广义相对论,光在引力场中并不是沿着直线传播,而是沿着所谓测地线行进。如果附近没有大质量天体,测地线就是直线;而当光线掠过大质量天体时会发生偏折(图 8–11)。根据广义相对论的计算,光线掠道太阳时会发生 1.75ʺ 的偏折。实际上,如果把光看成光子,牛顿力学也同样可以得出光线经过太阳时会有一个偏折,但偏折的角度只有广义相对论预言的一半。1919 年,英国天文学家爱丁顿(A. S. Eddington,1882—1944)利用日全食对光线经过太阳时的偏折进行了观测,基本证实了广义相对论的预言,以后又进行了多次更高精度的测量,完全验证了广义相对论的预言。正是由于这个原因,当遥远天体发出的光经过大质量天体时,光线发生偏折。我们不仅能观察到被大质量天体遮挡的遥远天体,而且还能看到被遮挡的天体形成的多个像,甚至看到如图 8–2 所示的环状,这个环就被称为爱因斯坦环。
爱丁顿在 1919 年对星光经过太阳时发生偏折的测量精度并不高,而且光在引力场中发生偏折并不是广义相对论独有的结论,其他理论也有类似的预言。如果把光子看成有质量的微粒,牛顿力学给出光经过太阳时的偏折为 0.875″,是广义相对论预言值的一半。严格来说,1919 年的测量结果并不能完全判定观测结果与广义相对论一致。之后又进行了多次测量,精度始终不高,直到 20 世纪 90 年代,利用甚长基线干涉技术,才以万分之一的精度证实了广义相对论对光线偏折的预言,只不过当时观测的不再是光,而是无线电波。
正如运动的钟会变慢一样,根据广义相对论,引力场中的钟也会变慢,引力场越强,钟慢效应就越显著。即地面的地球钟比高空的钟要走得慢。1971 年,物理学家哈菲勒(J. C. Hafele,1933—2014)和基廷(R. E. Keating,1941—2006)将铯原子钟由民航飞机携带,在万米高空沿赤道环绕地球飞行。实验结果与广义相对论的预言符合极好。从另一方面来说,引力场发出的光被远处的观测者接收时波长会变长,也就是会发生引力红移,引力场越强,红移越大。引力红移效应最早在白矮星的观测中得到验证,之后又进行了更多的精确测量,完全证实了广义相对论的引力红移效应。
爱因斯坦在 1907 年就从等效原理推出了引力红移效应,即引力场中发出的光在远处接收时会发生红移,比如太阳发出的光到达地球会发生红移,但红移量只有 10−6,难以测量。之后对天狼 B、波江座 40B 等白矮星光谱的引力红移进行了测量,得到了较好的结果。
光子的能量可以写成 E = hν,其中 h 为普朗克常量,ν 为光子的频率。根据相对论质能关系,可以把光子看成质量为 m = \(\frac{{h\nu }}{{{c^2}}}\) 的粒子。考虑到光子在引力场中的势能 mgH,如果在地面向上发射一束频率为 ν 的光,然后在离地面高度为 H 的地方接收,由能量守恒可得
\[h\nu = h\nu ' + mgH = h\nu ' + h\nu \frac{{gH}}{{{c^2}}}\]
则光子的红移为
\[\frac{{\Delta \nu }}{\nu } = \frac{{\nu ' - \nu }}{\nu } = - \frac{{gH}}{{{c^2}}}\]
将 H = 22.6 m代入,得
\[\frac{{\Delta \nu }}{\nu } = - 2.46 \times {10^{ - 15}}\]
1960 年,哈佛大学的物理学家曾在一座 22.6 m 高的楼顶做了这个实验,结果与广义相对论的计算结果符合极好。
1960 年,哈佛大学的两位物理学家利用穆斯堡尔效应巧妙地测得一座 22.6 m 高的楼到地面的引力红移,以极高的精度证实了引力红移效应。
引力场中的时钟变慢效应也经过多次实验的验证,如 1971 年铯原子钟在飞机上的实验,1980 年引力探测器 A(GP - A)携带原子钟的实验等,中国科学家也在“天宫二号”上开展了类似的实验。
爱因斯坦在 1916 年建立广义相对论之后不久就预言了引力波的存在。根据广义相对论,质量的分布导致时空的弯曲。而质量分布尤其是大质量分布的变化将导致时空曲率的变化,这种变化即所谓时空涟漪会以波的形式以光速向外传播,这就是引力波。黑洞及中子星的碰撞合并会产生最强大的引力波,从而能被地球上的探测设备探测到。在爱因斯坦
提出引力波的预言整整 100 年之后,经过 50 多年的不懈努力,2016 年,美国的激光干涉引力波观测台(Laser Interferometer Gravitational–Wave Observatory,LIGO)宣布,探测到了来自 13 亿光年之外两个黑洞碰撞合并所发出的引力波,这是人类第一次直接探测到的引力波信号。引力波的直接探测,给广义相对论的实验验证画上了圆满的句号。
早在 1916 年,爱因斯坦就预言了引力波的存在,即质量分布的变化会导致时空曲率的变化并以波的形式以光速向外传播。中子星的碰撞合并、黑洞的碰撞合并,都会产生强大的引力波,宇宙演化早期也会产生所谓的原初引力波。如果说用望远镜观测是看天体的外表,那么引力波的探测就是去“倾听”天体的声音。根据广义相对论,引力波传播时会导致时空曲率的变化,也就会使距离和长度发生微小的变化。不过,想要测出这个变化,精度必须要达到 10−21,也就是说,1000 m 的长度变化只有质子尺度的千分之一。20 世纪 50 年代末,韦伯最早开始用共振棒探测器进行引力波的探测,但因为灵敏度太低,一直没有结果。从 70 年代开始,泰勒和赫尔斯通过一对脉冲双星的持续观测,首先间接证明了引力波的存在。差不多在同时,韦斯等人开始尝试利用激光干涉来探测引力波。直到 2015 年,在爱因斯坦提出引力波预言整整 100 年之后,激光干涉引力波天文台(LIGO)终于第一次直接探测到了引力波。这是两个黑洞碰撞合并发出的引力波,经过 13 亿光年的长途奔跑到达地球。引力波的直接探测,给广义相对论的实验验证画上了圆满的句号,也给天体物理和宇宙学的研究打开了一个新的窗口,并再次证明了广义相对论的正确。
爱因斯坦不仅是狭义相对论和广义相对论的创立者,也是量子力学的创立者之一,他还是固体量子理论、量子统计、激光理论和现代宇宙学研究的先驱,在物理学众多领域都做出了开创性的工作,极大地推动了现代物理学的发展。
为了提高定位精度,卫星定位系统的一个重要问题就是时钟的精确同步。导航卫星在地球高空做高速运动,所以必须考虑到相对论效应的修正。根据狭义相对论,卫星高速运动将造成时钟变慢,而根据广义相对论,卫星所处位置的引力场较地面为弱因而时钟变快。根据计算,广义相对论的效应是狭义相对论的 6 倍。因此,如果不考虑广义相对论的修正,定位精度将大大降低。
广义相对论的效应虽然微弱,但其实离日常生活并不远,我们平时使用的卫星定位就需要考虑广义相对论的修正。如果忽略广义相对论的效应,就会大大降低卫星定位的精度。
- 下列情况中地面上和不同车上的观察者看到的光速是多大?
(1)两辆车沿直线道路高速相向而行,其中一辆车上的人向另一辆车发出一束光;
(2)两辆车一前一后沿直线道路以不同速度高速前行,后面车上的人向前一辆车发出一束光。
- 如果在一艘平稳行驶的游轮上的密闭船舱内做物理实验,和地面实验室的结果会有什么不同?
- 一列高铁高速行驶经过车站时,列车中点经过车站信号灯的瞬间信号灯正好发出一个闪光,列车上的观察者认为闪光是同时到达车头和车尾还是先后到达的?车站上的观察者认为是同时的还是有先后的?
- 一个优秀的短跑运动员在比赛时的速度可以达到 10 m/s,如果运动员跑完全程时,静止的计时员记录的时间为 19.7 s,则运动员携带的计时器记录的时间是否同样为 19.7 s?
- 一列高铁静止长度为 201.4 m。当它以 305 km/h 的时速通过站台,站台上的观察者测到的列车长度是否同样为 201.4 m?
- 到目前为止,已经有哪些实验和观测证明了广义相对论的正确性?
问题与思考解读
1.参考解答:根据光速不变原理,不论光源和观察者如何运动,光速都是 c,始终不变。
命题意图:通过具体例子理解光速不变原理。
主要素养与水平:运动与相互作用(Ⅰ);科学推理(Ⅰ);解释(Ⅰ);科学本质(Ⅰ)。
2.参考解答:根据相对性原理,物理规律在所有惯性系中都具有相同的形式,因此在平稳行驶的游轮上的密闭船舱内做物理实验,将得到与地面实验室完全一致的结果。
命题意图:通过具体例子理解相对性原理。
主要素养与水平:科学推理(Ⅰ);解释(Ⅰ);科学本质(Ⅰ)。
3.参考解答:因为车站上和列车上的观察者看到闪光都以光速传播,所以列车上的观察者认为闪光将同时到达车头和车尾。但车站上的观察者看来,闪光传播时列车同时在向前运动,因此闪光到达车头的距离与到车尾的距离不同,所以在车站上的观察者看来,闪光不是同时到达车头和车尾。
命题意图:通过具体例子理解同时的相对性。
主要素养与水平:科学推理(Ⅰ);科学论证(Ⅰ);解释(Ⅰ)。
4.参考解答:因为运动时钟变慢,运动员的计时器记录的时间要比 19.7 s 稍短。
命题意图:通过具体例子理解狭义相对论的时钟变慢。
主要素养与水平:科学推理(Ⅰ);科学论证(Ⅰ);解释(Ⅰ)。
5.参考解答:因为运动方向长度缩短,站台上的观察者测得的列车长度略小于 201.4 m。
命题意图:通过具体例子理解狭义相对论的长度缩短。
主要素养与水平:科学推理(Ⅰ);科学论证(Ⅰ);解释(Ⅰ)。
6.参考解答:到目前为止,广义相对论的预言已经被水星近日点进动、光经过太阳时的偏折、引力场中的谱线红移、引力场中的时钟变慢和引力波等实验和观测所证实。
命题意图:对广义相对论的实验验证进行小结。
主要素养与水平:证据(Ⅰ);科学本质(Ⅰ)。
参考资料
洛伦兹变换
从狭义相对论的两条基本原理出发,可以导出两个惯性系之间的变换,即洛伦兹变换。假设惯性系 S′ 系相对另一个惯性系 S 系沿 x 轴方向以匀速勘运动,则有变换
\[\begin{array}{l}x' = \frac{{x - vt}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\\y' = y\\z' = z\\t' = \frac{{t - \frac{{vx}}{{{c^2}}}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\end{array}\]
不难导出更一般的洛伦兹变换。由于运动是相对的,在上式中令 v 变为 − v,即可得到反变换
\[\begin{array}{l}x = \frac{{x' + vt'}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\\y = y'\\z = z'\\t = \frac{{t' + \frac{{vx'}}{{{c^2}}}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\end{array}\]
从洛伦兹变换可以很容易得出同时的相对性、时间膨胀及长度缩短的结论。显然,当 v ≪ c 时就回到伽利略变换。
如果只考虑沿 x 方向的运动,则物体在 S′ 系中的速度为 u′ = \(\frac{{{ \rm{d}}x'}}{{{\rm{d}}t'}}\),在 S 系中的速度为 u = \(\frac{{{\rm{d}}x}}{{{\rm{d}}t}}\),由洛伦兹变换可得狭义相对论的速度合成公式
\[u = \frac{{u' + v}}{{1 + \frac{{u'v}}{{{c^2 }}}}}\]
由上式可见,通过速度合成不可能得到大于光速的速度,并且当 u′ = c 或 v = c 时,立刻就得到 u = c。
质能方程
如果将初始静止的物体由于外力对其做功获得的能量定义为该物体的动能,则可以推出
\[\begin{array}{l}{E_k} = \int_0^v {{\bf{F}} \cdot {\rm{d}}{\bf{r}} = } \int_0^v {\frac{{{\rm{d}}{\bf{p}}}}{{dt}} \cdot {\rm{d}}{\bf{r}} = } \int_0^v {{\bf{v}} \cdot {\rm{d}}(mv) = } \int_0^v {m{\bf{v}} \cdot {\rm{d}}{\bf{v}} + {\bf{v}} \cdot {\bf{v}}{\rm{d}}m = } \\ = \frac{1}{2}\int_0^v {\left[ {\frac{{{m_0}{\rm{d}}{v^2}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }} + \frac{{{v^2}}}{{{c^2}}} \cdot \frac{{{m_0}{\rm{d}}{v^2}}}{{{{\left( {1 - \frac{{{v^2}}}{{{c^2}}}} \right)}^{3/2}}}}} \right] = } \int_0^v {{m_0}{c^2}{\rm{d}}\left( {\frac{1}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}} \right)} \\ = \frac{{{m_0}{c^2}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }} - {m_0}{c^2} = m{c^2} - {m_0}{c^2}\end{array}\]
其中,m0c2 是物体静止时具有的能量,称为静能,而
E = mc2 = Ek + m0c2
为物体具有的总能量,此即爱因斯坦质能关系或质能方程。
爱因斯坦场方程
广义相对论中最重要的方程是爱因斯坦场方程
\[{R_{\mu \nu }} - \frac{1}{2}R{g_{\mu \nu }} = \frac{{8\pi G}}{{{c^4}}}{T_{\mu \nu }}\]
这一方程描述了时空性质与物质分布之间的关系。其中,gμν 为描述时空性质的度规张量;Rμν 为里奇张量,R 为曲率标量,两者都是由度规张量及其导数构成的量,反映了时空的几何性质;Tμν 为物质分布的能量动量张量,反映了物质在空间的分布。这是一个很复杂的微分方程,广义相对论的所有结果都是从这个方程来的。在弱场近似下爱因斯坦方程就回到牛顿的引力方程。
广义相对论和牛顿引力理论在描述引力相互作用的方式上是不同的,按照牛顿理论,任何两个质量不为零的物体之间存在万有引力而互相吸引。而按照广义相对论,质量分布造成空间的弯曲,物体则是在弯曲空间中运动。如果用弹性膜来比喻时空,设弹性膜上有黑、白两个光滑的球,黑球质量较大,白球质量较小,如图 1 所示。黑球因质量较大使得弹性膜变形弯曲,白球由于质量较小,放在弹性膜上几乎不改变膜的性质。显然,如果白球初始静止,将很快滑向黑球。按照牛顿理论,这是因为两个球之间存在万有引力。而按照广义相对论,则是因为空间(弹性膜)的弯曲。也就是说,广义相对论中并不存在引力,有的只是时空的弯曲,引力相互作用被几何化了。
发布时间:2022/2/12 下午6:43:55 阅读次数:6253