6.3 狭义相对论理论体系的建立
从上述论文、信件、演讲和回忆录可看出爱因斯坦创建狭义相对论的曲折历程。
爱因斯坦和洛伦兹不同,他不是人为地拼凑出种种特设,企图解释地球相对于光以太运动的实验的零结果,而是把它看做自然界普遍规律的表现,从中领悟到这正是相对性原 理在力学领域和电磁学领域普遍成立的证明;并且因此概括出了光速不变原理。1922 年爱因斯坦在日本京都大学的演讲中回忆道:“我有幸读到 1895 年洛伦兹的专著。在其中他讨论并在一级近似的范围内解决了电动力学的问题,这时他忽略了 v/c 的高次项,其中 v 是物体的运动速度,c 为光速。然后我假定,关于电子的洛伦兹方程不仅在洛伦兹原先讨论的真空参照系中成立,而且也应该在运动物体的参照系中成立。我试着用这一假定去讨论斐索实验。在那时,我坚信麦克斯韦和洛伦兹的电动力学方程都是正确的。此外,如果假定这些方程对运动物体参照系也成立,就会得出光速不变性的概念。不过,这一概念同力学中的速度相加法则相矛盾。”[1]
在《论动体的电动力学》中的运动学部分,爱因斯坦首先讨论了“同时性”的定义。他说:“凡是时间在里面起作用的我们的一切判断,总是关于同时的事件的判断。比如我说‘那列火车 7 点钟到达这里’,这大概是说:‘我的钟的短针指到 7 同火车的到达是同时的事件’”。[2]
爱因斯坦指出,这种用静止在静止坐标系中的钟来定义的时间只是“静系时间”。
然后,爱因斯坦以两个公设为依据来考察长度和时间的相对性。
他开宗明义对这两个公设下了定义:
“1.物理体系的状态据以变化的定律,同描述这些状态变化时所参照的坐标系究竟是用两个在互相匀速移动着的坐标系中的哪一个并无关系。”(相对性原理)
“2.任何光线在‘静止的’坐标系中都是以确定的速度 V 运动着,不管这道光线是由静止的还是运动的物体发射出来的。”[3](光速不变原理)
接着,爱因斯坦设想在空间有 A,B 两点,一个刚性杆从 A 至 B 沿 AB 方向作匀速平移运动,同动杆一起运动的观察者采用光信号来核对原先静止于 A,B 的两只钟是否同步。由于光速不变原理在动杆坐标系里同样成立,“因此,同动杆一起运动着的观察者会发现这两只钟不是同步运行的,可是处在静系中的观察者却会宣称这两只钟是同步的。”[4]
爱因斯坦由此得出了同时性或时间的相对性的概念。他写道:“由此可见,我们不能给予同时性这概念以任何绝对的意义;两个事件,从一个坐标系看来是同时的,而从另一个相对于这个坐标系运动着的坐标系看来,它们就不再被认为是同时的事件了。”[5]
在《论动体的电动力学》的第三节(从静系到另一个相对于它做匀速移动的坐标系的坐标和时间的变换理论)中,爱因斯坦以两个公设为基础得到了不同惯性系的各个时空坐标之间确定的数学关系,即洛伦兹变换(公式(6 – 1)和公式(6 – 2))。
在《论动体的电动力学》的第四节“关于运动刚体和运动时钟所得方程的物理意义”中,爱因斯坦首先论述了长度收缩效应,他写道:
“我们观察一个半径为 R 的刚性球(即在静止时看来是球形的物体),它相对于动系 k 是静止的,它的中心在 k 的坐标原点上。这个球以速度相对于 K 系[6]运动着,它的球面方程是
\[{\xi ^2} + {\eta ^2} + {\zeta ^2} = {R^2}\]
用 x,y,z 来表示,在 t = 0 时,这个球面的方程是
\[\frac{{{x^2}}}{{{{\left[ {\sqrt {1 - {{\left[ {\frac{v}{V}} \right]}^2}} } \right]}^2}}} + {y^2} + {z^2} = {R^2}\]
一个在静止状态看起来是球形的刚体,在运动状态——从静系看来——则具有旋转椭球的形状了,这椭球的轴是
\[R\sqrt {1 - {{\left[ {\frac{v}{V}} \right]}^2}} ,R,R\]
“这样看来,球(因而也可以是无论什么形状的刚体)的 Y 方向和 Z 方向的长度不因运动而改变,而 X 方向的长度则好像以 1∶的比率缩短了。v 愈大,缩短得就愈厉害。对于 v = V,一切运动着的物体——从静系看来都缩成扁平的了。对于大于光速的速度,我们的讨论就变得毫无意义了;此外,在以后的讨论中,我们会发现,光速在我们的物理理论中扮演着无限大速度的角色。”[7]
“长度收缩”效应说明空间两点之间的距离不是绝对的,而是相对的,它随运动状态的改变(即随参照系的选择)而不同。
接着,爱因斯坦论证了“时间延缓”效应,他写道:
“进一步,我们设想有若干只钟,当它们同静系相对静止时,它们能够指示时间 t;而当它们同动系相对静止时,就能够指示时间 τ,现在我们把其中一只钟放到 k 的坐标原点上,并且校准它,使它指示时间 τ。从静系看来,这只钟走得快慢怎样呢?
“在同这只钟的位置有关的量 x,t 和 τ 之间,显然下列方程成立
\[\tau = t\frac{1}{{\sqrt {1 - {{\left( {\frac{v}{V}} \right)}^2}} }}\left( {t - \frac{v}{{{V^2}}}} \right)x\;和\;x = vt\]
因此
\[\tau = \frac{1}{{\sqrt {1 - {{\left( {\frac{v}{V}} \right)}^2}} }} = t - \left( {1 - \sqrt {1 - {{\left( {\frac{v}{V}} \right)}^2}} } \right)t\]
由此得知,这只钟所指示的时间(在静系中看来)每秒钟要慢 1 − \({\sqrt {1 - {{\left( {\frac{v}{V}} \right)}^2}} }\) 秒,或者——略去第四级和更高级的(小)量——要慢 \(\frac{1}{2}{\left( {\frac{v}{V}} \right)^2}\) 秒。
“从这里产生了如下的奇特后果。如果在 K 的 A 点和 B 点上各有一只在静系看来是同步运行的静止的钟,并且使 A 处的钟以速度 v 沿着 AB 联线向 B 运动,那么当它到达 B 时,这两只钟不再是同步的了,从 A 向 B 运动的钟要比另一只留在 B 处的钟落后(不计第四级和更高级的(小)量)\(\frac{1}{2}t{\left( {\frac{v}{V}} \right)^2}\),t 是这只钟从 A 到 B 所费的时间。”[8]
这就是所谓的“时间延缓”效应。
在《论动体的电动力学》的第五节:“速度的加法定理”及 1907 年发表的《关于相对论原理和由此得出的结论》中,爱因斯坦推导出了相对论的速度加法定理。
设一个相对于参照系 S′ 的质点按照下列方程
\[x' = {{u'}_x}t',yx = {{u'}_y}t',z = {{u'}_z}t'\]
而匀速运动着。利用变换方程(6 – 1)和方程(6 – 2),把 x′,y′,z′,t′ 用它们的 x,y,z,t 的表示式来代替,即可得到质点参照于 S 的速度分量 ux,uy,uz。我们设
\[{u^2} = u_x^2 + u_y^2 + u_z^2,{{u'}^2} = {u'}_x^2 + {u'}_y^2 + {u'}_z^2\]
如果两个速度(v 和 u′)是同一方向,就可得到
\[u = \frac{{v + u'}}{{1 + \frac{{vu'}}{{{c^2}}}}}\]
爱因斯坦写道:“从这个方程得出;两个小于 c 的速度相加,合成的速度总是小于 c”;“光速 c 同一个小于光速的速度相加,得到的结果仍等于光速 c”;“从速度加法定理还可以进一步得出一个有意思的结论,即不可能有这样的作用,它可用来作任意的信号传递,而其传递速度大于真空中的光速。”[9]
这样,爱因斯坦就修正了经典的速度合成法则,论证了光在真空中的传播速度 c 是一切物体运动的极限速度,而无限大速度的瞬时信号是不存在的。他不需要任何附加假定,只要依据相对论性速度相加定理,就能导出菲涅耳“曳引系数”。这与洛伦兹理论截然不同,洛伦兹必须借助于光受到介质拖曳的假定才能作出解释,而爱因斯坦仅仅作为运动学的简单推论,就得到了正确的结果。
根据相对论性速度相加原理,爱因斯坦还直接推导了光行差和多普勒效应的精确解;而洛伦兹理论却只能给出精确到 v/c 的一阶的近似公式。特别要指出的是,这些效应在相对论看来纯粹是运动学问题,不像洛伦兹理论那样,需要对以太的行为作出虚拟的特设。(在 1905 年第一篇论文中,爱因斯坦还把光行差和多普勒效应的理论列入电动力学部分,到 1907 年再一次讨论相对论时,他把这类问题改放在运动学部分之中。)
接着,爱因斯坦讨论了洛伦兹变换对各种电动力学现象的应用。他证明了无源和有源的麦克斯韦电磁场方程组在洛伦兹变换下保持形式不变。这就表明本来仅仅适用于静止坐标系的麦克斯韦方程组,在经过空间、时间坐标变换后,对任何运动的惯性系也是适用的。他写道:“麦克斯韦-洛伦兹理论的电动力学基础符合于相对性原理。”[10]也就是说,麦克斯韦-洛伦兹方程对于洛伦兹变换是协变的。
爱因斯坦进一步把洛伦兹变换施加于电场、磁场、电荷密度和电流密度,经过简单计算,得出结论说:“电场强度或磁场强度本身并不存在,因为在一个地点(更准确地说,在一个点事件的空间-时间附近)是否有电场强度或磁场强度存在,可以取决于坐标系的选择。”[11]
这样一来,前面提出的考查由磁体同导体的相对运动而产生电流时所出现的不对称性就迎刃而解了。“电力和磁力都不是独立于坐标系的运动状态而存在的”,也就是说在相对论看来,电场和磁场都是相对量,与坐标系的选择有关。如果在一个参照系内只有电场或只有磁场,则在另一个相对于它做匀速运动的参照系内,则既有磁场也有电场。
爱因斯坦还证明了电荷的守恒性,他写道:“电荷是一个同参照系的运动状态无关的量。因此,如果一个任意运动的物体的点电荷从随之运动的参照系看来是守恒的,那么,它对任何其他参照系也是守恒的”。[12]
质量的相对论性效应也是爱因斯坦的一个重要发现。这一效应及时得到了实验家的验证,成了相对论的重要实验证据之一(参看 5.2.7 节(“电磁质量”的发现)和 6.4 节)。
在《论动体的电动力学》的最后一节,爱因斯坦导出了电子动能公式
\[W = \mu {V^2}\left[ {\frac{1}{{\sqrt {1 - {{\left( {\frac{v}{V}} \right)}^2}} }} - 1} \right]\]
其中 μ 为电子的质量,V 为真空中的光速。爱因斯坦解释说:“当 v = V,W 就变成无限大。超光速的速度像我们以前的结果一样——没有存在的可能。”[13]
爱因斯坦在这里又一次论证了超光速不可能。1907 年,他在《论相对性原理所要求的能量的惯性》一文中,再次讨论到这个问题。
第一次发表相对论以后几个月,爱因斯坦发现了一个特别引起他兴趣的关系,即惯性质量和能量的关系。他写信给好友哈比希特(Conrad Habicht)说道:
“我又发现电动力学论文的一个推论。相对性原理同麦克斯韦方程一道,要求质量成为一个物体中包含的能量的一种直接量度;要求光传递物质。在镭这个例子中应当出现质量的明显减少。论据是有趣和吸引人的;但我不能说上帝是否正在嘲笑它并在和我变把戏。”[14]
爱因斯坦第二篇有关狭义相对论的论文,题为:《物体的惯性同它所含的能量有关吗》(1905 年 9 月发表),专门讨论了惯性和能量的关系。他利用洛伦兹变换和相对性原理发现:
“如果有一物体以辐射形式放出能量 L,那么它的质量就要减少 L/V2……
“物体的质量是它所含能量的量度;如果能量改变了 L,那么质量也就相应地改变 L/9×1020,此处能量是用尔格来计量,质量是用克来计量的。
“用那些所含能量是高度可变的物体(比如用镭盐)来验证这个理论,不是不可能成功的。
“如果这一理论同事实符合,那么在发射体和吸收体之间,辐射在传递着惯性。”[15]
不过,在这篇论文中,爱因斯坦的论述仅仅涉及到一个过程的初末态能量的差值与质量变化的关系。
在 1907 年《关于相对论原理和由此得出的结论》的第十一节“关于质量对能量的相依关系”中,爱因斯坦对上述关系作了推广。他证明了一个处在外部电磁场中的物理系统,在一个以速度 v 相对于它运动的参照系里,其能量
\[E = \left( {\mu + \frac{{{E_0}}}{{{c^2}}}} \right)\frac{{{c^2}}}{{\sqrt {1 - \frac{{{v^2}}}{{{c^2}}}} }}\]
其中 μ 为系统原来的惯性质量,E0 是系统在静止系中的能量(也即内能)。这样一来,所考察的物理系统的情况就像是一个质量为 M 的质点,其中 M 按照下列公式同系统的内能 E0 建立了如下关系
\[M = \mu + \frac{{{E_0}}}{{{c^2}}}\]
爱因斯坦写道:“这个结果具有特殊的理论重要性,因为在这个结果中,物理体系的惯性质量和能量以同一种东西的姿态出现。同惯性有关的质量 μ 相当于其量为 μc2 的内能。既然我们可以任意规定 E0 的零点,所以我们无论如何也不可能明确地区分体系的‘真实’质量和‘表观’质量。把任何惯性质量理解为能量的一种储藏,看来要自然得多。
“按照我们的结果来看,对于孤立的物理体系,质量守恒定律只有在其能量保持不变的情况下才是正确的,这时这个质量守恒定律同能量原理具有同样的意义。”[16]
这样一来,爱因斯坦就大大地扩充了质量的内涵,质量成了能量的一种量度。由于质量和能量之间的密切联系,封闭系统中,既然质量守恒,必有能量守恒,可以统一为“能量-质量守恒定律。”经典物理学中彼此独立的两个基本定律,原来是同一个自然规律的不同侧面。
关于质能关系的实验验证,由于条件的限制,直到 20 世纪 30 年代才在伽莫夫(G.Gamov)的隧穿理论指导下,由英国剑桥大学的两位物理学家考克饶夫(J.D.Cockcroft)和瓦尔顿(E.T.S.Walton)利用高压倍加器得到了严格的检验。(参看 9.11 节)
时空的四维描述是相对论理论框架中的又一发展。这是首先由爱因斯坦的老师闵科夫斯基(H.Minkowski,1864—1909)提出的方法。闵科夫斯基是德国数学家和物理学家,1896—1902 年任苏黎世联邦工业大学教授,爱因斯坦听过他的《分析力学应用》数学课。1908 年,闵科夫斯基提出把三维空间和时间结合成一个四维空间的思想。实际上,彭加勒也提出过类似的方案。这样的四维空间也叫闵科夫斯基空间(闵科夫斯基称之为“四维世界"),在这空间里的元素,就是在空间某一点和某一时刻发生的事件。这样一来,闵科夫斯基的四维世界里的元素(即事件)就具有物理的实在性,而不依赖于参考系。此外,他还假定,一切物理定律相对于一组洛伦兹变换具有不变性。他在其著作《动体中电磁过程的基本理论》(1908 年)中,推导了任意物质中的电磁场方程,并且发展了相对论物理学的全部概念。
爱因斯坦开始并不赞赏闵科夫斯基的工作,他认为过分细致的数学形式会掩盖物理内容。但他很快认识到运用几何方法,是进一步发展相对论理论的重要方向。正是他的老师闵科夫斯基教授,清楚地揭示出了他的新理论所含的普遍意义。
对于闵科夫斯基的贡献,几十年后,爱因斯坦是这样评论的:
“在闵科夫斯基之前,为了检验一条定律在洛伦兹变换下的不变性,人们就必须对它实行一次这样的变换;可是闵科夫斯基却成功地引进了这样一种形式体系,使定律的数学形式本身就保证了它在洛伦兹变换下的不变性。”[17]
1948 年,爱因斯坦在为《美国人民百科全书》撰写条目《相对性:相对论的本质》时总结性地写道:“狭义相对论导致了对空间和时间的物理概念的清楚理解,并且由此认识到运动着的量杆和时钟的行为。它在原则上取消了绝对同时性概念,从而也取消了牛顿所理解的那个即时超距概念。它指出,在处理同光速相比不是小到可忽略的运动时,运动定律必须加以怎样的修改。它导致了麦克斯韦电磁场方程的形式上的澄清;特别是导致了对电场和磁场本质上的同一性的理解。它把动量守恒和能量守恒这两条定律统一成一条定律,并且指出了质量同能量的等效性。从形式的观点来看,狭义相对论的成就可以表征如下:它一般地指出了普适常数 c(光速)在自然规律中所起的作用,并且表明以时间作为一方,空间坐标作为另一方,两者进入自然规律的形式之间存在着密切的联系。”[18]
[1] Einstein A.How I Created the Theory of Relativity.Phys.Today,1982,Aug:45
[2] 爱因斯坦全集,第二卷.湖南科技出版社,2002.245
[3] 同上注,第247页。
[4] 同上注,第248页。
[5] 同上注。
[6] K 系指的是另一个静止的坐标系。
[7] 爱因斯坦全集,第二卷,湖南科技出版社,2002.252
[8] 同上注,第 253 页。
[9] 爱因斯坦全集,第二卷.湖南科技出版社,2002.379。
[10] 同上注,第 385 页。
[11] 同上注,第 385 页。
[12] 爱因斯坦全集,第二卷.湖南科技出版社,2002.386。
[13] 同上注,第 266 页。
[14] 同上注,第 236 页。
[15] 爱因斯坦全集,第二卷.湖南科技出版社,2002.275。
[16] 爱因斯坦全集,第二卷.湖南科技出版社,2002.396
[17] 爱因斯坦文集,第一卷.商务印书馆,1976.26
[18] 同上注,第 458 页。
文件下载(已下载 22 次)发布时间:2024/2/29 下午7:16:08 阅读次数:2506