19世纪初期,随着牛顿力学的逐步完善,物理学家的研究逐步从力学转移到了电磁学、光学、热学等领域。观察现象,模拟实验,分析原因,总结规律,是物理学家进行科学研究的普遍做法,在这个过程中,出现了一些使物理学家感到困惑的实验现象,这些现象都无法用已有的理论去给出合理的解释,比如: 1、安培力是哪来的? 两排平行排列的同号电荷,对于与电荷相对静止的观察者A看来,电荷是静止的,两排电荷之间的是库仑力斥力,而对于相对电荷做匀速运动的观察者B看来,电荷是运动的,所以两排电荷形成的是两股电流,而同向电流之间是相互吸引的,这个吸引力就是安培力。可见,这里力出现了相对性,即对不同的观察者,力不是绝对不变的。 经典物理学告诉我们,所有的惯性参考系是平权的,匀速直线运动和相对静止没法通过实验区分,可安培力却告诉我们,选择不同的参考系,观察到的物理现象却是不同的,该如何解释呢? 2、电磁波的速度是相对什么的速度? 英国物理学家麦克斯韦通过严密的数学推理预言了电磁波的存在,并推导出了电磁波的速度,但令人疑惑的是,这个速度是相对什么参照物的速度,在推导过程中却没有体现,即以任何物体为参照物都可以得出这个速度。这又是与经典物理学矛盾的,因为经典物理学告诉我们,速度都是相对的,没有参照物,就无所谓速度。 3、光速为什么不变? 19世界末20世纪初,物理学家设计了各种巧妙的实验去测量光速,却发现光速与参考系无关,即不管观察者以什么速度运动,测量出的光速都可认为是一个恒定值。 如果火车相对地面的速度是,人相对火车的速度是,则人相对地面的速度,这在经典物理中是很显然的事情,但是在测量光速的时候这个速度叠加定律却失效了,事实证明光相对火车和相对地面的速度是一样的,一点差别都没有。 类似的现象还有很多,这些现象都无法用已有的理论去解释。这只能说明一件事:现有的理论是错误的,或者说是不完善的。物理学家需要一套新的理论来解释这些现象,这就是相对论产生的历史背景。 实际上,在建立新理论的过程中,很多物理学家都做出了重要贡献,只是这些成果都是零散的、孤立的,并没有形成体系,直到爱因斯坦的出现,他在总结前人成果的基础上建立了一套全新的理论,以取代之前的经典物理理论,这就是狭义相对论。 很多科普读物在介绍狭义相对论时喜欢从一些反直觉的结论入手,这样虽然容易吸引读者的眼球,但往往会增加理解的难度。本文尽量按照物理学的一般发展规律来展开,首先由特殊到一般,通过个别现象去总结归纳其中的规律,再由一般到特殊,通过规律去导出其它各种必然的推论,希望最后再去研究这些反直觉的现象时,让大家觉得好像也并没有什么神奇之处,本来应该就是这样的。 狭义相对论的两个基本公设 狭义相对性原理:在不同的惯性参考系中,一切物理规律都是相同的; 这是一个必须的假设,物理学家的目的就是为了找出自然运行的规律,如果连规律都没有普适性,也就不能称为规律了,物理学家的所有工作都将变得毫无意义。 光速不变原理:真空中的光速在不同的惯性参考系中都相同; 这个公设来自于客观事实,因为已有的实验现象都证明了这一点,那就把它作为新的物理理论的一个基本公设,就像数学中的公理,是最基础的设定,不需要证明,也不需要问为什么。 洛伦兹变换 首先,我们把光速不变这个现象用数学语言描述一下: 假设有两个参考系S(Oxyz)和S’(O’x’y’z’),坐标轴相互平行且轴x与轴x’重合,S’相对S沿x轴以速度做匀速直线运动,以两坐标原点O和O’重合的时刻为计时起点。 在参考系S中,当t0时,光从原点O向四周发出,以球面波的形式向外延伸,如图所示 在时刻t时,球面的半径Rct(c代表光速),球面上任意一点的坐标都满足方程 移项,得 同理,在参考系S’中,看同样这个发光事件,起始时刻t’0,光从原点O’向四周发出(此时O与O’重合),在时刻t’时,球面的半径R’ct’,球面上任意一点的坐标满足方程 移项,得 这就是光速在不同参考系中恒定的数学表达方式之一。 由于假设两个参考系的相对速度仅沿x轴方向,所以、,显然,否则,两个参考系就重合了。这里我们得到了一个反直觉的结论:只要两个坐标系存在相对速度,它们的时间就是不同的。 这是由光速不变推出来的,认可了光速不变,就必须接受这个反直觉的结论。 下面我们继续推导两个坐标系之间的坐标及时间的变换关系。由两个坐标系中球面的表达式,可知x和t必定是x、t的线性函数,不妨设 , 然后尝试用特殊值来求出参数A、B、C、D,从而得到坐标系间的变换规律: 考察O’点,在S坐标系中O’点以v做匀速运动,它在S坐标系中t时刻的坐标为xvt,而它在S’坐标系中的坐标x’0,代入参数方程,有 0; 考察O点,在S’坐标系中O点以v做匀速运动,它在S’坐标系中t’时刻的坐标为x’vt’,而它在S坐标系中的坐标x0,代入参数方程,有 ,,得; 从O发出的光,t时刻的坐标值在S中为xct,t’时刻的坐标值在S’中为x’ct’,由于光速在两个坐标系中不变,有 , 化简得; 至此,坐标变换式可写成 由上式的逆变换可求得x、t用x、t表示的表达式 当S’坐标系以v运动时,由中所推结论,应有 注意,此时的表达式应该与中的逆变换等价,因为它们表示的是同样的物理过程,所以有 ,化简后,得 ,记作,称为相对论因子; 所以最终的变换式为 这个变换式就是大名鼎鼎的洛伦兹变换式,它是相对论中最重要的变换式,也是最基础的变换式。 如何理解这两个变换式呢?如图,两个坐标系S和S’相对运动的速度为v 在S中的t0时刻,观察S’的原点O’的坐标为(0,0),观察点A的坐标为(X,0); 在S中,由洛伦兹坐标变换,O的坐标为(0,0),点A的坐标为(X,0);(说明不同位置在不同参考系中的坐标是不同的,好像是句废话,但背后的含义可以仔细体会一下) 在S中,由洛伦兹时间变换,O的时刻为t0,点A的时刻为X;(说明同时的相对性,在S中原点O’与点A的时刻是相同的,在S中这两个位置的时刻就不一样了) 在S中的tt时刻,观察S’的原点O’的坐标为(vt,0),空间中点A的坐标为(X,0), 在S中,由洛伦兹坐标变换,O的坐标为(0,0),点A的坐标为(X,0),X(Xvt); 在S中,由洛伦兹时间变换,O的时间为t,点A的时间为 注意,洛伦兹变换的是不同参考系下的坐标和时刻,是学习和理解狭义相对论的基础,下一节我们将介绍由洛伦兹变换导出的一系列推论。