当前位置:首页 >> 公务员考试 >>

100个著名初等数学问题


100 个著名初等数学问题
——历史和解
100 Great Problems of Elementary Mathematics:
Their History and Solution
[德]H·德里 Heinrich D?rrie

目录

目录
算术题 ..............................................................................................................................................1 第 1 题 阿基米德分牛问题.....................................................................................................1 第 2 题 德·梅齐里亚克的砝码问题.....................................................................................3 第 3 题 牛顿的草地与母牛问题.............................................................................................4 第 4 题 贝韦克的七个 7 的问题.............................................................................................5 第 5 题 柯克曼的女学生问题.................................................................................................8 第 6 题 柏努利—欧拉关于装错信封的问题 .......................................................................10 第 7 题 欧拉关于多边形剖分问题.......................................................................................12 第 8 题 鲁卡斯的配偶夫妇问题...........................................................................................15 第 9 题 卡亚姆的二项展开式...............................................................................................19 第 10 题 柯西的平均值定理.................................................................................................21 第 11 题 柏努利幂之和的问题.............................................................................................23 第 12 题 欧拉数.....................................................................................................................26 第 13 题 牛顿指数级数.........................................................................................................29 第 14 题 麦凯特尔对数级数.................................................................................................34 第 15 题 牛顿正弦及余弦级数.............................................................................................37 第 16 题 正割与正切级数的安德烈推导法.........................................................................41 第 17 题 格雷戈里的反正切级数.........................................................................................44 第 18 题 德布封的针问题.....................................................................................................47 第 19 题 费马—欧拉素数定理.............................................................................................50 第 20 题 费马方程.................................................................................................................55 第 21 题 费马—高斯不可能性定理.....................................................................................62 第 22 题 二次互反率.............................................................................................................68 第 23 题 高斯的代数基本定理.............................................................................................72 第 24 题 斯图谟的根的个数问题.........................................................................................74 第 25 题 阿贝尔不可能性定理.............................................................................................76 第 26 题 赫米特—林德曼超越性定理.................................................................................83 平面几何题 ....................................................................................................................................90 第 27 题 欧拉直线.................................................................................................................90 第 28 题 费尔巴哈圆.............................................................................................................91 第 29 题 卡斯蒂朗问题.........................................................................................................92 第 30 题 马尔法蒂问题.........................................................................................................93 第 31 题 蒙日问题.................................................................................................................96 第 32 题 阿波洛尼斯相切问题.............................................................................................97 第 33 题 马索若尼圆规问题...............................................................................................100 第 34 题 斯坦纳直尺问题...................................................................................................102 第 35 题 德里安倍立方问题...............................................................................................105 第 36 题 三等分一个角.......................................................................................................106 第 37 题 正十七边形...........................................................................................................109 第 38 题 阿基米德π值确定法............................................................................................. 114 第 39 题 富斯弦切四边形问题........................................................................................... 116 第 40 题 测量附题............................................................................................................... 118
i

目录

第 41 题 阿尔哈森弹子问题...............................................................................................121 圆锥曲线和摆线题.......................................................................................................................124 第 42 题 由共轭半径作椭圆...............................................................................................124 第 43 题 在平行四边形内作椭圆.......................................................................................125 第 44 题 由四条切线作抛物线...........................................................................................126 第 45 题 由四点作抛物线...................................................................................................127 第 46 题 由四点作双曲线...................................................................................................130 第 47 题 范·施古登轨迹题...............................................................................................130 第 48 题 卡丹旋轮问题.......................................................................................................132 第 49 题 牛顿椭圆问题.......................................................................................................132 第 50 题 彭赛列—布里昂匈双曲线问题...........................................................................133 第 51 题 作为包络的抛物线...............................................................................................134 第 52 题 星形线...................................................................................................................135 第 53 题 斯坦纳的三点内摆线...........................................................................................138 第 54 题 一个四边形的最接近圆的外接椭圆 ...................................................................140 第 55 题 圆锥曲线的曲率...................................................................................................143 第 56 题 阿基米德对抛物线面积的推算...........................................................................145 第 57 题 推算双曲线的面积...............................................................................................147 第 58 题 求抛物线的长.......................................................................................................149 第 59 题 笛沙格同调定理(同调三角形定理) ...............................................................151 第 60 题 斯坦纳的二重元素作图法...................................................................................154 第 61 题 帕斯卡六边形定理...............................................................................................155 第 62 题 布里昂匈六线形定理...........................................................................................157 第 63 题 笛沙格对合定理...................................................................................................159 第 64 题 由五个元素得到圆锥曲线...................................................................................163 第 65 题 一条圆锥曲线和一条直线...................................................................................165 第 66 题 一条圆锥曲线和一定点.......................................................................................165 立体几何题 ..................................................................................................................................167 第 67 题 斯坦纳的用平面分割空间...................................................................................167 第 68 题 欧拉四面体问题...................................................................................................168 第 69 题 偏斜线之间的最短距离.......................................................................................171 第 70 题 四面体的外接球...................................................................................................173 第 71 题 五种正则体...........................................................................................................175 第 72 题 正方形作为四边形的一个映像...........................................................................178 第 73 题 波尔凯—许瓦尔兹定理.......................................................................................179 第 74 题 高斯轴测法基本定理...........................................................................................182 第 75 题 希帕查斯球极平面投影.......................................................................................183 第 76 题 麦卡托投影...........................................................................................................185 航海与天文学题...........................................................................................................................187 第 77 题 航海斜驶线问题...................................................................................................187 第 78 题 海上船位置的确定...............................................................................................188 第 79 题 高斯双高度问题...................................................................................................189 第 80 题 高斯三高度问题...................................................................................................191 第 81 题 刻卜勒方程...........................................................................................................192

ii

目录

第 82 题 星落.......................................................................................................................195 第 83 题 日晷问题...............................................................................................................196 第 84 题 日影曲线...............................................................................................................197 第 85 题 日食和月食...........................................................................................................199 第 86 题 恒星及会合运转周期...........................................................................................202 第 87 题 行星的顺向和逆向运动.......................................................................................203 第 88 题 兰伯特彗星问题...................................................................................................205 极值 ..............................................................................................................................................208 第 89 题 与欧拉数有关的斯坦纳问题...............................................................................208 第 90 题 法格乃诺关于高的基点问题...............................................................................208 第 91 题 费马对托里拆利提出的问题...............................................................................209 第 92 题 逆风变换航向.......................................................................................................210 第 93 题 蜂巢(雷阿乌姆尔问题)...................................................................................212 第 94 题 雷奇奥莫塔努斯的极大值问题...........................................................................213 第 95 题 金星的最大亮度...................................................................................................215 第 96 题 地球轨道内的彗星...............................................................................................216 第 97 题 最短晨昏蒙影问题...............................................................................................217 第 98 题 斯坦纳椭圆问题...................................................................................................219 第 99 题 斯坦纳的圆问题...................................................................................................221 第 100 题 斯坦纳的球问题.................................................................................................223

iii

算术题

算术题
第1题 阿基米德分牛问题
太阳神有一牛群,由白、黑、花、棕四种颜色的公、母牛组成。 在公牛中,白牛数多于棕牛数,多出之数相当于黑牛数的 多出之数相当于花牛数的
1 1 + ;黑牛数多于棕牛数, 2 3

1 1 1 1 + ;花牛数多于棕牛数,多出之数相当于白牛数的 + 。 4 5 6 7 1 1 1 1 + ;黑牛数是全体花牛数的 + ;花牛数是全 4 5 3 4

在母牛中,白牛数是全体黑牛数的 体棕牛数的

1 1 1 1 + ;棕牛数是全体白牛数的 + 。 5 6 6 7

问这牛群是怎样组成的? 解:如果用字母 X、Y、Z、T 分别表示白、黑、花、棕各色的公牛数;用 x、y、z、t 分别表示白、黑、花、棕各色母牛数,则得 8 个未知数的如下 7 个方程: (1) (2) (3) (4) (5) (6) (7)
X ?T = Y ?T = Z ?T = x= y= z= t= 5 Y, 6

9 Z, 20 13 X, 42

7 (Y + y ) , 12 9 (Z + z) , 20 11 (T + t ) , 30

13 ( X + x) 。 42

由方程(1)(2)(3) , , ,得 6X – 5Y = 6T,20Y – 9Z = 20T,42Z – 13X = 42T。以这三个方程 解未知数 X,Y,Z,得:
X= 742 178 1580 T ,Y = T ,Z = T。 297 99 891

因为 891 和 1580 没有公因子,T 必定是 891 的某一整倍数——假设为 G 倍,因此得 (I) X = 2226G,Y = 1602G,Z = 1580G,T = 891G。 若将这些值代入方程(4)(5)(6)(7) , 、 、 ,得下列方程: 12x – 7y = 11214G,20y – 9z = 14220G,30z – 11t = 9801G,42t – 13x = 28938G。 解这些方程的四个未知数 x,y、z、t,得 (II) cx = 720630G,cy = 4893246G,cz = 3515820G,ct = 549213G。 其中,c 是素数 4657。因为在各式右边 G 的系数中没有一个可以被 c 整除,所以 G 必定是
1

算术题

c 的整数倍。 G = cg。 如果把这个 G 代入(I)和(II) ,最后可得到下列各关系式: (I') X = 10366482g,Y = 7460514g,Z = 7358060g,T = 4149387g, (II') x = 7206360g,y = 4893246g,z = 3515820g,t = 5439213g。 这里 g 可以是任何正整数。 所以,本题具有无数组解。若指定 g 值为 1,则得下列最小数值的解: 白公牛:10,366,482;白母牛:7,206,360; 黑公牛: 7,460,514;黑母牛:4,893,246; 花公牛: 7,358,060;花母牛:3,515,820; 棕公牛: 4,149,387;棕母牛:5,439,213。 史料:如上面解答所示,至少依据目前的概念,分牛问题确切地说不能被认为是个很难 的问题。然而,由于在古代常常把一道难解的题叫做分牛问题或者阿基米德题,特别考虑到 阿基米德(Archimedes)的其他辉煌成就,以及他把这个分牛之题献给古代希腊后期亚历山 大城的天文学家厄拉多塞尼(Eratosehenes)的这一事实,可以设想以上所述及的问题的方 式并不代表阿基米德问题完整和原始的形式。 G·E·莱辛(Gotthold Ephraim Lessing)于 1773 年在沃尔芬比特尔图书馆发现一本希腊文 手抄本,其中就有一篇关于该题“更完整”的阐述。该题由 22 句对偶句组成(或称为韵文) , 以诗歌形式出现: “朋友,请准确无误地数一数太阳神的牛群。要数得十分仔细,如果你自认为还有几分 聪明: 多少头牛在西西里岛草地上吃过草, 它们分为四群, 在那里来往踱步。 各群颜色不同: 第一群像牛乳那样洁白, 第二群闪耀着深乌木般的光泽, 第三群毛色棕黄, 第四群满身斑斓, 每群中公牛数总大大超过母牛。现在,告诉你这些牛群间的比例:白牛数等于棕牛数再加上 黑牛数的三分之一和二分之一。此外,黑牛数为花牛数的四分之一加五分之一,再加上全部 棕牛。 朋友, 最后你必须记住, 花牛数是白牛数的六分之一加七分之一再加上全部棕色母牛。 但是母牛群中,比例却大不相同:白母牛等于黑色公、母牛全部的三分之一加四分之一。而 黑母牛为全部花牛的四分之一加五分之一,这里要注意,每头花母牛和花公牛都要算进去。 同样, 花母牛的头数是全部棕牛的五分之一加六分之一。 最后棕色母牛与全部白牛的六分之 一加七分之一相等。朋友,如果你能确切告诉我,这些膘壮肌肥、毛色各殊的公母牛,一共 多少聚集在那里?这样你才不愧为精通计数。 但是你还算不上一个聪明人, 除非用我给出的 新数据来回答问题:当所有黑白公牛齐集在一起,就排出一个阵形,纵横相等;辽阔的西西 里原野,布满大量的公牛。当棕色公牛与花公牛在一起,便排成一个三角形,一头公牛站在 三角形顶端, 棕色公牛无一头掉队, 花公牛也头头在场, 这里没有一头牛和他们的毛色不同。 如果你把这些条件一一牢记,胸有妙算,朋友,如果你能说出每群牛的组成和头数,那你就 是胜利者,可昂首前进,因为你的声誉将在智慧的世界里永放光芒。 ” 然而莱辛对本题是否撰自阿基米德持有异议,内塞尔曼(Nesselmann)①、法国作家凡 桑(Vincent)②、英国人 R·贝尔(Rouse Ball)③以及其他人也都持有异议。 另一方面,研究阿基米德的著名权威丹麦人 J·L·海伯格(J· L· Heilberg)④、法国数学 家 P·达内瑞(P· Tannery)⑤以及克鲁姆比格尔(Krummbiegel)和安姆托尔(Amthor)⑥都 认为这个问题的完整形式应归功于阿基米德。 在倒数第七联对偶句中提出的两个条件要求X + Y是一个平方数U2,而Z + T是一个三角
1 形数⑦ V (V + 1) ,由此得下列各关系式: 2

(8)

X + Y = U2,

2

算术题

(9) 2Z + 2T = V2 + V。 如果根据(I)把 X,Y,Z,T 的数值代入(8)和(9) ,这两方程变成 2 2 3828G = U 及 4942G = V + V。 如果用 4a(a = 3 × 11 × 29 = 957) 及 cg 分别代 3828,4942 及 G,得: ,b (8') U2 = 4acg, (9') V2 + V = bcg。 从而 U 是 2,a 和 c 的整倍数: U = 2acu, 这样, U2 = 4a2c2u2 = 4acg, (8'') g = acu2 若把 g 的这个数值代入(9') ,得: 2 V + V = abc2u2或(2V + 1)2 = 4abc2u2 + 1。 若将未知数 2V + 1 用 v 表示,而且把 4abc2 = 4 × 3 × 11 × 29 × 2 × 7 × 353 × 46572 的乘积记为 d,最后的方程变为: v2 – du2 = 1。 这就是所谓费马(Fermat)方程,可按第 19 题所述方法求解。然而,因为 d 的值十分 巨大,解答非常困难, d = 410286423278424。 即使费马方程关于 u 和 v 的最小解答也会导致天文数字。 即使将 u 指定为可以设想的最小数 1,在解 g 时,ac 的值为 4456749。这样白牛和黑牛 数的和将超过 79 万亿。可是西西里岛的面积不过 2550 平方公里,即 0.0255 万亿平方米, 还不到
1 万亿平方米,把这么多的牛放牧在这个岛上是不可能的,这和第十七、十八联对 30

偶句论断矛盾。
① ② ③ ④ ⑤ ⑥ ⑦ Algrbra der Griechen, 1842 Nouvelles Annales de Mathématiques, vol. XV, 1856 A short Account of the History of Mathematics Quaestiones Archimedeae Scienes exactes dans l’antiquité Schl?milchs Zeitschrift für Mathematik und Physik, vol. XXV, 1880 一个三角形数 n,是指可以用这 n 个点来构造一个诸全等的等边三角形的顶点组成的点阵。开始的几 个三角形数为 1 =

1 2

×1× 2 , 3 =

1 2

× 2 × 3, 6 =

1 2

× 3 × 4 , 10 =

1 2

× 4 × 5 ,等等。原注。

第2题 德·梅齐里亚克的砝码问题
一个商人有一个 40 磅的砝码,由于跌落在地而碎成 4 块。后来,称得每块碎片的重量 都是整磅数,而且可以用这 4 块来称从 1 至 40 磅之间的任意整数磅的重物。 问这 4 块砝码片各重多少? 本题来源于法国数学家 G·B·德·梅齐里亚克(Gaspard Bachet de Méziriac,1581 – 1655 年) ,在 1624 年出版的他的名著①中,解答了这个题目。

3

算术题

天平的两个秤盘可区别为砝码盘和称量盘, 在砝码盘上只放砝码, 而在称量盘上放重物 外还可附加砝码。若想设法用最少块数的砝码去称量,就要把砝码也放到称量盘上。 假如任意取出几块砝码放在盘上,例如,在一个盘上放 5 磅砝码和 10 磅砝码各一块, 另一个盘上放 1 磅、3 磅、4 磅的各一块,那么这些砝码便使前一个秤盘偏重 7 磅。 我们只考虑重物和砝码均为整数,也就是说,重物和砝码的重量均为整数磅。 假如有一系列砝码 A,B,C,…,把它们适当地分放在两个盘上,就能称出从 1 到 n 的所有整数磅的重物。如果有一块新砝码 P,它的重量 p 超过原有砝码的重量总和 n,超过 量为原有砝码重量的总和加 1: p – n = n + 1, 或者 p = 2n + 1, 那么,把砝码 P 加入砝码组 A、B、C、…之后就能称出从 1 至 p + n = 3n + 1 的所有整数磅 的重物。 事实上,原有砝码组足以称出所有从 1 至 n 磅的重物,为了称出 1 个 p + x 或 p – x 磅的 重物,这里 x 表示从 1 到 n 的任一个数,把砝码 P 放在砝码盘上,再把砝码 A,B,C,… 分别放在两个盘上,使砝码盘或称量盘上的重量偏重 x 磅。 此法成立后,这个题目就容易解答了。 为了使两个砝码 A 和 B 能称出最多重量,A 必须是 1 磅,B 必须是 3 磅,这两个砝码能 称出 1,2,3,4 磅的重物。 如果选第三块砝码 C,使它的重量 c = 2 × 4 + 1 = 9(磅) , 那么用 A,B,C 三块砝码就能称出从 1 至 c + 4 = 9 + 4 = 13 磅的所有重物。 最后,如果选第四块砝码 D,使它的重量 d = 2 × 13 + 1 = 27(磅) , 那么,这四块砝码 A,B,C,D 便能称出从 1 至 27 + 13 = 40 磅的所有重物。 结论:这个砝码的四块碎片的重量分别为 1,3,9,27 磅。 注:英国数学家麦克马洪(MacMahon)概括了德·梅齐里亚克的砝码问题②。他确定 了可用来称出从 1 到 n 磅重量的所有可能的整磅数砝码。
① ② Problèmes plaisants et délectabled qui se font par les nombres Quarterly Journal of Mathematics, vol. XXI, 1886

第3题 牛顿的草地与母牛问题
牛顿(Newton)在 1707 年提出了如下一个有趣的问题①: a 头母牛将 b 块地上的牧草在 c 天内吃完了; a′ 头母牛将b′ 块地上的牧草在c′ 天内吃完了; a″ 头母牛将b″ 块地上的牧草在c″ 天内吃完了; 求出从a到c″ 9 个数量之间的关系。 假设所有草地提供的牧草数量相同, 每块草地每日长草量保持不变, 而且每头母牛每天 吃草量也相同。 解:令每块地上最初的牧草量为 M,每块地每日长草量为 m,每头牛每天耗草量为 Q。 第一天晚上,b 块地上吃剩牧草量为 bM + bm – aQ;

4

算术题

第二天晚上,b 块地上吃剩牧草量为 bM + 2bm – 2aQ; …… 这样,第 c 天晚上,b 块地上吃剩牧草量为 bM + cbm – caQ; 既然草地在 c 天内被吃光,那么这个数值必定等于 0。这样就得出方程: (1) bM + cbm = caQ。 同理得出下列方程: (2) b′M + c′b′m = c′a′Q, (3) b″M + c″b″m = c″a″Q。 把方程(1)和(2)作为求未知数 M 和 m 的一次方程组,得: cc' (ab' ? ba' ) Q, M= bb' (c' ? c) m= bc'a' ? b'ca Q。 bb' (c' ? c) bb' (c' ? c) ,便得所求关系式: Q

若将这些值代入方程(3) ,而且将所得方程乘以

b″cc′(ab′ – ba′) + c″b″(bc′a′ – b′ca) = c″a″bb′(c′ – c)。 以行列式的形式表示时,解答更容易被发现。若以 q 表示 Q 的相反数,方程(1)(2) , , (3)便可写成下列形式: bM + cbm + caq = 0, b′M + c′b′m + c′a′q = 0, b″M + c″b″m + c″a″q = 0。 根据行列式理论的一个基本定理,不全为零的 n 个未知数(本例中的 M、m、q)的 n 个(本例中为 3 个)线性齐次方程组的行列式必等于 0,因此,所求关系式为
b b' b''
① Arithmetica universalis

ba b'a' b''a''

ca c'a' = 0 。 c''a''

第4题 贝韦克的七个 7 的问题
在下面除法例题中,被除数被除数除尽: **7*******:****7*=**7** ****** *****7* ******* *7**** *7**** ******* ****7** ******

5

算术题

****** 用星号(*)标出的那些数位上的数字偶然被擦掉了,那些不见了的是什么数字呢? 这个引人注目的题目来源于英国数学家 E·H·贝韦克(E· H· Berwick) ,他于 1906 年发表 了这个题目①。 解:我们用不同的字母标每个空缺数字,从而本题取如下形式: AB 7 CDE LQWz:αβγδ7ε=κλ7μν a b Δ c d e FGH I K 7 L f g h i k Ξ l M 7 NOPQ m 7 n o p q R S T UΣVW r s t u 7 v w X YZ x y z X YZ x y z 第三行 第四行 第五行 ←7δ 第七行 第九行

I.除数 δ 的第一位数字 α 必须是 1,因为如题中第六行所示,7δ 只有六位数字,否则, 如果 α 等于 2,7δ 就有七位数字。 由于第三行和第七行的余数都是六位数,F 必定等于 1,R 也必定等于 1,因此,f 和 r 也必定等于 1(根据题意) 。 由于 δ 不能超过 19979, 的最大值是 9, μ 才能使第八行的积不超过 1799811, 而且 s < 8。 又因 S 只能是 9 或 0,而且第九行在 s 下面的位置没有余数,所以,只有第二种情况才是可 能的。因此,S = 0,而且(由于 R = 1)s 也等于 0。由于 R = 1,S = 0,随之而使 M = m + 1, 这样,m ≤ 8,第六行乘积 7δ 不可能大于 87nopq。 II.因此,除数的第二位数字 β 只能是 0,1 或 2(7 × 130000 已大于 900000) 。因为甚 至 9 乘以 109979 也不能得到第八行所要求的七位数,所以,β = 0 的可能性排除了。 然后,考虑 β = 1 的情况。这要求 γ 只能等于 0 或 1(如果 γ ≥ 2,在确定第六行第二位 数字时,必定会产生一种情况,即 7β = 7 × 1 = 7,还要加上来自 7γ 乘积的一个大于或等于 1 的数,而第二位必须是 7) 。 然而,γ = 0 是不可能的,因为第八行是七位数,即使 9 × 110979 也不能得到一个七位 数。 在 γ = 1 时,必须注意到以下的情况:一望第八行,便可看出 δ、ε 和 μ 的选择必须能使 μ · 111δ7ε 是个七位数,其最后第三位数是 7。只有乘数 μ = 9 才能达到这一目的(因为即使 8 × 110979 也只有六位数) 。通过试验很容易看出,仅当 δ = 0 或 δ = 9 时,9 · 111δ7ε 的最后 第三位数才是 7,在第一种情况下,即使 111079 与 9 相乘,第八行也不是七位数,在第二 种情况下,第六行是 7 × 11197* = 787***, 这是不可能的,这样 γ = 1 也要排除。因此,必须放弃 β 等于 1 的可能性。 所以,除数第二位数字的唯一适当的值是 β = 2。由此得 m = 8,且 M = 9。 III.因为 7 × 126000 大于第六行的数,而 7 × 124000 又小于第六行的数,除数的第三 位数 γ 只可能是 4 或 5。 再者, 由于 9 × 124000 大于 7 × 126000 又小于第八行的数 (10tu7vw) , 于是 μ 必定等于 8。 因为 8 × 124979 = 999382 < 1000000,γ = 4 这一假设不能满足第八行的要求,因此 γ 只
6

算术题

能等于 5。 IV.由于 8 · 125δ7ε 的最后第三位数必须是 7,通过试验发现 δ 等于 4 或 9。因为即使 7 × 1257970 = 881790 也大于第六行的数,所以 δ = 9 应被排除,而只有 δ = 4 适合。因此 ε 被 认为是从 0 到 4 中的一个数。然而,不论选用哪一个,从 7 · 12547ε = 878*** 中便求出第六行第三位数 n = 8。同样,第八行得到 8 · 12547ε = 10037**, 进而得到 t = 0,u = 3。 由于 λδ = λ · 12547ε 在第四行中是一个七位数,而只有 8δ 和 9δ 才是七位数,所以 λ 是 8 或者 9。 V.从 t = 0 和 X ≥ 1(以及 R = r = 1,S = s = 0) ,得 T ≥ 1;又从 n = 8,N ≤ 9,得 T ≤ 1, 于是 T = 1。所以,N = 9,而 X = 1。由于 X = 1,且 2δ > 200000(第九行) ,从而 v = 1,Y = 2,Z = 5,x = 4,y = 7,z = ε。至此从以上求得的结果,算式为: AB 7 CDE LQWε:12547ε=κλ781 a b Δ c d e 1 GH I K 7 L 1 g h i k Ξ l 9 7 9 OPQ 8 7 8 o p q 1 0 1 UΣVW 1 0 0 3 7 v w 1 2 5 4 7 ε 1 2 5 4 7 ε VI.在这种情况下,ε 是五个数字 0,1,2,3,4 中的一个。这五种情况与下列数列相 对应: vw = 60,68,76,84,92, cpq = 290,297,304,311,318。 并且,根据 λ 等于 8 或 9,可得: Ξl = 60,68,76,84,92, 或 Ξl = 30,39,48,57,66。 这便有十种不同的可能性。 若自上而下进行三次递加的方法对这十种可能性逐一检验, 首先 从第九行和第八行相加得第七行;然后第七、第六行相加得第五行;最后第五、第四行相加 得第三行,便发现只有当 ε = 3 和 λ = 8 时,才能使第三行最后第二位得到所要求的数字 7。 这种情况下,vw = 84,UΣVW = 6331,cpq = 311,OPQ = 944,ghikΞl = 003784,GHIK7L = 101778,这便使本题算式如下: AB7CDE8413:125473=κ8781 a bΔc d e 1 10 1 7 78 1 00 3 7 84 9 7 9 944 8 7 8 311 1 0 1 6331 1 0 0 3784
7

算术题

1 25473 1 25473 VII. 最后, 由于在 δ 的所有倍数中, 只有 5δ = 627365 加到第三行的最后的余数 1110177 之上,才能得到第三位是 7 的一个数。这就得到 κ = 5,同时也得到 abcΔcde = 627365 及 AB7CDE = 737542。这样就得到了该题所有空缺待求的数字。
① The School World

第5题 柯克曼的女学生问题
某寄宿学校有十五名女生, 她们经常每天三人一行地散步, 问要怎样安排才能使每个女 生同其他每一个女生在同一行中散步,并恰好每周一次? 这个非同寻常的问题是英国数学家 T·P·柯克曼(T· P· Kirkman)提出的①。 在已发现的众多解法中,现介绍两个方法。一个是英国牧师 A·弗罗斯特(Andrew Frost) 的解法(十五个女学生一题的一般解法及其推广)②,另一个是 B·皮尔斯(B· Pierce)的“女 学生难题的递推解法”③。 弗罗斯特解法:用数学方法表示,本题用 15 个元素x,a1,a2,b1,b2,…,g1,g2正确 地分布在系列的其它四行上。 用 7 个字母 a,b,c,d,e,f,g 构成一个三元组合群,其中每对元素恰好只出现一次, 特别像下面的一群: abc,ade,afg,bdf,beg,cdg,cef (这些三元组合按字母顺序排列) 。 从这个群里恰好可以为每列选取 4 个三元组合, 使这些组合包含在该列的第一行中已出 现的字母以外的其它所有字母。将这些三元组合按字母顺序排入每列,便得如下初步安排: 星期日 xa1a2 bdf beg cdg cef 星期一 xb1b2 ade afg cdg cef 星期二 xc1c2 ade afg bdf beg 星期三 xd1d2 abc afg beg cef 星期四 xe1e2 abc afg bdf cdg 星期五 xf1f2 abc ade beg cdg 星期六 xg1g2 abc ade bdf cef

现在用下标 1 和 2 对三元组合 bdf,beg,cdg,cef,ade,afg,abc 等作出标志。把他们 按照上述顺序先标注所有 bdf,然后标注所有 beg,…等等,并遵守下列规则: I.一列中的一个字母标上一个下标后,下一次该字母在同一列中出现时,应标上另一 下标。 II.假如一个组合的某两个字母已经标有下标,这两个下标不得以同顺序标在别的组合 中的该两个字母上。 III.假如一个字母的下标尚未按规则 I、II 决定,那么将这个字母标上 1。 分三个步骤标定字母下标: 第一步:将组合 bdf,beg,cdg 以及可按本标注系统和规则 I、II、III 标注的 a 不在内 的所有字母,依次标定下标。 第二步: 按规则 I 标定组合 ade 和 afg 中所缺的下标以及第二行中最后两个 a 的下标 (在 图表中用黑体字) 。 第三步:补标在第四和第五行中仍缺少下标的字母 a(在图表中空着的位置) ,第二行 标 2,第三行标 1。
8

算术题

按照这个方法,得以下的完整图表,它表示本题的解答。 星期日 xa1a2 b1d1f1 b2e1g1 c1d2g2 c2e2f2 星期一 xb1b2 a1d2e2 a2f2g2 c1d1g1 c2e1f1 星期二 xc1c2 a1d1e1 a2f1g1 b1d2f2 b2e2g2 星期三 xd1d2 ab2c2 af2g1 b1e1g2 c1e2f1 星期四 xe1e2 ab1c1 af1g2 b2d1f c2d2g1 星期五 xf1f2 a1b2c1 a2d2e1 b1e2g1 c2d1g2 星期六 xg1g2 a1b1c2 a2d1e2 b2d2f1 c1e1f2

皮尔斯解法:西尔维斯特(Sylvester)认可的最佳解法:令符号*表示一位女孩,她天 天都走在同一行的中间,把其他女孩分成两组,每组七人,用阿拉伯数字 1 至 7 或小写字母 表示第一组;用罗马数字 I 至 VII 或大写字母表示第二组。用例如 R = s 的等式表明字母 R 表示的罗马数字与字母 s 表示的阿拉伯数字具有相同数值。同时,用 0,1,2,…,6 表示 星期日,星期一,星期二,…,星期六。 令星期日按下列顺序排列: a α A b β B c γ C d * D E F G 由此,在每个数字上加 r = R,可得星期 r(星期日不在内)的排列: a+r α+r A+R b+r β+r B+R c+r γ+r C+R d+r * D+R E+R F+R G+R 这里,相加后超过 7 的每个数,像 c + r 或 D + R,表示那个女孩的编号为 c + r – 7 或 D + R – 7,即比原数小 7,随后把原数换为这个数字④。 如果下面三个条件得以满足,那么这样得到的排列就是该题的解答。 I.α – a,β – b,γ – c 这三个差分别是 1,2,3; II.A – a,A – α,B – b,B – β,C – c,C – γ,D – d 这七个差数形成一个以 7 为模数的 非同余数的完整余数列(参阅第 19 题) 。 III.F – E,G – F,G – E 这三个差分别是 1,2,3。 证:作为前提,下列同余式(参阅第 19 题)都以 7 为模数。 1.第一组的每一个女孩 x 和该组其他的每一个女孩 y 在一起散步恰恰一次,那么(根 据条件 I)差 x – y 仅与 a – α,b – β,c – γ,α – a,β – b,γ – c 等六个差中的一个同余。设 x – y ≡ β – b,或者 x – β ≡ y– b。若星期 r 的 r 与 x – β 或 y– b 同余,那么, x ≡ β + r 和 y ≡ b + r, 这样,女孩 x 和 y 于星期 r 在同一行散步。 2.第一组的一个女孩 x 和第二组的一个女孩 X 在一起散步恰恰一次。 根据条件 II,差 X – x 只能与 A – a,A – α,B – b,B – β,C – c,C – γ,D – d 等七个差 中的一个同余。设 X – x ≡ C – γ 或 X – C ≡ x – γ。若 s = S,这里是星期 s 的 s,且与 X – C 或 x – γ 同余,那么: X ≡ C + S 和 x ≡ γ + s, 这样,女孩 X 和 x 在星期 s 那天在同一行散步。 3.第二组的每一个女孩 X 和该组的其他每一个女孩 Y 在一起散步恰恰一次。
9

算术题

根据条件 III,差 X – Y 仅能与 F – E,G – F,G – E,E – F,F – G,E – G 六个差中的 一个同余。设 X – Y ≡ G – F 或 X – G ≡ Y – F。又设星期 R 的 R 与 X – G 或 Y – F 同余,得: X ≡ G + R 和 Y ≡ F + R, 这样,女孩 X 和 Y 在星期 R 那天在同一行散步。 因此,我们仅需满足条件 I,II,III 就可求星期天的排列。 选定 a = 1,α = 2,b = 3,从而 β = 5,于是 c = 4,故有 γ = 7,d = 6。然后选 A = I,于 是 B = VI,C = II,D = III,从而条件 II 中提到的差数 0, – 1,3,1,–2,–5,他们都是关 于模数 7 的非同余数。那么 IV,V,VII 三个数便留给了字母 E,F,G。因此,星期日的排 列是: 1 2 I 3 5 VI 4 7 II 6 * III IV V VII 按星期一到星期六的顺序,一星期每天的排列如下: 2 3 II 3 4 III 4 5 IV 4 6 VII 5 7 I 6 1 II 5 1 III 6 2 IV 7 3 V 7 * IV 1 * V 2 * VI V VI I , VI VII II , VII I III , 5 7 1 3 I
① ② ③ ④

6 2 4 * II

V III VI VII IV



6 1 2 4 II

7 3 5 * III

VI IV VII I V



7 2 3 5 III

1 4 6 * IV

VII V I II VI



Lady’s and Gentleman’s Diary, 1850 Quarterly Journal of Pure and Applied Mathematics, vol. XI, 1871 The Astronomical Journal, vol. VI, 1859 – 1861 例如 c + r = 9,换成 9 – 7 = 2。译注。

第6题 柏努利—欧拉关于装错信封的问题
求 n 个元素的排列,要求在排列中没有一个元素处于它应当占有的位置。 N·柏努利(Niclaus Bernoulli,1687 – 1759 年)最先考虑了这个问题,他是两位大数学 家雅可比·柏努利(Jacob Bernoulli)和约翰·柏努利(Johann Bernoulli)的侄子。后来, 欧拉(Euler)对此题发生兴趣,他称之为“组合理论的一个秒题” ,并在与柏努利毫无联系 的情况下,独自解了这道难题。 本题可以形象地叙述为装错信封的问题。 某人写了几封信, 并且在几个信封上写下了对应的地址, 把所有的信笺装错信封的情况, 共有多少种? 本题解法巧妙,格外引人入胜。

10

算术题

设信笺为 a,b,c,…,对应的信封为 A,B,C,…,所求的错误装法种数记为 n 。 先考虑把 a 装进 B 和 b 装进 A 的所有情况作为第一组,把 a 装进 B 而 b 没有装进 A 的 所有情况作为第二组。 第一组显然包括 n ? 2 种情况。 假如分别用 b′,c′,d′,e′,…和 B′,C′,D′,E′,…代替 b,c,d,e,…和 A,C,D, E,…,于是推出第二组情况,有 n ? 1 种。 那么,a 装进 B 的所有情况的种数是 n ? 1 + n ? 2 。因为把“a 装进 C”“a 装进 D” 、 、… 的每一种装法都有相同的情况种数,则所有可能情况的总数为 n ,则:

n = (n ? 1)(n ? 1 + n ? 2) 。
其递推公式为:

n ? n ? n ? 1 = ?[n ? 1 ? (n ? 1) ? n ? 2] ,
把它用第 3,第 4,第 5,…,直到第 n 封信,这样就得到:

3 ? 3 ? 2 = ?(2 ? 2 ? 1) , 4 ? 4 ? 3 = ?(3 ? 3 ? 2) ,


n ? n ? n ? 1 = ?[n ? 1 ? (n ? 1) ? n ? 2] 。
把这 n – 2 个等式相乘,便得到:

n ? n ? n ? 1 = (?1) n ? 2 (2 ? 2 ? 1) ,
又因 1 = 0 , 2 = 1 ,(–1)n–2 = (–1)n,所以

n ? n ? n ? 1 = (?1) n 。
然后用 n!去除这个等式,便得:

(?1) n n n ?1 ? = 。 n! (n ? 1)! n!
假如用一列数 2,3,4,…,n 顺次代替这个公式中的 n,便得: 2 1 (?1) 2 , ? = 2! 1! 2! 3 2 (?1) 2 , ? = 3! 2! 3! …

(?1) n n n ?1 ? = 。 n! (n ? 1)! n!
将这 n – 1 个等式相加,因为 1 = 0 ,其结果是 n (?1) 2 (?1) 3 = + + n! 2! 3! 最后,由此得所求数 n :
11

+

(?1) n 。 n!

算术题

(?1) n 1 1 1 ]。 ? + ? + 2! 3! 4! n! 假如利用符号ζ,对(ζ – 1)n应用二项式定理(参阅第 9 题) ,在二项展开式中每一乘幂ζ ν写成 ν!,那么,所求的数便可表示为淡淡的形式: n = n![

n = (ζ ? 1) n 。
作为例子,取 n = 4,得

4 = (ζ ? 1) 4 = ζ 4 ? 4ζ 3 + 6ζ 2 ? 4ζ + 1 = 4!?4 × 3!+6 × 2!?4 × 1!+1 = 9 ,
这个式子很容易通过验算来检验。 同样地,由n个元素,其中没有一个元素占有它应有的位置,所形成的排列数是(ζ – 1)n。 以 1,2,3,4 四个元素为例,就有 2143,2341,2413,3142,3412,3421,4123,4312, 4321 九种排列。 注:所得的结果也包括行列式问题的解: 在一个 n 阶行列式中,有多少个组成部分中不出现主对角线的元素? 假如第 s 列的第 r 个元素 C rs ,那么,便一目了然,主对角线的元素是:
1 2 3 n C1 , C 2 , C 3 ,…, C n 。

因此,这个行列式包括了在主对角线以外的(ζ – 1)n个组成部分。

第7题 欧拉关于多边形剖分问题
可以有多少种方法用对角线把一个 n 边多边形(平面凸多边形)剖分成三角形? 1751 年L·欧拉向数学家C·歌德巴赫(Christian Goldbach)提出此题。对于所求数En,可 能的剖分方法数,欧拉推导出一个公式: 2 ? 6 ? 10 ? ? (4n ? 10) 。 En = (1) (n ? 1)! 当读者试图不靠外来帮助而推导欧拉公式时, 他就会感到惊异, 发现这个问题令人极其 感到兴趣,因为它虽然看来容易,却涉及很多困难。欧拉自己说: “我的归纳过程是相当费 力的。 ” 在n = 3,4,5,6 的简单情况下,用图示法很容易得出的各种剖分数:E3 = 1,E4 = 2, E5 = 5,E6 = 14。但是,当边数增加时,这个方法很快就不能用了。 欧拉得出了最初的七种剖分数:1,2,5,14,42,132,429,并告知了西格纳(Segner) 。 西格纳于 1758 年建立了En的一个递推公式①。我们就从推导这个公式开始。 令任意n边凸多边形的角标为 1,2,3,…,n。对于n边形的每种可能的分法En来说, 可取边n1 作为一个三角形的底边, 这个三角形的顶点, 根据选定的剖分法, 可落在 2, 4, 3, …, n – 1 诸角中的顶点上。例如,若落在r角的顶点上,那么,在三角形n1r的一侧,有一个r边 形,而在另一侧有一个s边形,而r + s等于n + 1(因为顶点r既属于r边形也属于s边形) 。 因为r边形有Er种剖分法,而s边形有Es种剖分法,又因对于已知n边行的一种剖分而言, r边形的每一剖分法可以与s边形的每一剖分方法联系,所以,仅就选定r作顶点,对给定的n 边形就可有Er · Es种不同分法。 由于,r 可以依次取数列 2,3,4,…,n – 1 的每一个值,从而 s 可以依次地取数列 n – 1,n – 2,…,3,2 的每一个值,于是便得:
12

算术题

(2) En = E2 · En–1 + E3 · En–2 +…+ En–1 · E2, 这里E2只是为了使表达形式完整而采用的,其值为 1。 公式(2) ,是西格纳的递推公式。它证实了前述从E3到E6的数值,也给出了 E7 = E2 · E6 + E3 · E5 + E4 · E4 + E5 · E3 + E6 · E2 = 42, E8 = E2 · E7 + E3 · E6 + E4 · E5 + E5 · E4 + E6 · E3 + E7 · E2 = 132, 等等。 正如歌德巴赫所指出, 西格纳的公式与欧拉公式相比, 由于下标增多而变得越来越不适 用了。 如果按照罗德里格(Rodrigues)的思路②,研究欧拉的剖分问题或西格纳的递推公式, 并把本题和法国数学家凯特兰(Catalan)在 1838 年所解的一个问题③联系起来,欧拉公式 (1)的推求最为简便。 凯特兰的问题形式是: 成对地计算 n 个不同因子的乘积,共有多少种方法? 所谓成对计算一个乘积指始终有两个因子在一起相乘,并把这样“成对”乘得的积用作 继续计算中的一个因子。例如乘积 3 × 4 × 5 × 7 的成对计算进行如下: 3 × 5 =15,4 × 15 = 60,7 × 60 = 420。 对于这四个因子组成的乘积 abcd,把因子按字母顺序排列可得下列五个成对的乘式: [(a · b) · c] · d,[a · (b · c)] · d,(a · b) · (c · d),a · [(b · c) · d],a · [b · (c · d)]。 用括号或者类似形式指明要进行成对乘法被简称为“成对” 。 因此,{[(a · b) · c] · [(d · e) · (f · g)]} · [(h · i) · k]便是从 a 到 k,十个因子的成对乘积。立 即可以看出 n 个因子的成对乘积含有 n – 1 个乘号,对每两个因子来说,相应地含有 n – 1 个成对乘式。 凯特兰问题要求回答两个问题: 1.n 个给定的不同因子的成对乘积有多少个? 2.若因子的顺序(即字母顺序)是预定的,n 个因子可以形成多少个成对乘积? 现将第一数用Rn表示, 第二数用Cn表示, n的最简求法是用递推公式 R (根据罗德里格法) 。 假设n个已知因子f1,f2,f3,…,fn形成了Rn个n因子的成对乘积,加上第n + 1 个因子fn+1 = f, 并可求得的Rn个n因子的乘积来形成因子f1,f2,f3,…,fn+1的所有Rn+1个n + 1 因子的乘积。 现在看Rn的每个n元乘积,其中每一个乘积P包含n – 1 个A · B形式的成对乘式。假若用f 一次作为在A之前的乘数,一次作为A之后的乘数,一次作为B之前的乘数,一次作为在B之 后的乘数,则从A · B得到新的成对乘积(f · A) · B,(A · f) · B,A · (f · B)和A · (B · f)。 由于因子f的这四个不同的排列能对P的n – 1 个成对子乘积中的每一个产生影响,我们 就能从P得到 4(n – 1)个n + 1 元的成对乘积。 再者, 从P还可以得到 2 个n + 1 元的成对乘积f · P 与P · f。这样,所述的因子f的排列仅仅从Rn的一个(P)n元的成对乘积中可得Rn · (4n – 2) 个n + 1 元的成对乘积。因而,所求递推公式便是: (3) Rn+1 = (4n – 2)Rn 为了得到Rn的独立表达式,以R2 = 2(a与b两个因子仅能产生乘积a · b与b · a)开始,从 公式(3)推出R3 = 6 R2 = 2 × 6;R4 = 10 R3 = 2 × 6 × 10;R5 = 10 R4 = 2 × 6 × 10 × 14;…; 最后, (4) Rn = 2 · 6 · 10 · 14 ·…· (4n – 6)。 第二个问题也可以用一个递推公式解答。 令n个因子fν按规定的顺序为φ1,φ2,φ3,…,φn。我们从属于该系列的Cn个成对的n元 乘积中取具有() · ()形式者,左边括号包括r个元素φ1,φ2,φ3,…,φr,而右边括号包括s = n – r个元素φr+1,φr+2,φr+3,…,φr+s = φn。由于左边括号根据它的r个元素具有Cr种不同形式,
13

算术题

而右边也相应地具有Cs种形式, 而属于左边括号的每种形式可以与右边括号中的每种形式结 合,因而,上述主要形式可得Cr · Cs种不同的n元素的成对乘积。 (5) Cn = C1Cn–1 + C2Cn–2 +…+ Cn–1C1。 用这个递推公式,并从C1 = 1 和C2 = 1 开始,得如下序列: C3 = C1C2 + C2C1 = 2, C4 = C1C3 + C2C2 + C3C1 = 5, C5 = C1C4 + C2C3 + C3C2 + C4C1 = 14, 等等。 为了得到一个Cn的独立表达式,可设想f1,f2,f3,…,fn因子有n!个不同序列(排列) , 所有序列总加在一起具有Rn个这样的乘积, 这些顺序中的每一个均具有Cn个成对n元素乘积, 于是Rn = Cn · n!,或者

Rn 2 ? 6 ? 10 ? ? (4n ? 6) = 。 n! n! 公式(4)和(6)解答了凯特兰的问题。 下面解欧拉公式。 从已知数值 E2 = 1,E3 = 1,E4 = 2,E5 = 5, C1 = 1,C2 = 1,C3 = 2,C4 = 5, 以及公式(2)与(5) ,立即得出一般式 (7) En = Cn–1。 (这里是用归纳法得出的证明。假定对于至n的所有下标来说,公式(7)成立,则E2 = C1, E3 = C2,…,En = Cn–1。 根据公式(2)和(5) En+1 = E2 · En + E3 · En–1 +…+ En · E2, Cn = C1Cn–1 + C2Cn–2 +…+ Cn–1C1。 由于最后两个登时的左边各元素一一对应,便得: En+1 = Cn; 也就是公式(7)对每个下标都能成立。 ) 公式(6)(7)立即给出欧拉公式: 、 2 ? 6 ? 10 ? ? (4n ? 10) 。 En = (8) (n ? 1)!
(6)

Cn =

作为总结,所求欧拉公式的简化形式为: En = 且结果是:E n = kf 2 n ? 2 ? 1 ? 3 ? 5 ? ? (2n ? 5) 2 n ? 2 (2n ? 3)! , = (n ? 1)! (n ? 1)!2 n ? 2 ? (n ? 2)! (2n ? 3)

,这里,f = n – 2 表示 n 边形总是可分割为 n – 2 个三角形,而 k = 2n – 3 k 是这些三角形的边数。 本世纪来乌尔班(H· Urban)以下面的形式推导了欧拉公式④。 他先用西格纳的递推公式计算E5,E6,E7,并且“推导”出下列等式: E2 = 1,E3 = 1,E4 = 2,E5 = 5,E6 = 14,E7 = 42, E3 2 E E E E 6 10 14 18 , 5 = , 7 = , = , 4 = , 5 = 4 5 6 E2 2 E3 3 E4 E4 E6

由以上的分析,他推测En应该是:
14

算术题

(I)

En =

4n ? 10 E n ?1 。 n ?1

(遗憾的是,他没有说是否是“欧拉递推公式”或其他什么想法引起他这么“推断”的。 ) 这个递推公式对于下标 n 的若干初始数值来说肯定成立。为了证明其普遍成立,将 n 的结论用于 n + 1: 假设递推公式对所有从 1 到 n – 1 的下标都正确且被证实, 所以对 n 来说, 它也正确。 证明是用展开式进行: (II) S = 1 · E2 · En–1 + 2 · E3 · En–2 + 3 · E4 · En–3 +…+ (n – 2) · En–1 · E2, 或者写成倒序: (III) S = (n – 2) · En–1 · E2 + (n – 3) · En–2 · E3+ (n – 4) · E4 · En–3 +…+ 1 · E2 · En–1。 这两个等式逐项相加,便得: 2S = (n – 1)(E2En–1 + E3En–2 +…+ En–1E2), 或者根据西格纳的递推公式括号内的算式等于En。 (IV) 2S = (n – 1)En。 根据递推公式(I) ,将公式(II)(III)的每一乘积Er · Es(r = 2 除外)中左边的因子 , Er用

λ r ?1 E r ?1
r ?1

来代替,而λr = 4r – 6,得:

(II') S = E2En–1 + λ2E2En–2 + λ3E3En–3 +…+ λn–2E n–2E2, (III') S = λn–2E n–2E2 + λn–3E n–3E3 +…+ λ2E2En–2 + E2En–1。 将两行所列成的对位相加,由于λr + λn–r = 4n – 12, ,故得: 2S = En–1 + (4n – 12)(E2En–2 + E3En–3 +…+ En–2E2) + En–1。 或者由于括号内的式子等于En–1,得出: (V) 2S = (4n – 10)En–1。 由等式(IV)和(V)得:
En = 4n ? 10 E n ?1 。 n ?1

由此证明欧拉的递推公式(I)对于下边 n 亦能成立,也就是说普遍使用。
① ② ③ ④ Novi Commentarii Academiae Petropolitanae pro annis 1758 et 1759, vol. VII Journal de Mathématiques, 3 (1838) Journal de Mathématiques, (1838) Zeitschrift für math. und naturw. Unterrricht, 1941, vol. IV

第8题 鲁卡斯的配偶夫妇问题
n 对夫妇围圆桌而坐,其座次是两个妇人之间坐一个男人,而没有一个男人和自己的妻 子并坐,问有多少种坐法? 这个问题 1891 年出现于 (大概是首次出现) 法国数学家 E·鲁卡斯 (Edouard Lucas, 1842 – 1891 年)的书中①。英国数学家 R·贝尔(Rouse Ball)谈及该题时说: “解这个题决非易 事。 ” 法国人 M·莱桑(M· Laisant)和 M·C· 莫赫(M· C· Moreau )以及英国 人 H·M· 泰勒 (H· M· Taylor)都解过这个问题。在麦克马洪的书中作过基于现代观点的解法②。这里所 取的方法原则上是泰勒的解法③。 把从 1 到 2n 张循环排列的椅子编上号码。妇人们全坐在偶数或奇数号码的椅子上,这

15

算术题

两种情况无论哪一种都可能有 n!个不同的座次排列,因此,仅妇人们就有 2n!个不同的座次 排列。 假设妇人们已按这种排列中的一种方法就座, 并且下文所述全部保持这种排列。 那么该 题的核心便是求出可能有多少种方法在妇人们之间安排男人们入座。 假设把妇人们的座位顺序用F1,F2,…,Fn表示,她们各人的丈夫分别用M1,M2,…, Mn表示,成对夫妇(F1, M1),(F2, M2),…的座次用 1,2,…表示,而n对夫妇的排列方法用n 对排列表示。设不作进一步说明而就座的丈夫们的座次为X1,X2,…。 使F1X1F2X2…FnXnFn+1Xn+1表示没有丈夫坐在自己妻子身边的n + 1 对排列(一定要记住 。若从该排列中取出Fn+1和Mn+1 = Xν,并以 排列是循环式的,所以Xn+1坐在Fn+1和F1表之间) Xn+1 = Mμ代替Xν的话,便得到n对排列 F1X1F2X2…FνMμFν+1…FnXn。 这种排列可发生下列三种情况: 1.没有一个男人坐在自己妻子旁边(这样Mμ ≠ Mν,Mμ≠ Mν+1,Xn ≠ M1) 。 2.有一个男人和自己妻子并坐(Mμ = Mν或Mμ = Mν+1或Xn = M1的时候) 。 3.有两个男人和自己的妻子并坐(当Mμ = Mν或者Mμ = Mν+1,且同时Xn = M1,亦即在 。 排列中出现M1F1时) 这样,一定要考虑到除了在题中规定的那种以外的其它排列法。 下面来区别 A,B,C 三种形式的排列。A 式排列指没有一对夫妻并坐;B 式排列指某 一对夫妻并坐;最后,C 式排列指某一个男人坐在他妻子的指定的一边,而没有规定的另一 个男人坐在他妻子的没有规定的一边。 令n对中A,B,C三种排列数分别为An,Bn,Cn。 首先,试着确定六个数An,Bn,Cn,An+1,Bn+1,Cn+1之间的关系;并从最简单的关系开 始。 考察Bn+1,1,2,…,n + 1 对的B式排列 F1X1F2X2…FnXnFn+1Mn+1, 其中,Mn+1坐在Fn+1的右边。根据Xn = M1或Xn ≠ M1把排列分成两组,然后从他们所有人中移 出一对Fn+1Mn+1,那么第一组便得到Bn的n对的B式排列,而第二组则得到所有An种n对的A式 排列,这样, (1) Bn+1 = Bn + An。 考察Cn+1以求得第二个关系式。n + 1 对的C式排列 M1F1X1F2X2…FnXnFn+1, 其中,男人X1,X2,…,Xn中的一个紧挨着他的妻子,根据X1等于或不等于Mn+1,把这些排 列分成两组。 第二组包含 2n – 1 个小组,在第一小组里,M2坐在F2的左边;在第二小组里,M2坐在 F2的右边;在第三小组里,M3坐在F3的左边;在第四小组里,M3坐在F3的右边;如此等等。 在第 2n – 1 小组里,Mn+1坐在Fn+1的左边。 若从所有Cn+1种C式排列中移出对子M1F1,从第一组得到 2,3,4,…,n + 1 等对的所 有Cn+1种C式排列,其中Mn+1坐在Fn+1的右边,从第二组的每一小组得到 2,3,4,…,n + 1 等对的Bn种B式排列,这样, (2) Cn+1 = Cn + (2n-1)Bn。 按上述推导,若从n + 1 对的A式排列F1X1F2X2…Fn+1Xn+1中取出一个对子Fn+1Mn+1,且以 Xn+1代替已取出的Mn+1,便变成了n对的A式,B式或C式排列。 相反,当把Fn+1Mn+1插在 1,2,…,n等n对的一种A式,B式或C式排列的F1前,而后交 。显然,这个方法 换Mn+1和某一其他男人的位置(使交换后不再有一个男人挨着自己妻子)
B B

16

算术题

使我们得到 1,2,…,n + 1 等n + 1 对所有的A式排列。 于是,为了找出An+1,只要确定可能完成的对于从 1 到n等n对的这种插入和随后的所有 可能的A式,B式,C式排列的交换法的数目。 n + 1 对的 A 式排列的构成分为三个步骤: I.由 A 式排列构成。 在插入几对 A 式排列后: F1X1F2X2…FnXnFn+1Mn+1 可以交换Mn+1和除Xn与M1以外的任何一个其他男人的位置, 这便从An种n对A式排列中的每一 种得到n – 2 种n + 1 对的A式排列。从而得到总数为(n – 2)An种的n + 1 对的A式排列。 II.由 B 式排列构成。 n 对的 B 式排列有下列 2n 种形式: 1. …F1M1… 2. …F1M2 F2… 3. …F1 X1F2 M2… … … 2n – 2. …Mn FnXn F1… 2n – 1. …FnMn F1… 2n. …FnM1 F1… 且这些形式中的每一种都有Bn种形式。 此种形式的过程对于这些形式的每一和第 2n – 1 个来说不适用(因为插入的Mn+1该与 。 M1或Mn交换,然而,其结果为M1终将在F1的左边,或Mn+1在Fn+1的左边) 在第二、第三、…、第 2n – 2 式中,插入的Mn+1分别与M2,M2,M3,M3,…,Mn–1, Mn–1,Mn交换,把n对的B式排列变换成n + 1 对的A式排列,其结果共得到(2n – 3)Bn种n + 1 对的A式排列。 在 2n式中插入的Mn+1,可以与M2, M3,…,Mn中的任何一个男人交换,其结果总共 得到(n – 1)Bn种n + 1 对的A式排列。 III.由 C 式排列构成。 这个方法把Cn种n对的C式排列中的任何一种 M1F1X2F2X3 F3…XnFn 变换成n + 1 对的A式排列, 如果掉换男人Mn+1和夫妻并坐的男人Mν的位置 (ν是 2, 4, 3, …, n等数中的一个) 。这样,从每个n对的C式排列中得到n + 1 对的一个A式排列,这相当于总 计Cn种n + 1 对的A式排列。这样,I,II,III三步构成法得出所有n + 1 对的A式排列,或总计 (n – 2)An + (3n – 4)Bn + Cn种排列法。所以, (3) An+1 = (n – 2)An + (3n – 4)Bn + Cn。 为了得到仅含相同大写字母的公式,从(1)推导出 An = Bn+1 – Bn及An+1 = Bn+2 – Bn+1, 把这些数值代入(3) ,得出 Bn+2 = (n – 1)Bn+1 + (2n – 2)Bn + Cn。 若用 n + 1 代替 n,即得: Bn+3 = nBn+1 + 2nBn+1 + Cn+1。 若从上式减去前面一式,并运用(2) ,便得: Bn+3 = (n + 1)(Bn+2 + Bn+1) + Bn。 或者用 n 代替 n + 1,即得: (4) Bn+2 = (n + 1)(Bn+1 + Bn) + Bn–1。
B B B B B B B B B B B

17

算术题

由大写字母 B 组成的简单递推公式能从三个连续的 B 立即算出后继的一个 B。 还可能推导只含有三个连续的 B 互相联系的的递推公式,那就是下列形式的公式: (5) enBn+1 + fnBn + gnBn–1 = C, 其中,系数en,fn,gn表示n的已知函数,而c是一个常数。 为了求出他们,用 n + 1 代替(5)中的 n,得: en+1Bn+2 + fn+1Bn+1 + gn+1Bn = C。 用(5)减去这个等式,得: – en+1Bn+2 + (en – fn+1)Bn+1 + (fn – gn+1)Bn + gnBn–1 = 0。 为了寻求未知系数e,f,g的条件方程,把上式与等式(4)乘gn之后所得的登时 – gnBn+2 + ngnBn+1 +ngnBn + gnBn–1 = 0 进行比较。这样,能够得到 e,f,g,并满足下列三个条件: (I) en+1=gn; (II) en – fn+1 = ngn; (III) fn – gn+1 = ngn。 由这三个条件我们能求得递推公式。 从(III)可得: fn = gn+1 + ngn或fn+1 = gn+2 + ngn+1, 从(II)和(I)得: fn+1 = en – ngn = gn–2 – ngn+2。 使所得到的fn+1的两个数值相等,便得到: (n + 1)gn+1 + ngn = gn–1 – gn+2。 很容易看出 gn = n(–1)n 是该方程的一个解。根据(I) ,得 en = gn–1 = –(n – 1)(–1)n, 根据(III) ,得: fn = gn+1 + ngn = (n2 – n – 1)(–1)n。 从而,等式(5)转换成 (n – 1)Bn+1 – (n2 – n – 1)Bn – nBn–1 = –c(–1)n。 为了求常数c,使n等于 4,观察到B3 = 0,B4 = 1,B5 = 3,便得到c = 2。 从而所寻求的递推公式为 (6) (n – 1)Bn+1 = (n2 – n – 1)Bn + nBn–1 – 2(–1)n。 为了求得关于字母A的类似递推公式,依照(1)和(6)的形式,用Bn与Bn+1来表示An–1, An与An+1,这样得到:
B B B B B

An ?1 =

2(?1) n 1? n n2 ?1 B n +1 + Bn ? , n n n An = Bn+1 – Bn,
B B

An +1 =

2(?1) n n ?1 n +1 B n +1 + Bn + , n n n
2

消去Bn与Bn+1,得: (7) (n – 1)An+1 = (n2 – 1)An + (n+1)An–1 + 4(–1)n。 这便是莱桑的递推公式。这使得从前面紧接着的两个 A 可以计算出后继的 A。 于是,由于A3 = 1,A4 = 2 和(7) ,便得A5 = 13。这仍然很容易直接验证。更进一步整 A A A A A A 个系列A6 = 80, 7 = 579, 8 = 4738, 9 = 43387, 10 = 439792, 11 = 4890741, 12 = 59216642
18

算术题

等等,都可以从(7)推导出。从而消除了计算A的难点。 这样本题就解决了。 n对夫妇的可能座次排列的数目是 2Ann!,其中,An可从莱桑的递推公式算出。
① ② ③ “Récréaticns mathématiques”,见《Théoris des Nombres》 Combinatory Analysis The Messenger of Mathematics, 32, 1903

第9题 卡亚姆的二项展开式
当 n 是任意正整数时,求以 a 和 b 的幂表示的二项式 a + b 的 n 次幂。 解:为了确定二项展开式,写出 (a + b)n = (a + b) (a + b)…(a + b), 这里,右边包含 n 个相同的括号 a + b 的乘积,像人们所了解的那样,括号的乘式包含从每 一括号中选出一项,得出所选项的乘积,并继续该过程,直至取尽所有可能的选择,最后将 得到的乘积加在一起。 这类乘积的形式如下: P = a α1 b β1 a α 2 b β 2 a α 3 b β 3 , 其中, 从开头的α1个括号中各取出因子a, 从随后的β1个括号中各取出因子b, 再从其后的α2个 括号中各取出因子a,等等。在这种情况下,α1 + β1 + α2 + β2 +…等于现有的括号数,即n。 如果α1 + α2 +…等于α,β1 + β2 +…等于β,展开式可写成较简单的形式: P = aαbβ, 其中 α + β = n。 除所述的这种方法外,一般还有许多其它方法可以求得乘积 P。例如,从前面 α 个括号中取 出 a,而从后面 β 个括号中取出 b;从前面 β 个括号中取出 b,而从后面 α 个括号中取出 a, 等等。如果乘积 P 在上述方法中出现 C 次,C 被理解为代表一个最初的未知数,那么 G = Caαbβ 表示二项展开式的一项。其它各项除了指数 α 与 β 以及系数 C 不同外,都具有相同的形式。 因此,α + β 总是等于 n。 该题的关键是确定所谓的“二项系数”C,即回答问题:在二项展开式中乘积P = aαbβ出 现多少次? 为了解答这个问题, 首先按照从括号中最初选定的顺序逐个地写出乘积中的因子 a 和 b: aa a ? bb b ? aa a ? 共 α 1 个 共β 1 个 共 α 2 个 这就是出现 α 个相同元素 a 与 β 个相同元素 b 的 n 个元素的排列。 这些元素排列种数的多少 与从 n 个 a + b 的连乘式中得到的项 P 一样。 n! 。 但是,其中出现一类α个相同元素和另一类β个相同元素的n个元素的排列种数是 α! β ! 这就是乘积aαbβ经常出现在二项展开式中的情况,因此, n! C= 。 α! β ! 在展开式中的这一公式中an和bn两项是明显的例外,它们每一项只出现一次。为了消除 这一例外,令符号 0!表示 1;便能和公式协调一致地把an和bn的系数分别写成
n! n! 和 。 n!0! 0! n!
19

算术题

个别地形成乘积P的可能性也能以几何形式表示。例如,上述第一种可能性以下列方法 表示:用α1个连续线段a来标出一段水平距离,从这个距离的末端延伸一段垂直距离即β1个 连续线段b,从这个垂直距离的末端延伸第三段水平距离 E 等等。 同样地表示形成P的其它可能性, 即α2个连续线段a, 因此,从同一点开始描绘所有C个相同Z形的轨迹,这些 迹线表示C种可能性。这样,如要找出(a + b)18的二项展 开式中具有a11b7形式的的全部乘积数目ν的话,就画出一 个由 11×7 个矩形格子组成的矩形网络, 每格水平边为a, 垂直边为b, 形成每排为 11 格的 7 个横排, 一排在另一排 的下方(见图 1) 。那么可能性a4b3a7b4(由 4 个括号得a, 由随后三个括号得b, 由其次七个括号得a和由最后 4 个括 F 号得b)用粗实线表示;可能性b2a6b3a2b2a3用虚线表示, 图1 因此,所求的数ν等于从网络的角E引至角F的所有可能的 直接通道数。 这样,先前求得的 C 的公式也为下述有趣算题提供了解答: 某城有 m 条东西走向和 n 条南北走向的街道,从该城的西北角到东南角有多少种走法 (不得迂回)? 由于东西向的街道被分割成 n – 1 段,每段为 a;南北向街道被分割成 m – 1 段,每段为 b;所以,所有可能的通道数是 (m + n ? 2)! 。 (m ? 1)! (n ? 1)! 现在回到二项式定理。 二项式系数 C 的确定立即揭示所求的二项展开式:
( a + b) n = ∑ Ca α b β ,

其中 C= n!

α! β !



这里 α 和 β 适合凡能满足条件 α + β = n 的所有可能的非负整数。 例如,展开(a + b)5,得出:
( a + b) 5 = a 5 + 5! 4 5! 3 2 5! 2 3 5! a b+ a b + a b + ab 4 + b 5 4!1! 3!2! 2!3! 1!4!

或 (a + b)5 = a5 + 5a4b + 10a3b2 + 10 a2b3 + 5ab4 + b5。 通常写法用
n(n ? 1)(n ? 2) 1? 2 ? 3 ? ( n ? α + 1) ?α

代替

n!

α! β !

,并简写系数nα。从而获得展开式的较简化的形式:

(a + b)n = an + n1an–1b + n2an–2b2 +…+ bn。 系数nν被称为下标ν以n为底的二项式系数。 二项式定理可能是十一世纪波斯天文学家 O·卡亚姆(Omar Khayyam)所发现,他至少 可以因为他发现了前人所未能解出的所有(正整数)幂 n 的展开式而引以自豪。 注:上述推导很容易推广到多项式 a + b + c +…的 n 次幂的展开式。例如,对于一个含
20

算术题

有三项的多项式,其多项式定理是: (a + b + c) n = ∑ n! aα b β cγ 。 α ! β !γ !

这里总和 Σ 包括凡满足条件 α + β + γ = n 的正整数指数 α、β、γ 的所有可能项。

第10题 柯西的平均值定理
求证几个正数的几何平均值小于这些数的算术平均值。 A·L·柯西(Augustin Louis Cauchy,1789 – 1857 年)是最伟大法国数学家之一。关于算 术平均值和几何平均值的定理见于他 1821 年出版的著作①。 这里要介绍的该定理的证法是以基本算题——总和为常数的 n 个正整数, 何时其乘积有 最大值——的解法为基础的。 令 n 个数为 a,b,c,…,它们的总和为常数 K,它们的乘积为 P。用各种不同数验证 的结果,当数 a,b,c,…等都具有相同数值 M =
K 时,乘积 P 有最大值。 n

为了证明这个假设的正确性,利用辅助定理;在两对其和相等的数中,两数之差较小的 一对具有较大的乘积。 (若 X 与 Y 表示一对,x 与 y 表示另一对,且 X + Y = x + y, 辅助定理可从下列等式得到: 4XY = (X + Y)2 – (X – Y)2, 4xy = (x + y)2 – (x – y)2, 其中,两个等式的右边的被减数相等,右边数值较大的是其减数较小的那个。 ) 若n个数a,b,c,…并不都相等,那么,至少有一个数,例如a必定大于M;且至少有 一个数,例如b,必定小于M。现在组成N个数的一个新序列,a′,b′,c′,…,使(1)a′ = M; (3)其它数c′,d′,e′,…相当于c,d,e,…。 (2)对子a,b的和与对子a′,b′ 的和相等; 那么新的数具有与老的数相同的和K,但根据辅助定理a′b′ > ab,新的数具有较大的乘积P′ = a′b′c′…。 若数 a′,b′,c′,…不都等于 M,那么至少有一个,设其为 b′,大于(小于)M;并至 少有一个,设其为 c′,小于(大于)M。现在再组成一个 n 个数的新序列 a″,b″,c″,d″,…, 使(1)a″ = a′ = M; (2)b″ = M; (3)对子 b′,c′和对子 b″,c″具有相同的和; (4)d″,e″,… 相当于 d′,e′,…。那么数 a″,b″,c″,…具有和数 a′,b′,c′,…相同的和 K,但根据辅助 定理 b″c″ > b′c′,所以具有较大的乘积 P″ = a″b″c″…。 这样继续下去,便得到一个递增乘积的数列 P,P′,P″,…,其中,每一后继项大于前 一项,这由于它至少多乘一个因子 M,按这种方式得到最后一个乘积是所有乘积的最大者, 且含有 n 个相等因子 M。因此, P < Mn, 这导出了下述定理: 总和为常数的 n 个正数,当各数都相等时,其积最大。 若将上面的最后一个不等式取 n 次方根,并以其值各有大小的数 a,b,c,…表示 P 和 M,便得到柯西公式:
n

abc

<

a+b+c+ n



将这个公式用文字表达如下:
21

算术题

算术与几何平均值的定理: 几个正数的几何平均值总是小于这些数的算术平均值, 除非 这些数相等,此时两个平均值亦相等。 注 1:柯西定理可直接导出上述极值定理的逆定理; 乘积为常数的 n 个正数,当它们数值相等时,其和最小。 证:设 n 个数为 x,y,z,…,他们的乘积为定值 K,它们的可变和为 s,并设 k 的 n 次方根为 m。 根据柯西定理:
x+ y+z+ n ≥ n xyz



因此, s ≥ nm, 其中等号仅当 x = y = z = …时适用。证毕。 上述两个极值定理成为许多涉及最大值和最小值问题的简单解法的基础(参阅第 54, 92,96,98 等题) 。 注 2:柯西定理也直接为指数函数xc提供一个重要的指数不等式。 若 a 是不等于 1 的任意正数,n 是一个大于 0 的整数,m 是一个大于 n 的整数,那么, 其中 n 个具有数值 a, 而其它 m – n 个具有数值 1 的 m 个数的几何平均值小于这 m 个数的算 术平均值
na + m ? n 或 m
m

an <1+

n (a ? 1) , m

或者,若用 ε 代替

n ,则 m

(1) aε < 1 + ε(a – 1)。 在这个不等式中,ε 是任意正的有理真分数。下面证明这个不等式对于任意无理真分数 i 也 适用。 首先,aJ > 1 + J(a – 1)不能在J为任意无理真分数时都成立。如果成立,就有可能找到一 个有理真分数R < J而如此接近J,以致aR与aJ之差,及 1 + R(a – 1)与 1 + J(a – 1)之差,小于 譬如 aJ = 1 + J(a – 1) 的
1 。这时,aR仍将大于 1 + R(a – 1),而根据(1) ,这是不可能的。 4

设 z 是一个非常小的数,以致 i + z 和 i – z 都是正真分数。那么, a z + a ?z 2 z –z (由于根据柯西公式,a 和a 两数的算术平均值大于 1)或 ai < ai ? ai < 但根据前面的关系式, ai+z ≤ 1 + (i + z)(a – 1), ai–z ≤ 1 + (i – z)(a – 1), 所以 a i+ z + a i? z ≤ 1 + i (a ? 1) ; 2
22

a i+ z + a i? z 。 2

算术题

这样,下式肯定成立: ai < 1 + i(a – 1)。 因此,不等式(1)对任何真分数 ε 都成立。 1 (1)变 若用 代替(1)中的 ε,用 b 代替 1 + ε(a – 1),即用 1 + μ(b – 1)代替 a,那么,

μ

成: (2) bμ > 1 + μ(b – 1), 其中,μ 为任意正假分数,b 为任意整数。 结论:指数不等式。若 x 为任意正数,c 为任意正数指数,指数不等式为: 当指数为真分数时,xc <1 + c(x – 1); 当指数为假分数时,xc >1 + c(x – 1)。
① Cour d’Analyse,第 458 – 459 页

第11题 柏努利幂之和的问题
确定指数 p 为正整数时最初 n 个自然数的 p 次幂的和 S = 1p + 2p +…+ np。 用这种一般式表示的问题, 最先在 1713 年出版的瑞士数学家 J·柏努利 (1654 – 1705 年) 的一部著作中得到解答①。 下述巧妙的解法是以二项式定理为基础的。 展开二项式(x + ζ)ν,得到数ζ 1,ζ 2,ζ 3,…,ζ p,在一定的条件下,这些数可看作是取 决于ν的未知数而不管它是ζ的幂。用研究这些数的方法对S的推导可以惊人地得以简化。 根据二项式定理,若 P 可用以表示数 p + 1,则有: (v + ζ)P = vP + Pvpζ1 + P2vp–1ζ 2 +… 以及 (v + ζ – 1)P = vP + Pvp(ζ– 1)1 + P2vp–1(ζ– 1)2 +…。 二式相减,得: (I) (v + ζ)P – (v + ζ – 1)P = Pvp + P2vp–1[ζ 2 – (ζ– 1)2] + P3vp–2[ζ 3 – (ζ– 1)3] +…。 现在我们用下列等式: (1) (ζ– 1)2 = ζ 2, (2) (ζ– 1)3 = ζ 3, (3) (ζ– 1)4 = ζ 4, 等等来规定未知数ζ 1,ζ 2,ζ 3,…。这样就将(I)式化简为 (Ia) Pvp = (v + ζ)P – (v + ζ – 1)P。 用 v = 1,2,3,…,n,代入该方程,由此得到 P · 1p = (1 + ζ)P – ζP, P · 2p = (2 + ζ)P – (1 + ζ)P, … p P P · n = (n + ζ) – (n – 1 + ζ)P。 将上述 n 个方程相加,得: (II) PS = (n + ζ)P – ζP 或

23

算术题

(II)

1p + 2 p +

+ np =

(n + ζ ) P ? ζ P

P



其中 P = p + 1。 右端的数ζ 1, 2, 3, ζ ζ …得自二项式(n + ζ)P展开式的这一公式, 由等式 (1) , , , (2) (3) … 所规定,它给出了所求的幂之和。 为了在n = 1,2,3,4 的情况下应用此公式,我们首先要根据方程(1)(2) , ,…确定 1 2 3 4 未知数ζ ,ζ ,ζ 与ζ 。 由(1)式可知 – 2ζ 1 + 1 = 0, 即:

ζ1 =
进而由(2)式得:

1 。 2

– 3ζ 2 + 3ζ 1 – 1 = 0, 即:

ζ2=
又由(3)式知

1 。 6

– 4ζ 3 + 6ζ 2 – 4ζ 1 + 1 = 0, 即: ζ 3 = 0。 最后由式(ζ – 1)5 =ζ 5得:

ζ 4 =?
数ζ 1 =
1 ,ζ 2
2

1 。 30

=

1 ,ζ 3 = 0, ζ 6

4

=?

1 等等,称为柏努利数。 30
2

因此由(II)式得到 1+ 2 + 3+ 12 + 2 2 + 3 2 +
13 + 2 3 + 3 3 +

+n=

(n + ζ ) 2 ? ζ 2

=

n 2 + 2nζ 1 n(n + 1) , = 2 2
2

+ n2 =
+ n3 =

(n + ζ ) 3 ? ζ 3 n 3 + 3n 2ζ 1 + 3nζ = 3 3
4

=

n(n + 1)(2n + 1) , 6
? n(n + 1) ? =? ? , ? 2 ?
2

(n + ζ ) 4 ? ζ 4

=

n 4 + 4 n 3ζ 1 + 6 n 2 ζ 3

2

+ 4 nζ 3

(n + ζ ) 5 ? ζ 5 n 5 + 5n 4ζ 1 + 10n 3ζ 2 + 10n 2ζ 3 + 5nζ 4 pst , = = 4 3 30 其中 p = n(n + 1),s = 2n + 1,t = 3p – 1。 S 如果(II)式中 n 无限增大,S 同样无限增大,但比值 P 为有限数值。事实上,根据 n 二项式定理, (II)式可写成 14 + 2 4 + 3 4 + + n4 = PS = nP + Pζ 1nP–1 + P2ζ 2nP–2 +… PS = n P + Pζ 1 n P ?1 + P2ζ 2 n P ? 2 + 因此 ,

24

算术题

S 1 ζ 1 P2ζ 2 = + + + 。 n nP P Pn 2 如果 n 无限增大,右边的所有分数除第一项外均为无限小,就得到幂之和的极限等式:

(III)

1p + 2 p + + n p 1 = 。 p +1 n →∞ p +1 n lim

这一重要极限方程也可以由指数不等式(参见第 10 题)推导出 xP > 1 + P (x – 1)。 这一推导优于刚才的推导之处,就是不仅对正整数而言,而且对任意正指数 p 也都成立。 如果先用一假分数
V v 取代指数不等式中的 x,然后用真分数 消去分母,则得 v V

VP > vP + Pvp(V – v) 及 vP > VP – PVp(V – v) 或 V P ? vP < PV p 。 V ?v 将一系列数(1, 0),(2, 1),(3, 2),…,(n, n – 1)代入新不等式中一对数(V, v),得到: P · 0p < 1P – 0P < P · 1p, P · 1p < 2P – 1P < P · 2p, … p P P · (n – 1) < n – (n – 1)P < P · np。 将这 n 个不等式相加,得: P(S – nP) < nP < PS 或 S 1 1 1 < P < + 。 P n P n Pv p < 由于得商

S 1 在两界之间,当 n = ∞时其值为 ,则有 P P n 1p + 2 p + + n p 1 = , n →∞ p +1 n p +1 lim

(III)

式中 p 表示任意正数。 如果代入函数xp的平均值,则幂之和的极限等式还可以由另外的形式得到。 某一区间上函数的平均值通常理解为极限值, 即当 n 无限增大时, 该区间上均匀分布的 函数之 n 个值的平均值无限趋近此极限。因此,如果以 δ 为 x 的第 n 部分,则函数 f(x)在区 间 0 到 x 上的平均值 M 就是商

μ=

f (δ ) + f ( 2δ ) + n
x 0

+ f ( nδ )

当 n = ∞时的极限值。我们将这一平均值记作 M f ( x) 。 因此,在区间 0 到x上函数x 的平均值就是
p

μ=

δ p + (2δ ) p +
n

+ (nδ ) p



p

?

1p + 2 p + n

+ np

25

算术题

的极限值,因为

δ=
所以该值也就是

x , n

μ = xp ?
的极限值。

1p + 2 p + + n p n p +1

由于根据(III)式右边分式的因子极限为
x

1 ,因此所求函数xp的平均值为 p +1

(IIIa)

Mx p =
0

xp ; p +1

此公式与(III)式基本上没有区别。 公式(III)或(IIIa)广泛用于几何学和物理学中。
① Ars conjectandi

第12题 欧拉数
求函数 1? 1? ? ? ? ( x ) = ?1 + ? 及 Φ ( x ) = ?1 + ? x? x? ? ?
x x +1

当 x 无限增大时的极限值。 这一饶有兴趣的问题的最简单解法,是以指数不等式(参见第 10 题) xε < 1 + ε(x – 1) 为基础的。其中 x 是任意正数,ε 是 0 到 1 之间的任意真分数。 引入两个满足条件 a > b,b > 0 的任意正整数 a 与 b,将其代入指数不等式中,首先令:
x =1+ 1 b ,ε = ; b a

再令:
x =1? 1 b +1 ,ε = 。 a +1 b +1
b

在第一种情况下得

1?a 1 ? ?1 + ? < 1 + b? a ?
或 (1) 在第二种情况下, 1? 1? ? ? ?1 + ? < ? 1 + ? , b? a? ? ?
b a

1 ? a +1 1 ? <1? ?1 ? ? a +1 ? b + 1?
26

b +1

算术题

或 ? b ? ? ? ? b + 1? 或者最终得到 (2) 1? ? ?1 + ? b? ?
b +1 b +1

? a ? <? ? ? a + 1?

a +1

1? ? > ?1 + ? a? ?

a +1



所得两个不等式(1)和(2)包含了一条著名的定理: 1? 1? ? ? 当一个正的自变量 X 增加时,函数 ? ( X ) = ?1 + ? 递增,而函数 Φ ( X ) = ?1 + ? X? X? ? ? 减。 因此,对于 X > x φ(X) > φ(x),而 Φ(X) < Φ(x)。 另一方面,由于自变量取相同值时函数 Φ 大于函数 φ 1? ? ( Φ ( x ) = ?1 + ? ? ? ( x ) ) x? ? 因此得不等式 φ(x) < φ(X) < Φ(X) 以及 φ(X) < Φ(X) < Φ(x), 亦即函数 Φ 的每个值均大于函数 φ 的每一值(仅当所考虑的自变量取正值时) 。 假设有一正数轴,两动点 p 和 P 在数轴上,当时间为 t 时,距零点的距离分别为 φ(t)和 Φ(t),在瞬时速度 t = 1 时两动点开始移动。点 p 由 φ(1) = 2 开始向右连续移动,点 P 由 Φ(1) = 4 开始向左连续移动。然而由于 Φ(t)总是大于 φ(t),亦即 P 总是朝 p 的右侧移动,而两点 决不相遇。但是两者之间的距离缩短了
d = Φ (t ) ? ? (t ) = (t ) 。 t
X X +1



由于 φ(t) < 4, d <

4 是一个随时间的增大而无限变化的数,从而两动点最终相距为无穷小。 t

要表达这种情况,只有假定数轴上 2 和 4 之间存在着一个定点,动点 p 和 P 分别从左 侧和右侧无限逼近半永不触及这一定点。该定点到零点的距离就是所谓的欧拉数 e。最先由 欧拉建议用字母 e 命名这个数,这个数也就是自然对数的底(参见第 14 题)①。 对于欧拉数,重要不等式 (I) 1? 1? ? ? ?1 + ? < e < ?1 + ? x? x? ? ?
x x +1

成立(x 为任意大于零的正数) 。 如果选择 x = 1000,000, 由不等式可求得精确到五位小数的 e 值。 然而, 运用 e 级数 (参 见第 13 题)是一种较好的运算方法。 从而我们得到 e = 2.718281828459045…。 而所求的极限值是

27

算术题

1? ? lim ?1 + ? = e , x → ∞? x? 1? ? lim ?1 + ? x → ∞? x?
x +1

x

=e,

第一个极限为上限,第二个为下限。 注:由关于e的不等式(I)可直接得到关于指数函数ex的不等式。 1.在不等式 1? ? ?1 + ? < e x? ? 中,我们用
1 取代x,此处P是大于零的任意正数;对于e的幂eP,得到: P
x

(1) 2.在不等式

XP > 1 + P。
x +1

1? ? e < ?1 + ? x? ? 中, ? 用

1 1 1 取代 x + 1 , 这样就以 取代 1 + , n为不等于零的负的真分数, 对于e的幂en我 n n +1 x

们得到 (2) en > 1 + n。 3.假定对于每一个负的假分数 N,1 + N 为负数,必然有 (2) eN > 1 + N。 联列不等式(1)(2)(3) , , ,则得到指数函数的不等式: ex > 1 + x 上式对于 x 的每一个有限的实数值都是成立的,只有当 x = 0 时才成为等式。 从已得到的不等式可直接导出通常所说的指数函数的极限等式。 令 x 为任一有限的实数,n 为一个使 1 ±
x

x 为正数的正数。根据指数函数的不等式 n x n

en >1+


x 。 n x 将上两不等式分别取 n 次幂,而对于第二式,以 1 + 乘两边以后再取 n 次幂,其结果为: n e
? x n

>1?

x? ? e x > ?1 + ? n? ? 及

n

x ? ?x ? x2 ? ? ?1 + ? e > ?1 ? 2 ? 。 ? n? n ? ? ? ?
28

n

n

算术题

联合所得诸不等式,则得:

? x2 ? x ? x ? e < ?1 + ? < e x 。 ?1 ? ? ? ? n ? n? ? ?
进而如果允许n无限增大,不等式左边变换成ex,便得到指数函数的极限等式: x? ? lim ?1 + ? = e x , n → ∞? n? 其中 x 为任意的有限实数,n 为无穷增大的数。
① Commentarii Academiae Petropolitanae ad annum 1739, vol. IX
n

n

第13题 牛顿指数级数
将指数函数ex变换成各项为x的幂的级数。 通常称为指数级数的这种幂级数, 事实上可认为是数学里最重要的级数, 它是由英国伟 大的数学家和物理学家牛顿(1642 – 1727 年)所发现的。他的包含正弦级数、余弦级数、 反正弦级数、对数级数、二项级数以及指数级数的这篇著名论文写于 1665 年①。然而牛顿 指数级数的解法不太严谨且过于复杂。 下面的解法是以函数xn(见第 11 题)和函数ex的平均值为基础的。 借助于指数函数不等式 (1) eu > 1 + u (见第 12 题) ,可求得函数ex的平均值。 考虑指数函数自变量的两个连续值 v 和 V = v + φ > v,并且先以 u = φ 然后以 u = –φ 代 入(1) ,分别得到 eφ > 1 + φ及e–φ > 1 – φ。 分别乘以ev及eV,则得 eV > ev + φev及ev > eV – φeV。 合并得 (2) ex在区间 0 到x上的平均值就是商 e δ + e 2δ + e 3δ + + e nδ x (δ = ) n n 当 n 无限增大时的极限值。为了求 μ,当 x 是正数时,将一对数(v, V)相继以 (0, δ),(δ, 2δ),(2δ, 3δ),…,((n – 1)δ, nδ) 代入(2)式,将所得 n 个不等式相加,得到 ev < eV ? e v < eV 。 V ?v

μ=

nμ + 1 ? e x < 或者解出 μ,

ex ? 1

δ

< nμ

ex ?1 ex ?1 ex ?1 <μ< + (x > 0) 。 x x n 当 x 为负数时,将(v, V)相继以 (δ, 0),(2δ, δ),(3δ, 2δ),…,(nδ, (n – 1)δ)

29

算术题

代入(2)式,再将所得 n 个不等式相加,则可导出相同的最终不等式,只不过两端需要相 互对调。因而此时记作 ex ?1 ex ?1 ex ?1 + <μ< (x < 0) 。 x n x 如果允许两个不等式中的 n 无穷增大,则关于极限 lim μ,得值 (3) 式中 x 可为正数或负数。 现在求ex展开的级数。 我们从不等式 ex > 1 + x 开始。先假定 x 为正数,求得两端的平均值,得 ex ?1 x >1+ x 2 或 ex >1+ x + 重复求平均值,则得到 ex ?1 x x2 >1+ + x 2 3! 或 ex >1+ x + 按次方法连续进行,得到 (4) ex >1+ x + x2 x3 + + 2! 3! + xn 。 n! x2 x3 + 。 2! 3! x2 。 2! M ex =
0 x

ex ?1 , x

为了求得ex的上限,仍从不等式 ex > 1 + x 开始。以ex乘两端,得 1 > ex - xex 或 ex < 1 + xex。 在以下求取平均值的时候,我们运用了不证自明的定理: “两个(正)函数 u 与 v 的积之平 均值小于 u 的平均值与在所讨论的区间上 v 的最大值之乘积。 ” x 第一步(u = x,v = e ) ,得到 ex ?1 x <1+ ex x 2 或 ex <1+ x + 第二步( u = x2 ,得到 ,v = ex) 2 ex ?1 x x2 x <1+ + e x 2 3!
30

x2 x e 。 2!

算术题

或 ex <1+ x + 等等,最后 (5) x2 x3 + + 2! 3! 这样,当考虑 x 为复数时,问题会简单些。 由ex > 1 + x,如上述所知 ex <1+ x + ex ?1 x >1+ ; x 2 然而,因为 x 为负数, ex <1+ x + 下一步求平均值,得 ex ?1 x x2 <1+ + x 2 3! 或 ex >1+ x + 再下一步 ex <1+ x + 等等,最后得到 (6) 及 (7) x2 x3 x4 + + , 2! 3! 4! x2 x3 + , 2! 3! x2 。 2! + xn x e 。 n! x2 x3 x + e 。 2! 3!

ex >1+ x +

x2 x3 + + 2! 3!

+

x 2v ?1 (2v ? 1)!

ex <1+ x +

x2 x3 + + 2! 3!

+

x 2v 。 (2v)!

由不等式(4)(5)(6)(7)得到: , , , 当x为正数时,ex的值介于 1+ x + 与 1+ x + 之间。当x为负数时,ex的值介于 1+ x + 与 x2 x3 + + 2! 3! + xn n! x2 x3 + + 2! 3! + xn x e n! x2 x3 + + 2! 3! + xn n!

1+ x +

x2 x3 + + 2! 3!

+

x n +1 (n + 1)!

31

算术题

之间。 因此,如果我们写成 (8) ex =1+ x + x2 x3 + + 2! 3! + xn , n!

因此的误差对于 x 为正数时小于

x n +1 xn x (e ? 1) ,对于 x 为负数时则小于 。 n! (n + 1)!

xn 趋向于零。 (根据第 10 题,2(n – 1),3(n n! – 2),…,(n – 1) · 2 中每个乘积都大于 1 · n。因而这些积的乘积将大于nn–2,亦即 (n – 1)!2 > nn–2, 或 n!2 > nn 或 但是,对于x为有限值而n无限增大时,分数 n! > n n 。 因此得出 xn x < 。 n! n 如果给定 n 的值使 n 大于|2x|,则 xn x < n! n 及 xn =0。 ) n → ∞ n! 当 x 无限增大时,公式(8)所引起的误差因此而消失。所以对于每一个有限的值 x, lim 级数 (9) ex =1+ x + x2 x3 + + 2! 3!
n n

?1? <? ? ? 2?

n

成立。 注:所得到的级数特别适用于计算欧拉数 e。例如,若令 x 等于 1,
e =1+ 1 1 + + 1! 2! + 1 = 2.7182818012 10!

所引起的误差为
F= 1 1 1 + + + 11! 12! 13! = 1 1 1 (1 + + + 12 12 ? 13 11! ),

它小于
1 1 1 1 (1 + + 2 + 3 + 11! 12 12 12 ),

或者小于

32

算术题

1 12 ? < 0.00000008 。 11! 11

精确值为 e = 2.71828182845904504523536…。 应用于每一实数值 x 的公式(9) ,可假定进行推广到包括复变量 z 在内的指数函数。 z 求复变量z的指数函数e 可由公式 (10) ez =1+ z + z2 z3 + + 2! 3!

直至无穷来确定。 显然,对于每一有限的 z 值,式(10)右侧的无穷幂级数具有给定的有限值,换言之, 对每一限定的 z 值,该级数收敛: 令 1+ z + z2 z3 + + 2! 3! + zn = E n ( z) , n!

z n +1 z n+2 + + (n + 1)! (n + 2)!
因此

+

z n+v = Ev ( z) , (n + v)!

En+v(z) – En(z) = Rv(z)。 若以ζ表示z的绝对值,则Rv(z)的绝对值小于

ζ n +1
(n + 1)!
这必然远远小于

+

ζ n+2
(n + 2)!

+

+

ζ n+v
(n + v)!

ζ n +1
(n + 1)!

+

ζ n+2
(n + 2)!

+

= e ζ ? E n (ζ ) 。

根据(8)或(9) ,因为当选择足够大的n时,eζ – En(ζ)可以取得理想的小,无论v值多大, 对于同样的n,Rv(z)也一定可以取得理想的小。然而这意味着级数 z2 z3 + + 2! 3! 收敛(事实上,该级数是绝对收敛,即当 z 换成绝对值 ζ 时,该级数仍然收敛) 。 此外,令 a 和 b 为两个任意实数或复数,其绝对值为 α 和 β,且 α + β = γ。将 1+ z + E n (a ) = 1 + a + 与 E n (b) = 1 + b + 相乘,得到 En(a)En(b) = 1 + C1 + C2 +…+ C2n, arbs 的所有各项的和,其中r与s之和为v。只要v值不超过n,所有v + 1 对正的指 r!s! 数值(r,s)存在于Cv之中,且两指数之和为v。而当v > n时,只有一部分如此。因此,根据二 项式定理(见第 9 题) Cv表示形为
33

a2 a3 + + 2! 3! b2 b3 + + 2! 3!

+

an n! bn n!

+

算术题

对于 v ≤ n
Cv = 1 ( a + b) v , v! 1 v γ 。 v!

对于 v > n
Cv <

所以En(a)En(b)的前n + 1 项之和等于En(a + b),后n项绝对值之和小于Rn(γ),即必定小于

γ n +1
(n + 1)!

+

γ n+2
(n + 2)!

+

= e γ ? E n (γ ) = δ ,

因此,我们可令其等于 εδ,|ε| < 1。 从而得到方程 En(a)En(b) = En(a + b) + εδ。 如果我们进而让方程中的 n 变成无穷大,δ 为零,方程就化成 (11) eaeb = ea+b。 这一基本公式证明我们先前假定以级数 1+ z + z2 z3 + + 2! 3!

作为ez是正确的。 现令z = x + yi,x,y均为实数。根据(11)式,ez=ex · eyi或
y2 y3 y4 y5 y6 ez i+ i? = e yi = 1 + yi ? ? + + x 2! 3! 4! 5! 6! e y2 y4 y6 y3 y5 y7 = (1 ? + ? + ) + (y ? + ? + )i。 2 4 6! 3! 5! 7! 根据第 15 题,括号内为 cos y 与 sin y,因而得到欧拉公式: (12) ex+yi = ex(cos y + i sin y), 当 x = 0 时,欧拉公式为 (12a) eyi = cos y + i sin y。 如果在(12a)式中 y = π,我们得到两个数 e 与 π 之间著名的欧拉关系 eπi = –1 如果在(12a)式中再以– y 代替 y,则得 (12b) e–yi = cos y – i sin y。 依次将式(12a)和(12b)相加、相减,得到同样著名的一对公式

cos y =


e yi + e ? yi e yi ? e ? yi , sin y = 。 2 2i

De analysi per aequationes numero terminorum in finitas

第14题 麦凯特尔对数级数
不用对数表,计算一个给定的对数。 作为建立对数表的基础的这一基本算题,可以由对数级数得到简便的解答。 x? x2 x3 x4 + ? + 2 3 4 ,

34

算术题

这是一个表示 1 + x 自然对数的最简单的对数级数,最早发表在荷尔斯太因数学家 N·麦凯特 尔(Nicolaus Mercator,1620 – 1687 年)的书中①,他真名叫考夫曼(Kaufmann) 。为了对 数级数的推导,我们将用到函数 f ( x) =
1 的平均值,因此要先将它确定。 1+ x

我们从上题不等式(2)开始,先将这个不等式转换成一个自然对数 ln x 的对数函数的 不等式(ln x 是以欧拉数 e 为对数体系的底的 x 的对数,亦即该对数为 e 的幂求 x) 。 v V 因此,可用ln u及ln U代替v及V(U > u > 0) ,相应地用u及U代替e 及e ,得到:
u< U ?u <U ln U ? ln u

或 (1) 函数 f ( x) =
1 ln U ? ln u 1 。 < < (U > u > 0) U U ?u u 1 的平均值就是分数 1+ x

μ=
当 n 无穷增大且 δ =

f (δ ) + f (2δ ) + n

+ f ( nδ )

x 时的极限值。 n

为了确定 x 分别为正数及负数时的极限值 lim μ,用(1 + vδ, 1 + (v – 1)δ)分别代替(1)式 中的一对值(U, u)及(u, U),然后分别以 v = 1,2,3,…,n 代入(1)式,将所得 n 个不等 式相加,则得到两种情况:
ln(1 + x)

δ
换言之, μ 介于

介于 nμ 与 nμ +

x 之间, 1+ x

ln(1 + x) x ln(1 + x) ? 和 之间。 x x n(1 + x)
x

因此,如果 n 为无穷大,则有: (2)
M
0

ln(1 + x) 1 , = x 1+ x

式中 1 + x 通常认为是正数。 现在推导 ln(1 + x)的级数。 如果用 1 – x f 取代该等式右边的 f,则有 f = 1 – x + x2 f。 再用 1 – x f 取代右边的的 f,得到 f = 1 – x + x2 – x3 f。 同样,可得 f = 1 – x + x2 – x3 + x4 f, 等等。一般地, f = 1 – x + x2 – x3 + x4 +…+ (– 1)nxn–1 + (– 1)n+1xn f。 由此公式可以求平均值,则有 (3) ln(1 + x) x x2 x3 x n ?1 =1? + ? + + (?1) n + (?1) n +1 Mx n f 。 x 2 3 4 n 如果用F代表假定f在区间 0 到x上时的最大值(因此,x为正数时F = 1,x为负数时

35

算术题

F=

xn 1 ) ,那么,就绝对值而言,xn f的平均值必然小于xn的平均值 的F值。拒此可写 n +1 1+ x Mx n f = ΘF xn , n +1



式中 Θ 为一个确定的正的真分数。 将(3)式变换成 ln(1 + x) = x ? 其中 x n +1 。 n +1 因为 n 趋向于无穷大,如果 x 为一个真分数(x = 1 时亦然)“余项”R 趋近于零。 , 因此,当 x 为真分数,以及 x = 1 时,级数 R = (?1) n ΘF (4) ln(1 + x) = x ? x2 x3 x4 + ? + 2 3 4 x2 x3 x4 + ? + 2 3 4 + (?1) n +1 xn + R, n

成立。等式右边的级数即为麦凯特尔级数。 由于上式仅当 x 为真分数时成立, 故它不适用于计算任意的对数。 为了求得符合这一要 求的级数,我们用 ? x 代换(4)式中的 x,得 (5) (4)式减去(5)式得 ln(1 ? x) = ? x ? x2 x3 x4 ? ? ? 2 3 4 。

ln

? x3 x5 1+ x = 2? x + + + ? 1? x 3 5 ?

? ?。 ? ?

对于 x 为每一个正真分数或负真分数值, X = 式可写成 (6) 其中
x=

1+ x X ?1 都为正数,同时 x = 亦然,所得公 1? x X +1

? x3 x5 ln X = 2? x + + + ? 3 5 ?
X ?1 。 X +1

? ?, ? ?

对于每个正的 X,这一新级数收敛。 用两个任意正数的商
Z 代换这一级数中的 X,得: z

? Q3 Q5 Q7 ln Z ? ln z = 2? Q + + + ? 3 5 7 ?
其中
Q= Z?z 。 Z+z

? ?, ? ?

此级数就是对数表赖以计算出的对数级数,级数中 Z 和 z 可为任意两个正数。
36

算术题

例如为了计算 ln 2,可令 z 等于 1,Z 等于 2,得 1 1 1 ?1 + + + ln 2 = 2? + 3 5 5?3 7 ? 37 ?3 3?3 为了计算ln 5,可令z = 125 =53,Z = 128 =27,得

? ?。 ?

? Q3 Q5 Q7 7 ln 2 ? 3 ln 5 = 2? Q + + + ? 3 5 7 ?
其中
Q= 3 。 253

? ?, ? ?

为了计算ln 3,假定z = 80 = 5 · 24,Z = 81 = 34,因此 ln z = ln 5 + 4 ln 2 , ln Z = 4 ln 3 , 得

? Q3 Q5 Q7 4 ln 3 ? ln 5 ? 4 ln 2 = 2? Q + + + ? 3 5 7 ?
其中
Q= 1 。 161

? ?, ? ?

为了计算ln 7,令z = 2400 = 25 · 52 · 3,Z = 2401 = 74,得到

? Q3 Q5 Q7 4 ln 7 ? 5 ln 2 ? 2 ln 5 ? ln 3 = 2? Q + + + ? 3 5 7 ?
其中
Q= 1 。 4801

? ?, ? ?

括号内的级数收敛很快,亦即只需要求少数几项就可以相当精确地求得级数的和。 注:以 10 为底的常用对数是从自然对数计算得来的。由 10lgx = elnx(= x) 因而利用自然对数得 lg x · ln 10 = ln x 或 lg x = M ln x, 其中
M = 1 = 0.4342944819 ln 10

称为模数,自然对数必须乘以模数才能得到常用对数。
① Logarithmotechnia, (Lodon, 1668)

第15题 牛顿正弦及余弦级数
不用查表计算已知角的正弦及余弦三角函数。 完成所要求运算的最简便方法是运用正弦级数及余弦级数。

37

算术题

对于 sin x 和 cos x 的级数最早见于牛顿的论文①(参见第 13 题) 。文中出现的正弦级数 被转换成现在非常难得研究的反正弦级数。 此处介绍的正弦级数及余弦级数的推导, 是以区间 0 到 x 上函数 sin x 和 cos x 的平均值 为基础的(以下提及的所有角度均以弧度计) 。 函数 sin x 在区间 0 到 x 上的平均值 M 就是商

μ=

sin δ + sin 2δ + n

+ sin nδ 1 。 n

当 n 为无限增大的正整数时的极限值,式中 δ 表示 x 的 但是这个商的分子②具有值
sin m ? sin n sin

δ
2 ,

δ

2

式中 m 为 n 个自变量 δ,2δ,…,nδ 的算术平均值,也就是
n +1 x δ δ= + 。 2 2 2

因此

μ=

sin m sin n sin

δ
2

x 2。

因为当 n 为无穷大时②,右边分数的分母趋近于极限 到
M = lim μ =
n→∞

1 1 x ,而且 lim m 也等于 x ,我们得 2 2

sin

x x sin 2 2 x 2

或 (1) 按同样的方法,运用公式
cos δ + cos 2δ + + cos nδ = cos m ? sin nδ 2 ,
M sin x =
0
x

1 ? cos x 。 x

δ

2

得到 (2)
M cos x =
0
x

sin x 。 x

至此可以很容易得到 sin x 及 cos x 的级数。仍从不等式 cos x < 1 开始,求得两端的平均值,则有

38

算术题

sin x < 1 或 sin x < x。 x

如果再次求得平均值(参见公式[1]及第 11 题) ,得到 x2 1 ? cos x 1 。 < x 或 cos x > 1 ? 2 x 2 再次求得平均值,得 x2 x3 sin x >1? 或 sin x > x ? , x 3! 3! 如此等等。得到 cos x < 1 cos x > 1 ? cos x < 1 ? cos x > 1 ? x2 2! x2 x4 + 2! 4! sin x < x sin x > x ? sin x < x ? x3 3! x3 x5 + 3! 5!

x2 x4 x6 x3 x5 x7 + ? + ? sin x > x ? 2! 4! 6! 3! 5! 7! 等等。这些不等式右边的有理数函数即为函数 sin x 及 cos x 的第一,二,三,…,v 次近似 值。称其为近似值是因为三角函数的精确值的偏差随着指数 v 的增大而逐渐变小,而且当 v 取足够大时误差可以取到理想的小。 明确地说, 两个三角函数中每一个的值介于精确值的两 个邻近近似值之间。因此,如果我们令函数值等于这两个近似值之一,所产生的误差一定小 于形式为 xv xv 的两个近似值之差。然而当 v 取得无穷大时分数 趋近于零(见第 13 题) 。 v! v! 因此下述级数 sin x = x ? cos x = 1 ? x3 x5 x7 + ? + 3! 5! 7! x2 x4 x6 + ? + 2! 4! 6! , ,

对于 x 的有限值成立。 如果这些级数之一在任意点处中断,由此产生的误差小于略去诸项的首项。 借助于这些级数, 就可以计算任意给定角的正弦及余弦。 它们可用来建立对数手册中的 正弦表及余弦表。 为了说明近似的程度,让我们举例来计算 sin 1° = sin x(其中 x = sin 1° = sin x = x ? 由此产生的误差小于 x3 6
π ) 。令 180

x5 ,此分数小于 0.000 000 000 02,因此精确到 10 位时,sin 1° = 120

0.0174524064。 注 1:级数的求和法 S = sin α + sin(α + δ) + sin(α + 2δ) +…+ sin[α + (n – 1)δ]。 用 2 sin

δ
2

乘两边,并根据公式
2 sin

δ

2v ? 1 ? 2v + 1 ? ? ? sin(α + vδ ) = cos? α + δ ? ? cos? α + δ? 2 2 2 ? ? ? ?
39

算术题

来变换右边的每一个乘积。则左边有 δ δ? 2n ? 1 ? ? ? δ? 。 2 S sin = cos? α ? ? ? cos? α + 2 2 2? ? ? ? 由于等式右边为 δ n ?1 ? ? 2 sin ?α + δ ? sin n 2 2 ? ? 故得:
S = sin m ? sin n sin

δ
2 ,

δ

2

式中 m = α +

n ?1 δ 为所有 n 个角 α,α + δ,…,α + (n – 1)δ 的平均值。 2

为了求得级数 Σ = cos α + cos(α + δ) + cos(α + 2δ) +…+ cos[α + (n – 1)δ] 的和,我们再用 2 sin

δ
2

乘两边,但将右边写成
2v + 1 ? 2v ? 1 ? ? ? cos(α + vδ ) = sin ?α + δ ? ? sin ?α + δ ?。 2 2 ? ? ? ?

2 sin

δ
2

那么左边就是
2 Σ sin

δ

δ? δ 2n ? 1 ? n ?1 ? ? ? ? = cos?α + δ ? ? cos?α ? ? = 2 cos?α + δ ? sin n , 2 2 2? 2 2 ? ? ? ? ?

于是得到
Σ = cos m ? sin n sin

δ
2

δ

2

注 2:证明 lim n sin
n→∞

w = w。 n w w w w w w cos = 2 tg cos 2 = 2 tg ? (1 ? sin 2 ) 。 2 2 2 2 2 2

sin w = 2 sin

然而,由于 sin w < w 及 tg w > w,由此得出 sin w > 2 ? 或
sin w > w ? 1 3 w 。 4

w w2 ? (1 ? ) 2 4

因此 sin

w w w 1 w3 w 1 w3 的值介于 与 ? 之间,也就是 n sin 的值介于 w 和 w ? 之间。因此 n n n 4 n3 n 4 n3 w lim n sin = w 。 n→∞ n

① ②

De analysi per aequationes numero terminorum in finites, 1665 – 1666 对此不熟悉的读者可参见本题末注 2 的证明。原注。

40

算术题

第16题 正割与正切级数的安德烈推导法
由法国数学家安德烈(André)创造的推导 sec x 和 tg x 的指数级数的屈折形排列法①, 无疑是最方便的而且最吸引人的方法。 n个数 1,2,3,…,n的屈折排列 ——安德烈称为“交错排列”——是 Q2 P3 这样的一种排列:在所有这些数的值 6 c1,c2,…,cn中,没有一个元素cv的 5 P5 如 值介于两个邻近的值cv–1的cv+1之间, Q6 P1 Q4 P …, 果将点P1, 2, Pn标注在坐标系中, 4 相应的横坐标分别为 1,2,…,n,相 应的纵坐标为c1,c2,…,cn,并将相 3 Q1 P4 继的两点Pv和Pv+1用线段联结,则可得 P6 Q5 一条屈折线,该排列法的名称也就由 2 此而来(见图 2) 。 1 一条屈折线或一个屈折排列,可 P2 Q3 能一开始就上升,或者一开始就下降。 我们约定: 1 2 3 4 5 6 对于 n 个元素,由上升开始与由 下 降开 始一样 具有 同样多 个屈折排 图2 列。 证:令P1P2…Pn为与一屈折排列相对应的屈折线。过其最高点与最低点作横坐标轴的平 行线及中间平行线。 如果我们在中间平行轴上建立屈折线的镜像, 则可得到一条新的屈折线 Q1Q2…Qn或一组屈折线排列,其开端依据第一条屈折线是上升或下降分别为下降或上升。 因此,对每个由上升(或下降)开始的屈折排列,可得到一个相应的下降(或上升)开始的 交错排列。从而对每种形式都有相同的个数。 显然,末端上升和末端下降的屈折线排列也正好同样多。 因此,令n元屈折排列的总数为 2An,则An就表示由上升(或下降)开始(或结尾)的n 元屈折排列的总数。 数An可由周期公式确定。假定n个元素 1,2,…,n的 2An个屈折排列已经给定,我们选 α …, 出最高元素n占有第r + 1 点位置 (从左数起) 的这一排列, 那么n的左侧有r个元素α1, 2, αr,而右侧有s个数β1,β2,…,βs;且 r+s=m=n–1 因为随αr之后的就是最高点n,所以排列α1,α2,…,αr终端下降。而β1位于最高点n的后面, 故排列β1,β2,…,βs从上升开始。 现在由r个元素α1,α2,…,αr组成终端下降的Ar个屈折排列,同样由s个元素β1,β2,…, βs组成起始上升的As个屈折排列。因此,对于n占有r + 1 点位置、n左侧有r个元素α1,α2,…, αr的n个元素就有Ar · As个屈折排列。然而由于除所考虑的组合α1,α2,…,αr之外,尚有许
r 多从m个元素中取r个的其它组合(通常所知共有 C m = m r =

m! 种) ,因此,对于最高元素n r! s!

占有r + 1 点处的n个元素的屈折排列的总数为 , pr = mrArAs(r + s = m) 显然,对于下标r = 0、1、2,如果令A0 = A1 = A2 = 1,该公式也是成立的。

41

算术题

欲求得所有可能的屈折排列数,必须求得从 r = 0 到 r=m=n–1 的所有pr值的表达式,并将所得结果相加,得到

2 An = ∑ p r = ∑ m r Ar As 。
r =0 r =0

m

m

为了更进一步简化这个公式,我们用 (1) 然后变换成

m! 代替mr,并令 r! s!

Av = av 。 v!

2nan = a0an–1 + a1an–2 +…+ an–2a1 + an–1a0, 或者,应用和的符号,变成 (2)
2na n = ∑ a r a s ,

其中 r 与 s 为逐一代入所有可能大于零的整数 r + s = n – 1。 运用循环公式(2) ,就可以由a2开始,由某数前面所有数字来计算数列a0,a1,a2,a3, a4,…中的每一个数。 当an为n!的乘积时,可以由an得到n元屈折排列的一半的数。 对于最简单的情况,我们可以列表: n= an = An = 0 1 1 1 1 1 2
1 2

3
1 3

4
5 24

5
2 15

6
61 720

7
17 315

8
277 8064

1

2

5

16

61

272

1385

例如我们可以确定 4 个元素 1,2,3,4,得到 2A4 = 10 个屈折排列 1324,2143,3142,4132,1423,2314,3251,4231,2413,3412。 由屈折排列 sec x 和 tg x 的级数仅需很短的步骤。 首先我们确定从下标 3 开始的av均是小于
1 的真分数。因为对于n > 2,n元屈折排列的 2 1 。 2

数目小于n元的排列数目,因此必定有 2An < n!,因此
an <

因而无穷级数 y = a0 + a1x + a2x2 + a3x3 +… 又由于 y 的级数是绝对收敛的,故可将其平方,得到

y 2 = ∑ bn x n ?1 ,
n=0



式中b1 = 1,且对所有n ≥ 2 的情况 bn = a0an–1 + a1an–2 + a2an–3 +…+ an–1a0。 根据(2)式,只要 n ≥ 2,总有 bn = 2nan, 因此
42

算术题

y2 = 1 + 2 · 2a2x + 2 · 3a3x2 + 2 · 4a4x3 +…。 若在两端加上 1,得 1 + y2 = 2(a1 + 2a2x + 3a3x2 + 4a4x3 +…) 或 1 + y2 = 2y′。 将这一方程写成
y′ 1 ? =0 2 2 1+ y

并注意到左端为函数
Y = arctg y ? 1 x 2

的导数。但只有当函数 Y 为常数时该函数的导数才为零。所以我们有
Y = arctg y ? 1 x = 常数 。 2

为了确定常数值,令 x 等于零并得到自变量 x 为这一数值时, y = 1, arctg y = 因此常数值为

π
4

,Y =

π
4



π
4

,方程变换成
arctg y =

π
4

+

x 。 2

由此得
?π x ? y = tg? + ? , ? 4 2?

于是我们有级数 (3)
?π x ? tg? + ? = a 0 + a1 x + a 2 x 2 + a 3 x 3 + , ? 4 2? 对于每一 x 值为正或负的真分数时,该级数在任何情况下均成立。 我们以– x 取代(3)式中的 x,得到 ?π x ? tg? ? ? = a 0 ? a1 x + a 2 x 2 ? a 3 x 3 + 。 (4) ? 4 2?

显而易见,两个三角公式
?π x ? ?π x ? 2 sec x = tg? + ? + tg? ? ? ? 4 2? ? 4 2?


?π x? ?π x ? 2 tg x = tg? + ? ? tg? ? ? ? 4 2? ? 4 2?

均成立。 如果我们将(3)和(4)中所示的级数代入上述三角公式的右边,则得到所求的 sec x 和 tg x 的级数: sec x = a0 + a2x2 + a4x4 + 4a6x6 +…, tg x = a1x + a3x3 + a5x5 + 4a7x7 +…。 或者,如果我们回到屈折排列总数的一半(An) ,

43

算术题

sec x = A0 + A2 tg x = A1 x + A3

x2 x4 x6 + A4 + A6 + 2! 4! 6!

, ,

x3 x5 x7 + A5 + A7 + 3! 5! 7! 这两个级数对于 x 值为每一真分数的所有情形均成立。

然而,由于作为复变量 x 的函数 sec x 与 tg x 是 x 的解析函数,且当 x = 趋近于零,所以他们的收敛圆半径为 对于绝对值小于


π
2

时,个别值

π
2



π
2

的每一个 x 值,sec x 与 tg x 的两个指数级数必然收敛。

Comptes Rendus, 1879,及 Journal de Mathématiques, 1881

第17题 格雷戈里的反正切级数
已知三条边,不用查表就三角形的各角。 设 a,b,c 为三角形的各边,α,β,γ 为各角(角度为弧度) ,遂得到众所周知的关系 式:
tg

α
2

=

ρ
u

, tg

β
2

=

ρ
v

, tg

γ
2

=

ρ
w



其中

ρ2 =
因此,

uvw ,u = s – a,v = s – b,w = s – c,2s = a + b + c。 s

α
2



β
2



γ
2

既是正切值为

ρ
u

, ,

ρ
v



ρ
w

的弧度数。记作:

α
2

= arctg

ρ
u

β
2

= arctg

ρ
v



γ
2

= arctg

ρ
w



不言而喻,arctg x 表示正切为 x 的弧度数。函数 arctg x 就称为弧度测量函数。 如能成功地计算出对任意给定的 x 值的弧度测量函数 arctg x 的值,那么可以认为我们 的问题已得到解决。1671 年由英国数学家 J·格雷戈里(James Gregory,1638 – 1675 年)运 用反正切函数的指数级数解决了这道算题。 1 为了推导反正切级数, 要运用函数 f ( x) = 的平均值, 因此我们必须首先加以计算。 1 + x2 在单位圆 R 的一条切线上,从切点 A 作两线段 Ap = v,AP = V,且 Pp = φ = V – v;联 结圆心 O 与 p 及 P,并将距离 Op 与 OP 记作 r 与 R,它们与圆 R 的交点为 q 和 Q,弧 Aq, AQ,qQ 分别记作 w,W,ω。于是我们得到等式 w = arctg v,W =arctg V,ω = arctg V – arctg v。
1 将三角形 OPp 的面积 ? 分为两部分,为此作与 qQ 同心的圆弧 ph 和 PH,使其交 OP 2

与 Op 的延长线于 h 和 H。 因此三角形的面积就大于扇形 Oph 的面积 的面积
1 2 R ω ,因此 2

1 2 r ω 而小于扇形 OPH 2

44

算术题

r2ω < φ < R2ω。 由此可得 1 ω 1 < < 2 2 ? r R 或者如果取代掉φ,ω,r2和R2,可依次记作V – v,arctg V – arctg v,1 + v2,1 + V2[毕达哥拉 斯(Pythagoras)], arctg V ? arctg v 1 1 < < 。 (1) 2 V ?v 1 + v2 1+V 1 为了确定函数 F ( x) = 在区间 0 到 x 上的平均值,也就是求 1 + x2

μ=
的极限值(其中 δ =

F (δ ) + F (2δ ) + n

+ F ( nδ )

x ) ,用(0, δ),(δ, 2δ),(2δ, 3δ),…,((n – 1)δ, nδ)依次代替(1)式中的 n

一对值(v, V),将所得不等式相加,得到 arctg x nμ < < nμ + 1 ?

δ

1 1 + x2

或 arctg x arctg x x2 ? <μ< 2 x x n(1 + x ) 由于可看作 lim n = ∞,该不等式变换成 (2) 现在来推导反正切级数。 首先有
1 x2 , =1? 1 + x2 1 + x2 或者,如果为了简化,用 F 代替 F(x),就是 F = 1 – x2F, 如果用F = 1 – x2F代替该等式右边的F,得到 F = 1 – x2 + x4F。 如果再以F = 1 – x2F代替该等式右边的F,则得 F = 1 – x2 + x4 – x6F。 同理,由此可得 F = 1 – x2 + x4 – x6 + x8F, F = 1 – x2 + x4 – x6 + x8 – x10F, 等等。因此得不等式 1 – x2 + x4 – x6 +…– x4n–2 < F <1 – x2 + x4 – x6 +…+ x4n。 由此得到所求平均值

M
0

x

arctg x 1 = 。 2 x 1+ x

(3) 如果进而令

1?

x2 x4 x6 + ? + 3 5 7

?

x 4 n ? 2 arctg x x2 x4 x6 < <1? + ? + 4n ? 1 x 3 5 7

+

x 4n 。 4n + 1

45

算术题

arctg x = 1 ? 或者 arctg x = 1 ?

x3 x5 x7 + ? + 3 5 7 +

?

x 4 n ?1 4n ? 1

x3 x5 x7 + ? + 3 5 7

x 4 n +1 , 4n + 1

所产生的误差小于(3)式两边界之差

x 4 n +1 。然而,因为当 n 无限增大且 x 为真分数(也 4n + 1 可是 x = 1)时,这一差趋近于零,我们得到级数 arctg x = 1 ?

x3 x5 x7 + ? + (对于 x ≤ 1) 。 3 5 7 这就是格雷戈里公式。如果级数在任意处中断,则所产生的误差小于略去部分的首项。 该级数不能用于 x 为假分数时,因为这时级数不再是收敛的。为了在这样的情况下计算 (4) arctg x,引入 x 的倒数值 y = (5)
1 ,并运用公式 x arctg x + arctg y =

π
2



(如果 arctg x = α,就是 x = tg α,那么由 1 ?π ? =y tg? ? α ? = 2 tg α ? ? 反演之得

π
2

? α = arctg y



π
2

) = arctg x + arctg y 。

根据格雷戈里公式可以求得 arctg y,再根据(5)式求得 arctg x。 但是,即使 x 为一真分数,当 x 逼近于 1 的时候,反正切级数也是不可取的。在这种情 况下,引入 x 的半倒数值 z = (6)
1? x ,并运用公式 1+ x arctg x + arctg z =

π
4



(如果 arctg x = α,就是 x = tg α,则由
?π ? 1 ? tg α tg? ? α ? = ?4 ? 1 + tg α

反演之得

π
4

? α = arctg

1? x 1+ x



π
4

) = arctg x + arctg z 。

因此,可以根据格雷戈里公式求得 arctg z,再根据(6)式求得 arctg x。 注:如在(4)式中令 x = 1,便得到所谓莱布尼兹级数:

π
4
46

=1?

1 1 1 + ? + 3 5 7

算术题

该级数是由莱布尼兹(Leibniz)于 1674 年在与格雷戈里无联系的情况下发现的。 然而用此级数来计算 π 是不适用的。 较佳而合适的方法是运用由英国数学家 J·梅钦 (John Machin)发现并由他与 1706 年发表的另一种级数。梅钦运用了正切等于
tg λ = 1 可得 5 tg 2λ = 2 tg λ 5 , = 1 ? tg 2 λ 12 1 的一辅助角 λ。 5

同理,由此可得
tg 4λ = 2 tg 2λ 120 , = 2 1 ? tg 2λ 119 120 119

变换得
4λ = arctg


arctg 120 1 = 4 arctg 。 119 5 2 ? arctg 119 119 ,而根据公式(6) arctg , 数值为 120 120

根据公式(5) ,该不等式左边数值为
arctg

π

1 1 π ,所以左边就为 + arctg 。因此, 239 4 239

π
4

= 4 arctg

1 1 , ? arctg 5 239 ? ?。 ?

或最终写成
1 1 1 1 ?1 ? ? 1 = 4? ? + ? ??? ? + ? 3 5 3 4 5?5 5 ? 239 5 ?5 3?5 ? ? 239 3 ? 239 运用这一级数,梅钦计算 π 到小数 100 位。

π

第18题 德布封的针问题
在台面上画出一组间距为 d 的平行线,把长度为 l(小于 d)的一根针任意投掷在台面 上,问针触及平行线之一的概率如何? 这个引人注目的问题是由 G·L·勒克莱克(Georges Louis Leclerc)和第一个用几何形式 表达概率问题的 C·德布封(Comte de Buffon,1707 – 1788 年)提出的。 某一事件的概率,通常理解为有利于该事件的情况数与可能出现的情况总数之比。 设所求的概率为 W。 假定针有两个端点 A 和 B。让我们设想将平行线水平方向延长。选取这样两条相邻的平 行线 I 和 II(II 在 I 之下) ,并从 I 线上任意点 P 向 II 线作垂线 PQ(= d) 。 从具有下述三个条件特征的针的特殊位置 ? 开始考虑: 端点 A 落在线段 PQ 上; (1) (2) 针落在 QP 的右侧; (3)针与 QP 产生偏斜并与 AP 成锐角。 假定在上述任意特殊位置时针触及平行线 I 的概率为 w。 首先我们证明 W = w。 如果考虑针的端点 A 触及线段 PQ 的任一端点并且是任意放置的所有位置 ?′(即触及 I
47

算术题

或 II,或者都不触及) ,它使所有可能情况或者所有有利情况的数目都乘以四(对 ? 位置数 相比较而言) 。 因而在所有位置?′ 中,触及两平行线I和II之一的概率同样是w。 如果?′ 的情况中加上以端点B取代停在线段PQ上的终点A的那些位置, 便得到总数为?″ 的位置,这就使可能情况数以及有利情况数都加倍。 因此,在各种位置?″ 中,触及两平行线I、II之一的概率也等于w。 现在,如果在I和II之间用数量非常之大v条等距离依次紧密排列的垂线来代替唯一的垂 线PQ,考察针的一个端点在v条垂线中的任一条上的所有针的位置,因此我们可以用v乘以 。 所有可能情况以及所有有利情况的数目(相对于?″ 而言) 因此, 在针的一端位于平行线 I 和 II 之间各位置中, 针触及两平行线之一的概率仍然为 w。 尚要再增加第三条平行线 III,表示 I 在 II 上的镜像(或 II 在 I 上的镜像) ,这与增加针 的端点落在 III 和 II(或 III 和 I)之间的针的位置是一样的,概率还是 w。 简言之,这就证明了 G W = w。 因此, 问题就可局限于确定在特殊位置时针触及 I l 线的概率 w。 为了取得有关无限多个特殊位置更好的概念,我 P I 们将上述线段PQ划分成数目非常多(N > 10001000)的 F 相等部分, 并考虑针端A与所有等分点之一相截的所有 情况(见图 3)对于每一个等分点,有无限多的可能情 况与针的可能有的无限多的角度相对应。为了便于考 θs d E 察这些可能情况,可以仅考虑M个角 θ0 = 0,θ1 = ε,θ2 = 2ε,θ3 = 3ε,…,θM–1 = (M – 1)ε, II Q 图3 ,而ε为 其中M同样是一个很大的数(例如M > 2273) 的
1 。 M

π
2

在此种方法中,应考虑涉及 N 个点和 M 个角,从而也就包括了 NM 个针的位置总数。 然而,有利的位置仅是这些位置中的某一分数(就是w) 。为了确定这个分数,我们从 求得仅仅那些有利位置的总数入手,在这些位置中的针的倾斜角如图 3 所示取值为θs。这些 位置组成一个平行四边形EFGP,其边EF = l,EP = l cos θs。因为线段EP上有 EP l N? = N ? cos θ s PQ d 个等分点,总共包含有
N? l cosθ s d + cos θ M ?1 ) 。

。因此,所有有利位置总数n为 个有利的位置(与针共角为θs)
n=N? l (cos θ 0 + cos θ 1 + cos θ 2 + d

因此所求的概率为

n l cos θ 0 + cos θ 1 + cos θ 2 + = ? NM d M 因而所剩下的工作仅是确定分数 w=
48

+ cos θ M ?1



算术题

m=
的值。

cos θ 0 + cos θ 1 + cos θ 2 + M

+ cos θ M ?1

分数 m 与余弦函数在区间 0 到

π
2

上的平均值并无区别。

熟悉积分元的读者可以直接写出这一平均值,即

m=



π

2 0

cos x d x

π
2

=

2

π



对此种计算形式不熟悉的读者,可以很容易由下述灵巧的方法求得 m。 作一半径为 1 的圆的一个象限。令水平轴为 OH,垂直轴为 OK。如其绕着半径 OK 旋 转便形成一个半球,其表面积众所周知是 2π。 这一表面积可以用不同的形式表示。 为此让我们移动倾斜角θ,θ1,θ2,…,θM–1,使各角以OH为公共边建立在O点。那些非 公共边将象限分成长度都是ε的M个很小的弧。取其中位于两角θs和θs+1的非公共边之间的那 一部分,将其旋转成为一个很小的球带,将其展平成一狭条,其长度为 2π cos θs,高度为ε, 所以面积为 2πε cos θs。 因为用这种方法所得的所有球带的和为一半球,便得到方程 2πε(cos θ0 + cos θ1 + cos θ2 +…+ cos θM–1) = 2π, 或者因为 Mε =

π
2



cos θ 0 + cos θ 1 + cos θ 2 + M 因而得到所求的平均值。
余弦函数(当然还有正弦函数)在区间 0 到

+ cos θ M ?1

=

2

π



π
2

上的平均值为

2

π



(同样可由第 15 题的公式(1)和(2)推导出。 ) 同时得到
w= l l 2 m= ? d d π l 。 π d 2 ?


W=

该公式给出了我们所求的概率。 注:沃尔夫(Wolf)1850 年在苏黎世得出了用所得公式计算 π 的原定目的。通过实验, 一根长 36 毫米的针,平行线间距为 45 毫米,投掷很多次(5000)后,他得到概率 W 近似 地为 0.5064,并得到

π=

2l = 3.1596 。 dW

英国人史密斯(Smith,1855 年)与福克斯(Fox,1864 年)重复了这一实验,分别投掷了 3200 和 1100 次,求得 π 值为 3.1553 与 3.1419。

49

算术题

第19题 费马—欧拉素数定理
每个可表示为 4n + 1 形式的素数,只能用一种两数平方和的形式来表达。 十七世纪伟大的法国数学家费马(1601 – 1665 年)大约于 1660 年发现了这一著名的定 理。然而直到 1670 年才得以发表,在费马的儿子编辑的丢番图(Diophantus)著作中以附 注的形式出现,不幸的是没有证明。不能肯定费马是否已经得出证明。 大约一百年后, 才由欧拉第一次发表了这一定理的证明, 这是他寻求解决但劳而无功的 若干年后,才写出了论文“费马定理的证明,形为 4n + 1 的素数可以表示为两数平方之和” ①。 现在费马—欧拉定理已经有了好几种证法。下面的证明具有最简化的特色。 对于不熟悉数论的读者,我们将提供一些说明,这对于理解这一证明是必要的,并且对 于第 22 题所讨论的问题也是有用的。同时必须记住此处和第 22 题中所用字母均表示整数。 两个数 a 和 b [参照高斯(Gauss)著作],当其差能被 m 所整除时,就叫做对于模数 m 是同余的,写作:a ≡ b mod m,读作对模 m,a 与 b 同余。例如每个数对于模数(模)m 同 余于被 m 除时所得的余数,如 65 ≡ 2 mod 7。余数一词有更广泛的意义,意即对于任意选择 的商做除法后所得的余数。例如,如果写成
65 = 12 ,所留的余数为–19。 7 89 除得的最小余数为–2,因 13

在许多可能的余数之中有两个余数特别重要: 一为约定余数或称普通余数, 它是正数且 小于除数;一为最小余数,其绝对值不大于除数的一半。例如 为
89 2 = 7 ? ,这也可以写作 89 ≡ –2 mod 13。 13 13

对于同一模数同余,可应用下述不证自明的规则: 1.如两数同余于第三数,则此两数也彼此同余。 2.两个同余式可以相加,相减和相乘。 由 A ≡ B mod m,a ≡ b mod m 得到 A ± a ≡ B ± b mod m 及 Aa ≡ Bb mod m。 (例如由 A = B + Gm 和 a = b + gm 可以得到 Aa = Bb + pm p 为整数)亦即 Aa ≡ Bb mod ( , m。 ) 3.同余式 a ≡ b mod m 可乘以任意整数 g: ag ≡ bg mod m。 只有当 g 为 a 与 b 的公约数而且 g 与模数 m 没有公约数时同余式才可以被 g 除。例如用 7 去除 49 ≡ 14 mod 5,我们得到一个正确的同余式 7 ≡ 2 mod 5。 如有 m 个正整数的数系中无两个数同余于模数 m,则该数系就称作一个模数 m 的完全 剩余系。最简单的完全剩余系是 m 个普通余数 0,1,2,…,m – 1 的系,其次最简单的为 m 的最小余数的系。 对于模数 m,每个 z 与完全剩余系 mod m 中的一个数且仅当一个数同余。

50

算术题

下述定理特别重要: 定理: 如果用一个与模数没有公约数的数去乘完全剩余系的各数, 则得到对于这一模数 的又一个完全剩余系。 证:令模数为 m,a 是与 m 没有公约数的乘数。那么如果对于给定的剩余系由两个不相 等的数 x 和 x′, ax ≡ ax′ mod m 成立,则根据同余规则 3 必有 x ≡ x′ mod m,而这是不可能的。 从这一定理可以直接得出: a 与 m 没有公约数时同余式 ax ≡ b mod m 在每个完全剩余系 mod m 中,具有一个而且仅有一个“根”x。

二次剩余
有两个无公约数的数, 如其中一个数以相关的另一个数为模同余于某个平方数, 则此数 叫做另一数的二次剩余。如果不存在这样的平方数,则称为二次非剩余。例如 12 是 13 的二 次剩余,因为 12 ≡ 82 mod 13;–1 是 3 的二次非剩余,由于不存在一个平方数x2,x2 ≡ –1 mod 3。 以下为应用于奇素数模 p 的有关二次剩余定理:

I.对于模数p,总共有 ρ =

p ?1 个相互不同余的二次剩余,并且有同样多的相互不同余 2

的非剩余,前者为 12,22,32,…,ρ2。换言之无论哪一个数对于mod p,都与它们中的一 个同余。 II.两个剩余的积仍为一个剩余,一个剩余与一个非剩余的积为非剩余,而两个非剩余 的积为一个剩余。 I 的证明:1.如所给定两个数的平方彼此同余,例如 x2 ≡ y2 mod p, 则乘积(x + y)(x – y)(等于x2 – y2)必能被p所整除,而这是不可能的,因为两个因子都小于p。 2.如果我们将平方数延续到ρ2以后,不会得到新的剩余。以(ρ + h)2为例,取k ≤ ρ且使ρ + h + k能被p整除,由于ρ + h ≡ – k,因而,(ρ + h)2 ≡ k2 mod p,即平方数(ρ + h)2同余于k2 mod p。因为有 2ρ个mod p的互不同余的数(被p整除的数此处不予考虑) ,必然有ρ个p的互不同 余的二次非剩余。 II 的证明:令 R 与 r 为 p 的二次剩余,N 和 n 为 p 的二次非剩余。 1.由A2 ≡ R,a2 ≡ r mod p,相乘得到 (Aa) 2 ≡ Rr mod p。 因此 Rr 是一个剩余。 2.2ρ个数 12,22,32,…,ρ2,N · 12,N · 22,N · 32,…,N · ρ2对mod p为互不同余的 数。由于这些数中前ρ个数为p的二次剩余,有因为只存在ρ个剩余,所以ρ个数N · 12,N · 22, N · 32,…,N · ρ2必然为非剩余,亦即NR为非剩余。 3.2ρ个数n · 12,n · 22,n · 32,…,n · ρ2,n · N · 12,n · N · 22,n · N · 32,…,n · N · ρ2 对于mod p互不同余。根据 2,这些数中的前ρ个为非剩余,因此根据 1,其它的必然为剩余, 当然两个非剩余N与n的积就在其中。证毕。 现在让我们研究双线性同余式 (0) xy ≡ D mod p, 其中模数 p 再次定为奇素数,D 为与 p 没有公约数的已知数, “相互共轭”或“环绕”数 x
51

算术题

与 y 从 1,2,3,…,p – 1 的 Σ 系中选择以满足(0)式。对于 Σ 系中的每一个 x,只有唯 (由 xy ≡ D mod p 以及 xy′ ≡ D mod p 得到 一的共轭数 y, xy ≡ xy′ mod p, 并由此而得到 y ≡ y′ mod p 或 y – y′ ≡ 0 mod p。 然而由于y和y′ 均小于或等于p – 1,所以仅当y = y′ 时二者的差才能被p整除。 ) 从Σ中任意选择x1,根据 x1y1 ≡ D mod p 来确定y1,进而我们从Σ中选取不等于x1和y1的一个数x2,且由 x2y2 ≡ D mod p 来确定y2,那么y2也不等于x1或y1。 用这种方法连续运算,直至所得的同余式中列出 Σ 中所有的数。 此处有两种情况必须加以区别: 1.yv绝对不等于xv。换言之同余式xv2 ≡ D mod p不可能存在;D为p的二次非剩余。我们 可以准确地得到

ρ=

p ?1 2

对共轭数xv、yv,ρ个组成的同余式相乘,得: (1) (p – 1)! ≡ Dρ mod p, 2.对于某下标ν,有yν = xν,因此xν2 ≡ D mod p;D为p的一个二次剩余。假如除了ν以外, x 因此xμ2 ≡ xν2 mod p, 也就是xμ2 – xν2或(xμ + xν)(xμ 还有一个下标μ具有同样情况, μ2 ≡ D mod p, – xν)可以被p整除。因为xμ – xν不能被p整除,所以xμ + xν必定能为p所整除,并且有 xμ = p – xν。 那么实际上 xμ2 = p2 – 2pxν + xν2 ≡ xν2 ≡ D mod p。 因此如果相等环绕数真正存在,那么他们一定会出现两次。在yν = xν,yμ = xμ的情况下,现 在我们仅有ρ – 1 个同余式xsys ≡ D mod p,其中ys不等于xs。在这ρ – 1 个同余式中再增加同余 式 xνyμ ≡ D mod p, 将所有 ρ 个同余式相乘,得 (2) (p – 1)! ≡ Dρ mod p, 这种情况,例如当D = 1 时,那么由于 12 ≡ Dρ mod p,则有同余式 (2a) (p – 1)! ≡ –1 mod p, 此式即所谓威尔逊(Wilson)定理。 运用威尔逊公式,我们用 (1a) Dρ ≡ –1 mod p, (2a) Dρ ≡ 1 mod p 代替(1)式和(2)式,得到 欧拉定理:数D与素数p没有公约数,D是p的二次剩余还是非剩余,取决于Dρ对mod p 同余于正的单位数还是负的单位数。 引入勒让德(Legendre)符号,就使得有可能使用公式作为判别一个数的剩余特征的准

52

算术题

? D? 则。 勒让德符号 ? ? 表示正的或负的单位数取决于D为p的二次剩余还是非剩余。 举例来说, ? p? ? ?
? 2? ? 2? 2 ? ? = 1 ,因为 3 – 2 可被 7 整除;反之 ? ? = ?1 ,因为没有一个平方数与 2 的差可被 3 整 ?7? ? 3? 除。

(3) 其中

? D? ? ? ≡ D ρ mod p , ? p? ? ?
p ?1 。 2
p ?1 2

ρ=

作为简单情况 D > –1,同余式(3)可变换成等式 (4)
? ? 1? ? ? = (?1) ? p ? ? ?



因为在这种情况下(3)式两端均为单位数,而且只有当这两个单位数是相等时,它们的差 才可以被奇素数 p 所整除。
p ?1 是奇数还是素数,取决于素数 p 形为 4n + 1 还是 4n + 3。因此在第一种情况下 2

? ? 1? ? ? 1? ? ? = 1 ,亦即–1 是 p 的二次剩余,而在第二种情况下 ? ? = ?1 ,也就是–1 为 p 的二次非 ? p ? ? p ? ? ? ? ?
剩余。因此下述定理成立: 欧拉定理:当素数 p 形为 4n + 1 时,负单位数为 p 的二次剩余;p 形为 4n + 3 时则为 p 的二次非剩余。 换言之,当 p 形为 4n + 1 时,纯二次同余式 x2 + 1 ≡ 0 mod p 有整数解 x,而当 p 形为 4n + 1 时没有整数解。 现在证明费马—欧拉定理。 下述证明基于上述定理和 范数定理: 如果一个素数能整除一个范数但不能整除范数的底数, 则此素数本身就是一 个范数。 所谓范数可以理解为两个整数的平方和,而这两个整数叫做该范数的底数。 范数定理的证明:用素数p能整除a2 + b2,但不能整除范数的底数a和b,因此有 (5) a2 + b2 = pf, A B p 假定因子f大于 1 而小于 ,此假设并不表示该定理的一个限制,因为如果除式 与 的最 2 p p 小余数A – hp与B – kp与分别作为a与b,我们可由A2 + B2 = pF(其中 F >
p )直接得到等式 2

a2 + b2 = pf(其中 f <

p ) 。一方面 2

a2 + b2 = A2 + B2 – 2(Ah + Bk)p + (h2 + k2)p2
可被 p 整除,因此
53

算术题

a2 + b2 = pf;
同时另一方面,由于 a <
1 1 1 1 1 p , b < p ,a2 + b2就小于 p 2 或者 pf < p 2 或者 f < p 。 2 2 2 2 2

再者,p不能整除a与b,因为(与我们的假设相反)那将整除A = a + hp或B = b + kp。 A B 再来确定除式 与 的最小余数 f f

α = a – mf


β = b – nf,
同理可得 (6) 其中

α2 + β2 = ff ′,
f ′≤ 1 f 。 2

将(5)式和(6)式相乘,得

(a2 + b2)(α2 + β2) = pf2f ′


(aα + bβ)2 + (aβ – bα)2 = pf2f ′。
由于

aα + bβ = (a2 + b2) – (am + bn)f = a′f, aβ – bα = (bm – an)f = b′f,
所得等式可写成 (7) 其中

a′ 2 + b′ 2 = pf ′,
f ′≤ 1 f 。 2

此处f ′ 不能消失。如果f ′ = 0,根据(6)式有α = 0,β = 0,且由此得到a =mf,b = nf; 然后根据(5)式有p = (m2 + n2)f。在这种情况下p必定为f所整除,而且f必须等于 1,这是和 我们的前提相矛盾的。 于是如果f ′ = 1, 7)式已经给出了p的范数表达式。 ( 如果f ′ > 1,如同从(5)式得到(7)式那样,由(7)可得: (8) a″ 2 + b″ 2 = pf ″, 其中
0 < f'' ≤ 1 f ′。 2

通过不断缩小因子f,f ′,f ″,…来建立新的等式,这种方法要一直继续到出现因子 1。对应 的等式给出了被表示为一个范数的素数p。 现在我们再证明 I.形如 4n + 3 的素数 q 不能表示为一个范数。 II.形如 4n + 1 的每一个素数 p 只能按一种方法被表达为一个范数。 I 的证明:如果 a2 + b2 = q 是成立的,那么必有 b2 ≡ – a2 mod q,
54

算术题

并且q的一个二次非剩余–1 和一个剩余a2的乘积–1 · a2必须等于q的二次剩余b2,由上面所知 这是不可能的。 II的证明:根据欧拉定理,存在一个整数x使范数x2 + 1 可被p整除。根据范数定理,则p 本身也为一范数: p = a2 + b2。 此处且仅有一种可能的范数表达式。 如果我们假定第二种表达式: p = A2 + B2, (式中 a、b、A、B 代表四个不同的整数) ,得到 p2 = (a2 + b2)(A2 + B2) = (Aa ± Bb)2 + (Ab ? Ba)2, 式中符号可以取上面的两符号,或者取下面的两符号。又因为 Aa + Bb 与 Aa – Bb 的乘积 A2a2 – B2b2 = A2(a2 + b2) – b2(A2 + B2) 可被 p 整除,两因子中必有一个可被 p 整除。因此,根据可被 p 整除的是第一个还是第二个 因子,我们相应地选择上面的两个符号后者下面的两个符号。于是, Aa + Bb = p 且同时 Ab – Ba = 0 或 Ab + Ba = p 且同时 Aa – Bb = 0, 2 2 2 2 2 2 2 2 因此,A b = B a 或A a = B b 。 由上面等式中的第一个等式得到
A2 B 2 A2 + B 2 = 2 = 2 =1, a2 b a + b2

而由第二个等式得到
A2 B 2 A2 + B 2 = 2 = 2 =1, b2 a b + a2 因此,由第一等式有 A = a,而由第二个等式有 A = b,两者都与 A ≠ a 及 A ≠ b 的最初假设

相矛盾。因此把 p 作为范数只有唯一的方法,费马—欧拉定理证毕。
① Novi Commentarii Academiae Petrpoptlitance ad annos, 1774 – 1755, vol. V

第20题 费马方程
求方程

x2 – dy2 = 1
的整数解,其中 d 为非二次正整数。 1657 年,费马首先对他的朋友弗亨尼凯勒(Frénicle) ,然后对所有同时代的数学家们提 出了数论里这一个极其重要的问题。最先的解是由英国人 L·布龙克尔(Lord Brouncker)和 J·沃利斯(John Wallis)作出的,但解法非常烦琐。 最简单和最佳的解法是由欧拉、 拉格朗日和高斯等人发现的①。 所有这些解法都是以循 环连分数的特性为基础的。 现在让我们考察用较常见的一般方程式将此法稍加修改后的形式

55

算术题

X2 – DY2 = 4, 此式不仅作为一种特殊情况包含了原来的费马方程(其中 X = 2x,Y = y,D = 4d) ,而且还 包括了 D 被 4 除余数为 1 的情况。 为了方便起见,我们将连分式 a+ b+ c+ 1 1 1 d+

写成简化的形成(a, b, c, d, …)。 一个以 n 次为周期的纯循环连分数具有 u = (g1, g2,…, gn, g1, g2,…, gn, …), 的形式,因此我们可写成 u = (g1, g2,…, gN, u), 其中N为n的整数倍,为着将要予以叙述的原因,设N为偶数。g1,g2,…各项(偏分母)假 定都为正整数。 如果设定第N次近似值(g1, g2,…, gN)和第N – 1 次近似值(g1, g2,…, gN–1)的分子 和分母分别为P、Q、p、q,则根据连分数理论得到两个方程: (1) Pq – Qp = 1 及 Pu + p u= , (2) Qu + q 其中第二式还可以表达为如下形式 (2a) 其中
2

Qu2 – Hu – p = 0,

H = P – q。 二次方程(2a)的判别式D = H + 4Qp由(1)知,其值为H2 + 4Qp – 4 = (P + q) 2 – 4;
这一值比平方数小 4,因此它本身不可能为某数的平方。于是其正平方根 r = D 为无理数。 H ?r 此外,由于r > H(因为r2 = H2 + 4Qp) ,该二次方程的第二个根 u = 为负数,所以第一 2Q 个根 得
p Q 。 ?u = u

p H +r 代表假分数化的连分数u。为了获得 u 值的概念,我们由两根的积 uu = ? ,求 2Q Q

因为 P > p,且 Q > q,则有
p P Q q 及?u = 。 ?u = u u

然而右侧分数之一为真分数,因为连分数的值 u 介于依次相邻的两个近似值

p P 和 之 q Q

间,因此 ? u 必定为一个真分数。 一个二次方程,其系数为整数,且有非平方数的判别式,它的第一个根为正的假分数、 第二个根为负的真分数,这样的二次方程称为约化方程,它的第一个根叫做约化数。因此结 论可写成:

56

算术题

每一个纯循环的假分数化成的连分数是一个约化数。 现在我们反过来证明一个约化数的连分数的逆是纯循环的。 首先解决下面的问题: 具有不可约的整系数和正的非平方数判别式 D = r2 = b2 – 4ac 的二次方程 (3) au2 + bu + c = 0, 其中第一个根 u = 写为 u = g +
r ?b 化为连分数形式。 2a

1 ,其中g为小于u的最大整数(以下记作[u]) u′ 为正的假分数。引入三个 , u′

新的数a′,b′,c′ 使其与ag2 + bg + c,2ag + b及a数量相等而符号相反,得到 2a(r ? b ′) r ? b ′ 1 2a u′ = = = 2 = , 2a ′ u ? g r + b′ r ? b′ 2 其中

b′ 2 – 4a′c′ = b2 – 4ac = D。
因此,u′ 就是二次方程 (3') a′u′ 2 + b′u′ + c′ = 0, 的第一根,该方程有同样判别式D,而且每个系数之间没有公因数。 (如果a′,b′,c′ 具有公 因数,则因为有等式– c′ = a,– b′ = 2ag + b,– a′ = ag2 + bg + c必然a,b,c有公因数,这与 我们的假设矛盾。 )称新方程(3')为原方程(3)的导数,它的第一个根u′ 为u的导数。 a b c

ga → g(ga + b) ga + b c′ a′ b′ 将第三列的两项相加,并改变和的符号就得到 a′,将第二列下两项相加并改变和的符号就得 到 b′,变换 a 的符号就得到 c′。 导出的二次方程(3')正是按此方法处理的,其过程可连续到所要求的程度。下面例子 将这一过程完整清楚地表达出来。 将二次方程 3u2 – 10u – 1 = 0 的正根展开成为连分数。判别式等于 112,因此 r = 10,…,在算式中我们仅写出逐个二次 方程的系数, 而每一系数乃是前一个的导数。 在最后一列中写下相应方程的第一个根以及包 含在方程中的最大整数(同时也是连分数正确的偏分母) 。
10, + 10 6 10, 6 +8

3

–10 9 –1
–8 8 0 –8 9

–1
–3 –3 0 –4

=3+

4

=2+

10, 6

+8

3

=3+

57

算术题

1 3 –10 10 0

3 –3 0

10, 6

+ 10

= 10 +

3 –10 –1 重新回到原方程,展开式是纯循环的,于是得到: 112 + 10 = (3,2,3,10,3,2,3,10, ) 。 6 现在证明定理:约化数的展开式得到一个纯循环的连分数。 因为约化方程 au2 + bu + c = 0
的第一个根 u 是正的假分数,而 u 是负的真分数,则根据根与系数的关系式

uu =

c b ,u + u = ? , a a

约化方程的自由项 c 和一次项的系数 b 总是为负的(系数 a 假定恒为正数) 。 根据上面对展开式的讨论,我们写作 (4) 式中g = [u]且u′ > 1。由 u ′ =

u=g+

1 , u′

1 最先得到的导出方程的第一根u′ 为正的假分数。如果进而 u?g 1 1 中将r变成– r,该等式呈现 u' = 的形式,它表明第二个根 u' 为负的真 在等式 u ′ = u?g u?g
分数。 约化方程和约化数仍然是约化的, 所以只有约化数才能存在于约化数的连分数表达式 之中。 如果将(4)写作 1 ? = g ?u, u' 可见 g 也可以看作是最大整数,它包含在导出方程第二个根的倒数的异号值之中。 于是,与已知判别式D相应的所有约化数为有限数。 D = b2 – 4ac与– ac > 0 首先得知 (由 b的值必须从数列–1,–2.,…,– [r]中选取。其中须考虑的仅是D – b2可被 4 整除的。选出 这些数,且对于每一个这样选出的 b 的值可确定一对数 a , c (其中 a > 0 , c < 0 )满足

D ? b2 ,这就依次给出有限的数a和c。由此得到的每一组三个数a,b,c也就可以导 4 出一个约化方程au2 + bu + c = 0, 因此, 对于一个约化数u, 的值只能介于r + b与r – b之间。 2a ) 在有限的几步之后必然重新出现先前得到的约化 因此, 在约化数 u 的连分数展开式中, 数。即按以下形式: U = (K, L, u),u = (h, k, l, u)。 ? ac =
但是据上所述,因为 l 和 L 均表示包含在 u 的改号倒数值中的最大整数,所以 L = l。同理 K

= k。 因此

U = (k, l, h, k, l, h,…), 亦即:展开一个约化数可得到一个纯循环连分数。 在以上预备工作完成后,费马方程的解得到相当大的简化。我们表达为:I.属于判别
58

算术题

式 D 的任何约化的连分数展开式具有有限数的费马方程的解。II.由展开式可得到方程的每 一个解。 I.令 u = (g1, g2,…, gn, g1, g2,…, gn, …) 为约化方程 (5) au2 + bu + c = 0, 其判别式为 D 及各个系数没有公因数时的正根。且令 P = ( g1 , g 2 , , g N ) Q 为 u 的一个近似值,且指数 N 为 n 的偶数倍。又令 p = ( g 1 , g 2 , , g N ?1 ) q 为前一个的近似分数。那么根据(2a) ,得 2 (5') Qu – Hu – c = 0(H = P – q) , 因为(5)和(5')式的根一致,并且(5)式的系数之间没有公因数,因此将(5)式 ,则 乘以某整数 y 即可求得(5') (6) 如果再引入整数 (7) 由(6)与(7)式得到 及

y=

Q P?q p = , = a ?b ?c x = P + q,

x2 – b2y2 = (P + q)2 – (P – q) 2
4acy2 = – 4Qp。
将两式相加,得

x2 – Dy2 = 4(Pq – Qp),
且运用(1)式,得

x2 – Dy2 = 4。
II.反过来,令(x, y)表示费马方程 x2 – Dy2 = 4, (8 ) 当 x,y 为不渐近于零的正整数时的一个解,且令 u 为约化方程 au2 + bu + c = 0 的第一个根。 运用(6)和(7)式,得到四个不会为零的正整数

P=

x ? by ,Q = ay, 2 x + by , 2

p = – cy, q =

(显然,Q和p是这样的一些数,当欲求得P和q的时候可以由方程(8)得出,如再用判别式 D = b2 – 4ac可写成: (x + by)(x – by) = x2 – b2y2 = 4(1 – acy2) = 4(1 + Qp)。 那么由于右边出现可被 4 整除的不会为零的整数,可以推断出左边乘积中的 2q 和 2P 必须 是偶数且不等于零) 。根据(8)式,它们满足方程 (9) Pq – Qp = 1。
59

算术题

如果用 (10)

Q P?q p ,? , ? 取代约化方程中的系数 a,b,c,则得 y y y u= Pu + p 。 Qu + q

在由此而得到连分数展开式之前,我们还必须证明 Q ≥ q。

2(Q – q) = (2a – b)y – x 是成立的。由于约化方程的第二根 u 为负的真分数,得到 r + b < 2a 或 2a – b > r。 因此,
2(Q ? q ) > ry ? x = r 2 y2 ? x2 4 =? ry + x ry + x

或Q ? q > ?

2 。然而,由于D = r2 = b2 – 4ac至少等于 5,y至少等于 1,x至少等于 3,得 ry + x

到ry + x > 5,由此Q – q > –0.4,亦即Q ≥ q。证毕。 P 现在将 展开成项数v为偶数的连分数(γ1, γ2,…, γv),其方法是:该连分数和最后一个近 Q ′ p 似分数 之间存在关系为 q′ (9') 则由(9)和(9')相减得到

Pq′ – Qp′ = 1。

P(q′ – q) = Q(p′ – p)。 然而由于q ≤ Q,q′ < Q,且q′ – q可被Q整除,q′ 必定等于q,因此p′ 也等于p。于是得到 Pu + p (γ 1 , γ 2 , , γ v , u ) = , Qu + q
亦即:根据公式(10) ,则

u = (γ1, γ2,…, γv, u)。 因此,费马方程的每一个解(x, y)可以由将任意约化数 u 当作连分数加以展开而得到。 最终结果:费马方程 x2 – Dy2 = 4 具有无限多个解;所有的解可由属于判别式 D 的任何任意选择的约化数作为连分数展开, 它包含的循环元素为偶数个,再将所得到的近似值根据(6)和(7)而得到。 例:求费马方程 x2 – 112y2 = 4 的最小解(x, y)。 用于判别式 112 的约化方程就是上面论述过的方程 3u2 – 10u – 1 = 0; 约化数 u 的展开式记作 u = (3, 2, 3, 10, 3, 2, 10,…), 它以四项为循环。最初的四个近似分数为 p 24 P 247 3 7 , , = , = 。 1 2 q 7 Q 72
因为此处 a = 3,b = –10,c = –1,根据(6)和(7)式求得 x = 254,y = 24。 于是剩下的问题是要证明对应于每个判别式 D,最少有一个约化数。
60

算术题

1.如果 D = 4n,g 为包含在 n 中的最大整数,则

a = 1,b = –2g,c = g2 – n
就是约化方程的系数。 证:该方程的判别式是b2 – 4ac = 4n = D。此外, r + b < 2 a < r – b, 因为
2 n ? 2g < 2 < 2 n + 2g 。

2.如果D = 4n + 1,且g为满足g2 + g小于n的最大的整数(因此(g + 1) 2 + (g + 1) > n,或 ,则 者g2 + 3g + 2 > n) a = 1,b = – (2g + 1),c = g2 + g – n 就是约化方程的系数。 证:该方程的判别式是b2 – 4ac = 4n + 1 = D。且有 r + b < 2 a < r – b, 因为
2 D ? (2 g + 1) < 2 < 2 D + 2 g + 1

( 2 D ? 2 g ? 1 < 2 由上述条件g2 + 3g + 2 > n得来。两端乘以 4 就变成

4g2 + 12g + 9 > 4n + 1, 也就是变成(2g + 3)2 > D。由此得到
2 g + 3 > D 或者 D ? 2 g ? 1 < 2 ) 。

注:如果我们已经求得费马方程的最小解(例如按照刚刚导出的方法) ,在用拉格朗日 。 数后,我们可以以比较简单的方式求得其它解(这里考虑正的解) 我们给定每个解(x, y)为“拉格朗日数”

z=
并把 x,y 叫做拉格朗日数的分量。

1 ( x + yr ) , 2 1 1 ( X + Yr ) 和 z = ( x + yr ) 的乘积以及二者假 2 2

首先证明辅助定理。两个拉格朗日数 Z = 分数商 ζ =

1 (ξ + ηr ) ,仍为一个拉格朗日数。 2

证明:我们可立即求得

ζ ζ = 1 或者ξ2 – Dη2 = 4,
其中

ξ=

Xx ± DYy Yx ± Xy ,η = , 2 2

此处当所求为乘积时用上面的符号,当所求为商时用下面的符号。 由 X > rY 与 x > ry 得到 Xx > DYy,因此任何情况下 ξ 为正数。由
? x2 ? ?X2 ? ? 2 ? D ?Y 2 = ? 2 ? D ? y 2 , ?Y ? ?y ? ? ? ? ?
61

算术题

在ζ =

X x Z 的情况下,因为 Y > y,得到 < 或 Yx > Xy,所以在任何情况下 η 仍然为正数。 z Y y

因而由于 ζ ζ = 1 ,故 ζ 为正数且为假分数。 于是剩下的问题仅仅是要证明 ξ 和 η 为整数,无论 D 可被 4 整除后者被 4 除余数为 1。 在第一种情况下 X 和 x 均为偶数, 在第二种情况下费马方程的每一个解要么是两个偶数要么 是两个奇数。因此在所有的情况下 ξ 和 η 均为整数。 上述方法基于定理: 每个拉格朗日数均为以一个整数为指数的最小的拉格朗日的幂。 证:令(x, y)为费马方程的最小解,因此 z = 理得到:z 的每个幂均为一拉格朗日数。 于是令 Z =

1 ( x + yr ) 为最小拉格朗日数。首先由辅助定 2

1 ( X + Yr ) 为不是z的幂的拉格朗日数, 那么一定存在有两个依次相邻的幂δ = 2

zn与δ′ = zn+1,且Z介于两者之间,由 zn < Z < zn+1,
以zn除之则得到

1<
因此,拉格朗日数 ζ =

Z

δ

<z

Z

δ

必小于最小的拉格朗日数 z,而这自然是荒谬的。

因此,拉格朗日数仅为幂

z,z2,z3,z4,… 求费马方程第二、第三、…个解的最简单的方法是将他们当作拉格朗日数z2,z3,z4,… 的分量。
① 欧拉:“De usu novi algorithmi …,” Novi commentaii Academiao Petropolitanae ad annum 1765 拉格朗日:“Solution d’un problème d’arithmétique,” miscellanea Turinensia, vol. IV, 1768 高斯:Disquisitiones arithmeticae, 1801

第21题 费马—高斯不可能性定理
证明两个立方数的和不可能为一立方数。 于是所需证明的就是方程 x3 + y3 = z3 不可能由不为零的整数 x,y,z 所组成。 欲证明的这一定理,是著名的费马不可能性定理的一种特例。在费马的儿子于 1670 年 编辑出版的关于丢番图算术的书中引用了费马如下的论述: “将一个三次方分成两个三次方, 将一个四次幂分成两个四次幂, 总而言之除了平方以 ” 外的任何一个幂分成两个指数相同的幂,都是不可能的。 费马补充道: “我发现了这一定理的非常奇特的证明,但由于(书上的)页边太狭窄, ”遗憾的是,费马漏掉了对这一“奇特的证明”的揭示。 不能写出。 费马以后的许多伟大的数学家,包括欧拉、勒让德、高斯、狄里克雷(Dirichlet) 、库默 (Kummer)以及其他人企图得到这一定理的一般证明的尝试都失败了,费马不可能性定理

62

算术题

更著称于世。如今方程

xn + yn = zn 的不可能性的证明,众所周知仅适用于指数 n 的特殊值,如 3 到 100,但即使这些证明也是 非常复杂和困难的。 下面将例证限制于最简单的情况下,即 n = 3。方程 x3 + y3 = z3 的不可能性的证明出现在欧拉 1770 年的代数学中,其后又有高斯①的论证。正如数学里常 见的,这一问题说明了证明较普遍的定理比证明特殊情况来得容易。为了证明 (1) a3 + b3 = c3, 当 a,b,c 为普通整数时的不可能性,欧拉不得不运用比较复杂的方法。相反,高斯简单明 了地证明了更一般的方程 (2) α3 + β3 = γ3, 式中的 α、β、γ 为任意的形如 xJ + yO 的数,这里 x,y 为任意整数,而 J=
1 ? 3i 1 + 3i 与O = 2 2

为–1 的立方根。 为方便于标志,将形如 xJ + yO 的数(其中 x,y 为整数)叫做 G 数。 欧拉所论及的只不过是(2)式的一个特例,从其中每个整数 g 都是 G 数:g = gJ + gO 这一事实可以看出。 G 数(即所谓的立方单位根群的整数值)通常与普通整数具有许多相同的特性。对这些 特性不熟悉的读者可以从第 65 页的附录得到理解高斯证明的必需资料。 方程 α3 + β3 = γ3 的不可能性的高斯证明。 首先,用希腊字母表示 G 数,小写罗马字母表示普通整数。 然后用 ξ、η、– ζ 代替 α、β、γ,将式(2)先变换成对称方程 (3) ξ3 + η3 + ζ 3 = 0, 其中我们假定三个“底”ξ、η、ζ中的两个总是不具有公因子;因此可以将这一方程称为高 (上述假定不会以任何方式对证明加以限制。 举例来说, 如果ξ和η具有一个素因子δ, 斯方程。 那么根据(3) δ可以整除ζ 3,因而也可以整除ζ,所以用δ3去除必定能从(3)式消去δ。 , ) (3)式的不可能性可从下述两个由有关(3)式成立的假定推导出的定理得到。 I.在每个高斯方程中,三个底——我们称其为特殊底——中的一个而且仅有一个具有 素因子 π = J – O。 II.对每一个高斯方程都会有第二个高斯方程存在,其特殊底包含有一个比第一个方程 特殊底还要小若干倍的因子 π。 然而这两条定理是相互矛盾的。连续运用定理 II,能够得到一个不再含有特殊底的高斯 方程,这是与定理 I 相矛盾的。 I 的证明:设三个底 ξ、η、ζ 均不能被 π 所整除,则 ξ3 ≡ e,η3 ≡ f,ζ 3 ≡ g mod 9, 其中 e2 = f 2 = g2 = 1, 因此根据(3) ,有 e + f + g ≡ 0 mod 9,而这是不可能的,所以必定会有下述情况存在: ζ ≡ 0 mod π,ξ ≠ 0 mod π,η ≠ 0 mod π。 II的证明:根据(3)式,由ζ3 ≡ 0 mod π3可得
63

算术题

ξ3 + η3 ≡ 0 mod π3, 且由于ξ3 ≡ e mod 9,η3 ≡ f mod 9,e + f ≡ 0 mod π3,则 e + f ≡ 0 mod 3 3 必然成立;由此可得f = – e。于是ξ + η3 ≡ e + f ≡ 0 mod 3,因此ζ3 ≡ 0 mod π4,且 ζ3 ≡ 0 mod π2。 由ξ3 + η3 ≡ 0 mod π3和恒等式 ξ3 + η3 = φψχ, 其中 φ = ξJ + ηO,ψ = ξO + ηJ,χ = ξ + η, 可知因子 φ,ψ,χ 中至少有一个可被 π 整除。由此并且根据 φ – ψ = (ξ – η) π,φ + ψ = χ,可 知每一个因子 φ,ψ,χ 都可以被 π 整除,因此 φ = πφ′,ψ = πψ′,χ = πχ′。 于是数φ′,ψ′,χ′ 中每个都不具有公因子。 (例如,如果φ′,ψ′具有公因子δ,那么就有φ′ – ψ′ 必等于ξ – η,且π(φ′ + ψ′) = ξ + η,则 2ξ和 2η都能被δ所整除,因此δ必定等于 2。因而那么ξ = 2λ + ε,η = 2μ + ε,那么ξ = 2λ + ε, η = 2μ – ε,其中ε3 = ±1,且φ = 2ν + ε,或者 φ = 2ν + επ, 而它是不能被 δ = 2 所整除的。 )
如果

ζ = ω ,则有 π
ω3 = – φ′ψ′χ′,

其中

φ′ + ψ′ = χ′。 因为φ′,ψ′,– χ′ 中每两个都不具有公因子,至少可能有单位因子α,β,γ的这三个量必 定每两个都不具有公因子的数ρ,σ,τ的立方: φ′ = αρ3,ψ′ =βσ3,– χ′ = γτ3, 其中 α6 = β6 = γ6 = 1, 因此有 (4) ω3 = αβγρ3σ3τ3,αρ3 + βσ3 + γτ3 = 0。
然而,如果 κ = 因此

ω 的立方为G单位α,β,γ,则由于κ3 ≡ E mod 9,且αβγ ≡ E mod 9, ρστ
αβγ = E,

其中由 ω ≡ 0 mod π 可得到

τ ≡ 0 mod π,


ρ3 ≠ e,σ3 ≠ f mod π。 但是ρ3 ≡ e,σ3 ≡ f mod 9(e2 = f 2 = 1) 因此根据(4)式有 , eα + fβ ≡ 0 mod 3 由此可知 eα + fβ = 0。因而我们得到 β = Fα,Fα2γ = E(其中F2 = 1) , 且由(4)得 Fα3ρ3 + α3σ3 + Eτ3 = 0。
64

算术题

如果用ξ′、η′、ζ ′ 分别代替Fαρ、ασ、Eτ,最后得到变换成以ζ ′ 为特殊底的高斯方程 (3') ξ′ 3 + η′ 3 + ζ ′ 3 = 0, 而ζ ′ 的因子π要比(3)式中以ζ为特殊底的小好多倍。
① Complete Works, vol. II

附录:G 数的特征
I.数 J 和 O 满足下列方程: J + O = 1,JO = 1,J2 + O = 0,O2 + J = 0,J3 = –1,O3 = –1。 II.G 数的和、差、积仍为 G 数。 例如两个数 aJ + bO 与 a′J + b′O 的乘积为 pJ + qO(根据 I) ,其中 p = ab′ + ba′ – bb′,q = ab′ + ba′ – aa′。
范数。 复数 δ = ζ + ηi 的范数通常理解为两个相互共轭数的数 δ 和 δ = ζ ? ηi 的乘积。 III.

δ 0 = N (δ ) = δ δ = (ζ + ηi )(ζ ? ηi ) = ζ 2 + η 2 。
G数aJ + bO的范数相应的值为a2 + b2 – ab, 它是一个仅当a, 同时为零才消失的正整数。 b G数可能的最小范数为 1,2,3。 由 a2 + b2 – ab = 1 得到下述六种情况之一: a = 1 0 –1 0 1 –1 b=
因此范数为 1 时有六个 G 数:

0

1

0

–1

1

–1

J,– J,O,– O,1,–1。
方程

a2 + b2 – ab = 2 没有整数解。因此不存在范数为 2 的 G 数。 方程 a2 + b2 – ab = 3 最终可得六组整数解 a = 1,b = –1;a = –1,b = 1;a = 1,b = 2; a = –1,b = –2;a = 2,b = 1;a = –2,b = –1。
因此范数为 3 的范数有六个,即 π = J ? O = 3i ,πJ,πO 以及它们的共轭数 π = ?π ,– πJ,

– πO。 两个数乘积的范数等于这两个数范数的乘积。
证: N (αβ ) = αβ ? αβ = αβ ? α ? β = α α ? β β = N (α ) ? N ( β ) 。

IV.单位。一个 G 数 ε,当其倒数 η 也是 G 数时称为单位,或者更确切地称为 G 单位。 因为εη = 1,由范数的构成可推得ε0η0 = 1,亦即ε0 = 1。根据III,可得到六个G单位: J,– J,O,– O,1,–1。 这六个单位就是J或O的整数次幂,例如J,J2,J3,J4,J5和J6。 V.连带数。一个 G 数 ζ 乘以六个 G 单位所得的六个数就称为 ζ 的连带数。 πJ = –1 – O,πJ2 = –1 – J,πJ3 = – π,πJ4 = 1 + O,πJ5 = 1 + J,πJ6 = π。
65

算术题

VI.除法。两个 G 数 α 和 β 的商 q =

α 不一定是 G 数。然而,如果商是一个 G 数,则 β

β 称为 α 的除数(G 除数)或者 β 除 α 的除数。 为了用另一个任意 β 去除任一 G 数 α,可写成:

α α β α β hJ + kO h k = = = = J+ O。 β β β β0 β0 β0 β0
这里将每个有理数 于

h

β0



k

β0

分别为整数分量 m 和 n, 且每个有理分量 r 和 s 的绝对值均不大

19 1 (例如 = 4 ? 0.2 ) ,令 mJ + nO = κ,rJ + sO = R,得到 5 2

α = κ + R 或者 α = κβ + Rβ。 β
由 Rβ = α – κβ 可知 Rβ 是一个 G 数 γ,并有 α = κβ + γ。 此处

γ0 = R0β0 = (r2 + s2 – rs) β0。
然而由于 r ≤

1 1 3 3 , s ≤ ,着R0必定小于或等于 ,即 γ 0 ≤ β 0 。 2 2 4 4

结论:一个 G 数 α 被另一个 G 数 β 除,得到一个“商”k 和一个“余数”γ,即 α = kβ + γ, 其中余数的范数至多等于除数范数的

3 。 4

VII.最大公因子的运算。先从除法
(1) 其中

α 和有关等式 β
α = kβ + γ,

γ0 ≤
开始,并如 VI 所示确定出除法 (2) 其中

3 β0 4

β 中的商 λ 和余数 δ,这样可得到相应的等式 γ
β = λγ + δ,

δ0 ≤ γ 0。
然后,同理可得 (3) 其中

3 4

γ = μδ + ε,

ε0 ≤ δ0 ,
等等。由于余数的范数逐渐变小,最后必然得到余数为零。为了避免不必要的论述起见,假 定(3)式出发演算以后, (4)
66

3 4

δ 相除无余数,因此则得 ε
δ = νε,

算术题

于是可由(4)式得出 δ 也可被 ε 的每一个因子 τ 除且无余数,因此可由(3)得出 γ 也 可被 τ 除且无余数,由(2)得出 β 也可被 τ 除且无余数;最后,由(1)得出 α 可被 τ 除且 无余数。 反过来,由(1)式可得出 α、β 的每一个公因子也是 γ 的因子,于是由(2)得 τ 可以 去除 δ 且无余数;最后,由(3)式可知 τ 也是 ε 的因子。 α 和 β 的每个公因子必定可以去除 ε 且无余数, 的每个因子可以去除 α 和 β 亦无余数。 ε 相应地 ε 为 α 和 β 的最大公因子(就绝对值而言) 。 特别是如果 ε 为一个 G 单位数,数 α 和 β 被认为是没有公因子或彼此互为素数。 一系列等式链(1)(2)(3) , , ,…,等等,除作为确定普通整数最大公因子著名运算的 G 数推广外无其它的意义。 VIII.G 数没有明确分解成素因子。正如整数一样,判定可除尽、不可除尽以及明确地 分为素因子的普通定理都是由除法运算推导出的。 1.如果 α,β 没有公因子,且 αμ 可被 β 整除,则 μ 也可以被 β 整除。 2.如果两个 G 数无公因子,且与第三个 G 数也没有公因子,那么它们的积也与这三个 G 数没有公因子。 3.每一个 G 数能以唯一的方法分成素因子(即:G 素数)的乘积。 如分成 αβγ 与 ( αJ · β · γO,我们不考虑其中一个包含另一个中的某个因子的连带数,而不包含这个因子的 两者之间的差别。 ) 一个 G 素数就是除了它的六个连带数和六个单位数之外不再有其它因子的 G 数。 例如数 π = J – O 与 2 均为素数。 例如,如果假定π是可被除尽的:π = λμ,那么π0 = λ0μ0,或者 3 = λ0μ0。由此可得λ0 = 3, μ0 = 1。因而μ就是一单位数,π = λμ不能代表除法。 由 2 = λμ得到 2 = λ0μ0。情况λ0 = 2,μ0 = 2 可以排除,因为根据III,没有一个G数的范数 等于 2。 因此只剩下λ0 = 4,μ0 = 1。μ再次为一单位数,因此 2 = λμ不能代表除法。 IX.同余。正如自然数理论一样,当两个 G 数 α 和 β 的差 α – β 可被 G 数 μ 整除时,我 们说这两个 G 数对于模数 μ 是同余的,写作 α ≡ β mod μ。 X.G 数的模数 π。再考虑一个与模数 π = J – O 有关的 G 数 κ = aJ + bO。 如果 κ 可被 π 整除: aJ +bO = (mJ + nO)(J – O) = (2n – m)J + (n – 2m)O, 则 a = 2n – m,b = n – 2m。因此 a + b = 3g, 其中 g = n – m。 反过来,如果 a + b = 3g,m 和 n 是由 n – m = g 及 2n – m = a 来确定,给出 κ = (mJ + nO)(J – O)。 因此仅当 a + b 可被 3 整除时 G 数 κ = aJ +bO 才可以被 π 所整除。 如果 κ 不能被 π 整除,则下述三对公式之一能够成立: a = 3h,b = 3k + e; a = 3h + e,b = 3k; a = 3h + e,b = 3k + e; 2 其中e = 1。因此如果令hJ + kO等于λ, κ = 3λ + eO 或 κ = 3λ + eJ 或 κ = 3λ + e, 所以在每一种情况下 κ 的形式为
67

算术题

κ = 3λ + ε,
此处 ε 为 G 单位。 现在让我们考虑 κ 的立方。变成 κ3 = 9(3λ3 + 3λ2ε + 3λε2) + ε3, 由于ε3 = ±1,则形为 κ3 = 9μ ± 1。 如果 κ 不能被 π 整除,则有同余式 κ ≡ ε mod 3, 3 κ ≡ ±1 mod 9。

第22题 二次互反率
(欧拉—勒让德—高斯定理。 )奇素数 p 与 q 的勒让德互反符号取决于公式

? p? ? q ? ? ? ? ? ? = (?1) ? ? ? ? ? q ? ? p?

p ?1 q ?1 ? 2 2



称为二次互反定律的这一定律,由欧拉列出了公式但未给出证明①。1785 年勒让德在 与欧拉毫无联系的情况下,独自发现了相同的定律②,并作了部分证明。 第一个完整的证明由高斯(1777 – 1855 年)在他的奠定当代数论基础的名著中作出的 这部五百页的四开本充满了深奥观念的著作是高斯于 20 岁时写的。 “这确实令人惊奇, ” ③。 “试想一个这样年轻的人能够独自取得如此丰富的成果,尤其是 克罗莱克(Kroneaker)说: ” 对一个崭新的学科提出如此深远而又结构严谨的论述。 此后高斯又发现了互反率的另外七种证明(高斯的证明参见奥斯特瓦德(Ostwald)的 著作④。 二次互反率是数论的最重要定理之一。高斯称其为“基本定理” 。美国数学家迪克逊 “二次互反率无疑是数论中最重要的工具,并且在数论的 (Dickson)在他的著作中⑤写道: ” 发展史中占有中心位置。 这一定律的重要性导致了其他一些数学家像雅可比 Jacobi) 柯西、 ( 、 刘维尔 Liouville) ( 、 克罗莱克、谢林(Schering)和弗罗本里斯(Frobenius)继高斯之后去探讨这一定理并提出 了证明。P·巴克曼(P· Bachmann)列举了 52 种证明⑥,并且就最重要的问题提出了报告。 也许所有证明里最简单的证明是下述算术—几何证明,它是所谓高斯辅助定理⑦和 A·凯莱(Arthur Cayley,1821 – 1895 年)的几何思想⑧相结合的产物。 在作出证明之前先给出高斯辅助定理的推导。 设p为奇素数,D为不能被p整除的整数,如果x代表数 1,2,3,…, ρ = 个数,Rx为除法 (1) 按照Rx小于或大于

p ?1 中的一 2

Dx 的普通余数,gx为相应的整数商,于是 p Dx = Rx + gxp。 1 p ,相应地令Rx = ρx或 2 Rx = ρx + p, Dx 的负的最小余数,得到 p Dx = ρx + gxp。

第二种情况中的ρx代表除法 (1a)
68

算术题

或 (1b) 如果在 ρ 个除法

Dx = ρx + p + gxp。 Dx (对于 1,2,3,…,ρ)中出现 n 个负的最小余数,就有 n 个等式 p

。 (1b)和 m = ρ – n 个等式(1a) 将这些等式变换成 mod p 同余式,得到 ρ 个同余式 (2) Dx ≡ ρx mod p。 于是ρ个余数ρx,除了符号和序列不一致外,在数值上ρ个数 1 到ρ。 (例如:对于x的两个不同值r和s,ρx等于ρs或者ρx = – ρs,那么Dr ≡ ρx和Ds ≡ ρs分别相加 或相减就产生D(r ± s) ≡ 0 mod p,但此同余式不可能成立,因为无论D还是r ± s都不可能被p 整除。 ) 将 ρ 个同余式(2)相乘,得 Dρρ! ≡ (–1)nρ! mod p, 由此可得 Dρ ≡ (–1)n mod p。 然而根据欧拉定理(第 19 题) ,由于

? D? D ρ ≡ ? ? mod p , ? ? ? p?
得到

? D? ? ? ≡ (?1) n mod p , ? p? ? ?
由此,因为该同余式两边的绝对值为 1,则有 (3)

? D? ? ? = (?1) n 。 ? p? ? ? Dx (x = 1,2,3,…,ρ)所得的负 p

这一公式就是高斯辅助定理。式中 n 表示由 ρ 个除法

的最小余数的个数。 现在令 D 为不等于 p 的某个奇素数 q,将 ρ 个等式(1a)和(1b)变换成对模数 2 的同 余式,省去所有 2 的过量倍数,即(q – 1)x,则得到 x ≡ ρx + gx mod 2 和 x ≡ 1 + ρx + gx mod 2。 将这些 ρ 个同余式相加,得到

∑x≡n+∑ρ

x

+ ∑ g x mod 2 。

然而, 由于ρx的绝对值等于数 1 到ρ, 且每个被加数可以由其在mod 2 的同余式中的相反的值 来代替,可在所得同余式中用 ∑ x 代替 ∑ ρ x ,用– n代替n,因此得

∑x+n≡∑x+∑g
或者

x

mod 2

69

算术题

(4) 根据(4) ,可以将(3)式写作

n ≡ ∑ g x mod 2 。

?q? g ? ? = (?1) ∑ x 。 ? p? ? ?
于是gx是包含在商

? qx ? qx 中的最大整数。如果将其指定为 ? ? ,最后可得 p ? p?
∑? ? ?q? ? ? ≡ (?1) ? p ? , ? ? ? p? p ?1 的所有整数。 2 ∑? ? ? p? ? ? ≡ (?1) ? q ? , ?q? ? ? q ?1 的所有整数。 2 ∑ ? ? +∑ ? ? ? p? ? q ? ? ? ? ? ? ≡ (?1) ? q ? ? p ? 。 ? q ? ? p? ? ? ? ?
? px ? ? qx ? ? px ? ? qx ?

(I) 其中 x 为从 1 到 ρ = 相应地, (II) 其中 y 为从 1 到 σ =

将(I)与(II)相乘,得出 (III)

而右边的指数是容易求出的。 在直角坐标系 xy 中画出矩形,其四个角为

p p q q (0, 0), ( ,0) , ( , ) , (0, ) , 2 2 2 2 qx 且由原点用具有方程为 y = 的对角线 d 将其等分。然后在矩形内标出网点⑨(见图 4,其 p
中 p = 19,q = 11) 。 首先, 明显地看出没有一个标出的网点(x, y)落在 d 上, 因为此处必须 x < 这与条件

1 1 p ,y < q , 2 2

y q = 相矛盾。 x p

70

算术题

y

x
图4 对于一个值为整数的横坐标 x,相应的 d 的纵坐标为 y =

qx ,而标出的网点位于这一纵 p

? qx ? ? py ? 坐标上的个数为 ? ? 。因此,位于下半个矩形上标出的网点的个数为 ∑ ? ? ,其中 y 为 ? p? ? q ?
从 1 到 σ 的所有整数。 于是(III)式中所示的指数即为上述矩形中所有标出的网点数。总共有 ρ · σ 个元素。 因此,

? p? ? q ? ? ? ? ? ? = (?1) ρσ ? q ? ? p? ? ? ? ?
或者

? p? ? q ? ? ? ? ? ? = (?1) ? q ? ? p? ? ? ? ?
证毕。
① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ Opuscula analytica, Petersburg, 1783 Histoire de l’Académie des Sciences Disquisitiones arithmeticae, 1801 年出版 Klassiker der exaleten Wissenschaflen, vol. 14 Theory of Numbers Niedere Zahlentheorie Gauss’ Werke, vol. II, P. 51 Collected Mthematical Papers, vol. II 网点即坐标为整数的点。原注。

p ?1 q ?1 ? 2 2



71

算术题

第23题 高斯的代数基本定理
每一个 n 次的方程

zn + C1zn–1 + C2zn–2 +…+ Cn = 0
具有 n 个根。 表达得更确切些,该定理为: 多项式 f(z) = zn + C1zn–1 + C2zn–2 +…+ Cn 总是可以分成形为Z – αv的n个线性因子。 代数基本定理是一个有名的定理,首先于 1746 年由德·阿朗拜(d’Alembert)发表, 但只作了部分的证明。 一个严密的证明是 1799 年由 21 岁的高斯在他的博士论文①中作出的。 其后高斯又给出了这一定理的另外三种证明。 所有四种证明可见于他的著作第三卷, 也可以 、柯西、厄尔赫尔 见于奥斯特瓦德的著作②。高斯以后的其他作者,包括阿甘达(Argand) 、维尔斯特拉斯(Weierstrass) 、克罗莱克等也给出了该基本定理的证明。此处引 (Ullherr) 用的是阿甘达的证明③(经过柯西修正) ,它以其简洁而著称。 这一证明(像大多数其它证明那样)分为两步,第一步也是较难的一步,仅仅证明一个 n 次方程总是包含至少一个根;第二步证明该方程有 n 个根且没有更多的根。

第一步


zn + C1zn–1 + C2zn–2 +…+ Cn = f(z) = w 并考虑当z在高斯平面 (复平面) 内移动时绝对值|w|计算的不同的值。 令这些值中最小者为μ, 且设它到达位置例如z0,则|f(z0)| = |w0| =μ。 有两种可能的情况: 1.最小值 μ 大于零。 2.最小值 μ 等于零。 首先考虑第一种情况。在z0点最近的邻域内,也就是由半径为R,圆心在z0处的一个小圆 K所限定的区域内,因为μ代表|w|的最小值,所以|w|总是大于或等于μ,在z0处 |w| = |w0| = μ。 对于K内的任何z,z = z0 + ζ,其中ζ = ρ(cos θ + i sin θ),ρ为ζ的绝对值,即线段z0z,θ为 该线段与正实数轴之间的偏角。 计算 w = f(z) = f(z0 + ζ) = (z0 + ζ)n + C1(z0 + ζ)n–1 + C2(z0 + ζ)n–2 +…+ Cn, 消去括号并按 ζ 的升幂排列,这样得到 w = f(z) = z0n + C1 z0n–1 + C2 z0n–2 +…+ Cn + c1ζ + c1ζ 2 +…+ c1ζ n, 即 w = f(z0) + c1ζ + c1ζ 2 +…+ c1ζ n。 因为有些系数cr可能等于零,我们将第一个不为零的系数记作c,第二个为c′,等等。因此 w = w0 + cζ v + c′ζ v′ + c″ζ v″ +…, 其中 v < v′ < v″ <…。 用w0除之并分离出ζ v,得到 w = 1 + qζ v ? (1 + ζξ ) , w0

72

算术题

其中 q =

c ,ξ 表示指数为正数的、系数为已知的 ζ 的不同幂的总和。 w0

考察乘积qζ v · (1 + ζξ )。用三角的方法记下第一个因子,将cos φ + i sin φ简化为 1φ,且 由q = h(cos λ + i sin λ) = h · 1λ和ζ = ρ · 1θ,得到qζ v = h · 1λ · ρ · 1vθ = hρ1λ+vθ。此后仅限于考察 满足λ + vθ = π的K中的z值,他们必然位于与实数轴相交成角 θ =

π ?λ
v

的半径z0H上。对于所

有这些z值,数 1λ+vθ = 1π的值为–1,上述乘积呈现–hρv · (1 + ζξ )的形式。 如果选择足够小的半径R,由于ρ = |ζ | < R,第二个因子 1 + ζξ可以如所要求那样接近于 一个单位。但是这意味着乘积如所要求的那样接近于–hρv,即分数 w = 1 ? hρ v ? (1 + ζξ ) w0 如所要求的那样位于接近高斯平面上的点 1 – hρv,而高斯平面对于所有介于z0与H之间的z 的绝对值

w < 1 也就是说,对于这一z值,|w| < μ;而对于在z0邻域内的所有z值,|w|必然大 w0

于或等于μ。这是自相矛盾的。因此,上面给出两种情况的第一种(μ > 0)予以排除。这样 仅仅留下了第二种情况:w0等于零,或 f(z0) = 0, 因此,每个方程不管是几次的,至少有一个根。

第二步
我们从证明辅助定理开始: 如果一个代数方程 f(z) = 0 具有根 α, 那么方程左侧可被 z – α 除而无余数。 如果用 z – α 去除多项式直到余数 R 不再含有 z,得

f ( z) R , = f1 ( z) + z?a z?a
其中R为常数,f1(z)形式为

zn–1 + η1zn–2 + η2zn–3 +…+ ηn–1。
乘以 z – α,得

f(z) = (z – α)f1(z) + R。 如果对每个 z 都能成立的这一方程中,令 z = α,则 R = f(α) = 0。 因此对于所有的 z, f(z) = (z – α)f1(z)。 证毕。 如果将这一辅助定理与第一步中证明的关于一个根存在的定理结合起来, 就得到一个新 的定理:每个 z 的多项式可以表示成线性因子 z – α 与低一次的多项式的乘积。 如果我们写成α1而不是α,则得到 f(z) = (z – α1)f1(z)。 然后将所得定语用于多项式f1(z),得到 f1(z) = (z – α2)f2(z), 式中f2(z)为n – 2 次,且α2为f1(z) = 0 的一个根。按同样的方式 f2(z) = (z – α3)f3(z), f3(z) = (z – α4)f4(z),
73

算术题

等等。在这一系列方程中,从倒数第二个方程开始,如果用下一个方程的值代替每一个方程 右边的 f,最终得到将 n 次多项式变换成 n 个线性因子乘积的定理: f(z) = (z – α1)(z – α2)…(z – αn)。 用文字表达即为:每个 n 次的整有理函数可以表示为 n 个线性因子的乘积。 因此上述方程 f(z) = 0 可以写成 (z – α1)(z – α2)…(z – αn) = 0。 然而,只有某一个因子等于零时,左边的乘积才能等于零。又由于z – αv = 0 意味着z = αv, 所以最后得到: 方程f(z) = 0 有且仅有n个根α1,α2,…,αn。 这样,就证明了基本定理。 注:n个根α1,α2,…,αn中有几个可能相等,例如α2和α3可以都等于α1,而α4,α5,…, αn可能不等于α1。在此情况下α1叫做一个重根,特别有三个相等的根叫做三重根。
① ② ③ Demonstratio nova theorematis omnem functionem algebraicam rationalem integram unius variabilis in factores reales primi vel seaundi gradus resolve posso, Helmstaedt, 1799 Klassiker der esakten Wissenschafien, vol. 14 Annales de Gergonne, 1815

第24题 斯图谟的根的个数问题
求实系数代数方程在已知区间上的实根的个数。 1829 年,法国数学家 C·斯图谟(Charles Sturm,1803 – 1855 年)用令人意想不到的简 单方法解出了这个非常重要的代数问题①。 “由于这一巨大的发现, ”刘维尔说, “斯图谟立即简化并且完整了代数的原理,用新的 解法充实了它们。 ” 解:区别两种情况: I.在已知区间上所求方程的实根全为单根。 II.方程在该区间上还有多重实根。 首先证明由第二种情况会导致回到第一种情况。 设所定方程 F(x) = 0 有不同的根 α,β,γ,…,并令 α 为 a 重根,β 为 b 重根,γ 为 c 重 根,…,因此: F(x) = (x – α)a(x – β)b(x – γ)c…, 求出F(x)的导数F ′ (x),得 F ′( x) a b c = + + + F ( x) x ? α x ? β x ? γ a ( x ? β )( x ? γ )( x ? δ ) + b( x ? α )( x ? γ )( x ? δ ) + = 。 ( x ? α )( x ? β )( x ? γ )

如果将这一分式的分子记作 p(x),分母记作 q(x),并令每个整有理函数 那么

F ( x) 等于 G(x), q( x)

F(x) = G(x) · q(x), F ′ (x) = G(x) · p(x)。 这样函数p(x)与q(x)没有公因子。 (例如除p(x)第二项外,q(x)因子x – β可以整除p(x)所有项而 没有余数。 )由此可知G(x)为F(x)与F ′ (x)的最大公因子,这可由除法运算很容易确定,因而

74

算术题

能够看作已知的,结果q(x)也可看作已知的。 因此方程 F(x) = 0 可化成两个方程 q(x) = 0 与 G(x) = 0, 第一个方程仅有单根,而第二个方程可用 F(x) = 0 所使用的同样方法加以简化。 因而,具有重根的方程总是可以转换成仅有单根的方程(系数为已知) 。 因此,这足以解决第一种情况中的问题。 令f(x) = 0 为所有根均为单根的代数方程。那么对于任何一个根,f(x)的导数f ′ (x)均不为 零, 且函数f(x)与f' (x)的最大公因式为一个不等于零的常数K。 运用除法运算的方法来确定f(x) 与f ′ (x)的最大公因子,为了表达便利,就用f0(x)与f1(x)代替f(x)与f ′ (x),并将依次相除所得的 商记作q0(x),q1(x),q2(x),…,余数记作– f2(x),– f3(x),…。 为简化起见,去掉自变量的符号,则得到下列形式: (0) f0 = q0f1 – f2, (1) f1 = q1f2 – f3, (2) f2 = q2f3 – f4, 等等。 在这种形式中,最起码会出现一个余数– fs(x)(最后为K) ,该余数在整个区间的任何点 上都不等于零,因而在整个区间上符号皆相同。至此暂停运算。包括 f0,f1,f2,…,fs 的诸函数形成“斯图谟链” ,且由于这种联系,称其为斯图谟函数。 斯图谟函数具有下列三个特性: 1.在区间上任何点上两个相邻的函数不同时为零。 2.在一个斯图谟函数的一个零点上,相邻两个函数异号。 3.在f0(x)的零点周围充分小的区域内,f1(x)总是大于零或小于零的。 1 的证明:例如,如果f2与f3在一区间上的任一点处等于零,根据(2)在该点f4也等于 零,因此根据(5) 5也等于零,等等。所以根据运算的最后一行可知最终的fs也等于零, ,f 而这跟我们的假定是相矛盾的。 2 的证明:例如,如果f3在区间上的σ点处等于零,则由(2)得 f2(σ) = – f4(σ)。 3 的证明:此证明要用到已知的定理:函数f0(x)在一点的增或件,取决于其导数f1(x)在 该点是大于零或者小于零。 于是选择区间上的任一点x,记下f0(x),f1(x),…,fs(x)等值的符号,得到斯图谟符号链 (然而,为了使符号明白无误,必须假定给定的s + 1 个函数中没有一个函数值为零) 。该符 号链包含连号(+ +与– –)以及变号(+ –与– +) 。 考察符号链中变号次数Z(x),以及当x通过该区间时Z(x)经历的变化。只有当斯图谟函数 中一个或者几个改变符号时才会发生变化,也就是说,从负(正)数值经过零而到达正(负) 数值时。我们将相应地研究函数fv(x)经过零时对Z(x)所产生的影响。 设k为fv等于零的一点,h和l为位于k点左侧和右侧的点,且如此逼近于k使在区间h到l上 以下情况情况成立: (1) v的每一个邻域(fv+1, fv–1)不改变符号。 f 必须区别v > 0 与v = 0 的情况; 在第一种情况下,我们关心的是三个一组的值fv–1,fv,fv+1;在第二种情况下,是一对值f0, f1。 在三个一组值中,在所有三个点h,k,l上,fv–1与fv+1的符号不是+与–,就是–与+。因此, 不论fv在这些点上的符号可能是什么,对于三个自变量h,k,l中的每一个而言,三个一组的 值中有一个改变符号。函数fv通过零并不改变链中变号的次数。 在一对值中,在所有三点h,k,l上f1的符号为+或–。在第一种情况下f0为增函数,因此
75

算术题

在h为负值而在l为正值;在第二种情况下f0为减函数,因此在点h为正,在点l为负。在两种 情况下都少一个变号。 通过验证可知:只有当 x 通过 f(x)的零点时,斯图谟符号链在变号数 Z(x)上才经历一个 变化;而且特殊的是当 x 增加时该符号链恰恰失去一个变号。因此,如果 x 从左到右通过一 个两端点不代表 f(x) = 0 的根的区间,符号链失去变号的个数正好等于 f(x)在该区间上零点 的个数。因此有: 斯图谟定理:一个实系数代数方程其根在区间上都为单根,该区间的两端点均不为根, 则实根数就等于在区间两端点上斯图谟符号链的变号数之茶。 注:同样的研究可以不变地运用于任意正常数去乘f0,f1,f2,…,fs所得到的系列,于 是该序列同样可称为斯图谟链。在斯图谟链的组成中,相应地全部避免分数系数。 例 1:确定方程x5 – 3x – 1 = 0 实根的个数和存在的情况。 斯图谟链为 f0 = x5 – 3x – 1,f1 = 5x4 – 3,f2 = 12x + 5,f3 = 1。当x = –2,–1,0,1,2 时f的符号为 x –2 –1 0 1 2 f0 – + – – + f1 + + – + + f2 – – + + + f3 + – + + +

因此该方程具有三个实根:一个在–2 和–1 之间,一个在–1 和 0 之间,一个在 1 和 2 之 间。另外两个根为复数。 例 2:确定方程x5 – ax – b = 0 当a和b为正数且 44a5 > 55b5时实根的个数。 斯图谟链记作 x5 – ax – b,5x4 – a,4ax + 5b,44a5 – 55b5。 对于 x = – ∞与+ ∞,相应的符号为 –+–+ 与 + + + +。 所以方程有三个实根和两个复数根。
① “Mémoire sur la résolution des équalions numériques”, Bulletin des sciences de Férussac

第25题 阿贝尔不可能性定理
高于四次的方程不可能有代数解法。 意大利物理学家 P·鲁菲尼(Paolo Ruffini,1765 – 1822 年)1798 年在波洛尼亚出版的著 作中首先阐述了这个有名的定理①,但鲁菲尼的证明是不完善的。1826 年年轻的挪威数学 家 N·H·阿贝尔(Hiels Henrik Abel,1802 – 1829 年)第一个给出了严谨的证明②。 下述阿贝尔不可能性定理的证明,是以克罗莱克的定理为基础的③。 首先将简短地介绍一下辅助代数定理,这对理解克罗莱克的证明很有用处。 如果一个数系 P 中的两个数相加、相减、相乘及相除时仍得到一个本数系中的数,则此 数系叫做数群或有理域。 为简便起见称此数系中的数为 P 数。 当两群中的任一群中每一个数 也同属于另一群,则称为两群相等。最简单的数群是由全体有理数,有理数群 Q,或自然有 理数域组成的。
76

算术题

群 P′ = P(α, β, γ,…)产生在“P 群中 α,β,γ,…的代换” ,理解为得自 P 数的全部数的总 和及通过一种或多种四则运算代换的数 α,β,γ,…,换句话说也就是系数为 Q 数的所有 α, β,γ,…的有理函数的总和。 一个数群的的函数 f(x)或方程 f(x) = 0 就是系数为此群中的数的函数或方程。 中的多项 P 式意即一个系数为 P 数的变量 x 的整有理数。 群 P 中的多项式 F(x) = Axn + Bxn–1 +… 或方程 F(x) = 0 在本群中可约或不可约,按照 F(x)能否化成低次的多项式的乘积而定。 例如,函数x2 – 10x + 7 在群Q中是不可约的,而在群 Q( 2 ) 中是可约的:
x 2 ? 10 x + 7 = ( x ? 5 ? 3 2 )( x ? 5 + 3 2 ) 。

阿贝尔辅助定理④:当 C 为群 P 中的一个数但不是群中一个数的 p 次幂时,次数为素 数 p 的纯方程 xp = C 在该群中是不可约的。 间接证明:设xp – C = 0 是可约的,则 xp – C = ψ(x)φ(x), 其中ψ和φ是P中的多项式, 其中自由项A和B为P数。 因为方程xp = C的根为r, rε2, rεp–1, rε, …, 其中r为一个根,而ε为复数p次单位根,方程ψ(x) = 0 或φ(x) = 0 的自由项(不计符号)代表 了方程多个根的乘积,例如, A = rμεM,B = rνεN。 由于 μ 和 ν 不具有公因子(因为 μ + ν = p) ,必有整数 h,k 满足 μh + νk = 1。 h k hM+kN 因此,幂A 和B 的乘积为K时得到值rε ,并且对于P数K的p次幂得值Kp = rp = C。然而所 作的假定C一定不是一个P数的p次幂。因此xp = C不可能是可约的。 舍列曼(Schoenemann)定理⑤:如果多项式 f(x) = C0 + C1x + C2x2 +…+ CN–1xN–1 + xN 的整系数C0,C1,C2,…,CN–1可被一素数p整除,而自由项C0不能被p2所整除,则f(x)在自 然数域内是不可约的。 间接证明:设 f 为可约的,则 f = ψ · φ,其中 ψ = a0 + a1x + a2x2 +…+ am–1xm–1 + xm, φ = b0 + b1x + b2x2 +…+ bn–1xn–1 + xn。 根据高斯定理⑥,这里的系数 a 与 b 均为整数,将 ψ 和 φ 的表达式相乘,并与 f 相比较,得 C0 = a0b0, C1 = a0b1 + a1b0, C2 = a0b2 + a1b1 + a2b0, 等等。由于C0不能被p2所整除,假设a0可被p整除,在此情况下b0就不能被p整除。由于C1与 a0可被p整除而b0则不能,因而从上述式中第二行可知a1可被p整除。然后根据上述式中第三 行,C2,a0,a1可被p整除,因而a1也可被p整除,等等。最终可以断定am = 1 也能被p整除, 而这自然是不可能的。因此,f是不可约的。 可约的和不可约的多项式在多项式中所起的作用与合数和素数在整数中所起的作用一

77

算术题

样。 因此, 举例来说每一个可约的多项式仅可以用一种方法分成几个不可约的多项式的乘积。 与此有关的所有定理都是以不可约函数的基本定理为基础的。 如果 P 中不可约方程 f(x) = 0 的一个根也是 P 中的方程 F(x) = 0 阿贝尔不可约性定理⑦: 的一个根,则此不可约方程的所有根都是 F(x) = 0 的根。同时,F(x)可被 f(x)整除而无余数: F(x) = f(x) · F1 (x), 其中F1 (x)也是P中的一个多项式。 该定理的简单证明基于大家熟悉的求 P 中任意两个多项式 F(x)与 f(x)的最大公因子 g(x) 的算法。这一算法经过一系列的除法运算,导出一对方程 F(x) = F1(x) · g(x), f(x) = f1(x) · g(x), 其中所有的系数都是 P 数。并导出方程 V(x)F(x) + v(x)f(x) = g(x), 其中出现的所有函数都是 P 中的多项式。 如果上述函数 F 与 f 没有公因子,则 g(x)为一常数,为了方便起见令其等于 1。 如果f为不可约的, = 0 的一个根α也是F = 0 的根, 且f 则存在着至少为一次的公因子x – α。 因为f是不可约的,f1(x)必等于 1,且f(x) = g(x),则 F(x)(= F1(x) · g(x))= F1(x) · f(x)。 因此 F(x)可被 f(x)整除,且对于 f(x)的每个零点其值均为零。证毕。 该基本定理直接包含了两个重要的推论: I.如果 P 中不可约方程 f(x) = 0 的一个根也是 P 中次数低于 f 的方程 F(x) = 0 的根,则 F 的所有系数均等于零。 II.如果 f(x) = 0 是群 P 中的一个不可约方程,则 Q 中不存在别的月 f(x) = 0 有一个共同 根的不可约方程。 在群 P 内代换的最普通情况是将 n 次不可约方程 f(x) = xn + a1xn–1 +…+an = 0 的一个根 α 代入 P。由这种代换所定义的群 P′ = P(α)中的一个数 ζ 是 α 的一个有理函数,其 系数取自 P,并可写成: Ψ (α ) ζ = , Φ (α ) 其中 Ψ 与 Φ 都是 P 中的多项式。由于 an = – a1αn–1 – a2αn–2 – …– an, 指数为n或更高的α的每一个幂均可用幂αn–1,αn–2,…,α来表示,所以可以写成 φ (α ) ζ = , ? (α ) 其中 ψ 和 φ 为 P 中次数不高于 n – 1 的多项式。 由于 f(x)和 φ(x)不具有公因式,在 P 中可以找出这样两个多项式 u(x)与 v(x)(见上文) , 使得 u(x)φ(x) + v(x) f(x) = 1。 如果在此方程中令 x = α, (因为 f(α) = 0)则有 u(α) · φ(α) = 1,即 ζ = ψ(α) · u(α)。将其乘出来 并再次消去每一个指数大于或等于 n 的 α 的幂。最终得出 ζ = c0 + c1α + c2α2 +…+ cn–1αn–1, 式中cv为P数。亦即 III.若 α 为 P 中 n 次不可约方程的一个根,则群 P(α)中的每一个数都可以用系数为 P 数的 α 的 n – 1 次多项式来表示,且只有这一种可能的表示方法。
78

算术题

(由c0 + c1α + c2α2 +…+ cn–1αn–1 = C0 + C1α + C2α2 +…+ Cn–1αn–1 得到 d0 + d1α + d2α2 +…+ dn–1αn–1 = 0, 其中 dv = Cv – cv。 则对于 f(x) = 0 的一个根,n – 1 次函数 d0 + d1α + d2α2 +…+ dn–1αn–1 等于零,并且根据推论I,各系数必等于零。由dv = 0,则得Cv = cv。 ) 刚刚所见是将一个不可约函数借助一个根代换而转变为可约的函数的简单例子。 让我们考察更一般的情况,即 P 中的次数为素数 p 的不可约函数 f(x) ,通过 P 中的 q 次不可约方程 g(x) = 0 的一个根 α 的代换,变成可约函数。在这种情况下,f(x)可以被分解 成次数可能分别为 m 与 n 的两个多项式 ψ(x, a)与 φ(x, a)的乘积。 于是 r 为某个有理数,P 中的函数 u(x) = f(r) – ψ(r, x)φ(r, x) 对于 x = a 其值为零。根据不可约函数的基本定理,对于不可约方程 g(x) = 0 的所有根 a,a′, a″,…,函数 u(x)等于零。 例如,由于方程 f(x) – ψ(x, a′)φ(x, a′) = 0 对于每一个有理数 x 能够成立,则对于所有的 x 值也能成立,因此利用恒等式 f(x) = ψ(x, a′)φ(x, a′) 同样地对于 g(x) = 0 的所有其它根,上述方程也能成立。 由 q 个方程 f(x) = ψ(x, a)φ(x, a), f(x) = ψ(x, a′)φ(x, a′), 等等,相乘可得到 f q(x) = Ψ(x) · Φ(x), 其中 Ψ(x)及 Φ(x)分别为 q 个多项式 ψ(x, a),ψ(x, a′),…及 φ(x, a),φ(x, a′),…的乘积。由于 这些乘积中的每一个都是 g(x) = 0 的根的对称函数,每个乘积都可以根据华林(Waring)定 理,用 g(x) = 0 的系数表达为有理数(表达为自然数则用 x) ,因此 Ψ(x)及 Φ(x)都是 P 中的 多项式。 于是至少对于不可约方程 f(x) = 0 的一个根, Ψ(x)必然等于零, Φ(x)也是如此。 因此 Ψ(x) 及 Φ(x)都可以被 f(x)整除而无余数。有因为 f 不可约的,除 f 外再不可能有其它的因子,其 结果为 Ψ(x) = f(x)μ,Φ(x) = f(x)ν, 其中 μ + ν = q。比较左边和右边的次数,可得 mq = μp,nq = νp。 又因为 m 与 n 均小于 p,由此可知 p 为 q 的因子。因而可得定理: IV. 群中次数为素数 p 的不可约方程, 通过群中另一个不可约方程之根的代换变为可约 的,唯一的条件是 p 是最后一次方程的次数的因子。 现在可以回到阿贝尔定理的证明上来。 然而首先要考虑的是: 代数可解方程意味着什么。 群 Q 中的 n 次方程 f(x) = 0,当用一系列的根式可以解出时,亦即当一个根 w 可以用方 式确定时,该方程称为代数可解的: 1. 确定一个 Q 数 R 的 a 次方根 α = a R , R 不是一个 Q 数的 a 次幂, 而 并将 α 代入 Q, 因而建立起群 U = Q(α);
79

算术题

2.确定一个 U 数 A 的 b 次方根 β = b A ,而 A 不是一个 U 数的 b 次幂,并将 β 代入 U, 因而建立起群 V = U(β) = Q(α, β); 3.确定一个 V 数 B 的 b 次方根 γ = c B ,而 B 不是一个 V 数的 c 次幂,并将 γ 代入 V, 因而建立起群 T = V(γ) = Q(α, β, γ),等等。这样连续代入根 α、β、γ、…直至最终得到一个 数群,使所求的根 ω 属于其中,且该群中的 f(x)(因为它具有因子 x – ω)变成可约的。此 处假定所有的根指数 a,b,c,…均为素数。这并不意味着受到某种限制,因为指数为任何 ) 合数的开方可以化为指数为素数的逐次开方。 (例如: 15 u = 5 v ,其中 v = 3 u 。 为简便计,仅限考虑具有有理系数的方程 f(x) = 0,故 Q 为自然有理数域,它在 Q 中又 是不可约的,且其次数 n 为奇素数。 设首次代换为一个 n 次单位根

α = η = n 1 = cos

2π 2π + i sin 。 n n

由于η为次数小于n次的方程xn–1 + xn–2 +…+ x + 1 = 0 的一个根,根据IV,上述代换仍不 能使f成为可约的。 同时,当我们通过一系列根的代换仍然不能使 f(x)分解,此时我们也可以用复共轭根式 来代换。尽管这也许是多余的,但并无害处。 令 λ = l K 为这样一个根,使其加上前面的根可使 f(x)为可约的,因此 f(x)在群 P(K 为 其中的数)中,f(x)仍然为不可分解的,但在 ? = P(λ)中成为可分解的: f(x) = ψ(x, λ) · φ(x, λ) · χ(x, λ)…。 此处因子 ψ,φ,χ,…是 ? 中的不可约多项式(当然不是 P 中的多项式) ,其系数均为 P 中 λ 的多项式。 根据 IV,由于素数 n 必须是素数 l 的一个因子,因而 l 必等于 n。 根据阿贝尔辅助定理,P中不可约的方程xl = K的l个根为 λ0 = λ,λ1 = λη,λ2 = λη2,…,λv = ληv,…,λn–1 = ληn–1。 由于ψ(x, λ)为f(x)的因子,则ψ(x, λv)可以去除f(x)而无余数(见IV的证明) 。 n个函数ψ(x, λv)中的每一个都是?中不可约的。 (如 IV 的证明,由 ψ(x, λv) = u(x, λv) · v(x, λv) 得到 ψ(x, λ) = u(x, λ) · v(x, λ), 但这一方程是不可能的,因为 ψ(x, λ)是 ? 中不可约的。 ) μ n个函数ψ(x, λv)中没有两个是相等的(在ψ(x, λη ) = ψ(x, λην)中,如前一样λ必能被根ληn–μ 所代替,由此可得: ψ(x, λ) = ψ(x, λH), ν–μ 其中H表示单位根η 。此处λ必须依次用λH代入,则必然得到: ψ(x, λH) = ψ(x, λH2)。 同理,必然得到 ψ(x, λH2) = ψ(x, λH3), 等等。因此必有 ψ(x, λ) = ψ(x, λH) = ψ(x, λH2) =…,
80

算术题

即 。 n 然而作为xn = K的n个根λ, λH, 2, λH …的对称函数, 该方程的右侧是P中x的多项式, 因此ψ(x, λ)也必定是P中的x的多项式。而这是与上述关于f(x)规定相矛盾的。 ) 出于这两个原因, 得到: f(x)可被?中不可约的n个不同因子ψ(x, λ), λη), ψ(x, ληn–1) ψ(x, …, 的乘积Ψ(x)所整除: f(x) = Ψ(x) · U(x), n 其中Ψ(作为x = K的根的对称函数)以及由此而得的U均为P中的x的多项式。于是f(x)是P 中不可约的,U(x)必等于 1,且须有 f(x) = Ψ(x) = ψ(x, λ)ψ(x, λη)…ψ(x, ληn–1)。 因此,对于群?,假定的f(x)的可除性从而显示它本身可分解为线性因子。这样,如果ω, ω1,ω2,…,ωn–1为f(x)的根,而x – ω,x – ω1,x – ω2,…,x – ωn–1为f(x)的线性因子,则 x – ω = ψ(x, λ),x – ω1 = ψ(x, λη),…,x – ωn–1 = ψ(x, ληn–1), 因此 ω = K0 +K1λ + K2λ2 +…+ Kn–1λn–1, ω1 = K0 +K1λ1 + K2λ12 +…+ Kn–1λ1n–1, … ωn–1 = K0 +K1λn–1 + K2λn–12 +…+ Kn–1λn–1n–1, 其中所有Kv均为P数。 于是,由于方程 f(x) = 0 为奇次,最少有一个实根。令这个实根为 ω = K0 +K1λ + K2λ2 +…+ Kn–1λn–1。 区别两种情况: I.可约根 λ 的底 K 是实数; II.底 K 是复数。 情况 I:由于 n 次单位根属于群 P,可以假定 λ 为实数。在此情况下 ω 的复共轭为

ψ ( x, λ ) =

ψ ( x , λ ) + ψ ( x , λH ) +

+ ψ ( x, λH n ?1 )

ω = K 0 + K 1λ +
其中Kv的复共轭 K v 也是Q数。则由 ω = ω 得到
( K 0 ? K 0 ) + ( K 1 ? K 1 )λ +

+ K n ?1 λ n ?1

+ ( K n ?1 ? K n ?1 )λ n ?1 = 0 ,

再考虑定理I,则由此可得到对每个v有 K v = K v 。因而数K0,K1,…,Kn–1也为实数。 此外,有 ωv = K0 +K1λv + K2λv2 +…+ Kn–1λvn–1 以及 ωn–v = K0 +K1λn–v + K2λn–v2 +…+ Kn–1λn–vn

相关文章:
100个著名初等数学问题.pdf
100个著名初等数学问题 - 100 个著名初等数学问题 历史和解 100
100个著名初等数学问题1.pdf
100个著名初等数学问题1 - 100 个著名初等数学问题 第 01 题 阿基米
100个著名的初等数学难题.doc
发信人: bangbangbear (美人如玉剑如虹), 信区: Intelligence 标题: 100 个著名初等数学难题 发信站: 自由空间 (2003 年 04 月 30 日 16:44:17 星期三...
100个著名初等数学问题.doc
100个著名初等数学问题 - 100 个著名初等数学问题 第 01 题 阿基米德
100个著名初等数学问题.pdf
100个著名初等数学问题 - 第 01 题 阿基米德分牛问题 Archimede
100个著名初等数学问题.doc
100个著名初等数学问题 - 100 个著名初等数学问题 100 Great P
100个著名初等数学问题.doc
100个著名初等数学问题 - 100 个著名初等数学问题 第 01 题 阿基米德
100个著名初等数学问题.doc
100个著名初等数学问题 - 100 个著名初等数学问题 第 01 题 阿基米德
100个著名初等数学问题研究.doc
100个著名初等数学问题研究 - 100 个著名初等数学问题研究 可惜太过于零散
100个著名初等数学问题.doc
100个著名初等数学问题 - 100 个著名初等数学问题 第 01 题 阿基米德
100个著名的初等数学难题.txt
100个著名初等数学难题 - 发信人: bangbangbear (美人如玉剑如虹), 信区: Intelligence 标 题: 100个著名初等数学难题 发信站: 自由空间 (2003...
100个著名初等数学问题3.pdf
100个著名初等数学问题3 - 100 个著名初等数学问题 第 01 题 阿基米
100个著名的初等数学难题.doc
100个著名的初等数学难题 - 100 个著名初等数学问题 100 Great
100个著名初等数学问题.历史和解.德.H.德里.上海科学技....doc
100个著名初等数学问题.历史和解.德.H.德里.上海科学技术.1982_理学_高等教育_教育专区。数学100 个著名初等数学问题第 01 题 阿基米德分牛问题 Archimedes' Proble...
一百个著名初等数学问题.doc
一百个著名初等数学问题 - 第 01 题 阿基米德分牛问题 Archimedes
100个著名的初等数学难题.txt
发信人: bangbangbear (美人如玉剑如虹), 信区: Intelligence 标 题: 100个著名初等数学难题发信站: 自由空间 (2003年04月30日16:44:17 星期三), 站内...
100个著名初等数论问题.doc
100个著名初等数论问题 - 100 个著名初等数学问题 http://www.
100个著名初等数学问题.doc
100个著名初等数学问题_数学_高中教育_教育专区。100 个著名初等数学问题 100 Great Problems of Elementary Mathematics 第 01 题 阿基米德分牛问题 Archimedes' ...
100个初等问题.doc
100个初等问题 - 100 个著名初等数学问题 第 01 题 阿基米德分牛问题
100个著名初等数学问题.txt
1 100个著名初等数学问题 100个著名初等数学问题 100 Great Pr