Professional Documents
Culture Documents
齐民友
高等教育出版社
郑 重声明
高等教育出版社依法对本书享有专有出版权。任何未经许可的复制、销售行为均违反《中华
人民共和国著作权法》, 其行为人将承担相应的民事责任和行政责任 , 构成犯罪的 , 将被依法追究
刑事责任。为了维护市场秩序 , 保护读者的合法权 益 , 避免读 者误 用盗版 书造 成不 良后果 , 我 社
将配合行政执法部门和司法机关对违法犯罪的单位和个人给予严厉打击。社会各界人士如发现
上述侵权行为 , 希望及时举报 , 本社将奖励举报有功人员。
反盗版举报电话 : ( 010) 58581897 58581698 58581879 58581877
传 真 : ( 010) 82086060
E mail : dd@ hep .com .cn 或 chenrong@ hep .com .cn
通信地址 : 北京市西城区德外大街 4 号
高等教育出版社法律事务部
邮 编 : 100011
策划编辑 李 蕊
责任编辑 郭思旭
封面设计 王凌波
责任绘图 宗小梅
版式设计 马静如
责任校对 尤 静
责任印制
内容提要
图书在版编目 ( CIP) 数据
Ⅰ . 重 . . . Ⅱ . 齐 . . . Ⅲ . 微积分 Ⅳ . O172
经 销 新华书店北京发行所
印 刷
开 本 787×1092 1 16 版 次 年 月第 1 版
印 张 35 印 次 年 月第 次印刷
字 数 860 000 定 价 39 .60 元
本书如有缺页、倒页、脱页等质量问题 , 请到所购图书销售部门联系调换 .
版权所有 侵权必 究
序
齐民友
2003 年 3 月
目 录
序 …………………………………………… Ⅰ §6 分部积分法、广义函数、索伯列夫
第一章 变量的数学———从直观与思辨到 ( Sobolev) 空间 ………………… 260
成熟的数学科学 …………………… 1 §7 复积分 ………………………… 279
悖论 .
第二个悖论是所谓“两分法”( dichotomy) “
. 阿基里斯”是用相对 运动来 反对直线 是由无限 多
个单元组成这一论断的“
, 两分法”则说运动是不 可能的 , 并以 此反 驳上述 论断 : 若 一个物 体要 沿
某一直线走完一定的路程 , 它必先经过其中点 ; 但在达到中点以 前 , 先 要到达 1/ 4 点 ; 在到达 1/ 4
点以前先要到达 1/ 8 点……仿此进行下去 , 该物体必须在有限时间内走完无限多个区段 .而这是
不可能的 .因此 , 运动不可能 .当然 , 用现代的数学知识 来解释 这个 悖论也 不困 难 .只要承 认时 间
是无限可分的 , 则相应于空间的无限多个区段 , 也有时 间的无 限多 个区段 .而 这些 时间区 段的 长
度成为一个几何级数 , 公比是 1/ 2 , 因 而无 限多个 时间 区段长 之总 和可 以是有 限的 .这就 解释 了
两分法悖论 .
图1 -1
x ( t2 ) - x ( t1 )
v = ≠0 .
t2 - t1
因此 x ( t2 ) - x ( t1 ) ≠ 0 , 所以就必然有运动 .芝诺说 , 因为飞箭在每一瞬间都有一定位置 , 这就意
味着飞箭在这一瞬间是静止的 , 这个论断在逻辑上就没有根据 .上面我们说的其实就是导数的概
念 .飞箭在每一瞬间 都 有 固 定 的 位 置 , 即 x ( t ) 有 确 定 的 值 , 这并 不 是 静 止 .要 静 止 , 至 少 需 要
第一章 变量的数学 5
如果我们把内接正多边形边数增加一倍 , 则 S - P2 n 与 S - Pn 的关系
是从 ( 弓形 A BFCGA ) 中减去 △ A BC, 而 把原 来的 一个弓 形换 成两个
1
小弓形 , 其 弦 各 为 AC与 BC .但 被 减 去 的 △ A BC > ( 弓 形 A BFC-
2
GA ) , 所以这一个弓形被减去了“一大半”.每一个弓形如此 , n 个弓形
之总和当然也如此 .所以随着每一 次把内 接正 多边形 的边 数加 一倍 ,
S - Pn 就会被减去“一 大半”.仿 此进 行下 去 , 利 用卷 Ⅹ 命题 1 , 即 知 ,
只要 n 取得足够大 , S - Pn ( 其实就是 | S - Pn | ) 就 会变得“要 多小有
多小”.
图1- 2
至此 , 读者们一定会说 , 由此推知 , 对任 意 ε> 0 必 定有 N 存在 ,
使当 n > N 时 , | S - Pn | < ε, 亦即 nlim Pn = S .但是 不要 太急 , 不要 忘记 希腊 人还 没 有极 限的 明
→∞
斯“单元”以及后来的不可分量的“痕迹”.这只是在欧多克萨斯的基础上走了更明确的一步 .他们
也是宣告了亚里士多德潜无限思想的“胜利”, 把笼罩着的思辨色彩“ 清除”了 .这一点恐怕他们自
己也没有想到 .千真万确的是 , 他们 把变 量、极 限等 等归 结为 不等 式 , 确 是得 了欧 多 克萨 斯的 真
传 .可惜的是 , 正是这一点成了 ε- δ的罪名 , 因为它们 使人望而 生畏了 , 这 却是变量 的数学的 精
华 .
不过 , 凡事有利必有弊 《
. 几何原本》在数学上的严 格性成 了人 们的“模 范”以后 , 也必 然会 对
人的直觉、感觉、不严格的推理有所排斥 .而这种排斥时常也把许多极为生动的 , 通向真理的其它
道路封锁了 .以亚里士多德而言 , 潜无限的思想被推到 了主导 的地 位 , 实无限 的思 想难道 就一 无
是处了吗 ? 否 , 历史证明不是这样 《
. 几何原本》一个最 明显的 缺点 是轻视 数学 的实 际应用 .这 不
是说希腊数学整个都是轻视应用的 .即以欧多克 萨斯而言 , 他 不仅 是一位 数学 家 , 还是一 个天 文
学家 ( 他曾经提出一个关于天体运动的模型 ) , 他 还是一个 医生 , 一 个地理 学家 .另 一位更 著名 的
大人物是 阿基 米德 ( A rchimedes , 287—212 , B .C .) .他 是亚历 山大 时期 ( 或 称希 腊化 时期 ) 希 腊
数学和科学的代表人物 .他较晚于欧几里得 , 但二人 大异其 趣 .他不 仅在数 学 , 而且 在力学、机 械
学、光学等各方面都有大贡献 .他还是一位伟大的发明家 , 而欧几里得主要贡献则是完成了《几何
原本》( 其中不少是他的弟子们的功绩 ) , 有点像孔夫 子说的“述而 不作”, 而阿 基米 德的创 造天 才
却是光彩夺目的 .因为我们的目的只是讨论微积分的思想与方法的源起 , 所以现在就不来讨论希
腊数学各个时期特点的比较及 其 功过 了 .好在 到 了公 元前 2 世纪 至前 1 世纪 , 罗 马 人征 服了 希
腊 .出现了罗马帝国 , 希腊数学也退到历史的后台去了 .
千年沉睡以后 , 当数学科学再次醒来 , 已经开始进 入资本 主义 时代了 .社 会经 济的发 展要 求
变了 .到 了 16 和 17 世纪 , 人 类面临 新的 数学 问题 .其中 一些 重大 问题是 : 求 一般 几何形 体的 长
度 , 面积 , 体积 ; 求曲线的切线 ; 求运动的速度与加速度 ; 求函数的极大与极小等等 .我们的读者一
眼就可以看出来 , 当时人类需要的新科学就是微 积分 .这些问 题一 方面有 明确 的实 用背景 , 但 又
常与哲学上的论争 , 与人类争取从天主教神学以及 亚里士多 德的 教条 下获得 思想 解放的 斗争 紧
密联系 .伽利略在比萨斜塔上的实验 ( 但是科学史的研究表明 , 他并没有做这个实验 , 而是用斜面
的实验反驳了亚里士多德 ) 、围绕日心说的斗争是大家都熟知的了 .新时代呼唤巨人 , 他们是笛卡
儿、哥白尼、伽利略、开普勒直到牛顿和莱布尼茨 .下面是一些例子 .
第一个例子是关于积分学的 .那个时 代人们努 力的重 点是
发展希 腊人 的穷竭 法 , 但是 他们 又丢了 穷竭 法中的 精华 : 用 复
杂的反证法绕过缺少极限理论带来的困难 , 把问题 归结于 不等
式 , 从而为 19 世纪的 ε- δ铺 平了道 路 .他们 反而 又回 到了 不
可分量 ( 亦即毕达 哥拉 斯的 单 元 ) , 不过 更大 胆 , 而 且几 乎没 有
多少 玄 妙 的 思 辨 色 彩 了 .开 普 勒 ( Johannes Kepler , 1571—
1630 ) 有一本书名叫《测量酒桶体积的新科学》, 顾名 思义 , 其中
会讲到 面积 和体积 .在 开普 勒看 来 , 圆是无 穷多 个顶角 无穷 小 图1 - 3
的扇形堆成的 , 球是无穷多个互相平行的 厚度无穷 小的圆 柱形
堆成的 .伽利略也是这样 , 例如他认为若一物体 ( 应为质点 ) 作等加速运动 , 则在 t = 0 到 t = T 这
段时间走过的距离将由△ OA B 之面积来表示 .因为 , 若 在时刻 t , 速度为 A′B′, 伽利略将 它乘 以
无穷小 的 时 间 间 隔 , △ OA B 就 是 由 无 穷 多 个 直 线 段 A′B′组 成 的 , 因 此 他 得 出 结 论 : 距 离 由
第一章 变量的数学 9
△ OA B 之面积来表示 ( 图 1 - 3) .
这样看来 , 伽利略和开普勒在面积体积问题上 是一样 的 , 采用 了不可 分量 的观 点 .这 种观 点
在伽利略的学生卡瓦列 里 ( Bonaventura Cavalieri, 1598—1647) 的 著 作里 表现 得最 系统 .简单 地
说 , 他认为线段是由点组成的 , 正如链子是由珠子穿成的一样 ; 面是由线组成的 , 正如布是由纱织
成的一样 ; 立体是由平面组成的 , 正如书是一页一页 的纸叠 起来 的一样 .点、线、面 就是相 应的 不
可分量 , 它们在一个或几个维数上是无穷小 .
所以 , 如果说欧多克萨斯是在 千方 百计地 回避 无穷 小 , 而 为此 费 尽心 思利 用了 Archimedes-
Eudoxus 公理 , 利用了不等式 , 利用了反证法 , 这一个时代的数学 家却是 硬着头皮 往前闯 .虽说 不
严格 , 却得到了许多正确的结果 , 这样不会招致人们的批评吗 ? 卡瓦列里的回答是绝妙的 .他说 ,
我的目的只是为了改善穷竭法 : 我的方法确实不严格 , 但是我的结果很有用 , 有用就行 .严格不严
格那是哲学家的事 , 别的几何学家不是和我一样不严格吗 ?
首先 , 它确实改善了穷竭法 .上 面我 们讲 到的希 腊的 穷
竭法太依赖于特殊 的 几何 曲 线 ( 例如 圆 ) 的特 殊 性 质 , 现 在
2
却有了一定的程式 , 例如 要 计算 一 段抛 物 线 y = x 下 的 面
积 O A B 时 ( 图 1 - 4) , 我 们把 OA 分成 n 等分 , 每一段的 长
2 2 2
记为 d , 于是相应的纵坐标是 d , ( 2 d) , (3 d ) , … .如果 把
n 取为无穷大 , 那么图上用实线 画的 区域都 成了 直线 段 , 我
们用虚线把它们补成矩形的 .如果 n 是无穷 大 , 这 些矩形 和
实线所成图形是没有区别的 , 它们就 是不 可分量 .现 在把 这
些不可分量的面积加起来 , 就得到 O A B 的面积 : 图1 -4
2 2 2
OA B = d・ ( d) + d・ ( 2 d ) + … + d・ ( nd) | n = ∞
3 2 2 2
= d [1 + 2 + … + n ] n=∞
3
OA 2 2 2
= [1 + 2 + … + n ] n= ∞
n
3 2
3 2n + 3n + n
= OA 3 .
6n n=∞
这里只用了一个很初等的代数公式
1 2 2 1
1 +2 +… + n = n ( n + 1) (2 n + 1 ) .
6
1 1
还有 = 0 .前式并不难证 , 后面的 = 0 按卡瓦 列里 的说 法 , 交 给哲 学家 去管好 了 .不
n n=∞ n n= ∞
・
限”x ( t) , 牛顿称为“ 最终比”, 牛顿把变化中的 量如 x ( t ) 称为 流量 (fluen t ) , 而把其 变化率 x ( t )
称为流数 (fluxion) .牛顿的方法论似乎有些混 乱 , 有时 他也 使用不 可分 量 , 但是 例如在《原理》一
书中他又批评不可分量 , 明确地说 “
: 如果我说某 量由粒 子组 成 , ……不要 以为 我是 指不可 分量 ,
而是指趋于 0 的可分量”, 牛顿以为用运动学的观点去解释这些问题就可以避免古希腊人的思辨
方法、形而上学方法的困难 .他做到了吗 ? 下面再引牛 顿的几段 话 ( 这些 话都 见于《原 理》中文 版
38 页 .) “
: 可能有人反对 , 认为不存在将趋于 0 的量的最后比值 , 因为在 量消失 之前 , 比率就不 是
最后的 , 而当它们消失时 , 比率也没有了”( 就是说 ,Δt≠ 0 时就不是瞬时速 度 ,Δt = 0 就连运动 也
没有了 ) “最后速度……就是……物体到达其最后
. 处所并 终止 运动 时的速 度…… 最后比 可以 理
解为……它消失的那一瞬间的比……在这运动尚存的最后时刻速度有一极限 , 不能超越 , 这就是
最后速度 ,”牛顿还说“我论及最小的、将消失的或最后的量 , 读者不要以为是在指确定大的量 , 而
是指作无止境减小的量”.所谓瞬间是什么 ?“ 它消失那 一瞬间”是什么 ? 什么叫“ 无止境 减小 的
量”? 是不是 0 ? 可不可以略去不计 ? 这才是问题所在 .
看一下切线 问 题 还会 更 清楚 , 下面 我 们讲 一 下 费 马 的
作法 , 图 1 - 5 画出了求 y = f ( x ) 之图像在 P 点的切线的方
法 , 此图含意自明 , 下面除了其中关 键的 P R 记为 E 之外 均
不再解释 .令 G ( 即 x 点 ) 得一增量 E ( 就是我们常用的Δ x )
而变为 G1 , 由于△ TGP∽△ PR T1 , 所以
TG∶ PG = GG1 ∶ T1 R = E∶ T1 R .
但是 , 当 E 非常小时 , 费 马说 T1 R 和 P1 R 相 差不 多 , 从 而
可以把 T1 P1 略去不计 , 用我们熟悉的 语言 就是当 Δ x 很 小
时 , d y 与 Δy 之差可以忽略不计 , 所以
图1 -5
TG∶ PG = E∶ ( P1 G1 - PG )
= E∶ [ f ( x + E) - f ( x ) ]
但 PG = f ( x ) , 故上式给出
TG = E f ( x ) [ f ( x + E) - f ( x ) ]
f ( x + E) - f ( x )
= f( x ) . ( 7)
E
最后费马说“
, 去掉 E 项”( 即令 Δx = 0) , 立即 可得 TG, 在确 定了 T 点位 置以 后 , 连接 TP 即 得
切线 .
0
这里遇到的问题是 : 令 E = 0 时 , ( 7) 之分母成了 而没有意义 .然而 要注意 , 在那个 时代 , 人
0
们知道的函数不多 , 例如笛卡儿就只讨论 f ( x ) 是 多项 式的情 况 .这时 f ( x + E ) - f ( x ) 仍是 多
项式 , 而且 每一 项 都有 因 子 E , 因 此 , (7 ) 之分 母 中 E 可 以 约去 ( 注 意 , 这 当 E = 0 时 是 不 合 法
0
的 ) , 因而不会出现 问题了 .但是 令 E = 0 不但 是做 了不 合法 的事 , 而 且 E = 0 就 没 戏可 唱了 ,
0
这和上面讲的 Δt = 0 就没有运动如出一辙 . E 又是 0 又不是 0 , 是一个方生未死似 0 而又非 0 的
无穷小量 ! 可是什么是无穷小呢 ? 再说上面略去了 T1 P1 , 究 竟什么样 的东西 可以略去 不计呢 ?
所以 , 情况仍与芝诺时代差不多 , 必须要回答什么是无穷小 , 而且不能只用思辨的方法 , 要解决具
第一章 变量的数学 11
体问题 , 如当年用穷竭法计算圆面积一样 .
我们不能像卡瓦列里说的那样 , 把严格性完全交给哲学家 《
. 几何原本》对这个时代的数学家
仍然是不可改变的规范 .例如牛顿的基本著作《自然 哲学的数 学原理》就 完全 是模 仿《几何 原本》
的 .牛顿知道其中的问题时常出在无穷小量上面 : 说它 不是零 , 并 用看 起来很 像零 的英文 小写 字
母 o 来记它 , 又常用 a + o = a , 或在两个无穷小乘积中令它 为零 .说它是 零 , 又 允许以它 为分母 ,
0
并且称 为不定式 .18 世纪的许多 卓越的 数学 家都为 此绞 尽了 脑汁 .这当 然瞒 不过 哲学 家的 法
0
眼 .这里必须提到爱尔兰克罗因地方的主教伯克莱 (Bishop George Berkeley , 1685—1753) 的一本
著名的小册子《分析学家 , 或致 一 位不 信神 的数 学家》( The Analyst , or a Discourse Addressed to
an Infidel Mat hematician) , 读者可以在前面引用的李文林主编的《数学珍 宝》一书 316 ~321 页 上
看到此文的摘译 , 下面引用的 译文均 来自 此书 “
. 不信 神的数 学家”是 指哈 雷 ( E .Halley) , 哈雷 彗
星的发现者 , 对牛顿写出《原理》一书起了重要的 作用 , 并资助 出版 .伯 克莱写 这本 书当然 是为 了
宣扬自己的宗教观和自己的哲学 .大体说来 , 他的论据就是 : 连牛顿的微积分、无穷小量那样模糊
不清 , 逻辑混乱的东西都可以相信 , 为什么你们却不 肯相 信上帝 呢 ? 我们 不想 讨论 哲学 , 但是 应
该指出 , 伯克莱的批评是切中要 害的 .伯克 莱直 接指名 责备 牛顿“曲 线求积 术”一 文中 给 x 以 非
零的增量 h , 然后作了一些 代数 运 算 , 然 后 又叫 h = 0 , 这岂 非 背离 了 逻辑 学 中 最起 码 的矛 盾 律
( 即 A 不是非 A) 吗 ? 而在神学中是不允许这样做的 .而且他两次引用牛顿 在该文中 的原话 “
: 在
数学中最微小的误差也不可以忽略”来讥讽牛顿 .伯克莱指出 , 牛顿的“ 流数”( 即我们今天讲的导
数 ) 是不可理解的 , 更何况二阶、三阶……流数“ 全都超出整个人类理解能力”.这种又是零又不是
零的增量 , 还有增量的增量……“ 这就是我们的现代数学家们……全部思想的基石”.可是这些全
是不可理解的东西 .至于 由 此得 到 的成 功 , 伯 克 莱说 “
: 他使 用 流 数 , 就 像 建 筑 中 使用 脚 手 架 一
样 ,”房子盖好了自然“就立即将它们弃之一边 .”
“ 我所 非议的 不是 您的结 论 , 而是 您的逻 辑和 方
法 : 您是怎样进行证明的 ? 您所熟知的对象是 什么 ? 关 于它们 您的 表述 是否清 楚 ? 您依 据的 原
理是什么 ? 它们是否可靠 ? 您是如何应用它们的 ?”( 着重点是本书作者加的———作者 ) 至于得到
了正确的结论 , 这是“ 因为这个错误被另一个相反的 但程度 相当的 错误 抵消了 .”( 这句话 是指 莱
布尼茨 .) 伯克莱正确地点出了要 害 : 那个 似零 又不是 零的 h 是 什么 ?“ 这些 消逝 的 增量 又是 什
么呢 ? 它们既不是有限量 , 也不是无限量 , 又不是零 , 难道 我们 不能 称它们 为消 逝量的 鬼魂 吗 ?”
其实 , 从我们上面引述的牛顿在《原理》一书中对自己的最终比的说明 , 并且一再强调自己的方法
与不可分量并不相同 .看来 , 难道不能认为牛顿自己 也感到 了类 似的问 题 , 因而 理不直 , 气 不壮 ,
处于彷徨与无奈之中吗 ?
把微积分放在一个严格的基础上是很长一段时间 数学家 着重 努力的 大问 题 .但是有 一点 应
该指出 , 这一段时期所有的数学家是同时用极大的力量从事扩大与深化微积分的应用的 .现在的
大学数学系 , 一直到高年级的许 多课程 的内 容都是 在 18 世 纪、19 世纪 形成的 , 这 一 点与 希腊 时
代非常不一样 .这是生产力迅猛发展及其带来的 科学的迅 猛发 展的 表现 .达朗 贝尔 有一句 名言 ,
很可以反映当时的情况“
: 前进吧 , 你会得到信心 !”
确实是这样 , 数学进入了一个高歌猛进的时代 .新思想 , 新方法层出不穷 , 新领域一天天被发
现、被征服 .然而却全处在伯克莱大主教提出的一长串问题的笼罩下 .我们想从欧拉的《无穷小分
12 第一章 变量的数学
① 欧 拉这一 著作 , 是 用拉 丁文写 的 , 书名 In troduc tio In Analysis Infi nitorum , 1748 . 应译 为《无限量 分析 引论》, 1988 年 , J .
D .Bla nt an 有英 译本 , 就采 用了 这样的 书名 : In troduct ion to Analysis of t he Infin ite , 我们仍 然从俗 把欧 拉这部 著作 译为《无穷 小分
析引论》
第一章 变量的数学 13
2 3
x x
loge ( 1 + x ) = x - + - … . (14)
2 3
我们能同意伯克莱大主教说的“
: 所有这些错误碰 巧都抵 消了 , 所 以欧拉 得出 了如此 惊天 动
地的结果”吗 ? 当然不能 , 欧拉是一位极为罕见的大数 学家 , 他在 处理 数学与 力学 问题上 的能 力
是非凡的 .如果数学中以欧拉命名的东西都没有了 , 数学史一定要改写 .但是数学仍然会发展 , 而
是一定会和今天一样好 .欧拉 的成 就应 该归 功 于他 非凡 的洞 察力 和 数学 运算 能力 .更深 一层 来
看 , 牛顿、莱布尼茨真正伟大之处在于他们真正抓住了 变量的 数学 的本质 , 形 成了 高屋建 瓴势 如
破竹的局面 .所以在一两百年 之内 巨人 辈出 也 正是 时势 造英 雄 .余 下的 工作 就是 把 问题 都搞 清
楚 , 否则数学是不可能再进步了 .请读者看欧拉的一段 文章目 的就 是请大 家注 意 , 欧拉没 有一 个
结论是错的 , 但是真把他的毛病都消除 , 却是要大费周章 .特别是由二项级数 , 再逐项求极限决非
轻而易举 .读者们读过的微积分教本上面那一小段引文要花多少篇幅才说得清楚 , 读者自己都有
体会 .
上面我们完全没有讲莱布尼茨的贡献 .这不是 由于在“发明”微积分 的“知识 产权”问 题上 我
们有什么偏爱 .而是由于 , 一开始我们就说了 , 本章并不是一个初步但比较全面的微积分历史 .莱
布尼茨和牛顿虽然在微积分的理 论和 方法 上都 不一 样 , 但 是在 什么 是微 分 d x , d y ( 这都 是莱 布
尼茨的记号 ) 与不可分量、无穷小量的关系上 , 他与牛顿遇到相同的困难 .伯克莱大主教在反对他
们二人上似乎也是一视同仁的 , 所以我们就完全略去这一部分 .好在在本章开始时介绍给读者的
两本书中都有了介绍 .
解决遗留下 来 的 问 题———其 核 心 从 希 腊 时 代 起 就 是 关 于 无 穷 小 量 与 不 可 分 量 等 等 的 问
题———出路在于极限理论 .极限的概念牛顿等许多 人都已 经有 了 , 而在柯 西以 前 , 最接近 当代 极
限概念的是达朗贝尔 .然而所有这些论述都过于 几何 化 : 所谓一 个变 量 x 趋于 a , 人们自 觉或 不
自觉地是从运动学的角度来领会的 .因此柯西最大的功绩在于把极限的研究算术化了 .这方面的
先驱应该指 出 的 还 有 波 尔 察 诺 ( Bernhard Bolzano , 1781— 1848 ) 和 阿 贝 尔 ( Niels Henrik Abel,
1802 —1829 ) 前者曾指出高斯关于代数的基本定理 ( 每个代数方程都有根存在 ) 证明不够严格 , 因
为高斯利用了连续函数的中间值定理未加证明 .他 又是第一 个给 出不 可求导 的连 续函数 的例 子
(1848) 的数学家 , 比魏尔斯特拉斯早 30 年 .他多年来是布拉格的一位教士而未为人知 .阿贝尔很
年轻就去世了 , 一生贫病交加 .他对当时分析中缺少严 格性可 说是 痛心疾 首 .真正 成就和 影响 最
大的当然是柯西 , 他写了 几本 教 本 :《工 科 大学 分 析教 程》( Cours d’Analyse de l’ cole Politech-
nique, 1821 ) 《
. 无穷小计算概要》( Résumé des Lec, ons sur les Calculs Infinitesimals , 1823 ) 与《微 分
学讲义》( Lec, ons sur les Calculs Differentiels , 1829) , 使我们看到了今天我们熟知的微积分教本 .柯
西所作的事就是使极限摆脱几何的束缚 .极限概 念如果不 能摆 脱几 何的束 缚 , 终将 会引起 混乱 .
例如说圆内接正 n 边形当 n→∞时极限就是圆 , 那么就可以问 , 是否终于变成了圆 ? 圆的性质全
都含在正多边形的性质之中了 ? 柯西明确指出 , 极 限就是一 个数 , 所谓变 量 x 趋向 a 时 f ( x ) 以
A 为极限就是 : 若代表变量 x 的一串数值无限地趋近固定数 a 且其差 可以任 意地小时 , f ( x ) 与
A 之差也可以任意小 .但是稍后的数 学家 如魏 尔斯 特拉 斯仍 然对 此 定义 不满 , 认 为 仍然 包含 了
几何学与运动学的痕迹 , 应该更进一步算术化 .变量 是什 么 ? 魏尔 斯特拉 斯给 的回 答就是 : 若 有
一个无限非空集合 D ( 例如实数集 ) , 而 x 可 以取 D 中 任一元 为值 , x 就 称为一 个变 量 .lim f ( x)
x→ a
看到 , 这样做其实正是发展了《几何原本》中把穷竭法归结为不等式的实践 , 于是许多问题自然化
解了 : 这些正 n 边形最后会不 会与 圆重合 ? 根本不 必问 这 样的 问题 , 反 正有 nlim Pn = S .每一 个
→∞
Pn 均不是 S , { Pn }中没有最后一 个元 “
. 最终 比”是不 是运 动停止 的那 一瞬 间 的速 度 ? 无 所谓 这
一瞬间那一瞬间 , 既无所谓运动开始的最初比 , 也无所 谓运动 停止“那 一瞬 间”的最 终比 .我们 看
Δx Δx Δx Δx
到的只有 是 Δt 的函数 ,Δt 与 都是 变量 , 而当 Δt→ 0 时 也 有极 限Δtlim , 它就 叫做 瞬
Δt Δt Δt → 0 Δt
x
的级数展开式 , 后 来才有 e 和 sin x 的级数展开式 .为什么 现在通用的微积分 教本要用与历史 不
符的讲法呢 ? 一个重要原因是教学的需要 .首先看到这一点的欧拉 , 把关于微积分基础的讲授放
在前面作为 预 备 知 识 , 于 是 多 年 以 后 三 角 学 完 全 在 中 学 里 了 .大 学 里 先 是 给 出 了 e = nlim
→∞
n
1
1+ , 作为有界上升数列必有极限的一个重要的例子 .可是为什么重要 ? 为什么以 e 为底的
n
iθ
对数称为“自然”? 都只好不讲了 .e = cosθ+ isin θ按逻 辑的 要求应 该放 到另 一门 课 去讲 , 因 为
必须先定义什么是复变量的幂级数 ( 其实这只是一句话的问题 ) .现在 , 我们既然假设读者都学过
微积分 , 就有可能用一种比较接近历史真实的、比较接近物理学的讲法 .我们的出发点是 : 一个函
数 y = y ( x ) 可以作为一个微分方程的柯西问题
dy
= f( x , y) ,
dx ( A)
y ( x0 ) = y0
① Nic holas Me rcat or , 1620 —1687 , 数学 史上有 两位麦 卡脱 , 另 一位是 G erha rd Kr eme r Mer cator , 1512— 1594 是 著名 的地
图制作 家 , 现在地 图上 使用的 麦卡 脱投影 法就 是他创 造的 .他 为制作 地图 所引 进 的一 些 名词 , 现在 我 们仍 然 使用 在 微分 流 形理
论中 , 见 第七章 .这 二位 的姓名 中 M er cat or 一字在 德文 文献中 常作 Kaufman , 商人 之意 .其实 Me rcator 就 是商人 一词 的拉丁 文说
法 , 英文的 M er chan t 也来 自此 词 .
§1 增长的数学模型 : 指数与对数 17
§1 增长的数学模型 : 指数与对数
平移不变性来证明它 .加法定理本身也就是平移不变性的表现 .
设 E ( t ) 已定义在 [ t0 - h , t0 + h ] 中 , t0 = 0 , 于是 令 t1 = t0 + h1 , h1 = h - ε,ε是任 意小 正
数 , 并记 E( t1 ) = E1 , 于是 E( t ) 在 [ t0 , t0 + h] 上也是柯西问题
dy
= y , y ( t1 ) = E1
dt
之解 .令 t = τ+ t1 , 则此问题又可化为
dy
= y, y = E1 .
dτ τ= 0
E
dE
令右方的 t → + ∞ , 则 得 ∫ 1 E
在 t → + ∞ 时趋 于 + ∞ , 为 此需 要 E → + ∞ , 所以 E ( + ∞ ) =
E
dE
+ ∞ .当 t→ - ∞时 , 因为 ∫ 1 E
在 E = 0 处发散 , 易见这时 E→0 , 即是说 E( - ∞ ) = 0 .所以 E( t)
20 第二章 函 数
E( t) 的性质如上面的 1 , 2 两点全是利用微分方程方法证明的 .
这样一来岂非实数理论等等都是无用而多余的 吗 ? 不是 .数 学中 任何一 个重 要问题 总有 其
关键之处 .用不同的解决方法关键点可能不同 , 但是它 们困难 的程 度都是 一样 的 , 甚至这 些解 决
方法本质上都是一样的 .上面我们把问题归结为常微分方程解的存在与唯一性定理 .而这个定理
的证明又少不了证明某个函数序列的一致收敛性 .抽象地说来这也是一个完备性问题 , 与实数理
论要解决的问题是一样的 , 详见第六章度量空间一节 .这种情况以后还会出现 .
n
1
现在余下的问题是 , 我们很相信 E ( 1 ) = nlim 1 + , 可是 怎么 证明 呢 ? 我 们 的方 法是 回
→∞ n
到反函数上去 , 并且用离散的方法处理它 .
2. 增长的离散模型 现在设自变量 t 不是 连续变 化的 , 而 是“跳 动”着在 变 , 其“步 长”是 一
个有限数 h > 0 , 即 每 一 次 都 是 t → t + h , 或 写 作 Δt = h , 于 是 y ( t ) 也 相 应 有 改 变 量 Δy =
y( t + h) - y ( t ) .现在设
Δy
= λy , y (0 ) = y0 , ( 5)
Δt
问 y ( t ) 是什么函数 ? (5 ) 称为一个差分方程 , 它是上述增长问题的“离散模型”.人们 时常会以 为
只有连续模型 (1 ) , (2 ) 才是“ 真实”的 , 而离散模 型则 只是 近似的 .这 是不 对的 .例如 y ( t ) 是某 人
在银行的存款 , 则后一个条件表明他在期初 ( t = 0 时 ) 存入 了 y0 , 利 率为 λ, 则 y ( t ) 就 是他 在 t
时的本利和 .这个问题本质上就是离散的 .由 (5 ) , 并以一个存期为单位 , 即令 h = 1 , 有
y ( 1) - y (0 ) = λy ( 0) ,
亦即
y (1 ) = (1 + λ) y (0 ) .
所以由 y ( 0) 开始会得到
n
y( n ) = (1 + λ) y ( n - 1) = … = (1 + λ) y (0 ) .
1
如果总的存期仍为 1 , 但把它分成 n 个相等的小间隔 , 以 为短的存期 .因为存期变短 , 所以利 率
n
λ 1
也应相应变小 , 设为 , 仍然以存期的数目的 为单位 , 则原 来的一个 存期现在 要算作 n 个小 存
n n
期 .仍用上面的结果可知 , 在长存期 1 之末 , 本利和应该用上式的 y ( n) 来计算而有
n
λ
y ( n) = 1+ y ( 0) . ( 6)
n
2n
λ
不过这时 ( 6 ) 给出的 是一 个长 存期末 的本 利和 , 两个 长存 期末 的本利 和是 1 + y( 0 ) , … , t
n
tn
λ 1
个长存期末的本利和是 1 + y (0 ) , 令 n→∞ , 会得到连续的模型 .用 作为时间单位 , 即有
n n
nt
λ λt
y ( t ) = nlim 1+ y (0 ) = e y ( 0) . ( 7)
→∞ n
n
t 1
把它和连续模型得到 E( t ) = [ E(1 ) ] 比较 , 更令人想到 E( 1) 应该就是 e = nlim 1 + ,但
→∞ n
是严格地证明这一点是不容易的 .我们不妨来看 一看欧拉 是怎 样来 研究这 些问 题的 .首先 , 我 们
∞
∑
n
要给出一个“实际”计算 E( t ) 的方法 , 为此令 E( t ) = an t , 则由 E( 0) = 1 应该有 a0 = 1 , 又
n= 0
22 第二章 函 数
由 E′( t ) = E( t ) 应该有
∞ ∞
n-1 n
∑ na
n=0
n t = ∑a
n=0
n t .
比较同类项的系数有
1
( n + 1 ) an + 1 = an , 或 an + 1 = an ,
n+1
1 1 1 1
所以 , an + 1 = an = a =…= a0 = , 所以
n+1 ( n + 1) n n - 1 ( n + 1) ! ( n + 1) !
2 n
t t t
E( t ) = 1 + + + … + + … . ( 8)
1! 2! n!
这是一个形式解 .当然考虑其收敛性并不困难 .所以我们认为已证明了 (8 ) 在 - ∞ < t < + ∞上的
收敛性以及许可在其上逐项微分、逐项积分 .其实对复 数 t 也是 一样的 .详 见下 一章§ 4 .但是 在
欧拉的时代 , 人们对收敛性问题的重要性还很不注意 , 真正严重地注意到收敛性的数学家应该提
到高斯和阿贝尔 .即已经是 19 世纪初年了 .欧拉的伟大在于他对数学公式的推演有非凡的才能 ,
对正确的结论有出乎常人的洞 察力 , 虽 然自己 不甚 严格 , 但得 出 了许 多极 为重 要的 结 果 .即以 e
的问题为例 , 他先用二项定理对正整数 n 得出
n
1 n 1 n ( n - 1) 1 n ! 1
1+ = 1 + + 2 + … + ,
n 1 n 2! n n ! nn
令 n→∞ , 欧拉对每一个有限项取极限 , 则右方的前若干项成为
1 1 1
1+ + + … + .
1! 2! n!
再令项数趋于无穷 , 有
1 1 1
e = 1+ + +… + +… . ( 9)
1 ! 2 ! n !
欧拉的作法从今天看来当然是不能接受的 .但是 他不但得 到了正 确的 (9 ) 式 , 而且 他用类 似的 方
nt
1
法处理 1 + , 得到了
n
2 n
t t t t
e = 1+ + + …+ + …, (10)
1! 2 ! n!
这与 (8 ) 完全一样 .所以我们立即有 E (1 ) = e .可惜 , 这个证明是不严格的 .进一步我们回到 E( t)
的反函数 .
3. 对数函数 y = E ( t ) 有反函数吗 ? 上面我们 已经证 明了 E ( t ) 是单 调函数 , 它 把 R 单 调
地 ( 从而是一对一的 ) 、连续可微地映 到正 实数 轴 R + = { x : x > 0} 上 .所以 , 它 必有 一 个反 函数 ,
即以 E(1 ) 为底的对数 log E( 1 ) y .我们把它写成 t = L ( y ) , 定义在 y > 0 上而且把 y > 0 单调地、连
续可微地映为 - ∞ < t < + ∞ , 而且因为 t = 0 时 y = E (0 ) = 1 , 所 以 L ( 1) = 0 .由 反函数 的导 数
的定义知道
dt 1
= , t = 0 .
dy y y=1
所以
y
dy
t = L( y) = ∫ 1 y
. (11)
§1 增长的数学模型 : 指数与对数 23
如果令 y = 1 + x , 由上式经变量变换有
x
dx
t = L(1 + x ) = ∫ 0 1+ x
. (12)
令 x→ 0 即知 ξ→0 , 而得
ln( 1 + x ) 1
lim = ξ→
lim0 = 1 .
x→0 x 1+ξ
24 第二章 函 数
x
最后是幂级数展开式 , 对 E( x ) = e , 我们已得到处处收敛的 (8 ) 式 , 对于对数函数 , 当 | x | <
1 时 , 由于
1 2 3
= 1 - x + x - x + …,
1+ x
逐项积分后 , 立即有 , 当 | x | < 1 时 ,
x 2 3 n
dx x x x
∫
n- 1
ln (1 + x ) = = x - + + … + ( - 1) + …, (14)
0 1 + x 2 3 n
这就是尼古拉・麦卡托当年的作法 .
n
1
4. 对数的离散处理 E(1 ) = nlim 1 + 的证 明 从历史上看 , 对数的出现要 早于指数 .上
→∞ n
文说的欧拉 的贡 献 都见 于他 的《无 穷小 分析 引论》一书 , 出版 于 1748 年 , 但 纳 皮尔 ( John Napier ,
1550—1617) 在 1614 年 就 造 出 了 第 一 本 对 数 表 , 远 早 于 牛 顿 的 微 积 分 .另 一 个 瑞 士 人 比 尔 吉
( Jobst Bürgi, 1552—1632) 也 在 1620 年 发表了 另一 个对 数表 .对数 的出 现确 实直接 来自 航海 的
需要 .因为航海要作许多乘除法计算 , 当然人们希望用 更简单 的加 减法来 代替 它们 .这样 就想 到
y
了用对数 y = log b t, 它是指数函数 t = b 的反函数 .对数的底 b, 从一开始并不是 10 , 更不是 e,
而是看如何选取计算最为简单而定 .于是问题就成了给定一 定的 t 如 何求相 应的 y , 这当然是 很
困难的 .于是纳皮尔和比尔吉不约而同地想到 : 把问题反过来做 , 即给出许许多多 的 y, 再用幂 运
y
算来计算 b , 得到许许多多的 t .他们希望这些 t 尽量密集 , 这样 , 当你有了一个 t 以后 , 很有可能
这个 t 正是纳皮尔从某一个 y 算出来的 , 至少很接近纳皮尔算过的值 , 于是你就得到了相应于 这
y
个 t 的 y, 或者说 , 就得到了这个 t 的对数 , 至少是其近似值 .但是用 b 算 t 也不简单 , 除非 y 是整
数 .这样 , 既要 y 是整数 , 因而 Δy = 1 , 从而 y 不能太密集 , 又要求 t 很 密集 , 这个矛 盾如何解 决
y
呢 ?办法是取 b 尽可能接近 1( 但 b ≠ 1 , 否则不论 y 是什么值 , t = 1 总是 1) .所以比尔吉取 b =
-4 -7
1 + 10 , 纳皮尔取 b = 1 - 10 , 纳皮尔用小于 1 的 b 作底是因为航海中需要计算的多是某角的
正弦 , 因而小于 1 .如用大于 1 的 b 作底 , 对数将是负数 , 用起来很不方便 .
下面只限于讲比尔吉的作法 .我们问当 y 有一个增量Δy = 1 时 ,Δt 是多少 ?t 的相对误差是
-4 y+1 -4 y
Δt ( 1 + 10 ) - ( 1 + 10 ) 1 Δy
= -4 y = 4 = 4 ,
t (1 + 10 ) 10 10
所以 Δt 相当小 , 而 t 的分布很密 .上式其实就是差分方程
4
Δy 10
= . (15)
Δt t
y
如果用 4 = z 代替 y , 则对数的定义式与上述差分方程成为
10
Δz 1
= ,
Δt t
4
10 z n z
1 1
t = 1+ 4 = 1+ , (16)
10 n
4
这里 n = 10 , 如果令 n → ∞ , 则极限情况是
dz 1
= ,
dt t
§1 增长的数学模型 : 指数与对数 25
z
t=e .
n
1
这就是 e = nlim 1 + 的真正的来源 .可惜我们不知道欧拉是不是这样想的 .但是欧拉对他发
→∞ n
现的这个极限似乎情有独钟 , 所以把自己的姓氏用小写字母写上去了 .当然 , 这不是“ 证明”, 只是
一种启发 , 要证明差分方程的解之极限确是微分方程之解 , 并非易事 .证明见后文 .
现在我们来求解差分方程 , y = 0 ( 即 z = 0) 对应于 t = 1 , 然 后用相同 的步长 Δy = 1 , 即
1
Δz = 4 , 从 z0 = 0 依次得到分点 z 0 < z1 < … < zN , 而相应的 t 的分点是 t0 = 1 < t1 < …
10
4
Δy 10 Δz 1
< tN Δ
. i t = ti - ti - 1 是不相同的 .但这并没有关系 , 因为由差分方程 = 给出 = ,亦
Δt t Δt t
即
1
zi + 1 - zi = Δi t, i = 0 , 1 , … , N - 1 .
ti
把它们加起来 , 并且注意到 z0 = 0 , 即有差分方程的解
N-1
Δi t
zN = ∑ i= 0 ti
. (17)
显然它的极限即
t
dt
z =∫ 1 t
.
d L( t) 1
因此 , 当Δz → 0 时不但差分方程变成微分方程 = , 而且差分方程的解 ( 17 ) 之极限也正
dt t
是定义对数函数的积分 .
n
1
现在我们可以来证明 E(1 ) = nlim 1 + 了 .在通常 的微积分 教本中 都要先证 明此极限 的
→∞ n
存在性 , 并且记之为 e, 我们的工作 则不 是证 明 e 的存 在 ( 证 明 见通 常的 教本 ) , 而 是 承认 它的 存
在 , 只证明 e = E(1 ) .
dy
证明的基本思想是从几何着眼 .y = E ( t ) 是微分方程 = y 的解 , 另外有差分方程 ( 5)
dt
Δy
= y. (18)
Δt
可是差分是那 里 算起 呢 ?如 图 2 - 1 - 1 , 在 y = E( t ) 上 取 两 点 P: ( a , E( a) ) , Q : ( a + h ,
E( a + h) ) . 为了在 P、Q 之间考虑逼近 y = E ( t ) , 如果要从 P 开始 , 则用 F( t) 逼近 E ( T ) , 这
里 y = F( t ) 的差分取为 :
Δy y - F( a)
= . ( 181 )
Δt t - a
也可以从 Q 开始 , 用 G ( t ) 逼近 E( t ) , 而 y = G( t) 的差分取为 :
Δy y - G ( a + h)
= . ( 182 )
Δt t - a - h
Δy
于是在 (181 ) 的情况 , 差分方程 = y 成为
Δt
26 第二章 函 数
Δy y - F( a)
= = F( a) 或 y = F( a) + F( a) ( t - a) . ( 191 )
Δt t - a
在 (182 ) 的情况下则有
Δy y - G ( a + h)
= = G( a + h ) 或 y = G ( a + h) + G ( a + h) ( t - a - h ) . ( 192 )
Δt t - a - h
图2- 1- 1
n - 1 1
而不知道其值究竟是多少 .用上式从 a = ,h = 开始迭次往前推算 , 有
n n
-1 - n
1 n - 1 1
E(1 ) = G (1 ) = 1 - G = … = 1 - G( 0) .
n n n
E( t) 的图像也在切线 G ( t ) 之图像上方 .现在对 t = 0 应用这 个事 实 ( 上面 是在 t = 1 处应 用
E( t) > F( t ) 的 ) , 有
- n - n - n
1 1 1
E(1 ) = 1 - G( 0) < 1 - E(0 ) = 1 - .
n n n
综合这两步 , 得到最后的不等式 :
n - n
1 1
1+ < E (1 ) < 1 - . (21)
n n
n - n
1 1
这就与通常微积分教本 中同 时 考虑 两个 序 列 1+ 和 1 - 完全 一 致了 .不 过 在
n n
通常教材上先证明前一序列上升而有上界 , 后一序列 下降而 有下 界 , 因而 各有极 限 , 并且 证明 这
两个极限相等 , 记之为 e .现在我们 则是承认这个事 实 , 不 过对它作了几何 解释 , 即 y = E( t ) 的
图像在任一区间 [ a, a + h ] 上均在其左、右两端的两个切线上方 , 然后把 [0 , 1 ] 分成 n 个等分 , 并
i - 1 i
且对每个小 区 间 , 应用 上 面 的 事 实 : 或 者 对 左端 的 P T , 我 们 从 左 向 右 , 依 次 令 i =
n n
1 , 2 , … , n .在左端 i = 1 处用 E (0 ) = F( 0) = 1 , 而在右端的 i = n 处应用 E(1 ) > F( 1) 得出
n
1
E( 1) > 1+ .或者对右端的 Q T 则由右向左 , 依次令 i = n - 1 , … , 0 , 并在 i = n - 1 处应
n
- n
1
用 E(1 ) = G( 1) , 在最左端的 i = 0 处应用 1 = E(0 ) > G (0 ) 而得出 E(1 ) < 1 - ,总
n
之有 (21) 式 .
注意到
n
1
lim 1 + = e,
n→ ∞ n
- n n n- 1
1 1 1 1
lim 1 - = nlim 1 + = nlim 1 + lim 1 + = e,
n→ ∞ n →∞ n - 1 →∞ n - 1 n→ ∞ n - 1
立即有
E( 1) = e . (22)
这就是我们最后的目标 .
§2 周期运动和三角函数
图2 - 2 - 2
・
d
现在来计算 .ρ= ρ .如图 2 - 2 - 2 的 ( a) 作单位圆 , 若 ρ记为 OP, 经过时间 d t 后 , 若 P 沿
dt
(6″) 的研究 .
2. 指数函数与三角函数 平面向量都可以用复数来表示 .所以现在我们用 z = z ( t ) 来表
示 OP, 而方程 ( 6″) 就成了
2
z̈ ( t ) + α z( t ) = 0 . ( 7)
如果分开实虚部 : z ( t ) = x ( t ) + - 1 y ( t ) 就有
2
ẍ ( t ) + α x ( t ) = 0 , (81 )
2
ÿ ( t ) + α y ( t) = 0 . (82 )
因此关于 C( t ) 与 S( t) 立即有
¨ 2
C + α C = 0,
・ ( 101 )
C(0 ) = 1 , C (0 ) = 0 .
¨ 2
S + α S = 0,
・ ( 102 )
S ( 0) = 0 , S ( 0) = α.
我们立刻就会看到
C( t) = cos at , S ( t ) = sin at .
这是因为 : 由唯一性定理 , 自然有
- 1 αt
e = cos αt + - 1 sin αt . (11)
(11) 式是极重要的欧拉公式 , 而且公认是最漂亮的数学公式之一 .我们还想多说一些话 . z ( t ) =
cos αt + - 1 sin αt 为 什么成立 ?我们再 细细分析 一下 .这 个式子之 成立是 我们 实际验 证的 结
d sin θ
果 , 验证中的关键步骤又是证明 = cos θ .证明这个求导公式当然不会用到 ( 11 ) 式 , 因此没
dθ
有循环论证之嫌 .但是它用到了微积分中另一个重要的极限式
sin θ
lim = 1. (12)
θ→ 0 θ
x
e - 1
这个极限式与另一个极限式lim = 1 同时被称为两个最重要的极限式 .既然已经有了 (11)
x→0 x
式 , 当然就会问 , 这两 个极限 式的关系 是什么 ?我们先把 话说在前 面 : ( 12 ) 式 其实 与后一 极限 是
同一回事 .这一点我们慢慢道来 .且先问一下 , ( 12 ) 式在微积分教 本中是怎 样证的 ?它的 基础是 ,
当 θ充分小时 ( 不妨设它为正 )
sin θ < θ < tan θ. (13)
这里 θ要按弧度计 , 因为若把弧度按弧长来解释 , 这个不等式就是
弦长 < 弧长 < 切线长 .
但是如果再追究一步 , 何以知道这个不等式成立就会发现它很不好证 .因此在微积分教本中至少
在这里是用扇形面积来解释弧度的 .把问题归结为 面积有 很深的 含意 , 我 们暂 时把 它放在 一边 ,
而承认 (13) 式 , 用 sin θ( 这是正数 ) 通除 (13) 式 , 又有
θ 1
1 < < .
sin θ cos θ
于是只要证最后一项极限 (θ→ 0 时 ) 为 1 即可 , 用倍角公式
θ 2 θ
cos θ - 1 = cos 2・ - 1 = 1 - 2sin - 1
2 2
2
2 θ θ θ θ
= 2sin < 2・ 利用 sin <
2 2 2 2
故当 θ→ 0 时 , cosθ→ 1 , 而基本的极限式 ( 12 ) 得证 .
倍角公式的来源是和角公式 , 例如
cos(θ1 + θ2 ) = cos θ1 cos θ2 - sin θ1 sin θ2 .
它的证明当
32 第二章 函 数
π π
0 < θ1 , θ2 < , θ1 + θ2 < (14)
2 2
时确实是十分容易的 .因为如图 2 - 2 - 3
OC
cos(θ1 + θ2 ) = = OC
OA
= OD - CD = OB cos θ2 - ABsin ∠ BA E
= O Acos θ1 cos θ2 - O Asin θ2 sin θ1
= cos θ1 cos θ2 - sin θ1 sin θ2 ( OA = 1) .
图2 - 2- 3 这里只要注意到 ∠ BA E = θ2 即可 , 但是即使在中学里学三角学时 ,
许多老师以及细心的同 学都知道 , 如果条件 ( 14) 不成立 , 则不但是
证明和角公式, 甚至画一个适当的图也非易事 .这一切告诉我们, 经典的中学教本讲三角函数的办
法, 不仅谈不上简洁 ( 更不谈优美了 ) , 而且相当烦琐 , 使人难得要领, 更不说发展其实质了 .所以上
面讲的一切 , 虽然是对的 , 我们宁可把它放在一边 , 进而用其它方法证明 C( t) , S( t) 确实是余弦、正
弦了 .目前, 尽管我们心里明白结果是这样 , 却不准用这个结果 , 这样我们需要重新解释
-1 t
e = C( t ) + - 1 S( t ) (15)
( 为简单起见 , 我们取 α= 1 ) .
-1 t
现在我们回到匀速圆周运动 , z( t ) = e 就是一个在单位圆周上以匀速α( = 1 ) 运动的动
点 , 而 C( t) , S ( t ) 正是 z ( t ) ( 亦即向量 OP) 在坐标轴上的投影 .OP 与 x 轴的交角θ = αt ( = t)
π
的正弦、余弦定义了 :
2
C( t ) = cos t , S ( t ) = sin t .
这样做的好处就是我们不必再受 (14 ) 式那样的限制 .当然这意味着如和角公式这样简单的东西都
- 1 t
得重证 .这样也好 , 我们可以系统地用 (15) 式以及 e 满足方程 (7) 和初值条件 (10 ) 来得出有关正
余弦函数的全部性质 , 以此强调我们是走一条与中学数学不同的路 .我们现在讲法与中学里的讲法
最重要的区别何在呢 ? 把一个向量分解成 x 与 y 轴两个方向的分向量之和 , 这并没有什么出奇之
处 .可是当我们用运动学的思想来看待它时, 就发现匀速圆周运动有向心加速度这个简单事实现在
- 1 αt
成了一个常微分方程 (7) , 而且发现匀速圆周运动可以用 e 来表示 .这样向量之分解为分向量就
变成了欧拉公式 (11 ) .于是 , 这 个公认的数学中 最漂亮的公式从 运动
学的观点看来, 原来简单如此 ! 因为想法不同 , 所以还保留记号 C( t)
与 S( t) 一直到最后再改回习惯的 cos t, sin t .
圆具有近乎完美 无 缺的 对称 性 ( 直 线当 然 也如 此 , 不 过 直 线可
以说是半径为无 穷大 的 圆 ) .对称 性是 整个 数 学的 最 基本 的 基 础之
一 .我们当然现在 还不 能讲 得太 玄 , 但 就我 们“看 得 见”的 圆 的 对称
性 , 立即可得出 :
2 2 2
| z( t) | = C ( t) + S ( t) = 1 .
当然您可以说这就是勾股 定理 或 者什 么 别的 东 西 .要紧 的 是 , 不论
图2- 2 -4
辐角多少 , z ( t ) 之长总是不变的 , 这当然是对称性 .其次看“ 特别角”
§2 周期运动和三角函数 33
d - 1 t d d d
e = ( C( t ) + - 1 S( t) ) = C( t ) + - 1 S( t) .
dt dt dt dt
比较双方实虚部也可以得到同样结果 .
我们还可以用相位滞后加上欧拉公式来证 .因为 上面我 们已 经得 到了指 数函 数求导 后相 位
π
滞后 :
2
d -1 t - 1 t+
π
π π
e = e 2
= C t + + - 1S t + .
dt 2 2
π π
另一方面又有三角函数的 相位滞后公式 (18) : C t + = - S( t) , S t + = C( t ) , 代入 上
2 2
d d
式又一次得到 C( t ) = - S( t) , S( t) = C ( t ) .
dt dt
同一个结果可以用多种不同方法得到 , 这当然不是偶然的事 .这后面是否还隐藏着更深刻的
东西呢 ? 是的 , 本书第五章全章就是讨论这里的问题 .
总结以上的讨论就可以看到 , 我们的出发点就是指数函数是一个微分方程的解 .从运动学的
角度来看待这些问题之所以取得成效 , 也是因为匀速圆周运动的向心加速度公式就是 z ( t ) 所应
-1 t
满足的微分方程 .所以我们是通过 e 所满足的微分方程得出了三角函数的性质而完全没有利
用直角三角形的边角关系 .但是 C( t ) , S ( t ) 也直接地是常微分方程柯西问 题 ( 10 ) 的解 ( 我们 为
简单计是限于 α = 1 的情况 ) , 能否直接由它 ( 仍令 α = 1) 得出 C( t) , S ( t ) 的性质呢 ?这里又遇
到了上面说的“ 条条道 路通罗 马”的状况 : 上 面讲的 许多性质 都可以这 样得出 , 但为此我 们先 把
・
利 用它们一方面得出 C
( t ) + C ( t ) = 0 , 另一方面 , 令 t = 0 又得 C
(0 ) = 1 , C
(0 ) = 0 , 总之 C( t)
是以下柯西问题之解 :
¨
( t ) + C( t ) = 0 ,
C
・
C (0 ) = 1 , C
( 0) = 0 .
d
但这就是 (101 ) (令 α= 1) , 于是由唯一性定理知 C( t) = C( t)这也算是 sin t = cos t 的“另证”吧 !
dt
总之我们有了一个常微分方程组
・ ・
C ( t) = - S ( t ) , S ( t ) = C( t) ,
C(0 ) = 1 , S( 0) = 0 . (21)
36 第二章 函 数
2 2
有了它 , 许多性质的证明都十分容易了 , 例如 C ( t ) + S ( t ) = 1 的证明如下 :
・ ・
d 2 2
[ C ( t ) + S ( t) ] = 2[ C( t ) C ( t ) + S( t ) S ( t ) ]
dt
= 2[ - C( t ) S ( t ) + C( t ) S ( t ) ] = 0 .
2 2
所以 , C ( t ) + S ( t ) 之值不随 t 变化 , 因此
2 2 2 2
C ( t ) + S ( t ) = C ( 0) + S (0 ) = 1 .
又如加法定理的证明 , 注意到
d
[ S ( t ) C( a - t ) + C( t ) S ( a - t ) ] = C( t ) C( a - t ) + S( t ) S( a - t )
dt
- S ( t ) S ( a - t) - C( t ) C ( a - t) = 0 .
所以 S ( t ) C( a - t ) + C( t ) S ( a - t ) = S (0 ) C( a - 0 ) + C( 0) S ( a - 0) = S ( a) .令 a = x +
y, t = x , 即得
S ( x + y ) = S ( x ) C( y ) + C( x ) S ( y ) .
这样“证”下去 , 不免令人感到烦琐而无新意 , 但是下面我们就立 刻会得 到引人注 目的结 果了 .上
t
一节我们给出了指数函数 e 的幂级数展开式
∞ n
t t
e = ∑
n=0 n!
,
如果把 t 改成 - 1 t, 然后在式右分开实部与虚部 , 将有
- 1t
e = C( t ) + - 1 S( t)
2 4 2 5
t t t t
= 1 - + - … + - 1 t - + - … .
2 ! 4 ! 3 ! 5!
所以
3 5 ∞ 2 n+ 1
t t t
∑( -
n
S( t) = t - + - … = 1) , ( 221 )
3 ! 5! n= 0 (2 n + 1 ) !
2 4 ∞ 2n
t t n t
C( t ) = 1 - +
2! 4!
- … = ∑( -
n=0
1)
( 2 n) !
. ( 222 )
z
de z
于是这个极限就是 = e z= 0 = 1 .注意 , 我们有意引用记号 z , 它一般是代表复数的 .那么
dz z= 0
f ( z 0 + Δz ) - f ( z0 )
f′( z0 ) = Δlim
z→ 0 Δz
对不对 ?应该说对 , 只要右方的极限存在即可 , 但是复的 Δz → 0 比之实的 Δt → 0 内含要丰富 得
多 .如果 Δt 是实的 , 则 Δt → 0 无非是从左侧或右侧趋于 0 , 而当 Δt 是复数时 ,Δt → 0 的方式就
Δf
是复杂得很难想象了 .因此当 z 为复数时 , 有极限是一个极强的条件 , 所以我们就要问 , f ( z)
Δz
z
= e 有没有导数呢 ?复自变量函数的求导是一个很深刻的问题 , 下一章 §4 专 门讨论它 , 而且 恰
z
de z
好 = e 总是对的 .于是我们来看 ( 23 ) 式 , 并设其中 t 是复的 .如果 t 之虚部为 0 , 则 t → 0 就
dz
意味着实变量 t → 0 , 这时 (23) 式就成为
t
e - 1
lim = 1 .
t→ 0 t
如果 t 是纯虚的 : t = - 1 x , 而实变量 x → 0 , 则因
-1 x
e - 1 cos x - 1 sin x
= + ,
- 1x - 1x x
所以 (23) 式分开实虚部就给出两个极限式
cos x - 1
lim = 0,
x→0 x
sin x
lim = 1 .
x→0 x
于是我们看到 , 微积分中两个基本极限其实是同一个极限的两个特殊情况 .
但是这算不得一个证明 , 只是 一条“ 道 路”( approach ) , 要 把它 变 成证 明 , 还得 补 上复 自变 量
函数求导的许多知识 , 说它是“ 道路”, 因为它引导我们面对这许多新问题 .
3. 反三角函数 现在我们已经完成了通过微分方程来定义 C( t ) 与 S ( t ) 并研究它们的性
质 , 完全证实了它们就是中学学过的 cos t、sin t .所以下面我们不再使用 C( t ) , S ( t ) 这两个记号
了 .同样 - 1 也采用原来熟悉的 i 来表示 .
现在我们要讨论正、余弦函数的反函数问题 , 我们已知
d sin θ
= cos θ. (24)
dθ
π π
而当 - ≤ θ≤ 时 , 由 cos θ≥ 0( 这一点由 cos θ是OP 在 x 轴上的投影即可看到 ) 知 sin θ是
2 2
π π
θ的上升函数 .它把 - , 映到 [ - 1 , 1 ] .因此其反函数 θ= θ( x ) 存在 , 而且仍然是一个上升
2 2
1 π π
的 C 函数 ( 即一阶导数为连续的函数 ) , 映 [ - 1 , 1] 到 - , .这样 , 读者当 然会 问 , sin θ在
2 2
π π
- , 以外有没有反函数 ?当然也可以用类 似 上面 的办 法来 处理 , 而 例如 又可 得到 [ - 1 , 1]
2 2
1 1 1
→ k - π, k+ π , k = 0 , ± 1 , ± 2 , … 的 C 函数 , 它们都应该是 x = sin θ的反函数
2 2
π π
θk = 珓
θk ( x ) , 也都定义在 [ - 1 , 1 ] 上 , 但是其值 一般不在 - , 中 , 只有 k = 0 的一 个例外 :
2 2
38 第二章 函 数
珓
θ0 ( x ) = θ( x ) .如果我们说有无穷多个反函数 , 则称 k = 0 的一个 珓
θ0 ( x ) = θ( x ) 为其主值 , 然
后可以讨论这许多反函数之间有什么关系 ?这个关系式其实很简单 , 它就是
k
θk ( x ) = kπ + ( - 1 ) 珓
珓 θ0 ( x ) .
它相应于正弦函数的一个基本关系式
k
sin [ kπ + ( - 1 ) θ] = sin θ.
但是我们不来讨论这个问题 .我们也可以说 sin θ的反函数是一个“多值函数”, 至于什么叫“ 多值
函数”, 下一节再谈 .现在我们就只讲主值 珓
θ0 ( x ) .我 们习惯 地记它 为 arcsin x 而其 它一切珓
θk ( x )
则记为 Arcsin x .
由 (24) 即有
dθ 1 1
= = . (25)
dx cos θ 1 - x
2
∫
2
弦 P R .但是 (26) 是否扇形面积 ?这不要紧 , 我们来看积分 1 - y d y, 它是曲边梯形 O A PQ 的
0
面积 , 用分部积分法即有
y y y 2
y dy
∫ ∫
2 2
1 - y dy = y 1- y + 2
0 0 0
1- y
y 2
( y - 1) + 1
∫
2
= y 1- y + 2
dy
0
1- y
y y
dy
∫ ∫
2 2
= y 1- y - 1 - y dy+ 2
.
0 0
1- y
移项后即有
y y
1 1 dy
∫ ∫
2 2
1 - y dy = y 1 - y + .
0 2 2 0
1 - y
2
度 ( 按扇形面积理解 ) 值 .
图2- 2 -5
用这样的观点 重看 自然 对数 η = ln ξ更有 意义 .上 节我 们说
§2 周期运动和三角函数 39
ξ
dξ
过 , 麦卡脱就发现了自然对数 η = ∫ ξ 与双曲 线的弧下 的
1
面积有关 .由图 2 - 2 - 6 可见
ξ
dξ
∫ 1 ξ
= 曲边梯形 A B PQ 之面积 .
但是
1 1 1
△ OA Q = ・ 1・1 = △ OBP = ξ・η = ,
2 2 2
双方同减去 △ OA T , 即有 △ O TQ = 梯形 A BP T , 双方再加 图2- 2- 6
上 T PQ 即有
扇形 OP Q 面积 = 曲边梯形 A BPQ 之面积
ξ
dξ
所以 , 对数函数 ln ξ = ∫ ξ 作为面积与 arcsin
1
x 是十分相近的 , 如果我们作一个旋转
1 1
ξ= x + y,
2 2
1 1
η= x - y,
2 2
2 2
则ξ
η = 1 变成 x - y = 2 , 则这种相似更为明显 .不过 , 对于反三角函数
y
1 dy
扇形 A OP 面积 =
2 ∫ 0
1 - y
2
,
1 2 2 2
式中多了一个因子 , 是由于图 2 - 2 - 5 中的圆是 x + y = 1 , 而图 2 - 2 - 6 中的双曲线是 x
2
2
- y = 2 .如果注意到若在圆的方程中把 y 换成 i y, 则圆就变成双曲线 , 所以一旦进入复域 , 正弦
— 反正弦就会变成指数 — 对数 .欧拉公式也就不足为奇了 .
当年麦卡托正是看到了这一点 , 然后传到牛顿才得到许多初等函数的幂级数展开式 .欧拉在
他的《无穷小分析引论》一书中也就把以 e 为底的对数称为“ 自然对数或双曲对数”.
4. 振动现象 以上 我 们 从 匀 速 圆 周 运 动 向 两 个 互 相 垂 直 的 坐 标 轴 投影 , 找 到 了 z ( t ) ,
C( t ) , 以及 S( t ) 所 适 合 的 常 微分 方 程 .它 们的 相 互 关 系 给出 了 十 分 重 要 的 欧 拉 公 式 . z ( t ) ,
C( t ) , 和 S( t) 都是适合同样类型的微分方程
¨ 2
x +α x = 0 (27)
( 但初始条件不同 ) 的函数 , 由于它在物理和工程中的重要性 , 我们称适合 ( 27 ) 的 x ( t ) 为一个谐
振子 ( harmonic oscillator) .所以 z ( t ) 是一个复的谐振子 , 而 C( t ) , S( t ) 则是实谐振子 .实际用起
来 , 则复谐振子更方便 .
iαt iαt - iαt
一个一般的复谐振子总是 e 与e = e 的复系数的线性 组合 .但是 只要弄清 楚了其中 之
iαt
一 , 则另一个自然完全都清楚了 .所以下面我们限于讨论 Ce , 这 里 C 是 一个复 数 .但是 由欧 拉
iφ
公式我们很容易看到任一复数 C 都可写为 Ae , 这里 A ≥ 0 , 所以谐振子一定可以写为
i ( αt + φ) i ( 2πωt + φ)
Ae = Ae . (28)
这里 A 称为其振幅 ,α称为其频率 , ω称为圆频率 ,α之单位就是我们很熟悉的赫兹 ( Hertz) , 每秒
1
振动一次称为 1 Hz, 量 纲 则是 .所 以 αt 或 ωt 都是 无 量 纲量 .αt + φ = 2πωt + φ 称 为 相 位
T
40 第二章 函 数
iΦ( x , t )
( phase) , 这样一来 , 什么叫相位有了一 个数 学的 说法 : 今 后我 们时常 会遇 到形如 : A( x , t ) e
的 量 , 而且 A ( x , t) ≥ 0 , 这时我们总是说 A ( x , t ) 是振幅 , Φ( x , t ) 是相位 , Φ( x , t ) | t = 0 称为初
( 始 ) 相 ( 位 ) .所以对于 ( 28 ) , φ就是初始相位 .
谐振子为什么如此重要 ?在自然界中我们常见到这样的运动 : 某一物体 ( 某一质点 , 某一“电”
量 , 如电位、电容、… ) 在某一位置附近往复振动 .其例子不仅有摆 , 还有 如电子 在原子中 的振动 ,
所谓脉冲星一阵一阵地例如以 X 射线形式发出大 量的 能量 , 激 光在激 光器 内往 复反射 …… , 还
有电路中的电流、电压 …… 心电图、血压 …… 这些都是振动 .然后这些振动在空间中的传播 , 就
成为波 .例如水的振动在水面上传播成为水波 , 天线中的电磁振动在空间传播为电磁波 , 电压、电
流的振动在导线中传播输送出电讯号 .不但自然界如此 , 社会生活中也有越来越多的现象可以归
入其中而用数学方法考察 .例如价格、股市、流行病的发生等等都是 .尽管研究的对象可以几乎是
包罗万象 , 研究它们的数学方法却是统一而有系统 的 .常常总 是把它 们归 为一个 微分 方程 ( 但 时
常又是一个差分方程 ) , 而 (27) 可以说是最简单的一例 .
(27) 是一个理想的情况 , 称为一维谐振子 .说它是一 维的 , 因为刻
画这个物理现象 只 需 一个 物 理量 x ( t ) ( 时 间 t 总 是作 为 参数 来 看待
的 ) .物理学中许多重要的理论模 型都 是建 筑在它 的基 础上的 .例如考
虑单摆 ( 图 2 - 2 - 7) , 就是质量 m 的质点挂在长为 l 的弦上并在重力
下振动 .要想刻画它只需要知道一个物理量 x 随 t 的变化即可 , 所以它
是一维振动 .它是理想的 , 因为我 们假 设弦 的质量 可以 忽略不 计 , 而且
是刚性的 , 因此 l 之大小不变 .这 时质 点只受 重力 m g( 向下 ) 作用 .重
力有两个分力 .一是在弦的方向上 , 因 为弦 是刚性 的 , 这个 分力 不起作
用 .二是在图上的圆弧的切线方向 上 , 大小 为 m g sin x 而 且指 向平衡
位置 , 所以必与角位移 x ( t ) 方向相同 , 但符号相反 , 称为 恢复力 .我们
考虑单摆的小振动 , 就是角位移之绝对值 | x ( t) | 很小 , 所以 sin x ~
图2 - 2 - 7
x , 这样恢复力成为 - m gx .牛顿的第二定律给出
¨
m lx ( t ) = - m gx ( t ) .
¨ ¨
左方出现 l 是因为 lx 为线位移 , 而第二定律的加速度并非角加速度 x ( t ) , 而是线加速度 lx ( t ) .
此即方程 (27) .
上面我们研究三角函数时 , 是把 cos t = C( t ) 放在 x 轴上 , sin t = S ( t ) 放在 y 轴上 , 再考
虑一个复平面 . x 轴与 y 轴是圆上的点的投影运动 的场 所 , 我们 不妨 称之为 物理 空间 .在 单摆 的
例子中 , 我们也不妨把角位移 x ( t ) 放在 x 轴上 , 这个 x 轴就应称为物理空间 ( 一个恰当的数学名
词是构形空间 ( configuration space) , 因为它 的 一个 点 x 就 给 出了 角 的大 小 , 因 而决 定 了摆 的 形
状 ——— 即构形 ) , 那么是什么相应于 y 轴呢 ?回到三角函数的情况 , x 轴既用来表示 cos t , y 轴则
d ・
表示 sin t = - cos t .现在在单摆的情况下是否也可以用 y 轴来表示 x ( t ) 即速度呢 ?( 这里相
dt
・
差一个符号 , 但它显然没有影响 .) 或者用来表示 p = m x 即动量呢 ?当然都是可以的 , 真正重要
2 g ・
的是要看动量 p 与位 移 x 是怎样 联系 起来的 : 由方 程 (27) ——— 其 中 α = ——— 双方 乘以 x
l
§2 周期运动和三角函数 41
再积分 , 有
t t
¨ 1 d
∫ ∫ d t( x
2 2 2 2
0 = ( x x + α x x) d t = + α x )d t
0 2 0
1 2 2 2 1 2 2 2
= ( x ( t) + α x ( t) ) - ( x (0 ) + α x ( 0) ) .
2 2
2 2 2
所以 x ( t ) + α x ( t ) 是守恒的 .但是我们要注意 , 除了相差一个常数因子 其中有质量 m , 还有
g
, 恢复力是
l
2 2
d d α x
- U ( x) = - ,
dx dx 2
2 2 2
α x mx
所以 乃是质点的位能 , 另一方面 是动能 , 而
2 2
2
p 2 2 2 2 2
2 + α x = x ( t ) + α x ( t ) = 常数 (29)
m
就表示能量守恒 :
( 动能 ) + ( 位能 ) = 常数 .
现在我们就作一个平面 : x 轴表示位移 x ( t ) , y 轴表示动量 p( t ) = m x ( t ) , 并称此平面为相平面
( 相空间 ) ( phase plane , phase space ) 而与构形空间相区别 ; ( x , p ) 就称为 此质点 的相 , 因 为有 此
就足以完全决定此质点的运动状况 . x ( t) 的更高阶 的导 数不 必给了 , 因为牛 顿运 动方程 就给 出
¨
了 x ( t ) , 而更高阶的导数也可以从运动方程求导数 得出 .不 但现 时该 质点的 运动 状况完 全决 定
了 , 即其过去未来的运动状况也可以用此 时的 ( x , p) 作为 初始 条件再 通过 方程 (27) 完全 决定 .
当 x ( t ) , p ( t ) 已经决定了以后 , ( x ( t ) , p( t ) ) 就给出了相空间的轨道 , 称为相轨道 , 而与构形空
间中的轨道 x = x ( t ) 相区别 .于是对于单摆的小振动 , 相轨道就是椭圆 ( 29 ) .亦即
2
p ( t) 2
2 + α x ( t) = C .
m
当 m = α = 1 时就是圆 .于是 , 从力学的观点看来 , 这里的相平面就是前面讲的 z 平面的一般化 ,
而前面讲的
2 2
cos t + sin t = 1 ,
从几何上看无非是勾股定理 , 而从力学角度来看就 是能量 守恒定 律的 特例 .真 正值 得注意 的是 ,
2
这里得出了椭圆而前面得出了圆 , 差别仅来自恢复力系数 α 之大小 .从拓扑学角度来看 , 它们并
无本质的区别 : 都是封闭曲线 , 所以都表示周期运动 .下一章 我们 要详 细讨论 开普 勒三定 律与 牛
顿万有引力定律的关系 , 到那时我们会再一次看到行星的运动也包含在这样的框架内 .
现在再进一步 设质 点在 阻力亦 即摩 擦力下 运动 .阻力 是一 个复杂 的对 象 , 在 最简单 的情 况
下 , 可以假设阻力为 - hx , h > 0 是一个常数 .这里加了一个负号是因为阻力必与速度方向相反 ,
否则就谈不上阻滞了 .这时由牛顿第二定律将给出
¨ 2
x + hx + α x = 0 . (30)
( 我们略去了质量 m , 而 把系数作必要的 修正 ) .我们 首先把 ( 30 ) 化成一 个方程组 .为此 令 x1 =
x , 再引入 x2 = x 1 , 则 (30) 化成了
x1 = x2 ,
42 第二章 函 数
2
x2 = - hx2 - α x1 . (31)
( x1 , x2 ) 平面现在就是相平面 .所以 , 研究方程组 ( 31 ) 即是在相平面上讨论它 , 但是为了求解 , 我
λt
们仍用 (30) , 并且仍设 x ( t ) = Ce , 代入 ( 30 ) , 即得关于 λ的一个二次方程
2 2
λ + hλ + α = 0 (32)
称为特征方程 , 它有两个特征根
h 1 2 2
λ1 , 2 = - ± h - 4α .
2 2
2 2
这时最重要的是 h - 4α 的符号 .下面我们只看 λ1 , 因为 λ2 是 λ1 的复共轭 , 它不会给出新的物
理知识 .
相应于 λ1 , 将得到解
h
- t αt
i珘
2
x ( t ) = Ce e . (33)
2 2 2
α = α - h/ 4 .
珘
iφ
h = 0 , 就是没有阻力的情况 , 如果 h 逐步增大 , 把 C 写成一个复数 C = A e 0 , A > 0,有
h
- t i( 珘
αt + φ )
2
x ( t ) = Ae e 0
.
h
- t
于是我们看到频率由 α变成珘
α, 就是频率变慢 .振幅出现了因子 e 2
, 而当 t → ∞ 时衰减为 0 , 但
是它仍然表现了振动性质 . h = 2α是一个临界值 .这时珘
α = 0 .但是当特征方程出现重根时 , 解不
2 2
再写成 (33) 而有变化 .如果阻力再增加 , 使 h - 4α > 0 , 解 λ1 与 λ2 都成了实数 , 而解 ( 33 ) 现在
成了
λ t + iφ
x ( t) = Ae 1 0
,
h 1 2 2
λ1 , 2 = - ± h - 4α < 0 .
2 2
这时就不再有振动 , 而只有指数衰减了 .
以上我们是求出了 x ( t ) .如果转到相空间 ( x1 , x2 ) , 尽管 x1 ( t ) , x2 ( t ) 都不难得出 , 却不 容
易找到与椭圆 (29) 相应的联结 x1 , x2 的关系式 .实际上 , 相轨道不会再是一个封闭曲线 , 因为 不
再有周期运动 .但是相轨道的分析引导到数学与物理学中、工程学中十分富有成果的分支 .
§3 进 入 复 域
∑
k
的根 .这是一个很古老的问题 , 当年高斯第一次证明了 n 次代 数方程 an - k w = 0 ( a0 ≠0 ) 必
k=0
1
r n , 也就是正实数 r 的 n 次算术根 .如果 z 是一正实数 , 则可取辐角 φ= 0 , 这时在上述 n 个根中
1
有一个是正实数 ( 相应于 k = 0 ) , 这个根也就称 为 z n 的算 术根 .而 对于一 般的 复数 , 算术 根的 概
n 1
念是没有意义的 .有的书上规定只有算术根才可使用 z的记号 , 一般情况下则使用 z n .我们却不
如此拘谨 , 主要是要知道它是“ 多值函数”, 而且这种多 值性的 来源 就在于 复数 辐角 的多值 性 .为
了从这许多值中分出特别的一个便于使用 , 我们时常指定辐 角 φ 的取值范 围是 0 ≤φ< 2π, 并 称
这个值为“主值”.但是这又是一个不必过分计较的名词 , 有时也说 - π≤φ<π是主值、- π< φ≤
π是主值 , - π≤φ≤π是主值……总之 , 目的在于分离出一个特定的值来 .
n ( k)
乍看一下 , w = z 有 n 个反函数 w , 但仔细看一下又不能泰
1
iφ ( 0) iφ / n
然处之 , 因为若令 z0 = r0 e 0 , 0≤φ0 < 2π, 并取 w ( z0 ) = r 0n e 0
1
(0) (0)
为 w ( z ) 之“ 初始值”( w ( z ) 不妨称为 w = z n 的主值 ) , 现在来
看 z 变化时 w 之值如何变化 .这 时 z 变动 的道 路 ( pat h ) 之 构造 将
起关键作用 .例 如取 图 2 - 3 - 2 上的 不绕 过 O 的道 路 L1 .如 果 z
iφ
从 z 0 开始依逆时针方向绕 L1 一圈回到 z 0 , 则 z 变回原来的 r0 e 0
,
(0) ( 0)
而 w 也由 w ( z0 ) 变回原来的 w ( z0 ) .但是 z 从 z 0 开始沿绕过
i ( φ + 2π)
O 的道路 L2 依逆时针方向又回到 z 0 , 后一个 z0 将是 r0 e 0
,而
1
图2 - 3- 2 ( 0) i ( φ + 2π)/ n (1)
w 将由 w ( z0 ) 变成 r0n e 0
, 即变为 w ( z0 ) .若 z 再沿 L2
i ( φ + 2・2π)
绕 O 一 圈 再 次 回 到 z0 , 现 在 的 z 0 将 是 r0 e 0 ,而 w 由
1 1
(1 ) ( 2) i ( φ + 2・2π)/ n
w ( z0 ) 变成 w ( z0 ) = r 0n e 0 .所以这 n 个 w = z n 将依
1
次互相转变 .所以把 w = z n 看成一个单值的反函数更为妥当 .但
是现在给定一个 z , 可以求出 n 个 w 值如 ( 5 ) , 这个 矛盾 如何 解
决 ? 办法就 是把 原 来的 z0 与绕 L2 转了 一圈 使 φ0 增加 了 2π的
i ( φ + 2π)
z0 = r0 e 0 区别开来 .这里就表现了黎曼的天 才 : 设想有 n 个
z 平面 , 如同 n 张纸一样 , 而且把它们钉在一起 , 可是不是像 书那
样沿书脊钉 , 而且在 z = 0 处钉 住 , 然 后 例如 把 它们 都 沿 正实 轴
剪开 , 再把一张纸的沿正实轴 的下 沿 ( 辐 角接近 2π处 ) 与另 一张 图2- 3 -3
纸的上沿 ( 辐角接 近 0 处 ) 粘在一 起 , 像一个旋 转楼梯 .当我 们沿
楼梯旋转一周环绕 O 点就自动上了一层楼 .初始的 z0 在一楼 , 下一个 z0 在二楼……这样就把 两
( 0) (1 ) ( n)
个 z0 区别开来了 .这样一层又一层地转 , w 就自动地变成 w ……再变成 w 等等 .可是到了
1 1 1
( n - 1) i ( φ + 2 ( n - 1 )π+ 2π) / n i( φ + 2 nπ) / n iφ / n
n 楼 ( 即 k = n - 1 处 ) , 如果再 转 , w 就 应变 成 r 0n e 0 = r 0n e 0 = r 0n e 0 ,
所以 z0 就应该回到一楼的起点 ( 图 2 - 3 - 3 ) .可 是 z0 怎 么能 由 n 楼神 不知 鬼不 觉 地再 回起 点
呢 ? z 0 的路径应该与其它楼面都 相交 , 可 是交点 处的 z 0 对 应的 w 值又 怎么 计算 呢 ? 可 是黎 曼
认为不必管 , 就让 z 像崂山道士那样钻天入地了 无痕迹算 了 , 黎 曼把 这样造 出来 的东 西 Sn 看 成
1/ n
一个曲面 , 后世就称为黎 曼曲面 .于是所谓多值 函数 w = z 就成了黎曼曲面 Sn 上的 单值函数 .
自此以后 , 研究多值函数就变成了研究如何构造相应的黎曼曲面 .
46 第二章 函 数
当然 , 读者会感到困惑 , S n 究 竟是 怎样构 造的 呢 ? 我们 不妨 这
样来作 .先找一个小纸片 , 在上面标 记一点 z0 , 然后 例如 沿着 L2 与
z 0 相近处 , 再找 一个 小 纸 片与 第 一片 粘 起 来 , 粘 了 一 整 圈以 后 , 当
L2 回到 z0 时 , 注意在 这时 的小 纸 片上 虽然 仍 然标 记 上 z 0 , 可 是 不
要与原来最初的小纸片 粘在 一起 , 而要 用新 的小 纸片 粘 下去 , 这 样
到了第 n 圈时 , 已经 用过 了 不 少小 纸 片 .后 来的 小 纸片 与 第 二片、
第三片大相径庭 , 所以可以“ 置之不 理”, 而硬是 把它 与 最初 的一 片
粘在一起 .这有点像运动会上 的万 米赛 跑 , 运 动员 要在 400 米的 圆
形跑道上跑 25 圈 .于是当一个运动员一路领先已到了冲刺 阶段 , 金
牌在望时 , 突然看见前面还有一个运动员 , 他当然可以“ 置之不理”,
图2 - 3- 4
因为“ 前面”的运动员还只跑了 24 圈 , 还差 400 米呢 .上面我们写 了
一些“游戏文章”其实例如道路、粘结 , 旋转楼梯等等都大有数学文章在后面 .
1
n
如果读者仍然感到 S n 神秘莫 测 , 我们 再换一 个 角度 来看 : w = z n 是 w = z 的 反 函数 , 因 此
n
其定义域是后者的值域 . w = z 映 C: ( z 平面 ) → Sn , 我们现在研究 Sn 的构造 .把 z 平面 C 分成n
个扇形 , 其顶角均为 2π/ n , 于是 O A0 被映为 w 平面的正实轴 , O A1 也是一样 , 总之第一个扇形 被
一对一地映为 ω的全平面 , 而 O A0 我们认为变为 w 平面正实轴“上岸”, OA 1 变为 w 平面正实轴
“下岸”, 总之 , 我们得到第一页的平面 .再往下进 行到 了第二 个扇 形 , OA 1 变 成第 二页 w 平面 正
实轴的 上 岸 , 而 与第 一 页 相 邻 .仿 此 进 行 下 去可 以 作 出 n 页 w 平 面而 且 再 回 到 第一 页 .在 图
2 - 3 - 4上我们画了一些小区域 , 它们都是跨在两页 w 平面上的 , 借此标志第一页与第二页以 及
第 n 页相邻 , 但与第三页、第 n - 1 页都不相邻 .所 以在第 n 页上的 w 又 会“ 从天 而降”, 不知 怎
n
么又回到了第一页 .这样看来 w = z 的值域 Sn 显 然具 有上面 讲的 黎曼曲 面的 构造 .所以 它的 反
1
函数 w = z n 应以这样的 Sn 为定义域 , 而且成为 S n 上的 单值函数 .所以 , 黎 曼曲面 是实实 在在 的
结构而非空中楼阁 !
n z
有了对 w = z的详细讨论 , 再 看 w = e 的反 函 数 w = ln z 就 容 易多 了 .事 实 上 , 因 为 z =
tφ i ( φ+ 2 kπ)
re = re , k = 0 , ±1 , ±2 , … ,
w = ln z = ln r + i( φ + 2 kπ) , k = 0 , ± 1 , ± 2 , … . ( 6)
从表面上看来 , ln z 是一个无 穷值 的多 值函 数 , 但 是如 果 按上 面讨
n
论 w = z 的方法 来 处理 , 可 以知 道 它 只 是 一个 定 义 在 黎 曼曲 面
S∞ 上的函数 . S ∞ 由无穷多页 z 平面叠合而成 ( 图 2 - 3 - 5) .只不
过 , 它一方面可以向上 ( 如果 z 绕 z 0 作反时 针方向 旋转的 话 ) 升到
无穷多层 , 也可以向下 ( 如果 z 绕 z0 作顺时针方向旋转的话 ) , 降到
无穷多 层 的“ 地 下 室”去 .读 者 由 此 可 见 , w = ln z 是 黎 曼 曲 面
S∞ ( 它有无穷多页 ) 上的单值函数 .
还有反三角函数也是相应黎曼曲面上的单值函数 .但因 其黎曼
曲面的构造比较复杂 , 我们就不再讨论了 .
图2- 3 -5
可是不论怎么说 , 神秘气 氛终于 难 以尽 除 .为 什么 数 学家 们肯
§4 “函数”概念够用了吗 ? 47
§4 “函数”概念够用了吗 ?
图2- 4- 1
所以 m ( - ∞ ) = 0 , 因此又有 m ( x ) = ∫ -∞
ρ( x ) d x , 只要 ρ( x ) 是比较“规则”的 , 例如是 连续的 ,
m( x ) =∫ -∞
ρ( x ) d x . ( 1)
∫ -∞
δ( x ) d x = 1 . ( 4)
则可得一系列左闭右开的 区 间 σn = [ an - 1 , an ) 把 实 数轴 R 覆盖 起 来 : R = n =∪- ∞ σn , 对 每个 区 间
σn , 我们规定一个实数 m (σn ) , 使得
m ( ∪ σn ) = ∑ m (σ ) n . ( 5)
这样的 m 当然是一个“ 集函数”, 即对集 σn 确定了一个实数 m (σn ) 与之相 应 .测度的例 子很多 ,
通常的区间长度是一个测度 , 如上面所说的棒上的质 量分布 也是 测度 .这 里有两 点需 要说 明 : 首
先我们是从区间 σn 而不是更一般的集合开始 , 而且 (5 ) 式中的 ∪ 与和 ∑ 都不明确规定是有限
并 ( 有限和 ) 还是可 数并 ( 可数 和 ) .我们在 这里虽 然含糊其 辞了 , 好 在读者们 在第四章 会有机 会
读到准确的论述 .其次 , 我们取 σn 为左闭右开的而且 彼此不 相交 , 这 却是 重要的 .因为我 们要 考
虑集中在某一点的质量 , 如果该点在 x = an , 则这个点的质量是算在 [ an - 1 , an ] 的质量内还是算
52 第二章 函 数
∫f ( x ) d m = f (0 ) . ( 7)
这里我们必须在观念上有一个大转 变 : 过 去 讲函 数总 是讲 的可 以 在某 一集 合上 逐点 取 值的“ 东
西”.( 当然“ 逐点取值”有时可以马虎一点 , 在 积分 一章中 我们 还要回 来讲 怎样“马 虎”) .现在 ,δ
函数则对应于一个测度 , 测度可不是逐点取值的东西 , 而 是在 某个 集合 σn 上 有一 个值 .但 是 , 它
可以作用在一个充分光滑的函数 f ( x ) 上 , 按 ( 7) 式起一种作用 , 即取出该函数 ( 以后称为试验函
数 ) 在 x = 0 处的值来 .凡是可以按某种线性的规律如 ( 7) 在一类试验函数上取值的对象 , 叫做一
个线性泛函 .一个普通的连续函数 φ( x ) 也可以在一类试验函数上取值 , 例如按下式
∫φ( x ) f ( x ) d x
( φ, f ) = ( 8)
( φ, f ) = ∫f ( x ) dΦ .
所以 , 普通的连续函数也可以形成泛函 .但是泛函不一 定由普 通连 续函数 生成 , 而 也可以 由例 如
测度生成 .所以我们把这些线性泛函叫做广义函数 .其实还可以由更加复杂的东西生成更复杂的
广义函数 ,δ函数只是最简单的一例 , 它按
(δ, f ) = f ( 0) ( 9)
生成一个由测度给出的广义函数 , 就是上文讲的在 x = 0 处有单位质量的质点生成的测度 .
这样 , 我们看到测度可以认为是函数概念的推 广 .测度理 论是 一个很 重要 的数 学分支 , 它 特
别是概率论的基础 .我们将在第四章讨论一个特别有用的测度———勒贝格测度以及勒贝格积分 .
它是黎曼积分直接的推广 .至于更一般的测度和积分 ( 包括斯蒂尔切斯积分 ) 我们都不讲了 .我们
只指出 , 它们都构成广义函数 , 而未在广义函数理论中 把这一 类划 分出来 专门 讨论 , 因为 那是 太
费力了 .
再看如何用分 部 积 分 法 来 解 释 δ 函 数 .和 上 面 一 样 , 取 f ( x ) 为 一 试 验 函 数 , 即 定 义 在
( - ∞ , + ∞ ) 上的充分光滑而且在一有限区间 [ A , B] 外恒为 0 的函数 .若 φ( x ) 在 ( - ∞ , ∞ ) 上
有连续的一阶导数 , 则有
∞ B
B B
= -∫φ′( x ) f ( x ) d x
A
= - (φ′, f ) . (10)
∫
-∞ ∫
H ( x ) f′( x ) d x =
0
H ( x ) f′( x ) d x
B B
∫
=
0
f′( x ) d x = f ( x )
0
= - f ( 0) = - (δ, f ) .
∫
对偶空间 .这个名词也是由线性代数中借来的 , 而例如 φ( x ) f ( x ) d x = ( φ, f ) 就好像线性代数
∫ (1 -
2 n
In = u ) d u, (11)
- 1
- 1/ 3 - 1/ 3
将它分成两部分 , 一部分是在 | u | ≤ n 上积分 , 另一部分是在 n ≤ | u | ≤ 1 上积分 , 即
- 1/ 3
n
In = K n + Ln = ∫ - n
- 1/ 3
+ ∫
- 1/ 3
.
n ≤ | u|≤1
∫
2 2 n -
In > (1 - u ) d u > 1 - n ・n 3
,
1
2
n
- 1/ 3
4
因此
n
- 2/ 3
1/ 3 1 - n
Ln/ In < 2 n .
1 - 2/ 3
1 - n
4
但是
3 - 2/ 3
- 2/ 3 n
1 - n 4 3 - 2/ 3 -
3
n
- 2/ 3
= 1 - ≤1 - n < e 4 ,
1 - 2/ 3 1 - 2/ 3 4
1 - n 1 - n
4 4
§4 “函数”概念够用了吗 ? 55
x x
这里我们用到了不等式 e > 1 + x ( x ≠ 0) , 计算一下 e - 1 - x 之最小值即可得此式 .总之
3 1/ 3
1/ 3 - n
Ln/ In < 2 n e 4
→0 .
现在我们可以来构造 Pn ( x ) 了 , 我们需要的 Pn ( x ) 是一个 2 n 次多项式
1
1
∫
2 n
Pn ( x ) = f ( y) [1 - ( y - x ) ] d y
In 0
1- x
1
∫
2 n
= f ( x + t) (1 - t ) d t .
In - x
2 n
用 上面的式子并用二项定理把 [1 - ( y - x ) ] 展开 , 就知道 Pn ( x ) 是 x 的 2 n 次多项式 .变换 y
= x + t 则给出第二个式子 .因为 α≤ x ≤ β, 故
- x ≤ - α < 0 < 1 - β≤ 1 - x .
- 1/ 3
取 n 充分大 , 使 n < min{α, 1 - β} , 则
- 1/ 3 - 1/ 3
- x < - n < n < 1 - x .
这样 ,
- 1/ 3 - 1/ 3
n n 1 - x
1 1 1
Pn ( x ) =
In ∫ - x
+
In ∫ - n
- 1/ 3
+
In ∫ n
- 1/ 3
= J1 + J2 + J3 .
- 1/ 3
- n 1- x
1
∫ ∫
2 n
| J1 + J3 | = + - 1/ 3 f ( x + t) (1 - t ) d t
In - x n
- 1/ 3
- n 1
M
∫ ∫
2 n
≤ + - 1/ 3
(1 - u ) d u
In -1 n
= M Ln/ In →0 , M = max | f ( x ) | ,
这里趋于 0 是对 x 一致趋于 0 .对于 J2 则利用积分中值定理而有
- 1/ 3
n
1 Kn
∫
2 n - 1/ 3
J2 = f ( x + t) (1 - t ) d t = f ( x + θ) , | θ| ≤ n ,
In - n
- 1/ 3
In
再利用 f ( x ) 的一致连续性以及 I n = Ln + K n 即知对 x 一致地有
J2 → f ( x ) .
定理证毕 .
魏尔斯特拉斯定理有许多发展 .例如设 f ( x1 , … , xn ) 为连续函数 , 而且对 每个变量 xi 都 有
周期 2π, 则 f ( x1 , … , x n ) 一定可以用三角多项式
- 1 ( k x + …+ k x )
∑ ak 1 , … , k n e 1 2 n n | k1 | , … , | kn | ≤ N
去一致逼近 .
现在我们从 δ函数的观点来看看这个证明 .我们很容易想到 In → 0 , 因为计算这 个积分并不
1 2 n 1 2 n
难 .所以 (1 - u ) , 当 n 越变越大时 , 图形大抵如图 2 - 4 - 2 , 当 u ≠ 0 时,“总有”lim (1 - u )
In n→ ∞ In
1
1 1 1
∫
2 n 2 n 2 n
= 0 , 但当 u = 0 时 , n→
lim∞ (1 - u ) = ∞ , 同时恒有 (1 - u ) d u = 1 , 所以 (1 - u ) 之“极
In In - 1 In
限”就是 δ函数 , 而我们上面证明的定理其实就是说
56 第二章 函 数
图2 - 4 - 2
1
∫I ∫δ( t) f ( t +
2 n
lim (1 - t ) f ( t + x ) d t = x ) d t = f ( x) .
n
这就是狄拉克所说的 δ( x “
) 可以看作是某个函数序列的极限”的意思 .但是 , 上面的 讲法总是 不
1 2 n 2 n
严格的 .因为只看 nlim (1 - u ) = ∞ ( u = 0 时 ) 以及 nlim ( 1 - u ) = 0 ( u ≠ 0 时 ) , 不能就
→∞ In → ∞
说函数极限就是 δ函数
∞, u = 0,
δ( u ) =
0, u≠0 .
再则 , 我们不能随意地在积分号下取极限 , 所以我们又只好说是一种“广义 的”极 限过程 .我们 称
它是“弱极限”.但是应 说明 “
, 弱极 限”是一个很 严肃的 数学概念 , 读者以 后有很多 机会遇 见它 .
上面讲的函数序列 , 通常称为 δ型序列 , 它在物理学中是很常见的 .其中有一些是如上所示的“ 钟
形曲线”, 而有一些则完全令人联想不到这种图形 , 而表现 出的剧 烈的 振荡 特性 .关 于广义 函数 ,
包括这里讲的 δ型序列 , 四、五两章中将比较详细地介绍 .
第三章 微 分 学
§1 微分学的基本思想
顿的方法的要点是什么 .
设有心力场的中心是原点 O .先设没有外力 , 这自然是有心力场的特例 , 即力之强度为 0 .若
质点初始位置在 A , 经过一个无穷小时间 d t 后到了 B 点 .因为没 有外力 , 按牛 顿第一定 律 , 该 质
点将沿直线 A B 作等速运动 .再过一段时间 d t 到达 C 点 . A BC 是一条直线 , 而且 A B = BC .所以
§1 微分学的基本思想 59
OB 是△ O AC 之中线而△ O A B = △ OBC .这 就 是说 质点 的动 径 OA 在 d t 时 间内 扫 过的 面积 相
同(图 3 - 1 - 1 ) .
若有向心力作用 , 则在 B 点处有一个力沿BO方向 指向 O , 因此在 第二个时 间段 d t 内 , 质 点
还有一个与 BO方向平行的位移CD .这样质点从 B 的位 移将是 BC与CD的 合位 移BD .而动径 OB
在第二个时间段 d t 内扫过的面积是 △ O BD .比较△ OBC 与△ OBD, 其底 等长 ( 均 为 OB) , 而 高
又因顶点 C 和 D 位于 OB 的 平行 直 线 CD 上 , 故 又为 等高 , 所 以△ O A B = △ OBC = △ OBD .因
而定理证毕 .
这个证明中最值得注意的是 : 牛顿的证明暗地里使用了一个假设 , 即在每一个时间段 d t 里 ,
有心力的方向与其开始瞬间的方向 BO一样 , 所以才得到面积速度可以用△ O A B 与△ OBD 表 示
的结论 .如果我们记质点动径 ( 从 OA 算起 ) 扫过的面积为 A( t ) ( 它当然是 时间的 函数 ) , 而 在“ 无
穷小”时段内 d t 内 , 扫过的面积为 d A ( t ) , 则在时刻 t
d A( t ) = △ O AB + 高阶无穷小量 ,
在时刻 t + d t
d A( t + d t ) = △ OBD + 高阶无穷小量 ,
注意到△ OA B = △ OBD, 略去高阶无穷小量 , 并用 d t 去除 , 即有
2
d A( t )
2 =0 .
dt
图3 - 1 - 2
d A ( t)
所以得知面积速度 为常数 .
dt
下面再举一个光学中的例子 , 光学在 17 世纪也是 一个重 要的 科学分 支 .这当 然是与 望远 镜
和显微镜的发明分不开的 .而特别是望远镜 , 是天文研究最有力的工具 .于是几何光学兴起了 ( 波
动光 学则 晚到 19 世纪 才流行 起来 ) , 而 17— 18 世纪 的几乎 所有 大数学 家、大物 理学 家 ( 包括 牛
顿 ) 对光学都作出了贡献 .我们特别要举出费马 ( Pierre de Fermat, 1601—1665) .他其实也是微 积
分学的奠基者之一 .他的方法如下 : 例如 , 要考虑光的反射问题 , 设 L 是一个平面镜面 , 光线 从 A
点射向 L 并在点 P 反射到 B 点 , 问反射点 P 的位置 是什么 ? 当费 马着手 解决这个 问题时 , 他 已
经有了一个著名的费马原理 : 光在 一切 可能 的 路径 中必 取耗 时最 短 的路 径 .这里 要 注意 什么 是
“可能的路径”? 即联结 A 与 L 上一点 P 再到 B 的路 径 .如果找 到了 这样一 条路 径 , A P 必为 直
线 .因为在镜面以外 , 光当然也走耗时最短因此长度也最短的路径———直线 .同理 P B 也 是直线 .
我们可以看到 , 若由 A , B 两点作 L 之垂线 , 令垂足 为 A 1 , B1 , 则 A A1 与 BB1 , 决定一 个与 L 垂
60 第三章 微 分 学
π π
点处的法线的夹角而不是与 L 的夹角来表示其方向 .故 θ= - θi (θi 称为入射角 ) , φ= - θr ,
2 2
(θr 称为折射角 ) , 就得到折射点的位置是
sin θi sin θr
= .
v1 v2
在物理学中这叫做斯涅耳 ( Willibrord Snell) 定律 .其实笛 卡儿 也得 到了这 个定 律 .而且费 马解 决
了希腊时代托勒密未能解决的问题 .
用我们今天的语言来说 , 即令 d x→ 0 而求极限 , 并令其为 0 :
f ( x + d x) - f ( x) sin θi sin θr
lim = f′( x ) = - =0 .
d x→0 dx v1 v2
但是在费马的时代人们还在为无穷 小量 是什 么而困 扰 : 费马 说 E 是无穷 小量 , 那 么它究 竟是 不
是 0 ? 如果是 0 , 那么从一开始我们就停在 P 点 , 而不会前 进到 Q 点 , 因此 整个讨论 就都无法 进
行了 ; 如果不是 0 , 为什么在经过许多计算后 , 在关键的一步上说“令 E = 0”? 有了我 们今天对 无
穷小量的理解 , 我们知道 , 无穷小量并不是“不可分量”, 而是趋于 0 的变量 ; 并不是“令 E = 0”, 而
是令 d x→0 .高阶的无穷小量在除以 d x 后 , 仍会趋向 0 , 所以我们说是 : 丢掉高阶无穷小量 .
以上我们通过实例说明了微分学的基本思想就是“丢掉高阶无穷小”.要注意 , 当时的大数学
家、大数学物理学家 , 不但是在某种社会经济发展和科 学探索 的需 要的推 动下 工作 , 而且 是在 一
定的文化、科学的传统下工作 .从欧几里得以来 , 数 学的严 格性、合 逻辑性 的要 求 , 并不如 常人 认
为的那样是一种过分的苛求 .牛顿写《原理》以《几何原本》为范本 , 就是这种表现 .那么 , 什么是无
穷小 , 它是不是零 , 诸如此类的问题自然成了他的最放 不下 心的事 .所 以 , 一方面 牛顿 自称“在 数
学中最微小的误差 也 不 可忽 略”, 另 一 方面 , 反对 他 的人 就 以此 相 讥 “
: 高 阶 无 穷 小何 以 可 以 略
去 ?”一直到 19 世纪中晚期 , 这场大争论才尘埃落定 .微积分学才站在稳固的基础上 , 就是我们今
天的教材的讲法 , 而略去高阶无穷小这个威力强大的方法也就得了无疑问的公认了 .
2 .这个基本思想在数学物理中的展开 自牛顿以后 , 这场争论如火如荼地进行了两百年 .可
是人们并不只是坐而论道 , 而是把牛顿的这个思想用于各个方面 .因为牛顿既然对机械运动提出
了一个包罗万象的理论 , 而且公认是人类思想史上对认识大自然的第一次伟大的综合 ( 综合就是
总结 ) , 人们当然就会把它用于机械运动的各个方 面 : 流 体、弹性 体、声学…… 都纳 入了科 学家 的
视野 , 成了新生的数学武器———微积分学———的试验场 .下面我们将要介绍“略去高阶无穷小”这
个基本方法怎样帮助我们得到某些领域的基本规律的 数学表 述 .但是 这些规 律的 物理内 容都 比
较简单 .大体上都是例如质量守恒、动量守恒等等 , 因此都是牛顿力学的适用范围 .
第一个 例子 是热传 导方 程 .热现 象本来 在牛 顿力学 的视 野之 外 .人们认 真地 研究热 现象 是
19 世纪的事 .那时有了热力学 , 能 量守 恒定律 内容 的丰 富性才 开始 展现 .然后 是统 计 物理 , 使 统
计的、随机的观点进入了物理学 .因此 , 研究热现象应该从这个观点着眼 .但是下面介绍的研究的
出发点却是把热当作一种“流体”———热质说 .从物 理上说 , 它 是很 不够的 , 但 是从 数学上 说却 简
单得多 , 而且带来了料想不及 的丰 硕成 果 .至 于从 概率 的观 点 来描 述热 传导 以至 得 出同 样的 方
程 , 在第四章§4 将简单介绍 .
1811 年巴黎科学院悬赏解决以下问题 “
: 给出热的传播规 律数学理 论 , 并将理论 结果与精 密
的实验结果相比较 .”应征得奖者是傅里叶 ( Jean-Baptiste Joseph Fourier , 1768— 1830 ) .后来他 把
62 第三章 微 分 学
地加以介绍 .
为简单起见 , 在热传导的区域中切出一块无穷 小的长 方体 , 其 棱平行 于坐 标轴 , 而三 边长 度
分别是无穷小 d x , d y, d z .设热量通 过其 各个面 进入 这个 无穷小 区域 ( 注 意 , 关于 热 本质 的了 解
要等到 19 世纪后半叶 , 而在傅里叶的时代 , 人们仍把热看成一种流体———热质 , 傅里叶的著作中
也沿袭了这个观点 ) , 如果我们 记 ( x , y, z ) 处时 刻 t 的温 度为 u ( x , y , z , t ) , 则 例如 图 3 - 1 - 4
断面Ⅰ处 , 依外法 线方 向 ( 现在 外法 线方 向即 - x 方 向 ) 在时 刻 t 到 t + d t 之间 流入 区 域的“ 热
量”应与温度的梯度、断面Ⅰ的面积以及时段长度成正比 , 因此应为
u( x , y, z , t ) u ( x , y , z , t)
kd yd zd t = - kd yd z d t . ( 2)
n x
k 是一个比例常数 , 称 为传导 系数 .一般说 来 , k 是 ( x , y , z ) 的 函数 , 是表征 介质的 传热性 质的 ,
现在为简单起见设它是常数 .注意这里我们用了一个点 ( x , y , z ) 、一个时刻 t 的温度状况来表示
一个断面、一段时间的温度状况 , 自然就会有误差 , 但由于断面 面积 d z d y 以及时 段长度 d t 均 为
无穷小 , 所以误差应为高阶无 穷小 , 按我 们上 面的 规 定 : 高阶 无穷 小 可以 略去 不计 , 这样 才得 到
u u
(2 ) 式 .用同样的方法处理断面Ⅱ , 不过注意 , 这时外法线方向即 x 方向 , 从而 = , 由前所 述
n x
知 , 经过断面Ⅱ在时间 t 到 t + d t 之间流入该无穷小区域的热量应是
u ( x + d x , y, z , t )
kd yd zd t . ( 3)
x
(2 ) , (3 ) 之和是
2
u( x + d x , y, z , t ) u( x, y, z , t) u( x , y, z , t)
k - d yd z d t = k 2 d x d yd zd t . ( 4)
x x x
注意 , 在利用 拉格 朗日公 式时 , 我 们又 略去了 一个 高阶无 穷小 量 .至此 , x 方 向的 热流已 经清 楚
了 .用完全同样的方法处理 y , z 方向的热 流 , 我们 将得到 , 在 t 到 t + d t 之间经过 该无穷小区 域
之表面进入的热量总量是
2 2 2
u u u
dQ= k 2 + 2 + 2 d xd yd zd t = kΔu ( x , y , z , t ) d xd yd zd t . ( 5)
x y z
这里我们引入了一个记号 Δ, 我们称它为拉普拉斯算子 :
2 2 2
Δ= 2 + 2 + 2 ,
x y z
它可能是数学物理中“最重要的”算子了 .它的 形状如此 简单是 否隐 含了 大自然 的某 种奥秘 ? 是
的 , 它表现了空间 ( 爱因斯坦以前的空间 ) 是均 匀和 各向同 性的 .我 们暂 置不论 , 倒 是 d Q 的流 入
§1 微分学的基本思想 63
将导致温度的改变 , 即 由 u ( x , y, z , t ) 变 成 u ( x , y, z , t + d t ) , 温 差 是 u ( x , y , z , t + d t ) -
u
u( x, y, z , t) = d t .这里我们又略去了高阶无穷小 .可是使单位质量的介质温度上升所需的热
t
量应与质量以及温 度 增 量 成 正 比 , 比 例 常 数 c 称 为 比 热 .现 在 该 无 穷 小 区 域 的 介 质 之 质 量 是
ρd xd yd z(ρ是密度 ) , 所以又应有
u
d Q = cρ d t d xd yd z . ( 6)
t
比较 (5 ) 和 ( 6) , 立即得到温度 u 所应适合的方程
cρ u 1 u 2
Δu = = 2 , a = k cρ. ( 7)
k t a t
这里我们又假设了 c,ρ都是常数 .
方程 (7 ) 称为热传导方程 .可是 值得 注意 的是 , 不仅 是热 传导 现 象由 它来 描述 , 而且 扩散 现
象 , 渗流 , 化学反应乃至生物的繁殖与迁移等等也都是 由它或 由它 衍生的 方程 来反 映 .数 学物 理
中的偏微分方程大多有此特点 .例如 , 波动方程不但能反映声波 , 而且也能刻画电磁波 , 以及一定
条件下的水波、空气中的波等等 .定常现象则常用拉普拉斯方程
2 2 2
u u u
Δu = 2 + 2 + 2 =0 ( 8)
x y z
来刻画 .静电场的势 , 引力场的势等等都适合这样的方程 .
现在应特别注意以下的事实 .( 7) 是一 个很一 般的 方程 .即 是说 , 只要 传热 的物 体 Ω 是均 匀
的 , 因此 c 和 h 都是常数 , 密度 ρ也 是常数 , 则不论该物体 是什么形状 , 处于什么条 件下 , 总 是这
一个方程 .因 此 , 在解决具 体问题 时 , 总 要附加 一些条件 .一 是应该知 道在初 始时刻 ( 设 为 t = 0)
该物体内的温度分布 , 这样就有了一个附加条件
u = φ( x , y , z ) , ( x , y , z) ∈Ω, ( 9)
t=0
u = ψ( x , y , z ) , ( x , y , z ) ∈ Ω, ( 101 )
Ω
另一种情况是假设 Ω 与外界没有热交换———绝热情况 , 则有
u
= 0, ( 102 )
n Ω
- [ρu1 ( x , y, z , t ) ] d xd yd z d t .
x
而由全部边界进入的流体总量是
d Q = [ρ( x , y , z , t + d t ) - ρ( x , y , z , t ) ] d xd yd z
ρ
= ( x , y , z , t ) d td xd yd z
t
比较二式即得表征质量守恒的连续性方程 :
ρ
+ (ρu1 ) + (ρu2 ) + (ρu3 )
t x y z
ρ
= + div(ρu) = 0 . (10)
t 图3 -1 - 6
再看动量守恒 , 我们也可以引入所谓动量密度流的概 念 , 但 这就涉及
速度向量的张量积的概念 , 我 们暂 不假 设读 者 都知 道它 , 也 不 打算 现在 就花 很大 篇 幅去 讲解 它
( 第七章中会讲到这里涉及的张量积 ) , 因此就直截了当地把这个无穷小流体小块当成一个质点 ,
其质量是 ρ( x , y , z , t ) d xd yd z , 其速度为 u( x , y , z , t) , 然后直接应用 牛顿第 二定律 .其实这 里
已经包括了舍去高阶无穷小量的思想 .例如 , 一个无穷 小元并 不真 正是一 个点 , 因 而其内 部不 一
定是均匀的 .我们以 ( x , y, z , t ) 处的 密度 作 为此 无穷 小元 内各 点 t 时的 密度 , 本 身 就有 一个 误
差 , 只不过这样算出的质量与真正的质量也就只差一个高阶无穷小 .下面计算加速度和外力时也
都如此 .
在计算加速度时要注意 , 速度 u( x , y , z , t ) 中的 x , y, z 都是 t 的函数 , x = x ( t ) , y = y ( t ) ,
du
z = z ( t ) 即该质点的轨迹 , 所以在计算 时 , 既要看 到第 四个变 元 t 在变 化而 x , y , z 不 变时 产
dt
u
生的加速度 ( 称为当地加速度 ) , 又要看到因为 ( x , y , z ) 随着时间变化而改变位置使 u 也得 到
t
ud x ud y ud z u u u
一个加速度 + + = u1 + u2 + u3 = u1 + u2 + u3 u( 称 为
xdt y dt z dt x y z x y z
对流加速度 ) , 所以
du
= 当地加速度 + 对流加速度
dt
u u
= + u1 + u2 + u3 u= + ( u・grad) u . (11)
t x y z t
最后看外力 , 外力有两个部分 , 一是流体之外来的力 , 例如 重力 .又 例如当 流体 是带 电的 , 同时 又
处在电磁场中的电磁力 , 这时 我们 得到 了电 磁 流体 力学 .还 有 例如 流体 中有 某种 化 学反 应或 燃
烧、爆炸而产生的力 .我们记这种外力的质量密度 ( 即作用 在单位质 量上 的外 力 ) 为 F .第 二部 分
是流体中这个无穷小元以外各部分对它的力 , 亦即压力 , 这一部分我们已计算了 .例如通过Ⅰ、Ⅱ
两个面的作用力是
p
- p( x + d x , y, z , t ) d yd z + p( x , y, z , t ) d yd z = - d xd yd z . (12)
x
把这些结果综合起来 , 由牛顿第二定律 :
质量×加速度 = 外力
有
du
ρd xd yd z = ρd xd yd z・F - grad pd xd yd z .
dt
66 第三章 微 分 学
于是我们得到表现动量守恒的方程
du u 1
= + ( u・grad) u = - grad p + F . (13)
dt t ρ
(10) 和 (13) 就是流体力学的基本方程组 , 如 上所述 , 它们 是不 完备的 , 因 为热 力学的 考虑 都
被忽略了 .它是一个极广泛又极困难的领域的起点 .
以上我们通过两个例子表明 , 应用微分学的基本思想于研究自然界的许多广泛领域 , 得到了
描述其基本物理规律的微分方程 .( 这两个 例子 都是 偏微分 方程 ( PDE ) , 下面 我们 将见到 常微 分
方程 ( ODE) 的例子 .) 微分方程是数学中范围极广泛、内容极丰富而且又极困难的领域 .在许多自
然科学分支中 , 它是基本的数学工具 .我们可能以为略去高阶无穷小是产生这些微分方程的最重
要的方法 .实际上 , 这是由于我们现在研究的物理过程 都比较 简单 , 因 而一些 守恒 律都变 得很 简
单 .随着科学的发展 , 我们需要解决的问题更深刻 , 所应用的数学工具也更深刻 , 这时 , 单只是“ 略
去高阶无穷小”的方法就很不够了 .我们将在本书最后 介绍麦 克斯 韦方程 组 , 以便 了解数 学的 发
展怎样帮助我们在更深的层次上认识自然界 .
3. 牛顿与开普勒 牛顿写的《原理》是为了研究物体的运动 , 而所谓 物体 , 上至日月 星辰 , 下
至苹果树上落下的苹果 , 无所不包 .这样才看出《原理》是认识大自然的规律性的第一次伟大的综
合 .但是牛顿的三定律中讲的“ 物体”, 其实是指的质点 .例如第一定律 , 牛顿的陈述原文如下“
: 每
个物体都保持其静止、或匀速直线运动的状态 , 除非有外力作用于它迫使它改变那个状态”.(《原
理》中译本 , 13 页 ) .然而牛顿紧 接着举 的例 子却 有陀螺 , 并 指出 陀螺各 个部 分的“凝 聚力 不断 使
之偏离直线运动 , 如果没有空气的阻碍 , 就不会停止旋转 .”可见 , 如果不是质点而是有内部构造 ,
分成各部分的物体 , 如陀螺 , 牛顿也承认 , 其运动并 不一定 是匀 速直 线运动 , 而 可以 是旋转 .把 物
体当成质点无非两个办法 : 一是如果空间极大 , 则哪怕 是日月 星辰 , 在 浩渺无 垠的 太空中 也只 是
沧海一粟的质点而已 .二是物体有各部分 , 则各个部分 若取得 足够 小 , 如上面 两个 例子中 讲的 无
穷小的一块 , 小到对其内部结构 , 对其内部的不均匀性 等等都 可以 忽略不 计时 , 则 其各部 分也 就
看成一个质点 , 而物体整体则看成一个质点组 .当然质 点组中 的质 点总数 可以 是有 限的 , 例如 研
究地球受太阳、月亮的作用而运动时, 我们只需考虑由日、月、地三个质点形成的质点组 , 而其它行
星和火星等等的影响都暂不考虑了, 这就是著名的三体问题 .这样 , 由牛顿的第二定律可以得出
2
d xi dx
mi 2 = fi t, x , , i = 1,…, N . (14)
dt dt
注意 , 这里的 N 不一定是质点的个数 .因为每一个质点可以有三个坐标 , 即相应于三个 xi ( t ) .
牛顿遇到的问题通常并不是已知 x1 ( t ) , … , x N ( t ) 然后 求它 们 的二 阶导 数 , 而 通常 是已 知
dx
fi t, x , , 要求未知的 x i ( t ) .这就是求解作为一个常微分方程 ( ODE) 组的 (14 ) .正如前一 段
dt
所说的 , 应该加上某些附加条件 .从物理上看 , 只要知道这个质点组内各质点在初始时刻 ( 例如可
设为 t = 0 ) 的位置及速度就足以完全确定这个质点组在以后的运 动状况 .因此 , 我们 所需的附 加
条件是
0 d xi (0 ) 0
xi (0 ) = x i , = vi . (15)
dt
(15) 就是一个初始条件 .在一个初始条件下 求解 ( 14 ) , 称 为一个 柯西 问题 或初 值问 题 ( initial va-
lue problem) .以上讲的是有限质点组的情况 .如果是无穷多个质点所成 的质点 组 , 如 上面讲的 连
§1 微分学的基本思想 67
・
M ( t ) = 0 不仅表示 M ( t ) 大小不变 而且方向也不变 .这样 , r
・
与 r恒在与 M 正交 的平 面上 .这 样 一来 ( 17 ) 就变 成了 平 面 问题 ,
即 r 是 平 面 向 量 , 而 只 有 两 个 分 量 .不 妨 设 它 们 就 是 r ( t ) =
( x ( t ) , y ( t ) ) , 于 是 ( 17 ) 成了 两 个二 阶 ODE 的方 程组 , 相当 于 4
个一阶 ODE .这就是降阶 .
我们还可以应用 M ( t ) 之 大小 也 不变 .既 然开 普 勒问 题已 经
图3 - 1- 7 化为平面问题 , 我们就可以引入极坐标系 .于是 在每一 点 ( r , φ) 处
可以引入两个单位向量 er ———径向 向量与 eφ ———横向向 量 , 而 且
( er , eφ ) 取为右手系 ( 图 3 - 1 - 7 ) , 而且
r = rer + φeφ . (18)
・
我们想在极坐标系下计算一下速度 r .在第二章中讲三角函数时我们就讲 过这个 结果 ( 但是使 用
的记号不同 .现在的 er 与 eφ 那时记作 ρ与θ) , 由 于其 重要性 , 我 们再 从角动 量守 恒角度 再来 算
一次 .
因为 er 是单位向量 , er・er = 1 .对 t 求导有
・ ・ ・
er・er + er・er = 2 er・e r = 0 .
・ ・ ・
所以 er 与 er 正交而与 eφ 平行 .问题是同向还是反向 ? 但是 er 是绕单位 圆旋转 , 所以 er = φeφ ,
・ ・
同理 eφ = - φer :
・ ・ ・ ・
e r = φeφ , eφ = - φer . (19)
这样 , 由于 r = rer , 我们立即有
・ ・ ・ ・ ・
r = r er + re r = r er + rφeφ . (20)
・
这就是 说 , 速 度向 量 有两 个分 量 , 一 是径 向的 r er , 另一 是 横
・
向的 rφeφ .利用它来 计算角 动量 ( 以下 均设 质点 的质 量 m =
1) , 有
・ ・ 2 ・
M ( t ) = r× r = r ( r× er ) + r φ( er × eφ )
2 ・
= r φ( er × eφ ) .
因为 er × eφ 是 M ( t ) 方向 的单 位向 量 ( 这 由向 量积 的 定义 可
2 ・
知) , 所以 M ( t ) 之“ 大 小”是 r φ .( | M ( t ) | ≥ 0 而 M ( t ) 之
图3- 1- 8
・
“大小”却因 φ可能为负而可能小于 0 ) , 它是守恒的 .
设动径 r( t) 扫过的扇形 ( 以原点为顶点 ) 的面积为 S( t) .则由图 3 - 1 - 8 易见
1 2・
Δ S = S ( t + Δt) - S( t ) = r φΔt + o(1 )Δt .
2
所以“面积速度”
§1 微分学的基本思想 69
d S 1 2・ 1
= r φ= M ( t) .
dt 2 2
因为角动量不随时间变化 , 所以面积速度也不变 .这就是开普勒第二定律 .
定理 2( 开普勒第二定律 ) 有心力场中运动的质点恒有不随时间变化的面积速度 .
这也就是前面讲的第一个例子 .
为了看开普勒另外两个定律 , 我们再来看能量守恒 .首先注意 , 方程 ( 17 ) 中的力是有位能的 .
其位能是
k
U( r) = - .
r
这是因为牛顿的引力是 - grad U ( r) , 事实上
k r 1
- 2 = - grad U ( r ) = kgrad .
r r r
但是我们要把 (17) 这个 2 维问题化为 1 维问题 .为此我们记住角动量“大小”的 守恒值 为 M
2 ・
= r φ .由 ( 20 ) 式对 t 再求导 , 有
・
・ ・
・ ・・ ・・ ・
・ ・・
r = r er + r er + rφeφ + rφ eφ + rφeφ
・
・ ・2 ・・ ・
・
= ( r - rφ ) er + ( 2 rφ+ rφ) eφ = - grad U ( r ) .
但是
x y r
grad U ( r) = U′( r ) , U′( r ) = U′( r) = U′( r ) er ,
r r r
所以有
・
・ ・2 ・・ ・
・
r - rφ = - U′( r) , 2 rφ+ rφ = 0 . (21)
以角动量之守恒值代入 , 得到 r 所适合的方程为
2 2
・
・ U M M V
r= - + r 4 = - U+ 2 = - .
r r r 2r r
2
M
这里 V ( r) = U ( r ) + 2 称为有效位能 .
2r
(21) 的后一式没有给我们新信息 , 因为若用 r 乘此式两边 , 会得到
・・ 2 ・
・ d 2・
2 rrφ+ r φ = ( r φ) = 0 ,
dt
亦即角动量之“大小”不变 .
定理 3 服从 ( 17 ) 的质点的总能量是
1 ・2 1 ・2
mr + m U = mr + m V .
2 2
证 由 (20)
2
・2 ・・ ・2 M 2 ・2 ・2
r = r・r = r + r φ = r + 2 .
r
所以
2
1 ・2 1 ・2 M 1 ・2
r + U= r + U+ 2 = r + V .
2 2 2r 2
70 第三章 微 分 学
2 ・
一时刻之具体位置并不知道 .但是这并不 重要 , 因为 例如 由 r φ= M , 再积 分就 可以 求出 φ为 t
的函数 , 然后 r 作为 t 的函数也可以求出 .
余下的只有开普勒第三定律了 .由 r 和φ的表达式 (23) 即知当 φ运动 过 2π以后 , r 就会 进
入下一个周期 , 如果时间由 t = 0 到 t = T 能使 φ增加 2π, 则 T 自然是周 期 .在一 个周期 内动 径
dS
扫过椭圆一次 , 而面积速度 又是常数 M 2( M 是角动量的“ 大小”) , 所以
dt
T
dS 1
∫ 0 dt
dt =
2
M T =πab .
等式最右端是轨道椭圆的面积 .现在我们就用上式来计算周期
T = 2πab M .
注意到
2 2
M
2 2 EM
a = p (1 - e ) = 1 - 1+ 2
k k
2 2
M 2( - E) M k
= 2 = .
k k 2| E|
这里出现 | E | 是因为现在我们讨论的是椭圆轨道因 此 E < 0 , 从而 - E = | E | .此外 , 由离 心率 之
2
2 2 2 k 2| E| M M
定义 e = c a = a - b a, 从而 b = a 1- e = ・ 2 = .所以
2| E| k 2 | E|
1
- 3 2 3 2 -
T = 2πab M = 2πk [2 | E | ] = 2πa k 2
. (24)
定理 5( 开普勒第三定律 ) 当 上述质 点之 轨道为 椭圆 时 , 其周期 与质 点质 量无 关而 只与 其
3 2
轨道长半轴之半立方 a 成正比 .
证 只需注意 k = Gm1 = ( 引力常数 ) × ( 第一质点质量 ) 即得 .
以上我们由牛顿的万有引力定律导出了开普勒三 定律 .但是 实际 上牛顿 是由 开普勒 定律 得
到万有引力定律的 .牛顿实际上的思考过程当然 很复杂 , 其中 涉及 许多具 体力 学问 题的解 决 , 例
如对离心力的理解等等 , 这里有许多过程已不可 考 .而 在《原理》一 书中 , 牛顿 则用 逻辑方 法证 明
了万有引力定律确是开普勒三定律的必然结论 .由于牛顿是用几何方法做这个工作 , 其中省略了
“应该略去”的高阶无穷小量 , 就是说 , 他还是用的不成熟的微积分学 , 所以现在读起来相当困难 .
在微积分已经成熟了的今天 , 所 需要 做的 大 体上 也就 是把 以上 的 推理“ 颠倒 过来”, 这就 容易 多
了 .以下记号均与上面相同 .
首先 , 既然承认质点的轨道是椭圆 .所以这就是平面问题 .不妨设质点 ( 质量为 m2 , 但 m2 下
面记作 m ) 的运动发生在 ( x , y) 平面上 , 其轨道为 ( x ( t ) , y ( t) ) .若使用极坐标 , 则该质点之轨 道
为 ( r ( t ) , φ( t ) ) .另一质点则在原点处 , 其质量是 m1 .
先还是看角动量 , 由第二定律应有
d ・ ・ ・ 1
0 = ( r( t) × r ( t ) ) = r( t) × r ( t ) + r( t ) × f ( t )
dt m
1
= r( t ) × f( t) .
m
所以 f( t ) ‖ r( t ) .而 f = f ( x , y ) er 是未知的外力 .下面我们来求 f ( x , y ) , 并简记为 f .
72 第三章 微 分 学
・
由 r× r之大小也不变 , 即有
・ ・ 2 ・
r( t) × [ r ( t ) er + rφeφ ] = r φ( er × eφ )
之大小不变 .所以
2 ・
r φ = M≠0 . (25)
・ ・
( 若 M = 0 , 则 φ≡0 而质点不可能绕椭圆运动 ) .由此可知 φ≠0 .
为了求 f ( x , y ) , 我们需要考虑质点的动能
2 2 ・
m・ ・ m ・2 2 ・2 m ・2 ( r φ)
K = r・r = ( r + r φ ) = r + 2
2 2 2 r
2
m ・2 M
= r + 2 .
2 r
双方对 t 求导 , 有
2
・・
・ ・・
・ M ・
mr r = m r r - 3 . ( 这里 r 与 r 不同 .)
r
・
・ ・ ・ ・
以 m r = fer , r = r er + rφeφ , 代入即有
2
・ ・・
M・
fr = mr r - 3 .
r
・
我们在下面将证明 r 可以约去 , 于是有
2
・
・ M
f= m r - 3 . (26)
r
・
・
为了计算 r , 我们要利用椭圆轨道的焦方程
r (1 + ecos φ) = r + ex = p .
双方对 t 求导二次 .于是有
・
・ ・
・ ・
・ e ・・ e
0 = r + ex = r + ( f 之 x 分量 ) = r + f ( x , y ) cos φ .
m m
即
・
・ e
r= - f ( x , y ) cos φ .
m
代入 (26) , 并且注意到椭圆的焦方程 r( 1 + ecos φ) = p , 即有
m 2 1
f( x , y) = - M・2 ,
p r
而外力
2
mM 1
f= - ・ 2 er . (27)
p r
2 ・
这就是说该质点受到的引力是有心的 , 而且与 r 成反比 .为什么上面提到 可以约去 r ? 事实上 ,
把椭圆方程对 t 求导 , 将有
・ ・
r (1 + ecos φ) - ersin φ・φ= 0 .
§2 什么是微分 ? 73
・ M ・
但上面已说了 φ= 2 ≠0 , 即 φ= 0 ,π以外恒有 r ≠0 .因此除了在 φ= 0 ,π( 即近心点与远心点 ) 外
r
(27) 恒成立 .求极限即知 ( 27 ) 在整个轨道上都成立 .
现在要问 , 怎样求引力常数 .这 就需 要 开普 勒第 三定 律 , 令 质点 的周 期为 T , 和 前面 的证 明
一样
T 2π
・
∫ ∫
2 2
MT = r φd t = r dφ= 2πab .
0 0
2
所以 (27) 中的常数 M p是
2 2 2 2 3
M 4π a b a 4πa
= 2 ・2 = 2 .
p T b T
2
b 2
这里我们利用了 p = a( 1 - e ) = .由 开普勒 第三 定律 , 上式 右方 是一 个适 用于 一 切质 点的 常
a
数 .我们再恢复最早的 记号 , 即 位于 原 点的 质 点质 量 为 m1 , 而 运 动质 点 的 质 量 为 m2 ( 即 m =
2
m2 ) , 把常数 M p 写成 Gm1 , G 之大小与 m1 , m2 无关 , 称为引力常数 , 而 ( 27 ) 成为
Gm1 m2
f= - 2 er . (28)
r
这就是牛顿的万有引力定律 .
§2 什么是微分 ?
1. 线性化 现在进一步分析上一节的两个例子 .
在光的折射问题中 , 我们发现光走过折线 AP B( 图 3 - 1 - 3) 所需的时间 f ( x ) ( 上节 ( 1) 式 )
适合以下关系式
cos θ cos φ
f ( x + d x) - f ( x) = - d x + 高阶无穷小量 .
v1 v2
对于行星绕日问题 , 若记动径扫过的扇形面积为 S( t) ( 假设 t = 0 时动径位置在 O A , 参看图 3 -
1 - 1 ) , 则在有引力存在情况下 , 在 d t 时间内 , 扫过的面积应是 S( t + d t ) - S ( t ) , 而 且除了一 个
高阶无穷小以外 , 这个差应为扇形 OBD ( OB为动径在时刻 t 的位置 ) , 其顶角为 dφ= ∠ B OD , 半
1 2 1 2・
径为 r , 因此面积为 r dφ= r φd t, 于是我们又有
2 2
1 2・
S( t + d t) - S( t) = r φd t + 高阶无穷小量 .
2
在这两个例子中 , 我们都是把注意力放在右方第一项上 , 在折射问题中 , 由费马原理得出
cos θ cos φ
- =0,
v1 v2
d S( t )
由此即得关于折 射 的 斯涅 尔 定 律 , 在 行 星 运 动 问 题 中 , 我 们 得 到 了 瞬 时 的 面 积 速 度 =
dt
1 2・
r φ = 常数 .
2
74 第三章 微 分 学
为线性化 .这是数学物理一个根本的处理问题的方法 .
3. 在以上的讨论中我们必须把 x 与 h 分开 .魏 尔斯特 拉斯 的那一 段话 中就 提到 d x = h 是
1
完全不依赖于 x 的 .现 在 从 几 何 上 来 看 这 个 问 题 . y = f ( x ) 是 一 条 曲 线 , 它 定 义 在 R ——— x
轴———上的开区间 ( a , b) 上 , 但是它在 P 点 ( 自变量为 x 处 ) 有一 切线 .这切线 可以无限 延伸 .其
定义域是 - ∞ < h < + ∞ , 即图 3 - 2 - 1 上的斜线 , 不过我们把它的原点 h = 0 移到了 x 处 .曲线
与切线都是映射 .前者是定义在 ( a , b) 上的非线性 映射 .后者 是定义 在 - ∞ < h < + ∞上 的线 性
映射 .我们在图上画出了它们的图像 ( graph ) .这两个映射之差 当 h→ 0 时是 h 的 高阶无 穷小 .曲
1 1
线的定义域 ( a , b) 是 R ——— x 轴———的 一个 开 集 , 切 线的 定 义域 则 是整 个 R 空间 - ∞ < h <
+ ∞ , 我们称 此空间为 曲线在 P 点的 切空间 , 记 作 T P .我们 对上面 用的图像 二字还要 作一些 解
释 , 若有一个将 E 的 子 集 A ( 称 为定 义 域 ) 映 入 F 内 的 映 射
Φ: A E → F , 所 谓 图 像 就 是 乘 积 集 合 E × F 的 子 集 graph
( Φ) = { ( x , y ) ; x∈ A , y = Φ( x ) } .所 以上 图中 有 两个 映射 ,
一是 f : ( a , b) →{ y 轴} , 其自变量用 x 表示 ; 一是切 线 SP T :
{ - ∞ < h < + ∞}→{ y 轴} , 其 自变 量用 h 表示 .它的 图像 一
是曲线 R Q , 一是直线 P T .我们还说现在有两个空间 , 一是 曲
线 RP Q ( 或 者说 它 的 定 义 域 ( a , b) ) , 称 为 底 空 间 , 二 是 直 线
1 1
SP T ( 或 h 轴 R ) 称为切 空间 .有 两个 映 射 f : ( a , b) → R 和
1
d f : Rh →R , 后者称为前者在 x 点的切映射 .魏尔斯特拉斯说
图3- 2 -1
的“ h 完全不依 赖于 x”就 是说 我们 研 究切 映 射 d f ( x ) 时 , 要
以 h 为自变量 , 而 x 则视为固定的 , 最多也是看作一个参数 .我们常把 x 与 h 的变化混在一起分
不清是因为现在我们讨论的仅是最简单的情况 .要研究相应于 h 的函数的 全改变量 f ( x + h) -
f ( x ) 与 h 之关系 , 这样就必须而且也能够把这两 个不同的 变量加 起来 , 甚至 给人 一个印 象即 切
空间是一个仿射空间 : 其原点可 以任意 放到 一个位 置上 ( 现 在是 放到 底空间 的 x 点 ) , 而 在研 究
一般的映射与切映射之间的关系时 , 就不一定 ( 也不需要 ) 能把两个不同的变量加起来 , 我们研究
的也不是 f ( x + h) - f ( x ) 这样的问题 .
以上我们是固定了 x 来看切 映射 d f ( x ) 的 .如果 x 变 动
了又如何 ? 例如令 x 变到另一点 x′, P 点变成了 P′, 则切空间
( 图 3 - 2 - 2 上的虚线 ) 也要变 , 其原点对着 x′处 , 我们把 它看
成与 P 点的切空间不同的一维空间 .这样一 来 , 联 系着一 小段
曲线 R PQ , 就有许许多多 的切 空间 , 各视 为互 不相 干的 , 这 一
切空间、切映射和切丛在现代数学中都有特别重要的地位 , 我们将在第七章详细讨论 .
上面我们提出了一个问题 , 即 f′( x ) 中包含了有关 f ( x ) 的信息 .现在要问 , 能否从 f′( x ) 的
信息来恢复 f ( x ) ? 其实这是很常见的问 题 : 如果 已知某 一区 间 ( a , b) 上的 f′( x ) , 则只 要再 知
x
∑
2
‖ x‖ = xi . ( 9)
i=1
m
1 2
∑ ( x i - x′
2
‖ x - x′‖ = i ) .
i= 1
m
但是 , R 中一点的范数可以用多种方式来定义 .例如可以定义为
‖ x ‖ = 1 ≤sup | xi | . (10)
i≤ m
m
线性代数理论告诉我们 , 对于有限维空间 , 任意两种范数都是等价的 .即 是说 , 如果在 R 中有 两
个范数‖・‖1 , 与‖・‖2 , 则必存在两个常数 c, C > 0 使对任意一点 x 均有
c‖ x‖2 ≤‖ x‖1 ≤ C‖ x‖2 .
c, C 与 x 无关 .在下面 , 凡用到‖・‖ 时 , 一律是 指 (9 ) 式所 定义的 欧几 里 得范 数 .这样 , (7 ) 式 中
的高阶无穷小 o( h) 就理解为
‖ o( h) ‖ ‖ h‖→ 0 ( ‖ h‖→0) .
m n
下面考虑坐标变换下 (7 ) 式如何变化 .我们先从线性空间的线性变换 开始 .R 和 R 中有无限 多
种不同的线性坐标系 , 如果另取
1 , … , x′
x′= ( x′ m ) 和 y′ 1 , … , y′
= ( y′ n )
则必存在两个非奇异的线性变换
s11 … s1 m r1 1 … r1 n
S= … … 和 R= … …
sm 1 … sm m r n1 … r nn
§2 什么是微分 ? 79
中的 M 就是sup ‖ A( x ) ‖ .
x
在球内 , 其方程为
x = ( 1 - t ) x A + t xB , 0 ≤ t≤ 1 .
A 点与 B 点分别对应于参数值 t = 0 , t = 1 .令
Φ( t ) = f [ ( 1 - t ) x A + t xB ] .
n
于是 Φ( t) : I→R , I = [0 , 1 ] .很明显 Φ( t ) 是 t 的可微函数 .因为已设 A ( x ) = 0 , 所以 Φ′( t ) =
0 , t∈ I , 而可取 (16) 中的 M = 0 .对于 Φ( t ) 显然可适用中值定理 , 从而
Φ( 1) - Φ(0 ) = 0 .
或 f ( xB ) = f ( x A ) .此式在上述球内之任一点 x B 处均成立 , 所以在此球内有 f ( x ) ≡ f ( x A ) .
现在可以用此球内任一点作为心 , 再作其它的 球 , 只要此 球含 于 U 内 , 必有 f ( x ) ≡ f ( x A )
于其中 .现在令
V = { x ; x∈ U , f ( x ) = f ( x A )} .
于是 V 非空 . V 一定 是开的 , 因为 若 x0 ∈ V U , x0 必为开集 U 之内 点 , 因此必有 以 x0 为 心
的球 W U , 而且由 上证 , 在 W 内 f ( x ) = f ( x 0 ) = f ( x A ) , 而 W V .这 样 , V 一 定是 非空 开
集 .另一方面 V 又一定是闭的 .因为若 x0 ∈珡
V 而且 x0 ∈ U , 则由定理的条件 , f ( x ) 在 x0 为连续
的 .x0 在 V 的 闭 包 中 , 所 以 存 在 一 个 序 列 { xn } V , xn → x0 .由 f ( x ) 之 连 续 性 , f ( x0 ) =
lim f ( xn ) = nlim f ( x A ) = f ( x A ) .因此 x0 ∈ V , 这样又得到 V 是闭的 .一个连通集 U 的非空的既
n→ ∞ →∞
U= ∪ U , 每一个
i
i Ui 都是连通的 .若在不同的 U i 中各取 x A , 当可证明 f ( x ) 在每个 Ui 中分别
等于一个常数 : f ( x ) = Ci , x∈ Ui , 而这些 Ci 彼此可能不同 .这种 f ( x ) 称为局部常值函数 .
下面我们来看一下微分作为一个运算 , 亦即微分算子 d 的性质 .
第一个性质几乎是自明的 , 即线性性质
d( C1 f1 + C2 f2 ) = C1 d f1 + C2 d f2 , C1 , C2 是常数 . (20)
第二个性质称为莱布尼茨性质 : 若 f1 , f2 可微 , 则 f1 f2 也可微 , 而且以下的莱布尼茨公式 成
§2 什么是微分 ? 85
立:
d( f1 f2 ) = f1 d f 2 + f2 d f1 . (21)
证明很简单 :
( f1 f2 ) ( x + h) - ( f 1 f2 ) ( x )
= [ f1 ( x + h) - f1 ( x ) ] f2 ( x + h) + f1 ( x ) [ f 2 ( x + h ) - f2 ( x ) ]
= [ d f 1・h + o( h) ] [ f 2 ( x ) + o(1 ) ] + f1 ( x ) [ d f2・h + o( h) ]
= ( f2 d f1 + f1 d f 2 ) h + o( h) .
在数学中有许多乘积 : 向量的数量积、向量积、外积 等等 , 也有 许多 求导或 微分 : 普 通的求 导和 微
s
分、外微分、协变导数等等 , 而一定要适合 ( 21 ) ( 或 者其 某一项 前加 上一个 因子 ( - 1 ) ) 这 样的 公
式 .所以 , 只要有这种类型的 公式 成 立 , 我们 就称 相应 的 算子 为 导 子 ( derivation) 或反 导 子 ( anti-
s
derivation) 即 ( - 1 ) = - 1 的情况 .
可是关于微分算子 d 最重要的性质无疑是下面的 链式法 则 , 而这 就导致 对微 分作内 蕴的 处
理 .
3. 微分的内蕴性质 以上的讨论都是对某一固定的坐标系进行的 , 所 以要问如 果有了坐 标
变换 , 这些 结果 是否仍 成立 , 或 有改 变 ? 如果 有改 变 , 则新老 坐标 系中相 应的 结果 有什么 关系 ?
为了回答这个问题 , 首先要问 , 哪一些坐标变换是容许的 .这就导致了微分同胚的概念 .
n
定义 3 设有 R 中的开区域 U 与 V , 各赋有坐标 x = ( x1 , … , xn ) 与 y = ( y1 , … , yn ) .若 U
- 1
与 V 之间有一映射 φ: U→ V , yi = φi ( x1 , … , xn ) , 它有逆映射 ψ= φ : V → U , xi = ψi ( yi , … ,
k
yn ) , 从而实现了 U 与 V 之间的一一对应 ; 再设 φi 与ψi 分别在 U 与 V 中为 C 可微 , 则称 φ ( 或
k
ψ) 为 U→ V ( 或 V → U ) 的 C 微分同胚 .
现在来看链式法则 .我们有
m n p
定理 4 设 U R 是一 个开集 , x0 ∈ U . f : U→ R 在 x0 处可 微 .又 设 g : V → R 在 y0 =
n p
f ( x0 ) 处可微 , 这里 V R 且 f ( U) V .则 Φ= g f : U→R 在 x0 处也可微 , 而且
dΦ( x0 ) = d g( y0 ) d f ( x0 ) . (22)
n
证 在证明之前先要回顾一下可微映射的定义 .关于映射 f : U→R 的可 微性的定 义中 , 在
m m n m n p
R ( U R ) 与 R 中都是取定了坐标系的 .所以 我们先 在 R , R 与 R 中都 取定 坐标系 , 这 样
d f ( x 0 ) 与 d g( y0 ) 是两个确定的矩阵 .现在由可微性的定义即有
f ( x0 + h) = f ( x0 ) + d f ( x0 )・h + o1 ( h) ,
g ( y0 + k ) = g ( y0 ) + d g( y0 )・k + o2 ( k ) ,
而且对任意 ε1 > 0 , 必可找到 δ1 > 0 使当‖ h‖ < δ1 时 ,
‖ o1 ( h) ‖ < ε1 ‖ h‖ ,
对于 k 也有ε2 ,δ2 , 使当‖ k‖ < δ2 时 , ‖ o2 ( k ) ‖ < ε2 ‖ k‖ .而且 因为 d f ( x0 ) , d g ( y0 ) 是确 定
的矩阵 , 所以必有适当的正数 M > 0 使
‖d f ( x0 )・h‖≤ M‖ h‖ , ‖d g( y0 )・k‖≤ M‖ k‖ .
现在我们来计算 Φ( x0 + h) - Φ( x0 ) .我们有
Φ( x0 + h) = ( g f ) ( x0 + h) = g[ f ( x0 ) + d f ( x0 ) h + o1 ( h) ]
86 第三章 微 分 学
= g ( y0 + k ) = g ( y0 ) + d g( y0 ) k + o2 ( k ) ,
这里 k = d f ( x0 ) h + o1 ( h) .所以当‖ h‖ < δ时 ,
‖ k‖≤‖d f ( x 0 ) h‖ + ‖ o1 ( h) ‖≤ ( M + ε1 ) ‖ h‖
≤ ( M + 1) ‖ h‖ .
所以
Φ( x0 + h) = Φ( x0 ) + d g( y0 ) [ d f ( x0 ) h + o1 ( h) ] + o2 ( k)
= Φ( x0 ) + d g( y0 )・d f ( x0 ) h + d g( y0 ) o1 ( h) + o2 ( k ) . (23)
δ2
当‖ h‖ < min δ1 , 时 , 一方面有
M+2
‖ d g( y0 ) o1 ( h) ‖≤ Mε1 ‖ h‖ , (24)
同时又有
‖ k‖≤ ( M + 1 ) ‖ h‖ < δ2 ,
从而
‖ o2 ( k ) ‖ < ε2 ‖ k‖≤ ( M + 1)ε2 ‖ h‖ . (25)
δ2
合并 (24) , ( 25 ) 即知当‖ h‖ < min δ1 , 时
M+2
‖d g( y0 ) o1 ( h ) + o2 ( k ) ‖ < ( Mε1 + ( M + 1 )ε2 ) ‖ h‖ .
由 ε1 ,ε2 任意性 , 知道上式右方比之 h 是高阶无穷小 .所以 ( 23 ) 式最终化为
Φ( x0 + h) = Φ( x0 ) + d g( y0 )・d f ( x0 ) h + o( h) ,
因此 Φ 在 x0 是可微的 , 而且其微分是
dΦ( x0 ) = d g( y0 ) d f ( x0 ) .
这样在指定的坐标系下定理得到了证明 .当然 , 对任意 的坐标 系这 个证明 均有 效 , 所以 (22 ) 式 成
立 .证明暂停于此 .
余下的是 , 如果在 U 中作坐标变换
i = Xi ( x i , … , x m ) , i = 1 , 2 , … , m .
x′
n p
类似地 , 也在 R 和 R 中作坐标变换
i = Yi ( y1 , … , yn ) , i = 1 , 2 , … , n ,
y′
i = Zi ( z1 , … , z p ) , i = 1 , 2 , … , p ,
z′
k
会得到什么结果 ? 这里有两个问题 , 首先 , 上述 坐 标变 换是 C 微 分 同胚 , 而 且因 为 问题 只涉 及
一阶导数 , 所以只需考虑 k = 1 的情 况 .这样 的微 分同 胚是 否 存在 ? 这是 一个 很大 的问 题 .下 面
我们会看到 , 局部的微分同胚总是存在的 , 而整体的则不一定 .但是迄今为止 , 我们引进的概念全
是局部的 , 所以不妨设 U 是 x0 的一个充分小的邻域 , 它在微分同胚下变成 x′
0 的邻域 U′.对 于
n p p
y0 = f ( x0 ) , 我 们 不 必 设 g : R → R , 而 只 要 设 g : V → R 为 可 微 . V 是 y0 的 一 个 邻 域 , 而 且
f ( U) V , y0 与 V 在微分同胚 Y 下变为 y′
0 与 V′.最后 , 令 z 0 = g( y0 ) = Φ( x0 ) , z0 有 一个 邻
所以 , 引理 5 用矩阵来表达就是
- 1
1 , … , x′
( x′ n ) ( x1 , … , x n )
= .
( x1 , … , xn ) 1 , … , x′
( x′ n )
1 , … , x′
( x′ n ) ( x1 , … , x n )
这个结论用矩阵乘法直接验证并不难 .因为这两 个矩阵之 积 ・ 之第 k
( x1 , … , xn ) ( x′1 , … , x′n )
行第 l 列的元是
x′k xm x′
k
∑ m x m x′
l
=
x′
l
= δkl .
但是引理 5 的表述显然更能说明问题的本质 .
- 1 - 1 - 1
读者又可能会问 , 上面的记号 d X 究竟是指逆映射 X 的微分 d( X ) , 还是微分 d X 作为
- 1
一个映射的逆映射 ( d X ) ? 其实 , 引理 5 正是说明 , 它们是一回事 , 而且既是左逆又是右逆 .
~ ~ ~
现在来看源空间中的坐 标变换 X : U→ U .原来的 映射 f : U→ V 衍 生出 新映射 f : U → V ,
~
- 1
这里 f = f X .于是由定理 4 和引理 5 有
~
- 1
df=df dX .
- 1
因此 , 源空 间的 坐标 变 换相 应于 将微 分 d f 右 乘 以 d X .类 似于 此 , 若 在靶 空间 中作 坐标 变 换
~ ~ ~ ~
Y : V → V , 原来的映射将衍生出新映射 f : U→ V , f = Y f .于是又有
~
df =dY df .
所以靶空间中的坐标变换相当于用 d Y 左乘 d f .所以 , 如果对定理 4 中的 U , V , W 都作变换 X ,
Y , Z, 则 f 生成
~ ~ ~
- 1 - 1
Φ= Z g Y Y f X = g f,
~ ~ ~
- 1 - 1
dΦ = d Z d g d Y d Y df dX = dg d f . (26)
~ ~ ~
- 1
不过这里的 f 与上面的不同 : 在上面 f 是由 f 经过源 空间 的坐 标变换 而得 , 故 f = f X , 现在
~ ~
- 1 - 1
则源空间与靶空间都作了变换 , 所以 f = Y f X .同样 , g = Z g Y .( 26 ) 形式 上与 ( 22 ) 是
一样的 .这就是说 , 无论坐标系如何选取 , ( 22 ) 都是成立的 .也就是说 (22) 是一个与坐标选择无关
的结果 , 定理 4 证明至此完成 .
定理 4 是一个很深刻的结果 .它告诉我们 , 两个映 射的复 合原 本是一 个很 复杂 的映射 .但 是
如果考虑其线性化 , 则 dΦ 等于两个线性映射的复 合 : d Φ= d g d f .线 性映射 可以 用一个 矩阵 来
88 第三章 微 分 学
( w1 , … , w p ) - 1
所以上述矩阵之积是 即 d Φ的 矩阵 表示 .前 面我们 已经 说了 , d X 的矩阵 表示 就
( x1 , … , x m )
是 d X 的矩阵表示的逆矩阵 , 现在又看到线性变换之积 ( 即复合 ) 对应于相应矩 阵的乘积 .所以 我
们有时就说 , 微分算子把一般的映射变成了矩阵 计算问题 .准 确些 说 , 则是一 般的 映射通 过线 性
化以后归结为其切映射 , 而再通过引入坐标化成了很容易处理的矩阵计算 .这正是线性化的真正
的有力之处 .
注 1 上面例如 在引理 5 中我 们说到 X 是 U 与 U′之间 的微分同 胚之类 的话 .怎样 来判 断
- 1
X 是否微分同胚呢 ? 由引理 5 , d X d X = I , 于是沿用上面的记号 , 有
- 1
1 , … , x′
( x′ n ) ( x1 , … , x n )
= ,
( x1 , … , xn ) 1 , … , x′
( x′ n )
1 , … , x′
( x′ n ) ( x1 , … , xn )
从而 与 均为非奇 异的 , 即 其 行列 式 均 不为 0 .于是 许 多人 可 能 设想 ,
( x1 , … , xn ) 1 , … , x′
( x′ n )
向无穷大 .
注 3 通常的微积分教本在讲到复合函数的微分时都会讲到一阶微分的形式不 变性, 其意思
是, 以一元函数为例 .如果有复合函数 Φ( x ) = g[ f ( x ) ] = ( g f ) ( x ) .令 y = g( x ) , 则一方面有
dΦ
dΦ= Φ′( y ) y′( x ) d x = dx,
dx
另一方面由 y′( x )d x = d y 又有
dΦ = Φ′( y) d y .
所以不论 y 是中间变量 ( 如后一式 ) 或 x 是自变量 ( 如前一式 ) , d Φ的“表现形式”都是一 样的 .我
m
们在这里不采用这个说法 .因为 R 中 可以 有无 穷多个 坐标 .用 x 还是 用 x′为坐 标 应该 都是 一
样的 , 无所谓自变量与中间变量之别 .对 坐标 x 有前 一式 , 对坐 标 y 有后 一式 , 其 形状都 是一 样
的 , 说明 d Φ 其实与坐标的选取无关 .其 间的联 系就 是定理 4 .所 以真 正重要 的是 定理 4 , 它表 明
d Φ 是一个内蕴的对象 .而问题出现 在 , 讨论 高 阶微 分时 就不 再有 这 样有 利的 情况 , 而这 正表 明
我们将揭开整个数学的新篇章了 .
4. 曲线、方向场、方向导数 关于一阶微分与坐标选取的关系的讨论至此 为止 .下面我们 将
要讨论一些新的概念 .在这以前 , 我们先从一个具体问 题看一 下 , 限制 使用一 定的 坐标会 带来 什
么样的问题 .
设有曲线如 图 3 - 2 - 3 , a ) , 从 直 观看 来 , 它 在 P
点有切线 PQ 平行于 y 轴 , 因 而斜率 为∞ .如 果按 可微
性的 定 义 , 它 在 P 点 是 不 可 微 的 .因 为 f ( x + h ) -
f ( x ) = QP , 而 h = Q R , 因 而 当 h → 0 时 , QP QR =
+ ∞ , 所以找不到一个数 A 使
f ( x + h) - f ( x ) = Ah + o( h) .
但是从几何 上看, 它 完全是一 个“很 好”的 曲线 .如果 我
们把坐标轴逆时针倾斜一个小角度 , 或者说把曲线顺时
针倾斜一个小角度如图 3 - 2 - 3 , b) , 则这个曲线立刻就
成了一个 可微 函 数的 图像 .因此, 研究一条曲 线的性质
时, 必须设法把曲线本身的性质与坐标的性质区别开来 . 图3 - 2- 3
π π
, | x| < ,
4 2
π
s( x ) = 0, | x| = ,
2
π π
- , < | x | <π .
4 2
90 第三章 微 分 学
∫ ∑ x′( t ) d t .
2
s( t ) = i
a i=1
这样做时常会得到较简洁的结果 .
k n
如果给出一个 C 曲线α, 则 α′( t ) 对每个 t 都是 R 中的一个元 , 因此是一个向量 .我们称它
为此曲线在 t 点的切向量 .因为时常是以时间作 为参数 t 的 , 所以 切向量 也称 为速 度向量 .而 当
・
我们确实在研究一个物理或力学问题 , 而 t 又确实代表 时间 , 则 α′( t ) 时 常写为 α( t ) .这是 牛顿
留下的传统 , 沿用至今 .
§2 什么是微分 ? 91
m m
t
f1 ・ fn・
df dα = ∑
j= 1 xj
xj ( t) , … ,∑
j=1 xj
xj ( t) . (29)
f
们用 ( P) 来表示在 P 点 ( 即 t = t0 处 ) 沿 α之方向导数 , 而且就说成是“沿 l 方向的”方向导数 .
l
这里的讲法和通常微积分教本中的讲法有些不 同 .在 那里 , 讲 到方向 导数 时 , 是用一 个单 位
向量 u = ( u1 , … , u m ) 来表示此方向 .然后设 P 点坐 标是 ( x1 , … , x m ) , 作通过 P 点的 以 u 为 方
f
向余弦的直线α: t→ ( x1 + tu1 , … , x m + tu m ) , 然后在 t = 0 处对 f 求 .利用 (29) 就有
α
f f ( x + t u) - f ( x )
= lim .
α t→ 0 t
为什么我们不采用通常的讲法 ? 一是因为可能需要作坐标变换 , 而原来的直线可能变成曲线 ( 如
果坐标系总画成直角坐标系的话 ) .而甚至可能根本没有直线 , 例如在曲面上 .而通过重新参数化
t = t (τ) 以后‖ u ‖ = 1 的这 一条 件也可 能不 成立 .这一 点其 实前 面 也讲 过 .如果 把参 数 t 看 成
・ f ・
时间 , 则切向量 x ( t ) 应理解为速度 .这样一来 , 就成了 : 当点 x 以速度 x 运动时 , f 对时间的变
α
化率 d f dα就是方向导数 .d f dα就 理解 为 : 首先 t 的变 化造 成了 x 位 置之 变化 dα( 其 变率 为
・ ・ f f
( x1 ( t ) , … , x m ( t) ) ) , 位 置的变 化再 造成 f 的 变化 d f 其变化率为 , …, .二 者合 成
x1 xm
即得 d f dα .
m
进一步可 以 定 义 向 量场 .设 Ω R 为 一开 集 , 而 在 Ω 内 之 每 一 点 x 处 都 定 义 一 个 向 量
m
∑
k k
X( x ) = Xi ( x ) i , 我们就说有一个向量场 .如果 Xi ( x ) ∈ C ( Ω) , 就说 X( x ) 是一个 C 向
i= 1 x
m
量场 .常微分方程理论告诉我们 , 这时经过 Ω 中任一 点 P 均可找 到唯一一 条曲线 α( t ) : I →R ,
・
使 α( t0 ) = x0 即为 P 点之坐标 , 而沿此曲线恒有 α( t ) = X (α( t ) ) .这条曲 线就称为 此向量场 经
过 P 点的积分曲线 .以上的讨论 中我们 要利 用 k≥1 这一 事实 , 才能 保 证经 过任 一 P 点 均有 唯
一的积分曲线通过 .
§2 什么是微分 ? 93
既然有了向量场 , 也就有了一个方 向 ( 在现 在的 问题 中 , 即 是 ( X1 , … , X m ) 的 方 向 ) , 也就 是
・
在此点的 α( t ) , 所以也就可以定义这个方向的方向导数和 ( 28 ) 式 .我们约定 , 把这个 方向导数 算
子记作 D X( x) .即是说按下式定义它 :
D X( x) f ( x ) = d f ( x ) dα( x ) . (30)
这里 dα( x ) 其实应该写成 dα( t) , t 是相应于 x 的参数值 .DX ( x ) 是一个很重要的算子 , 其特点如下 .
上面我们已经说过 , 可以把接触于某点的曲线所形成的等价类当作一个向量 .如果在这个等
・ ・ ・
价类中选一个代表元 , 即曲线 α( t ) , 则 这个向 量有 一个 坐标表 示 α( t ) = ( α1 ( t ) , … , αm ( t ) ) , t
是该点 P 的相应的参 数 值 .按 同 样的 方 法 , 方 向导 数 算子 D X ( x ) 也 是 一个 向 量 .因为 由 ( 30 ) 式 ,
n
D X ( x ) 作用于一个 n 维向量 f ( x ) ∈R 后得出
D X ( x ) f ( x ) = d f ( x ) dα( x )
m m
f1 fm
∑ , … , ∑ Xj
t
= Xj ( x ) . (31)
j= 1 xj j= 1 xj
所以
m
DX ( x ) ~ X ( x ) = ∑ X ( x)
j= 1
j
x
j . (32)
m
正如我们可以认为曲线的等价类就是向量一样 , 也可以认为微分算子 X( x ) = ∑X
j=1
j ( x)
x
i 是
Δf
方向得到一个改变量 Δ x1 , 然后计算函数 f 的相应的改变量 Δ f , 并令 D x 1 = Δlim , 这样的 说
x →0
1
Δx1
∑X
j =1
j ( x)
xj
就看成向量 ( X1 ( x ) , … , X m ( x ) ) , 这 一点大概 读者 会能接 受得 了 , 但是既 然承 认
为 1 , 其 他方 向 上分 量为 0 的向 量 .所以 它 的坐 标表 示就 是
x1
= ∑X
j =1
j ( x)
xj
, X1 = 1 , X2
求方向导数 , 也就是 D1 ! 既然 D x
= D1 , 又何必兴师动众用那么复杂的记号呢 ?
1
D∑ X j ( x ) x
= D X ( x ) 这样的记号有许多重要性质 :
j j
C1 , C2 是常数 .二是莱布尼茨性质 , 即
D X ( f1・f2 ) = f1 D X f2 + f2 D X f 1 . (34)
这一点由 (30) 式直接验证即知 .
(2 ) 其次 , 它是按 X ( x ) 的要求作用于函数的 . X ( x ) 可是说 是“ 作用者”.而这些 作用者又 有
线性结构 , 那么 D X ( x ) 对这种结构又有什么性质呢 ? 这是十分值得注意的 .有
k k
定理 6 设 g1 ( x ) , g2 ( x ) 是 Ω 中的 C 函数 , 则对 Ω 中的 C 向量场 X1 ( x ) , X2 ( x ) 恒有
D g1 X 1 + g
2
X
2
f ( x ) = g1 D X 1 ( f ) ( x ) + g2 D X 2 ( f ) ( x ) . (35)
f 是 Ω 上的可微函数 .
・ ・
证 因为 D X f ( x ) = d f α( x ) .这里 α( x ) 即是方向场 X 在 x 之值 .所以令 X1 , X2 相应的积
・ ・
分曲线是 α1 ,α2 , 则 g1 X1 + g2 X2 在 x 之值应为 g1 ( x )α1 ( x ) + g2 ( x )α2 ( x ) :
・ ・
Dg 1 X1 + g
2
X
2
( f ) ( x ) = g1 ( x ) d f α1 ( x ) + g2 ( x ) d f α2 ( x )
= g1 ( x ) D X 1 ( f ) ( x ) + g2 ( x ) D X2 ( f ) ( x ) .
( f1 , … , f n ) ・
(35) 式得证 .这里我们应用了以下事实 : d f 实际上就 以乘以 n × m 矩阵 .α ( x ) 也
( x1 , … , x m ) 1
是一个 m× 1 矩阵 , g1 ( x ) 则只是一个标量因子 , 所以
( f 1 , … , fn ) ・ ( f1 , … , f n ) ・
g1 ( x ) α1 ( x ) = g1 ( x ) α1 ( x ) .
( x1 , … , xm ) ( x1 , … , x m )
总结起来 , D X f 中其实含有两个“成分”, 一是“ 被作 用者”f .D X f 对于 它既 是线 性的 , 又适 合
莱布尼茨法则 ; 二是“作用者”X , D X f 按定理 6 其 实还 不只 是线性 地依 赖于它 .因为 ( 35 ) 式只 要
k
当 g1 , g2 取 常 数 时 成 立 , 就 已 经 表 明 D X “
f 线 性”依 赖 于 X 了 , 可 是 现 在 它 甚 至 对 C 函 数
g1 ( x ) , g2 ( x ) 也成立 .可见这个依赖性还超过“线性”.这是一种新的代数结构 , 也是有用的 .
m
可是 , 我们费了这许多口舌都是 为了 另 一件 事 .现在 我 们只 是对 一个 函数 f ( 映射 f : R →
n
R 则是 n 个函数 ) 作方向导数 .而更 严重的 问题 却是 要对 更复 杂的 对 象 , 例如 对一 个 向量 场 Y
m
可作方向导数 D X Y .而且不是在 R 的某 一个区 域 Ω 上 作 , 甚至是 在一 个曲 面以 至 更一 般的 弯
曲的空间上作 , 而且这在几何和物理学上都十分重要 .有鉴于此 , 尽管本书讲不到这些问题 , 预为
读者计 , 现在有一个“ 心理准备”, 一旦遇到这类问题会有似曾相识之感 .这是会有好处的 , 值得现
在花点力气 .
m n
5. 高阶微分 本节 最后 , 我们简 单讨论 一下一个 映射 f : Ω R → R 的高阶微 分 .作为 一
n
个启发我们先看最简单的一元函数 f ( x ) 的 二阶微分 .现 在 Ω 将 成为 R 的 一个 区间 , R 也成 为
R .首先看一阶微分 d f , 在 x∈Ω 点 , 一阶微分 d f ( x ) 就是 f ( x + h) - f ( x ) =Δh f ( x ) 关于 h 的
线性部分 :Δh f ( x ) = d f ( x )・h + o( h) .于是 d f ( x ) 又是一 个由 x ∈ Ω 到 d f ( x ) 的映 射 .不过 这
里 d f ( x ) 是一个线性映射 , 它把 Ω 的切空间 , 即 仍为 R( 前面 说过这就 是 h 的空 间 ) 映为 靶空 间
n n 1 n
R 的切空间 ( 仍为 R , 现在 n = 1 ) .也就是 R →R 的线 性映射 ( 即一 阶矩阵 ) . n = 1 时 , 一阶 矩
阵就是一个数 , 这个数即是古典意义下的导数 f′( x ) .因为这个数依赖于 x , 所以是一个 函数 .但
是这 个 函 数 不 是线 性 函 数 .现在 再 求 这 个 函数 的 微 分 , 就得 到 二 阶 微 分 .因 此 , 我们 又 要 讨 论
§2 什么是微分 ? 95
( y1 , … , yn ) , 而
yi = fi ( x1 , … , x m ) i = 1 , 2 , … , n .
m
现在我们只讨论 f1 , 并将它写成 f , 取 ( h , k ) ∈R .如果记一阶微分映射为 d f , 则
f ( x + h ) - f ( x ) = ( d f ) ( x )・h + o( h) .
但是 , 由定义 5 , ( d f ( x )・h) 正是 f 沿方向 h 的方 向导数 , 用 ( 30 ) 中的记号 把它写 成 ( Dh f ) ( x ) .
2 m 1
于是由定义 6 知 , 所谓 f∈ C 就是指对 Ω 中任意 x 以及任意 h∈R , 方向导数 ( D h f ) ( x ) ∈ C .
m
再取 k∈R , 我们又应有
( D h f ) ( x + k ) - ( D h f ) ( x ) = d( D h f ) ( x ) k + o( k ) .再用一 次方 向导 数记号 : d( D h f ) ( x ) k =
2 2
Dk ( D h ( f ) ) ( x ) , 而由 C 之定义知此式应为 Ω 中的连 续函数 .可见 这就 是 f : Ω→ R 为 C 映 射
的充分必要条件 .于是有
2
定理 8 f : Ω→R 为 C 映射的 充分 必要条 件是 在取定 任意 坐 标 x = ( x1 , … , x m ) 后 , 古 典
2
f
的二阶偏导数 为 Ω中的连续函数 .
x i xi
m m
证 在 R 中取定坐标 x = ( x1 , … , x m ) .也是 由定 理 6 前 面的 讨论 , , …, 成为 R
x1 xm
m m
∑hk
2
(d f ) ( x ) h・ k = Dk ( D h f ) ( x ) = i j D x
D x
f ( x) .
i, j=1 j i
2 m 2
于是 f∈ C 之充分必要条件就是 : 对任意 h, k∈R , (d f ) ( x ) hk 是 x∈Ω 的连续函数 .但此式是
h, k 的双线性形式 , 它对 x∈Ω 为古典的连续函数的充分必要条件就是其系数 D x
(D x
f) ( x)是 x
j i
2
f
的连续函数 .但是在定理 5 前的讨论中已经 看到 D (D ) ( x ) 即古 典的 二阶偏 导数 .故
x
j
x
i x i xj
定理得证 .
1 n
以上我们是对 f : Ω→R 的情况证明定理 8 的 , 但是由前 面的说 明可知对 f : Ω→R 也有 类
似的结论 .
1 2
还有一个重要的说明 .对于 f : Ω→R 的情况 , d f ( x ) 就是一个双线性形式
m 2
f
∑
2
( d f ) ( x ) hk = h i kj . (36)
i, j = 1 xi x j
一个双线 性 形 式 与 定 义 它 的 矩 阵 是 一 一 对 应 的 , 这 个 矩 阵 在 我 们 的 情 况 下 称 为 黑 塞 矩 阵
( Hessian , Hesse matrix) .
2 2
f f
2 …
x 1 x1 xm
Hess x f ( x ) = … … . (37)
2 2
f f
… 2
xm x1 x m
也有一些文献中称此矩阵的行列式为 Hessian .
这一段一开始我们就提出 , 没有理由让 Δx 两次都取成相同的 h .因此 , 我 们第一次 取 Δx =
§2 什么是微分 ? 97
∑ hi hj .
xi x j
反过来 , 由二次型变成双线性形式亦非难事 .线性代数 里面讲 过这 一点 .但是 如果 考虑更 高阶 的
微分 , 事情就远非这么简单 .这也是为什么我们坚持两个 Δ x 各不相同 , 而分别为 h , k 的原因 .
2
关于高阶导数在通常的微积分教材中都会介绍一个重要的定理 , 即是若 f ( x , y ) ∈ C , 必有
2 2
f f
= . (38)
x y y x
2
然后一般会举出一两个反 例 , 说 明 若 f ( x , y ) ∈ C 这 个 条件 不 成 立 , 则 上式 也 可能 不 成立 .有
时 , 人们就会去想 , 能否找一个较弱的条件保证上式成立 .但忽视了这个等式是否有深远的后果 .
我们要指出 , 这个结果虽然证明十分简单 , 却是一个重要的结果 , 我们将在最后一章讨论它 .若它
不成立 , 将意味着什么也是很有意思的事 , 这一点本书完全不能涉及了 .正因为它如此重要 , 我们
将在本节中一直采用的与坐标无关的框架下去讨论它 .
若 (38) 成立 , 则黑塞矩阵 ( 37 ) 成为 一个 对 称矩 阵 , 而双 线 性形 式成 为一 个对 称 的双 线性 形
n
性形式 .由它就可以产生二次型 ∑
i, j = 1
aij hi kj .所以二次型总 要适合 上述对称 性条件 aij = aj i .而 一
严格地讨论过 , 在此再提醒一下 .
2
上面已说了 , 当 f∈ C 时 , (38) 成立 , 而 ( 36 ) 成为一个对称的双线性形式 .现在我们要证明
2 2 2 2 2
定理 9 设 f : Ω→R 是 C 映射 , 则 ( d f ) ( x ) hk 是对称的 , 即 ( d f ) ( x ) hk = ( d f ) ( x ) kh .
证 这个定理虽然是在与坐标无关的框架下表述 的 , 但 它的 内容 和证法 都与 通用的 微积 分
教本中证明 (38) 式是一样的 , 就是用差商趋向微 商 , 而 对差商 则利 用拉格 朗日 格公 式 .所 以我 们
先引入差分
(Δh f ) ( x ) = f ( x + h) - f ( x ) .
为了求二阶微分 , 我们再引入差分 Δk , k 与 h 无关 .
Δk (Δh f ) ( x ) = (Δh f ) ( x + k) - (Δh f ) ( x )
= f ( x + h + k ) - f ( x + k) - f ( x + h) + f ( x ) . (39)
很明显 , ( 39 ) 对于 h 与 k 是对称的 , 所以
Δh (Δk f ) ( x ) = Δk (Δh f ) ( x ) .
由差分转向微分时 , 在通常的微分教本中是用拉格朗日公式 , 但我 们在讲定 理 2 前 就指出 , n > 1
时是没有拉格朗日公式那样 的 中值 定理 的 , 而 我们 要用 一个 不等 式 来代 替它 , 这 个 不等 式就 是
定理 2 , 也称为中值定理 .其 中 的 M 可 以 取为 连 接 a , b 两 点的 线 段 上 微 分 ( 作为 一 个 映 射 ) 范
数的上确界 .于是在考 虑 f ( x + h) - f ( x ) 时 , 我 们 可 以更 精 确 地 来 估 计 它 .我 们 本 来 想 估 计
98 第三章 微 分 学
f ( x + h) - f ( x ) .现在则更精确一点来估计 Φ( t ) = f [ x + th ] - ( d f ) ( x ) th , 当 t 在 [ 0 , 1 ] 中 变
动时 x + t( y - x ) 就沿连接 x 与 x + h 的线段从 x 变到 x + h , 所以可以应用定理 2 , 这样做的好
处在于 , Φ( 1) - Φ( 0) = f ( x + h ) - f ( x ) - ( d f ) ( x ) h , 所以 我 们不 仅可 以估 计到 f ( x + h ) -
2
f ( x ) , 而且估计到了 f ( x + h) - f ( x ) - (d f ) ( x ) h .注意到我们假设了 f∈ C , 所以 ( d f ) ( x ) ∈
1 1
C , 这样 Φ( t ) ∈ C .所以应用定理 2 是合法的 .Φ( t) 对于 t 的微分是
f′( x + t h) h - ( d f ) ( x ) h ,
所以定理 2 中的 M 可以取为0 ≤sup ‖ f′( x + th) h - ( d f ) ( x ) h‖ .
t≤ 1
§3 泰勒公式、莫尔斯引理、插值公式
1. 泰勒公式 在前 面 两 节中 我 们已 经 指 出 , 微 分 学 的 基本 思 想 就 是 对一 个 映 射 f ( x ) 把
§3 泰勒公式、莫尔斯引理、插值公式 99
但是它并不是我们需要的进一步的分解 , 因 为其右 方的 θ并 不确 定 .我 们只 知道 θ依 赖于 h , 但
2
具体的依赖方式并不知道 , 所以 θh 并不 是 h 的 二次式 .回 忆 一下 我们 在上 一节 一 开始 时对 于
微分 d f 作为差分的“主要部分”的说法所作的评论 ( 可 以把 o( h) 的一 部分 也归入 Ah 而 不损 害
它作为“主要部分”, 而当 A = 0 时 , Ah = 0 怎样也不能算是 Δh f 的主要部分 ) , 就知道我们提出问
2 2
题时为什么说要把 o( h) 分解成一个 h 的二次式而与 h 同阶 ( 其实 h 的二次式不一定必与 h 同
阶 , 因为有系数全为 0 的特例与上述 A = 0 相应 ) .可见要解决 o( h) 的进一步分解还 要用其他 方
法 .
仍是为简单起见 , 下面令 n = 1 , 也就是在 (2) 中把 f 的各个分量分开来讨论 , 但是却令 m > 1 .
只有在这时我们才会看到 , 由于缺 少了 拉格朗 日公 式带 来的麻 烦 .如果 我们 是想 在 x 点 附近 研
~ ~
究 f ( x ) , 则要求 Ω 是 x 的这样一个邻域 : 若一点 x ∈ Ω, 则连接 x 与 x 的线段也全在 Ω 内 .这类
区域称为对 x 为星形的区域 , 于是若 x 与 x + h 都在 Ω 中 , 则连接这两点的线段即集合
{ x + t h , 0 ≤ t≤ 1} ( 4)
也全在 Ω 中 , f ( x ) 在此集合上的限制
F( t ) = f ( x + th) = f ( x1 + t h1 , … , x m + thm )
∞ ∞
成为 t 的函数 , 而且因为已设 f ( x ) ∈ C , 所以 F( t ) ∈ C ( [ 0 , 1] ) , 尤其值得注意的是
m
f ( x + th)
F′( t) = ∑
i=1 xi
hi , F′( 0) = f′( x ) h = ( d f ) ( x ) h ,
…………
k
( k) f ( x + th) ( 5)
F ( t) = ∑ h … hi k ,
x i1 … xi k i1
k
( k) f ( x) k
F (0 ) = ∑ hi 1 … hi k = ( ( d f ) ( x ) ; h , … , h ) .
xi1 … x i k
h , … , h ) 是 k 次型的标准记号 .
对于这个 F( t ) , 可以应用微积分的基本定理而有
1
1 1 1
∫ F′( t ) d t =
0
- (1 - t ) F′( t )
0 ∫ (1 -
+
0
t ) F″( t ) d t
1
= F′( 0) + ∫ (1 -
0
t ) F″( t ) d t
m 1
f ( x)
= ∑
i=1 xi
hi + ∫ (1 -
0
t ) F″( t ) d t
§3 泰勒公式、莫尔斯引理、插值公式 1 01
= ( ( d f ) ( x ) , h) + ∫ (1 - 0
t ) F″( t ) d t . ( 7)
这里为什么要“积出”一个 (1 - t ) 而不用
1 1 1
∫ F′( t ) d t =
0
tF′( t )
0 ∫
-
0
tF″( t ) d t ?
m
f ( x + h)
因为这样一来 , 右方第一项成为 F′(1 ) = ∑ i=1 xi
hi = ( ( d f ) ( x + h) , h) 这 样我们 不是 将
这里
1 2
f ( x + th)
Fi j ( x , h) = ∫ 0
(1 - t)
xi x j
dt
1
1 1
∫ (1 -
2 (3 )
= F″( 0) + t) F ( t) d t
2 2 0
m 2 1
1 f ( x) 1
∑ ∫ (1 -
2 ( 3)
= hi h j + t) F ( t) d t .
2 i, j = 1 xi x j 2 0
2 2
现在可以和前面的 o( h) = f″( x )θh + o( h ) 来 比较了 .如果 把我们现 在的推 算用于它 ( 即 m =
n = 1 的情况 ) .将得到
1
1 1
∫
2 2 (3 )
o( h) = f″( x ) h + (1 - t ) F ( t)d t .
2 2 0
( 3) 3
注意到由 (5 ) 式 , F ( t ) = O ( t ) h , 代入上式立即有
2 2 1 2 3
f″( x )θh + o( h ) = f″( x ) h + O( 1) h .
2
1
因此当 h→0 时 , 至少在 f″( x ) ≠0 处有 θ→ 即是说 , 拉格朗日公式中的 θ确切依赖于 h 的状况
2
1
虽然还不知道 , 至少可以得出 θ= + o(1 ) .
2
这样的计算当然还可以继续作下去 , 即对积分项逐次应用分部积分法 , 有
1 1 1
1 1 1
∫ (1 - ∫ (1 -
2 ( 3) 3 (3) 3 (4)
t) F ( t)d t = - (1 - t) F ( t) + t) F ( t)d t
2 0 3! 0 3! 0
=…
1 02 第三章 微 分 学
N 1
1 1
∑ ∫ (1 -
k N ( N + 1)
= [ d f ( x ) ; h , … , h] + t) F ( t) . ( 8)
h= 3 k! N ! 0
k k
在 [ ( d f ) ( x ) ; h , … , h] 中是把 ( d f ) ( x ) 作为一个 k 线性映射而作用到 k 个 h 上去 .
我们再来分析一下这个证明 .我们假设了 Ω 对 x 是星形域 , 这个假设的作用在于 , 也仅仅 在
于它保证了连接 x 与 x + h 的线段全在 Ω 内 , 而沿着这样一个线段可以作积分 , 拉格朗日公式那
1
∫
k ( k + 1) ( k + 1)
样的 θ也就可以从 (1 - t) F ( t ) d t 中对 F ( t) 这个因子应用积分中值定理得出 .但 这
0
只对 n = 1 时 可 用 .( 就 是 应 用 以 下定 理 : 若 f ( x ) , g ( x ) , 均 为 连 续 函 数 , 而 且 g ( x ) ≥ 0 , 则
b b
∫ ∫
( k + 1)
f ( x ) g( x ) d x = f ( c) g( x ) d x , a≤ c≤ b .但当 n > 1 时 , F ( t ) 是 一个 n 维向量 , 而不 是
a a
N
1
∑
k
f ( x + h) = f ( x ) + [ d f ( x ) ; h , … h] + RN ( x , h ) , ( 9)
k= 1 k!
k个
这里
1
1
∫ (1 -
N ( N+1)
RN ( x , h) = t) F ( t)d t , (10)
N ! 0
1 α
f ( x) = ∑
| α| ≤ N α!
αx f (0 ) x + RN (0 , x ) . (13)
这样得到的泰勒公式形式与一元函数的泰勒公式完全相同不过我们要注意 , ∑
| α| ≤ N
表示对一切 长
度不大于 N 的重指标求和 .
注 3 由推导出泰勒公式的推理过程 , 可以得到一个十分有用的结果如下 :
k n
引理 2( 阿达玛 ( J .Hadamard) 引理 ) 设 f ( x ) 在 x = 0 的某个邻域 Ω 中为 C 映射 , Ω R ,
k- 1 n
且 f (0 ) = 0 , 这时必存在 C 映射 g1 , … , gm : Ω→R , 使得
m
f( x) = ∑
i=1
xi gi ( x ) . (14)
F( t ) = f = f ( tx ) .
I
显然 F( t ) 对 t 是 k 阶连续可微的 , 而有
1 m 1
f
F(1 ) - F( 0) = f ( x ) - f (0 ) = ∫ 0
F′( t ) d t = ∑ ∫
i= 1
xi
0 xi
( tx ) d t .
因为 f (0 ) = F( 0) = 0 .又有
m 1
f
f ( x) = ∑ ∫
i= 1
xi
0 xi
( tx ) d t .
1
f
∫
k- 1 n
令 gi ( x ) = ( tx ) d t, 显然 gi ∈ C ( Ω) : Ω→R 即合于所求 .
0 xi
2. 极值问题 微分学最重要的应用之一是求极值 .不仅是在 17 世纪费马 的时代如 此 , 而 且
从那时以来几个世纪中极大极小问题都是数学和数学 物理中 人们 注意力 的焦 点之 一 .它 所采 用
的方法 , 所产生的新概念和新思想早已超越了微 分学的领 域 .我们 这里仅 只能 就古 典的情 况 , 就
多元函数的局部极值看一下微分学的应用 .
在古典的极值问题中我们只考虑函数在某区域的内点取得的极值 , 而现代的许多极值问题 ,
例如出现在规划问题中的极值 , 时常是在区域边界上取得的 .这一些与我们下面所讨论的很不一
2
样 .我们在下面又不打算深究函数光滑性问 题 , 所 以我 们假 设 f : Ω→R 是一 个 C 函数 , Ω 是 一
n
个开区域 , 还要注意 f 的靶空 间 R 就是 R , 即 n = 1 , 因此 f 就 是一个 函数 , 而不是 一个高维 向
量 : 一个高维向量是谈不上什么极值问题的 .
所谓极值是一个局部概念 , 准确一些说 , 我们有
定义 1 设 f ( x ) : Ω→R , x0 ∈ Ω 是 f ( x ) 的一 个局部极 小 ( 或者说 f ( x ) 在 x0 达到 局部 极
小 ) , 如果存在 x0 的一个邻域 U , 使对一切 x ∈ U , 都有
f ( x ) ≥ f ( x0 ) .
类似地可以定义局部极大 .以下简称为极小和极大 .
我们处理这种局部极小 ( 或极大 ) 的方法 , 仍与 前面证 明泰 勒公 式的方 法一 样 , 不失一 般性 ,
取 Ω 为对 x0 星形的区域 ( 例如 Bρ ( x0 ) ) , 则对充分小的 h , 线段
I = { x0 + th ; 0≤ t≤1}
§3 泰勒公式、莫尔斯引理、插值公式 1 05
全在 Ω 内 , 并连接 x0 与 x = x0 + h 两点 , 令 F ( t ) = f ( x0 + t h) , 则 F( t ) 是 t∈ I 的函数 .而 且
k k
若设 f ∈ C , 则 F( t) ∈ C ( I) , 且 F(1 ) = f ( x0 + h) = f ( x ) , F(0 ) = f ( x0 ) .因此
1 1 1
= F′( 0) + ∫ (1 -
0
t ) F″( t ) d t
m m 1 2
f ( x0 ) f ( x0 + th)
= ∑i=1 xi
hi + ∑∫ ( 1 -
i, j=1 0
t)
xi x j
hi h j d t .
2
f ( x0 + th)
如果必要 , 可以把 Ω 向 x0 缩小一点 ( 例如把 Bρ ( x0 ) 的 半径缩 小一点 ) 而 设 在Ω
上
xi xj
2
f ( x0 + th)
连续 .这样做的目的在于保证 对于 t 和 h 为一致连续 , 因此
xi x j
2 2
f ( x0 + th) f ( x0 )
= + r( t, h) .
xi x j x i xj
这里 r ( t , h ) 当‖ h‖→0 时 , 对 ( t , h) 一致地趋于 0 , 因此 , 只要‖ h ‖ < δ(ε) , 必有 | r ( t, h) | <
ε.将上式代入前面的积分 , 就会得到我们所需的基本的估计式 .
m m 2
f ( x0 ) 1 f ( x0 )
∑ 2 ! i∑
2
f ( x ) = f ( x0 ) + hi + hi hj + o(1 ) ‖ h‖ . (15)
i= 1 xi , j=1 xi x j
现在设 x0 是局部极小 , 并一项 一项 地估计 上式 , 先 看 h 的一 次项 , 我 们 把过 x0 + h , x0 以
及过 x0 - h , x0 的两个线段合并成一个 .后一段不妨写成 [ x0 + ( - t ) h , x0 ] , 因此合 并以后得 到
一个较长的线段 [ x0 - h , x0 + h] 或 α( t ) = { x0 + t h , - 1 ≤ t≤ 1} .这 样做的目 的是使 x0 相应 于
m
f ( x0 )
[ - 1 , 1 ] 的内点 t = 0 .于 是记 F ( t ) = ( f α) ( t ) , h 的一 次项 ∑
i= 1 xi
hi = d F ( 0) = d f ( x0 )・
・
α( 0) .由假设 f 以 x0 为极小 .所以 F( t ) 作为 t 的函数 , 以 [ - 1 , 1 ] 的内 点 t = 0 为 极小 .因此 , 由
费马定理 d F( 0) = 0 , 即是说
・
d f ( x0 )・α(0 ) = 0 , " α( t ) .
但是前面已说过 , 每一条 过 x0 的 按接触意义的等价 类就是一个向量 .我们 用直线 α( t ) = { x0 +
th , - 1≤ t≤1} 作为它的代表元 , 就可以得到这个向量的坐标表示为 h = ( h1 , … , h m ) .d f ( x0 ) 作
m 1 1
为由 x0 的切空间 R = { h} 到靶 空 间 R 的 切空 间 ( 还 是 R ) 的 线 性 映射 , 既 然 把所 有 的 向 量
・
α( 0) 都映为 0 , 自然是一个零映射 :
d f ( x0 ) = 0 .
如果读者感到这样的推理太抽象 , 不妨按通常的微积分教本中的讲法再讲一次 : f ( x ) 既以 x 0 为
(1 ) ( m)
极小 , 记 x 之分量为 ( x1 , … , x m ) , x0 之 分量为 ( x0 , … , x0 ) , 则在 f ( x ) = f ( x1 , … , x m ) 中 ,
( 2) ( m)
我们可以依次地只让一个分量变化 .于是可 以考查 f ( x1 , x 0 , … , x0 ) , 作 一个一 元函数 , 应 在
(2 ) ( m)
(1 ) f ( x1 , x 0 ,…, x 0 ) (1) f ( x0 )
x1 = x0 时达到极小 .因 此 , 由费 马定 理 = 0 于 x1 = x0 时, 亦即
x1 x1
f ( x0 )
= 0 .同理 = 0 , i = 2 , … , m .这样 , 我们就会得到
xi
1 06 第三章 微 分 学
f f
grad f ( x0 ) = ,…, ( x0 ) = 0 . (16)
x1 xm
f ( x0 )
所谓只让 x1 变 , 就是在 (15) 中令 h = ( h1 , 0 , … , 0) , 所以 = 0 也就是
x1
m
f ( x0 ) f ( x0 ) f ( x0 ) f ( x0 )
x1
h1 +
x2
0+…+
xm
0= ∑ i =1 xi
hi = 0 ,
・
这正是 d f ( x0 )・α( 0) = 0 .
既然问题如此简单 , 又何必用与坐标无关的讲 法让 缺少经 验的 读者 摸不着 头脑 呢 ? 问题 在
于 , 我们会遇到需要在许多坐标系之间作变换的情况 .因此 , 与坐标无关的处理是最方便的 .我们
正是想多通过一些例子帮助读者逐步熟悉这种处理问题的方法 .
m 2
1 f ( x0 ) 1
现在来看关于 h 的二次项
2 ∑
i, j = 1 xi xj
hi hj .它是一个二次型 , 其系数矩阵 除了因子
2
即
2
f 之黑塞矩阵 , 亦即 ( d f ) ( x0 ) .记此矩阵为 A , 则上节定理 8 已表明 A 是一个对称矩阵 , 而这 一
1 m
项就是 〈Ah , h〉 .这里我们引用了线性代数 中 R 中 的内 积记 号〈・,・〉 .线性 代数告 诉我 们 , 任
2
一个实对称矩阵都有实特征根 λ1 , … , λm .不妨设 λ1 ≤λ2 ≤…≤λm ( 现在的函数 f 自然是实值函
数 , 否则谈不上极值 ) 且必可用正交变换化为对角形 , 即
λ1
- 1
T AT = w . (17)
λm
n
λi 是 A 的特征根 .特征根也称为固有值 .在〈Ah , h〉中令 h = T k, k 仍为 R 中的向量 , 则
t
〈Ah , h〉=〈A Tk , Tk〉=〈 T A T k, k〉
- 1
=〈T A T k, k〉 .
这些特征根有以下几种情况 :
1. 所有 λi > 0 .这时 A 称为正定的 ( positive definite) .而且
- 1 2 2
〈Ah , h〉=〈T A Tk , k〉≥λ1 ‖ k‖ = λ1 ‖ h‖ .
这里我们利用了正交变换不改变向量之长度 : ‖ h‖ = ‖ T k‖ = ‖ k‖ .
2. 所有 λi ≥0 , 这 时 A 称正 半定 ( positive semi-definite ) 或非 负定 ( non-negative definite ) , 而
且对一切 h≠0 有
〈Ah , h〉≥0 .
3. 所有 λi ≤0 .这时 A 称为负半定 ( negative semi-definite) 或非正定 ( non-positive definite) 而
且对一切 h≠0 有
〈Ah , h〉≤0 .
4. 所有 λi < 0 , 这时 A 称为负定 ( negative definite) , 且
2 2
〈A h, h〉≤ - | λm | ‖ h‖ ( = λm ‖ h‖ ) .
注意 , 因为 λm < 0 , 所以 λm = - | λm | .
5. 有的 λi 为正 , 有的为负 , 这时 A 称为不定的 ( indefinlte) 〈Ah
. , h〉对某些 h≠0 取正值 ( 不
§3 泰勒公式、莫尔斯引理、插值公式 1 07
m 2
1 f ( x0 ) ( 1 ) ( 1 ) 1
∑
2 ( 1) (1)
h j h j = [ ( d f ) ( x0 ) ; h , h ]
2 i, j=1 x i xj 2
1 2 (1) (1 ) λ1 2
= 〈( d f ) ( x0 ) h , h 〉= ‖ h1 ‖ .
2 2
(1) | λ1 |
最后余项中的 o( 1) 当‖ h‖充分小时可 以任 意小 , 因此 取‖ h ‖充 分小 , 使 | o( 1) | < ,或
4
λ1 (1 )
者说 o( 1) < - ( 注意 λ1 < 0 ) .把这些结果代回 (14) 即知 , 当‖ h ‖充分小时
4
(1 ) λ1 (1 ) 2
f ( x0 + h ) - f ( x0 ) ≤ ‖h ‖ <0 .
4
这与 x0 是 f ( x ) 之极小显然是矛盾的 .
关于 x0 是极大值的情况证明类似 , 定理证毕 .
m 2
定理 4 若 f : Ω R →R 在 Ω 中为 C 映射 , x0 是 Ω 之内点 , 则 f 以 x0 为极小 ( 极大 ) 的充
分条件是
1. ( d f ) ( x 0 ) = 0 ,
2
2. ( d f ) ( x0 ) 为正定 ( 负定 ) .
m
证 当 1 成立时 , 我们有 , 对任意 h∈R
m 2
1 f ( x0 )
∑
2
f ( x0 + h ) - f ( x0 ) = hi hj + o( 1) ‖ h‖
2 i, j = 1 x i xj
1 2 2
= 〈(d f ) ( x0 ) h , h〉+ o( 1) ‖ h‖ .
2
2
如果 ( d f ) ( x0 ) 为 正 定 , 则 其 最 小 特 征 根 λ1 > 0 , 如 前 面 所 述 , 当 ‖ h ‖ 充 分 小 时 , 余 项 为
2 λ1 2 2 λ1 2
| o( 1) | ‖ h‖ < ‖ h‖ , 故 o( 1) ‖ h‖ > - ‖ h‖ .
4 4
λ1 2 λ1 2 λ1 2
f ( x0 + h) - f ( x0 ) ≥ ‖ h‖ - ‖ h‖ = ‖ h‖ ≥0 .
2 4 4
所以 x0 是极小 .
关于极大的情况证明类似 .
2
大家可以看到 , 必 要条 件 与充 分 条 件之 间 仍有 一 些间 隙 .( d f ) ( x0 ) 为 正 半定 表 明作 为 矩
阵 , 它可能有零特征根 .一个矩阵 有零 特征 根的充 分必 要条件 是其 行列 式为 0 , 在这 个情 况下 这
个矩阵 或 这 个 映 射 或 这 个 临 界 点 称 为 蜕 化 的 . 在 我 们 的 情 况 下 , 如 果 用 坐 标 系 来 表 示 ,
2
2 f ( x0 ) m
( d f ) ( x0 ) 就是黑塞矩阵 Hess x f ( x0 ) = .当它 蜕 化时 , 我们 就 说 映射 f : Ω R →R
x i xi
的临界点 x0 是 蜕化的 .因此 , x0 为极 小的必 要条件与 充分条 件的间隙 就在于 : 当 x0 为 极小时 ,
2 2 2
( d f ) ( x0 ) 可能是正定的 , 也可能是蜕化的 , 而得不出 ( d f ) ( x0 ) 为正定 .反之 , 若设 ( d f ) ( x0 ) 为
正半定 , 则它可能是正定的 ( 如果 我们 把正 定也 算作 正半 定的 话 ) , 这 时 x0 确 定是 极小 ; 但它 也
可能是蜕化的 , 这时我们对 f 在 x0 附近的性态就说不出所以然来了 .
2
于是 , 余下的就只有 ( d f ) ( x0 ) 为 不定 的 .这时 , 它既 可能 是蜕 化的 , 又可 能是 非蜕 化 的 .但
§3 泰勒公式、莫尔斯引理、插值公式 1 09
( 1) (2 )
不论如何 , 其特征根有正有负 , 不妨设 λ1 > 0 , λ2 < 0 , 而相应的特征向量为 h , h .于是仿照 前
面的作法很容易看到 , 当‖ h‖充分小时
(1 ) λ1 (1 ) 2
f ( x0 + h ) - f ( x0 ) ≥ ‖ h ‖ > 0 , 若 h≠0 ;
4
(2 ) λ2 (2 ) 2
f ( x0 + h ) - f ( x0 ) ≤ ‖ h ‖ < 0 , 若 h≠0 ;
4
就是说 , 在某些方向上 , f ( x0 ) 很像极小 , 而在另一些方向上 , f ( x0 ) 又像极大 .这样的点称为鞍 点
( saddle poin t ) .图 3 - 3 - 1 上画的是
2 2
z = f ( x , y) = x - y ,
这时
2 1 0
d f ( x ,0) = 2 .
0 -1
( 1)
它有两个特征根 λ1 ,λ2 = 1 , - 1 .相应的特征向量是 h = (1 , 0) ,
(2 ) (1) (2)
h = (0 , 1 ) . h 是 x 轴方向的向量 .沿此方向 f ( x ) 有极小 .h
是 y 轴方向的向量 , 沿此方向 f ( x ) 有极大 .但整个看来 , (0 , 0) 是
一个鞍点 .但是 (0, 0) 是映射 (17) 的一个非蜕化的临界点 .
临界点的研究是现代数学中一个 很活跃 的分支———奇 点理 图3- 3 -1
∑ ∑
2 2
f ( x ) = f [ x ( y ) ] = Φ( y ) = f ( 0) + y -
i yλ+ j . (18)
i= 1 j= 1
f ( x ) = f (0 ) + ∑
j= 1
x j gj ( x ) = ∑
j=1
xj gj ( x ) ,
而且有
f ( 0)
gi (0 ) = =0 .
xi
于是再用一次阿达玛引理 :
m
gi ( x ) = ∑k=1
xk hki ( x ) ,
gi (0 )
且 hki (0 ) = .以它代入 f ( x ) 的表达式即得
xk
m
f ( x) = ∑
k, j = 1
xk xj hkj ( x ) . (19)
我们可以假设
hkj ( x ) = hj k ( x ) .
因为取上式中的两项 , 并将其和改写为
1 1
xk x j hkj ( x ) + x j xk hjk ( x ) = xk xj [ hkj ( x ) + h jk ( x ) ] + x j xk [ hkj ( x ) + h jk ( x ) ]
2 2
= xk xj珔
hkj ( x ) + xj xk珔
h jk ( x ) ,
2
f (0 )
显然 珔
h jk = 珔
hk j .把这两项代回 f ( x ) 之表达式 .即 知 hkj ( x ) = hjk ( x ) .而 且易见 hkj ( 0 ) = .
xj xk
所以 det ( hkj ( 0) ) = det ( Hess x f ( 0) ) ≠0 .
2
f ( 0)
x j xk 的主对角线上必有非 0 元 .因为 , 如果 h11 = 0 , 则 ( 19 ) 中至少 有一 个 h1 i ≠ 0 .否 则
2
f ( 0)
f ( x ) 的表达式中将不出现因子 x1 xi ( " i) .所以 = 0 而 Hess x f ( 0) 是蜕 化的 .这样我们 就
x1 xi
可以设 h11 = 0 , 但 h12 ≠ 0 .这时 , 再令 x1 = y1 + y2 , x2 = y1 - y2 , 则 f ( x ) 中将出现
2 2
h12 x1 x2 + h21 x2 x1 = 2 h12 ( y1 - y2 ) .
2 2 2
此外再也不会有含 y1 和 y2 的因子了 .所以在作了这样的变量变换以后 , f ( x ) 的表 达式中 y1 的
系数为 2 h12 ≠0 .但这就是在新变量下的 h1 1 , 所以我们说可设 (19) 中 h11 ≠0 .
将 (19) 重写为
m m
∑h ∑h
2
f ( x ) = h11 x + 1 1i x i x1 + i1 x1 x i + …
i= 2 i= 2
m
∑h
2
= h1 1 x + 2
1 1 i x i x1 + …
i =2
m
2
∑h
i= 2
1i xi
= ±( | h11 | x1 ) + 2 ( | h11 | ) x1 + … .
| h11 |
这里±表示 h11 之符号 , 即 h1 1 = ± | h1 1 | “
, …”中不含因子 x1 , 经过配方 , 有
§3 泰勒公式、莫尔斯引理、插值公式 1 11
m 2
f( x ) =± | h11 | x1 ± ∑ h1 i x i | h1 1 | + ∑ R ij ( x ) xi xj .
i= 2 i, j > 1
如果作变量变换
m
y1 = | h1 1 | x1 ± ∑
i= 2
h1 i xi | h11 | ,
yi = x i , i > 1 , (20)
则
2
f ( x ) = ± y1 + ∑ 珔h ( x ) y y
i, j > 1
ij i j . (21)
∑ 珔h ( x ) y y ,
2 2
f ( x) = ± y + 珔
1 f ( y) = ± y + 1 ij i j
i, j = 2
在珔
f 中视 y1 为参数 , 很容易证明 ( d珔
f ) (0 ) = 0 ( 这里 ( d珔
f ) (0 ) 表示对 y2 , … , ym - 1 , ym 的微分 , 而 y1
作为参数也为 0) .我们也容易看到
±2 0 … 0
0
Hess x f ( 0) = .
… Hess y珔
f (0 )
0
Hess y珔
f ( 0 ) 表 示 只 对 y2 , … , ym 求 导 , 但 在 参 数 y1 = 0 以 及 y2 = … = ym = 0 时 求 值 .因 为
Hess x f (0 ) 是非奇异的 , 所以 Hess y珔
f ( 0) 也是非奇 异的 .这 样 , 可以对 珔
f ( y ) 重 复上 面的作 法 ( 但 以
y1 为参数 ) , 经有限次以后 , 即是 (18) 式 .定理证毕 .
m n
有了莫尔斯引理后我们换一个角度来看一个映射 f : Ω R →R 在 0 ∈Ω 处的泰勒公式
N
α
f ( x ) = f (0 ) + ∑
1 ≤ | α| = k
Aα x + RN (0 , x ) . (22)
上一节我们讲过两条曲线 x = f1 ( t ) 和 x = f 2 ( t ) 在 t = 0 处 k 阶接触的概念 , 即
k k+1
f1 ( t ) - f2 ( t ) = o(1 ) | t | , 但右方不能改为 o(1 ) | t | .
n
曲线是 I R→R 的映射 , 即 (22 ) 中 m = 1 的情 况 , 这个概 念当 然可 以推 广到 两个 映 射 f1 , f2 :
m n
Ω R →R , 0∈ Ω .我们说这两个映射在 x = 0 处 N 阶接触 , 即指 .
N N+1
f 1 ( x ) - f 2 ( x ) = o(1 ) ‖ x ‖ , 但右方不能改为 o( 1) ‖ x‖ .
1 12 第三章 微 分 学
N
α 1 α・
所以 (22) 就表明 f ( x ) 与 f (0 ) + ∑
1 ≤ | α| = k
Aα x ( Aα =
α!
x f ( 0) ) 在 x = 0 处 N 阶 接触 .泰勒公式 的
受从离散的角度来描述自然现象 .
回顾一下我们已讲过的内容 , 就可以看到离散的 东西与 连续 的东 西是彼 此对 立而又 互相 补
Δf
充的 .微分学的最重要的定理之 一的拉 格朗 日公 式 , 告 诉我 们 , 不但 之极 限 是导 数 f′( x ) , 而
Δx
且其本身也就是导数 f′(ξ) , 只不过 ξ这 个点 的位置 不能 确定而 已 .其实 泰勒 公式也 是一 样 , 只
不过把函数改变量 Δ f ( x ) ( 它是离散的 ) , 改 用泰勒 公式的节 ( 少 一项 f (0 ) ) 来近似 , 其余 项也 有
不确定处 .所以泰勒公式也可认为是拉格朗日公式的推广 .再从泰勒公式的节的几何意义来看更
可以看到这一点 .从 m = 1 , n = 1 , 即 f 表 示一条 曲线 来看 .它 的 1 阶节 f ( 0 ) + f′( 0 ) x 表示 切
线 , 但我们可以通过曲线上两点 P、Q : (0 , y0 ) 与 ( h , y1 ) 作割线
y1 - y0
y - f ( 0) = ( x - 0) ,
h
其极限 ( 当 Q→ P 时 ) 就是切线 .所以 1 阶节是某一“离散量”的极限 .若通过曲线上三点 P、Q、R
2
作一条二次曲线 y = A x + B x + C , 则当 Q、R → P 时其 极限 位置也 恰好 是二阶 节 ( 若过 这三 点
作一个圆 , 则其极限位置仍是 一个 圆 , 称为 P 点处 的密 切圆 ( osculating circle ) 或其 曲 率圆 , 其 半
径为曲率半 径 , 恰 好 表 征曲 线 在 P 点处 的 弯 曲程 度 ) .仿 此 , 若 在 此 曲线 上 取 N + 1 个 点 ( xi ,
N
f ( xi ) ) , i = 1 , 2 , … , N + 1 , 并通过它们作一条 N 次曲线 y = A0 x + … + AN , 则当这 N + 1 个 点
都趋向一点时 , 这个 N 次曲线似乎应该趋向于此曲线在该点的 N 阶节 , 从 而保证达 到最佳的 接
触阶数 .而这个 N 次多项式应该能很好地描述 f ( x ) 在该点附近的性态 .但 是为此首 先应该解 决
如下的问题 , 即插值问 题 : 设 给定 N + 1 个离散的 点 : ( xi , yi ) , i = 1 , … , N + 1 , 怎 样在一 个指 定
的函数类中找到一个函数 y = f ( x ) 使得 yi = f ( xi ) .或者用物理的语言来陈述它 , 设在某个实 验
或观测中发现 , 对应于某一物 理量 x1 , … , x N + 1 , 另 一物 理量 的 相应 值是 y1 , … , yN + 1 , 如 何在 一
个指定的函数类中找到一个函数 , 使其图像 通过这 N + 1 个 点 ( xi , yi ) .有了 这样 一个函 数自 然
十分有利于研究其中的物理规律性 .上面我们都 是讲的在 一个指定 的函数 类中去找 这个 f ( x ) .
函数类的限制是十分重要的 .这种函数类应该是更容易处理的函数 , 因为“真正的”( 应该说是“ 更
准确的”) 函数关系是很难找到或者很难处理的 .最简单的情况下可以取多项式 , 或三角多项式等
等 .因此最简单的插值问题如下 : 设在 x 轴上有 N + 1 个 点 , 依 次排 列为 x1 < x2 < … < x N + 1 , 找
一个 N 次多项式 PN ( x ) , 使 PN ( xi ) 等于 N + 1 个指定的值 PN ( xi ) = yi .
这个问题很容易回答 .因为拉格朗日插值公式给出的
( x - x2 ) … ( x - x N + 1 ) ( x - x1 ) ( x - x3 ) … ( x - x N + 1 )
PN ( x ) = y1 + y2
( x1 - x2 ) … ( x1 - x N + 1 ) ( x2 - x1 ) ( x2 - x3 ) … ( x2 - x N + 1 )
( x - x1 ) … ( x - x N )
+ … + yN + 1
( x N + 1 - x1 ) … ( x N + 1 - x N )
N +1
( x - xi )
= ∑
j= 1
yj ∏
i≠ j ( xj - xi )
(23)
正 .
如果 yi 是某一函数 f ( x ) 在 xi 处之值 : yi = f ( x i ) , 则 上式给 出用 一个 多项式 去逼 近 f ( x )
的公式 .
如果这些给定的 x i ( 称为结点 ) 是等距的 , 即令 x1 = a , x2 = x1 +Δ x = a + Δx , x3 = x2 +Δ x
= a + 2Δx , … , x N + 1 = x N + Δ x = … = a + NΔ x , 将 得到 拉格 朗 日插 值公 式的 一个 特 例 : 牛顿 插
值公式
2
x - aΔ f ( a) ( x - a) ( x - a - Δ x ) Δ f ( a)
QN ( x ) = f ( a) + +
1 ! Δx 2
2! Δx
N
( x - a) … ( x - a - NΔ x ) Δ f ( a )
+…+ N . (24)
N ! Δx
这里我们应用了差分记号 :Δ f ( a) 表示 f ( x ) 在 x = a 处对 x 的增量 Δ x 的相应增量
Δ f ( a) = f ( a + Δx ) - f ( a) .
2
Δ f ( a) 的增量记为 Δ(Δ f ( a) ) =Δ f ( a) , 称为二阶差分 , 所以
2
Δ f ( a ) =Δ f ( a + Δx ) - Δf ( a) .
但是
Δ f ( a + Δx ) = f [ ( a + Δx ) + Δx ] - f ( a +Δ x )
= f ( a + 2Δx ) - f ( a +Δ x ) ,
所以
2
Δ f ( a ) = [ f ( a + 2Δ x ) - f ( a + Δx ) ] - [ f ( a +Δ x ) - f ( a) ]
= f ( a + 2Δx ) - 2 f ( a + Δx ) + f ( a) .
仿此有
k k k( k - 1 ) k
Δ f ( a) = f ( a + kΔ x ) - f ( a + ( k - 1 )Δx ) + f ( a + ( k - 2 )Δx ) + … + ( - 1) f ( a)
1 ! 2!
k
∑
k - l l
= ( - 1) Ck f ( a + lΔx ) . (25)
l= 0
由此也可以得出
f ( a + Δ x ) = f ( a) + Δ f ( a) ,
f ( a + 2Δx ) = f ( a + Δ x ) + Δ f ( a +Δ x )
2
= f ( a) + 2Δ f ( a) + Δ f ( a) ,
f ( a + 3Δx ) = f ( a + 2Δx ) + Δf ( a + 2Δ x )
2 3
= f ( a) + 3Δ f ( a) + 3Δ f ( a) + Δ f ( a) ,
………… (26)
我们不讲如何由拉格朗日插值公式得出牛顿插值公式 .但是很容易验证 ( 24 ) 的正确性 .例如
以 x = a 代入 ( 24 ) 式后 , (24) 式就只余下第一项 , 故 Q N ( a) = f ( a ) .令 x = a + Δ x 就此 余下 前
Δ xΔ f ( a)
两项 , 从而 Q N ( a + Δx ) = f ( a) + = f ( a) +Δ f ( a) = f ( a + Δx ) , 余类推 .
1 ! Δx
现在的问题是由 ( 23 ) 和 ( 24 ) 去 逼近 f ( x ) 的 误 差 问题 .这 里 首先 要 注 意 , 既 然 在 结 点 x1 ,
x2 , … , x N + 1 上 PN ( xk ) = Q N ( xk ) , 则 PN ( x ) ≡ QN ( x ) .这 是因为 PN ( x ) - Q N ( x ) 是一 个 N 次
§3 泰勒公式、莫尔斯引理、插值公式 1 15
a 与 x 之间 .这样我们又重新回到泰勒公式
N ( k) ( N + 1)
f ( a) f (ξ)
∑
k ( N + 1)
f( x ) = ( x - a) + ( x - a) . (31)
k=0 k! ( N + 1) !
余项的形状与前面讲的积 分 形式 不 同 , 称 为 拉 格朗 日 形 式 的 余项 .但 当 x - a → 0 时 它 仍 是 比
N
( x - a) 更高阶的无穷小量 .
值得注意的是 , 从历史上看泰 勒 ( B .T aylor, 1655 —1731 ) 在 1715 年 正是 用差 分 方法 得出 了
牛顿插值公式 ( 但没有余项 ) .然后他大胆地令 Δ x = 0( 应为 Δx →0 ) , 令 N = ∞ ( 应 为 N→ ∞ ) 而
得出了泰勒级数 .说他大胆是因为当时人们对无穷级数以及对极限过程都不清楚 , 也不太了解问
题的严重性 .但是泰勒就进入了我们将在下一节讨论的新领域 .
∞
§4 解析函数与 C 函数
1. 幂级数 泰勒大胆地从插值公式得出了以他命名的级数展开式———泰勒级数展开式 :
∞ ( k)
f ( a)
∑
k
f ( x) = ( x - a) . ( 1)
k= 0 k!
m n
或者在多个变量即 f : Ω R →R 而 m , n≥1 的情况下有
∞ α
f (0 ) α
f ( x) = ∑
0 ≤ k = | α| α!
( x - a) . ( 2)
∑ ∑
n n
w= an z 或 w = an ( z - a ) . ( 3)
n= 0 n= 0
n=0
n
级数∑ an z 其中 z 适合不等式 | z | < | z0 | = ρ, 我们有
n n
n z n z
| an z | = | an z | 0 ≤M
z0 z0
∞ n ∞
z | z| z
∑ ∑
n
但是 = < 1 , 所以几何级数 M z < + ∞ , 由比较 判别 法即知 | an z | < + ∞ ,
z0 ρ n= 0 0 n= 0
亦即 (3 ) 绝对收敛 .
若 (3 ) 在一点 z0 ≠ 0 处发散 , 则在 | z | > | z 0 | 处 (3 ) 亦必发散 .事实上 , 若 (3 ) 在一点 z 1 收敛 ,
∞
∑
n
而 | z 1 | > | z0 | , 则把证明的前一部分用于 an z0 , 即 知它是绝 对收敛 的 , 而与 ( 3) 在 z 0 处发 散
n=0
相矛盾 .
现在看一个集合 J = {ρ> 0 , (3 ) 在 | z | < ρ处绝 对收 敛 } .有 两 个可 能 , 一 是 J = , 即是说
1 18 第三章 微 分 学
n
证 证明分两部分 , 先证当 | z | < R 时 ( 3) 必绝 对收敛 .首先 , | an | 的极 限不一 定存 在 , 但
上极限却是一定存在的 , 而且易见 R≥0 .如果 R = 0 , 则 | z | < R 是一个空集而谈不上 (3 ) 是否 在
z 点收敛或绝对收敛 .如果 R > 0 , 则由上极限的定义 , 对于任意小的正数 ε> 0 , 最多 除有限多 个
n , 一切系数均适合
n 1
| an | ≤ + ε.
R
现在 z 是固定的 , 故当 | z | < R 时 , 一定可以找到一个实数 λ: 0 < λ< 1 , 使 | z | ≤λR .于是从某 一
个 N0 开始 , 当 n > N 0 时
n
n 1
| an z | ≤ + ελR .
R
2
现在 λ+ 1 < 2 , 从而 > 1 , 因此一定可以取 ε> 0 使得
λ+ 1
1 2
+ ε< .
R ( λ+ 1 ) R
于是上式给出
n
n 2λ
| an z | ≤ .
λ+ 1
∞
§4 解析函数与 C 函数 1 19
2λ
但是 < 1 , 所以由级数绝对收敛性的比较法则 ( 它对于复的无穷级数仍成立 , 这一点读者可以
λ+ 1
自己验证 ) , 即知 (3 ) 当 | z | < R 时绝对收敛 .
证明的另一部分是求证当 | z | > R 时 , 级数 (3 ) 必发散 .与上一部分不同 , 这一 部分证 明对 R
= 0 也适用 .由上极限的定义 , 对任 一 ε> 0 , 必 有一 个上 升序 列 n1 < n2 < … < nk < …→ + ∞ 使
n 1
k
| an k | ≥ - ε, 所以
R
n
n 1 k
| an k z | ≥
k
- ε | z| .
R
但因 z 是固定的且 | z | > R , 所 以 必可 写 出 | z | = R + δ而 δ 是一 个 固 定 的 正数 .适 当 取 ε使
1 n
- ε ( R + δ) > 1 .代入上式即有 | an k z k | ≥1 , 即是说级数 ( 3) 的一般 项不趋 向 0 因而 发散 .注
R
———
1 n
意若 R = 0 , 上面 用到 处都 没 有意 义了 .但 R = 0 即 nlim | an | = + ∞ , 因 而 对任 意 大的 正 数
R →∞
n 1
M , 必可找到子序列 n1 < n 2 < … < nk < …使 k
| an | ≥ M - ε.上面凡用到 处都换成 M , 即知论
R
证仍然有效 .故定理成立 .
凡讲到幂级数 (3 ) 之收敛性时 , 总有两个特例 .一类幂级数收敛半径 R = 0 , 即 ( 3) 只在中心 z
∞
∑
n
= 0 收 敛 .例 如 n !z 即 是 .但 我 们 不 必 用 阿 达 玛 公 式 ( 4 ) 来 计 算 R , 因 为 那 会 涉 及 求
n= 0
———
n
lim | n ! | .这个计算并不容易 , 而需要一 个有 名的 , 也 非常 有用 的 斯特 林 ( Stirling) 公 式 .第 四
n→ ∞
∞
∑
n
章中我们还会遇到它 .对于 n !z 反而用比值 an + 1 an 来求收敛半径要容易得多 .另一类幂 级
n= 0
———
n n
数的收敛半径 R = ∞ , 即 nlim | an | = 0( 也就是 nlim | an | = 0 , 因为 这时极 限值一定 存在 ) .于 是
→∞ →∞
z
级数 (3 ) 对一切 z 均收 敛 , 这 时 ( 3 ) 之 和 称为 整 函数 .数 学中 许 多重 要 的函 数 如 e , cos z , sin z
……都是整函数 .不论如何 , 幂级数在收敛圆内的性 状已完 全清 楚 .在收敛 圆外 也很简 单 : 发散 .
但是在收敛圆周上情况却十分复杂 .( 3) 可能收敛 , 可能绝对收敛 , 可能一致收敛一直到圆周……
但也可能发散 .总之 , 级数 (3 ) 在收敛圆周上的性状是一个专门的研究领域 .
要注意 , 级数 ( 3) 在收敛圆内是绝对收敛的 .无穷级数理论中有一个基本的事实 : 绝对收敛级
数在代数运算性质上最接近于有限和 : 可以交换求和次序 , 适用分配律等等 .因此 , 幂级数的运算
性质最为简单 .下面我们只举出几个最简单常用的性质而都不再证明 .
∞ ∞
n m
首先是乘 法 .设 有 两 个 幂 级 数 ∑
n= 0
an z 与 ∑m=0
bm z , 其 收 敛 半 径 分 别 是 R1 与 R2 , 则
∞ ∞ ∞
∑a ∑b ∑
n m m+ n
n z m z 本来是一个二重级数 am bm z .但是我 们常用的 是以 下的写 法 , 即
n= 0 m= 0 m, n = 0
按 m + n = k 的大小来排列 .即有
∞ ∞ ∞
n m k
∑
n=0
an z ∑ bm z
m=0
= ∑ ∑
k=0 m+ n = k
an bm z . ( 5)
注意 , 内含的求和 ∑
m+ n = k
an bm 只是有限的 , 而不存在 收敛性问 题 , 故 ( 5) 式不是 一个二重 级数 .( 5)
1 20 第三章 微 分 学
的收敛半径不小于 min( R1 , R2 ) .
∞
∑
n
其次是求函 数 的 复 合 .设 有 两 个 函 数 F ( w ) = an w , 其 收 敛 半 径 为 R1 , 以 及 ψ( z )
n= 0
∞
n
= ∑
n= 1
bn z , 其收 敛 半 径为 R2 , 注 意 我们 设 b0 = 0 , 其理 由 从 下 面 即可 以 看 到 .现 在 我 们 要 求
( F ψ) ( z ) 的幂级数展开式 , 一方面我们有
∞
∑
n
F[ ψ( z ) ] = an [ ψ( z ) ] ( 6)
n= 0
∑
n
| z | 充分小时 | ψ( z ) | 也充分小 .我 们假设 b0 = 0 的原 因即 在此 .这里 我们 用到 了 bn z 在 它
n=1
∑
n
紧集 , 而 bn z 在 K 上一致收敛 , 从而其和 ψ( z ) 在 K 上 连续 , 当 然也 在 z0 连续 .因 为 z0 是
n= 1
收敛圆内任一点 , 所以 ψ( z ) 在整 个收 敛圆内 , 而不 只在 其任 一紧 子 集上 连续 .但 是 一致 连续 性
并不是对于某一点来说的 , 而是要指定一个区 域———现在是 收敛 圆 , 而我们 恰好 不能证 明 (3 ) 在
收敛圆内一致收敛 .由 ψ( z ) 在 | z | < R2 内连续 以及 ψ( 0) = 0 即知一 定有一个 正数 r > 0 存在 ,
使当 | z | < r时 | ψ( z ) | < R1 从而级数 ( 6) 不但有有意义的各项 , 而且 ( 6) 收敛 .于是
∞ ∞
∑ ∑b
m n
F( ψ( z ) ) = an m z . ( 7)
n= 0 m= 1
∞
n
m
但是我们可以利用上面讲的乘法来把 ∑bm= 1
m z 写成幂级数
∞ ∞
n
∑b ∑B
m k
m z = nk z . ( 8)
m =1 k= n
n n
现在的问题是如何 把它代入 ( 7 ) 式 , 为此 要注意 这个级数 是由 z 开始的 , 而 且易见 Bn n = b1 .因
l l
此当我们把 (8 ) 代入 ( 7) , 并且 要求 例如 z 之 系数 时 , 则 ( 7 ) 中 n > l 的 各项 中 一定 不会 有 z 出
l
现 . z 只出现在相应于 n = 0 , 1 , … , l 各项中 , 而成为
l
∑n= 0
an Bnl = A l , 其中 B00 = 1 .
∑b
m
φ( z ) = a0 + a1 z + … = a0 1 - m z ,
m =1
∞
§4 解析函数与 C 函数 1 21
而 bm = - am a0 .于是
1 1 1
= ∞ .
φ( z ) a0 m
1 - ∑b m=1
m z
由此可知 , 我们可以考虑
1 1
F( w ) = ( 9)
a0 1 - w
∞
∑
m
再把它与 w = bm z 复 合起 来 即 可 .但 是在 整 个“复 分 析”( 即 复 变 量函 数 的 微 积分 学 ) 中 ,
m= 1
“最重要”的幂级数展开式就是几何级数
∞
1 2 n
1- w
=1+ w+ w +…= ∑
n=0
w ,
a0 ∑ ∑
m
= bm z ,
φ( z) n= 0 m=1
∞
m
这里 | z | 应充分小以保证 ∑b
m =1
m z < 1 .但是我们得不到收敛半径的具体表达式 .
2 4
1 z z
更具体一点 , 我们来看 sec z = 的幂级数展开 式 .现 在因 cos z = 1 - + … , 所以 a0
cos z 2! 4!
∞ ∞ m - 1
( - 1)
= 1 , 而 ∑ bm z = ∑
m 2m
z , 所以
m= 1 m=1 2m !
∞ m-1 ∞ m-1 2
( - 1) ( - 1)
∑ ∑
2 m 2 m
sec z = 1 + z + z + …
m= 1 2m ! m= 1 2m !
1 2 5 4
=1+ z + z +… .
2 24
它的系数有些什么规律性 , 几乎无法看出 .它的收敛半径是π 2 也是用其他方法得 出的 .总之 , 这
是许多困难而又深刻的数学定理的来源 .
2. 解析函数与泰勒级数 级数的一 致收敛 性可 用于解 决级 数所 表示的 函数 的微分 与积 分
问题 .所以首先要说明什么是复变量函数 f ( z ) 在一点 z0 的导数 .这时的导数与微分等概念形式
上均与实变量函数无异 , 但是实质上大不相同 .关于导数 , 我们仍定义
f ( z0 + h ) - f ( z0 ) f ( z ) - f ( z0 )
f′( z0 ) = lim = zlim . (10)
h→0 h → z
0
z - z0
这里 h 是一个非 0 复数 , z = z0 + h .这样定义以后 , 实变 量函数导 数的基 本性 质 , 特别如 莱布 尼
茨性质、复合函数导数的计算等都 与实 变量情 况一 样 . f 在 z0 点 的微分 仍定 义为 一 个线 性映 射
A : C→C 使
f ( z0 + h) - f ( z0 ) = Ah + o( h) . (11)
A 就是“乘以 f′( z0 )”.在通常的教本上是把 Ah 即 Δ f 之线性部分称为微分 ( d f ) ( z 0 ) 的 , 而我们
现在则用 ( d f ) ( z0 ) 表示一个线性映射 , 它作用在 h 上的结果则是古典意义下的微分 :
( d f ) ( z0 )・h = 古典意义下的微分
1 22 第三章 微 分 学
= f′( z 0 ) d z , d z = h .
因为这一切与前面讲的没有区别 , 我们就不再重复 .问题是如何求 f′( z 0 ) .由于至今 我们还没 有
定义过多少具体的函数 , 如何计算导数就成了问题 .但有两个非常重要的导数完全可用初等方法
k k - 1
算出 .一是对非负整数 k, ( z )′= kz .事实上 , 利用二项式定理 ,
k 1 k k k - 1 1 k- 2
( z )′= lim [ ( z + h) - z ] = lim kz + k ( k - 1) z h+…
h→0 h h→0 2!
k - 1
= kz .
1 ′ 1
另一个是 = - 2 .事实上
z z
1 ′ 1 1 - h 1
= lim - h = lim ・
z h→ 0 z+ h z h→ 0 z ( z + h) h
1
= - 2 .
z
1 ′ k
此式自然只在 z≠0 时成立 .类似他还有 k = - k+1 .
z z
由此 , 如果允许对幂级数 ( 3) 逐项求导 , 则应有
∞
∑
n - 1
f′( z ) = nan z .
n=0
的结果 :
定理 3 若幂级数 ( 3) 之收敛半径为 R > 0 , 其和为 f ( z) , 则
∞
∑
n - 1
f′( z ) = nan z , (12)
n=0
且收敛半径不变 .
证 先证 (12) 之收敛半径仍为 R .事实上
n - 1 n - 1 n - 1
lim | nan | = nlim n nlim | an |
n→ ∞ →∞ →∞
n
n - 1 n n - 1
= nlim n nlim | an | .
→∞ →∞
n- 1 n - 1
但是很容易看到 nlim n = 1 .这是因为 n > 1 故可写为
→∞
n - 1 1
n= n n - 1
= 1 + αn , αn > 0 .
从而由二项式定理 ,
∞
§4 解析函数与 C 函数 1 23
n - 1 1 2
n = (1 + αn ) >1+ ( n - 1 ) ( n - 2 )αn .
2
因此
2 1
0 < αn < ( n - 1) ( n - 1) ( n - 2 ) →0 .
2
又利用求上极限问题可以化为求 某个 子序 列的极 限问 题 ( 我 们不 妨 设 { an } 就是 这个 子 序列 ) 又
知
n n
n n lim
n - 1 n - 1
lim | an | = lim | an |
n→ ∞ n→ ∞
n 1
= nlim | an | = .
→∞ R
所以级数 (12) 之收敛半径不变 .
再证 (12) 之和为 f′( z ) .设 (12) 之和为 f1 ( z ) , 它 也定义 在 | z | < R 上 .又记 ( 3) 之部 分和 及
余项分别为 S N ( z ) 与 R N ( z ) :
N- 1 ∞
∑ ∑a
n n
SN ( z ) = an z . R N ( z ) = n z .
n=0 n= N
∑
n - 1 n - 2 n - 1
an ( z + z z0 + … + z 0 ) .
n= N
而当 | z | < ρ时有
∞
RN ( z ) - RN ( z0 ) n - 1
≤ ∑ n | an | ρ .
z - z0 n= N
但是从我们对收敛半径不变的证明中已可看到 ∑ n | an | ρ
n - 1
< + ∞ , 因此 , 对任意 ε, 必可找 到
n=0
RN ( z ) - RN ( z0 )
N0 , 使当 n > N0 时 它的余 项小于 ε 3 .即是 说 n > N0 时 < ε 3 .这里 N0 的
z - z0
选择与 ρ有关 , 但与 z 无关 , 只要它适合 | z | < ρ即可 .再看 第二 项 .因 为 (12 ) 在 z = z0 ( z0 在 收
敛圆中 ) 处收敛 , f 1 ( z 0 ) 是 (12) 之和 , S′
N ( z0 ) 是它的部分和 , 所 以如果有 必要就把 N0 放 大一些 ,
不过这个记号暂时还不代表 作 为和 的极 限的 积分 , 而代 表原 函数 .读者 不要 以为 我 们在 故弄 玄
虚 : 原函数与积分不是一回事么 ? 否则又何必叫做不定积分呢 ? 恰好不是一回事 .前者是求导数
的逆运算 , 后者是和的极限 .两个本不相同的概念后来被发现还有联系 , 这是一件大事 , 是牛顿—
莱布尼茨的伟大功绩 , 因此才 被称 为微 积分 的 基本 定理 .但 读 者绝 不要 以为 那些 陈 述起 来很 简
单 , 证明起来又很容易的东西都是简单而不足道的 .这就是一个例子 .问题在于 , 如果我们限于讨
x
n
1 1
证 收敛半径不变很 容 易证 明 , 因 为 = n → 1 , 其 余 证明 与 定理 3 几 乎完 全 相
n+1 n+1
同 .记 ( 13 ) 之和为 F( z ) , 则由定理 3
∞ ∞
d an d
∑ ∑
n+ 1 n
F( z ) = (z )= an z = f ( z ) ,
dz n= 0 n + 1d z n=0
z
而且易见 F( 0) = 0 , 所以 F( z ) 是 f ( z ) 在 z = 0 时为 0 的原函数 , 即 F( z ) = ∫
0
f ( z ) d z .定理 证
毕 .
由定理 3 得到一个重要结论 .
定理 5 幂级数 ( 3) 当收敛半径 R > 0 时必为其和在其中心 z = 0 处的泰勒级数 .
证 若 (3 ) 之收敛半径为 0 则这个定理显然无意义 .当 R > 0 时 , 反复应用定理 3 , 有
( k)
f (0 ) = a0 , f′(0 ) = a1 , … , f (0 ) = k ! ak , …
因此定理得证 .
这个定理之重要性在于它说明了 , 凡一个函数 可以用幂 级数 ( 3) 表示 , 则 此级 数必定 就是 其
泰勒级数 .所以为了求 f ( z ) 在 z = 0 处的泰勒展开式 , 我们不必去计算 f ( z ) 之各阶导数 , 然后再
1 ( k)
计算泰勒级数的各个系数 f ( 0) , k = 0 , 1 , … .只要我们能用某种方法把 f ( z) 写成 (3 ) , 则 ( 3)
k!
必是 f ( z ) 以 0 为中心的泰勒级数 .不论用什么方法 , 只要能判断出 ( 3) 在某圆内收敛而在其外发
散 , 此圆必为其收敛圆 , 而用不着去动用很难计算的阿达玛公式 .
例如 , 利用定理 4 逐项求原函数有
z z ∞ ∞ n
dz ( - 1) n+1
∫ ∫ ∑ ( - 1) ∑
n n
ln(1 + z ) = = z dz= z
0 1+ z 0 n= 0 n= 0 n+1
∞ n - 1
( - 1)
∑
n
= z , | z| <1 . (14)
n= 1 n
z z ∞ ∞ n
dz ( - 1) 2n+ 1
∫ ∫ ∑ ( - 1) ∑
n 2n
arctan z = 2 = z dz= z ,
0 1+ z 0 n= 0 n=0 2n +1
| z| < 1 . (15)
它们都恰好是泰勒级数 , 而收敛半径 R = 1 , 事实上 , 当 | z | > 1 时 , 这两个级数的一般项都不趋于
1 1
0 , 因而都发散 .可是怎么知道 ln(1 + z) 和 arctan z 恰好是 , 的原函数呢 ? 下一段中 我
1 + z 1 + z2
们会回答这个问题 .
1
3. 解析延拓 从 (14) 和 (15) 看见一个情况 .例如 (14) 中的函 数 , 直 接用 定义易 见它 有
1+ z
1 1
连续的导数 - 2 , 所以除了在 z = - 1 处以 外 , 它是 解析 的 . z = - 1 是它 的奇 点 . 2 则
(1 + z) 1+ z
∞
§4 解析函数与 C 函数 1 27
∑
n
设有解析函 数 f ( z ) , 它 在圆 | z | < R 中可以 表示 为幂级 数 an z , | z | < R 是它 的收 敛
n=0
( k)
圆 .在收敛圆中取一点 a , 而且按定理 3 , 可以用此幂级数逐项求导来算出 f ( a) , k = 0 , 1 , 2… ,
于是可以作出一个新的幂级数 .
∞ ( n)
f ( a)
∑
n
F( z ) = ( z - a) .
n= 0 n!
它的收敛圆形如 | z - a | < ρ,ρ的大小要使在圆周 | z - a | = ρ上 , 有 f ( z ) 的奇点 ( 这 一点前面 提
出过 , 是需要证明的 , 但我们未证 ) .此 圆 在图 3 - 4 - 1 上 用虚 线画 出 .在 这两 个圆 的 公共 部分 ,
F( z ) = f ( z ) .但是可能有这样的情况 , 即 | z - a | < ρ有一部分位于 | z | < R 之外如图 .这时我们
就说 , F( z )是 f ( z ) 由圆 | z | < R 向 | z - a| < ρ的解析延拓 .更一般地说, 若有两个圆: Di : | z - ai |
< Ri , i = 1 , 2, 以及两个各以它们为 收敛 圆的幂 级数 ( 3) , 分别记 其和 为 f1 ( z ) 和 f2 ( z ) 若 D1 ∩
D2 ≠ , 而且在 D1 ∩ D2 上 f 1 ( z ) = f2 ( z ) .令
f1 ( z) , z∈ D1
F( z ) =
f2 ( z) , z∈ D2
我们称 F( z ) 是 f 1 与 f2 向 D1 ∪ D2 中的解析延拓 , 或者说 f1 ( z) ( f2 ( z ) ) 是 f2 ( z ) ( f1 ( z1 ) ) 由
D2 向 D1 ( 由 D1 向 D2 ) 的解析延拓 .我们这里采用了比较特殊的区域 ( 圆 盘 ) 和解析 函数比较 特
殊的表示 ( 幂级数 ) 来定义解析延拓 , 这样做的目的是为了避免一些几何上的困难 .当然也可以用
其它形状的区域或者解析函数的其他表示方式 , 但最后的 结果 都是 一样的 .不 论怎 么做 , 这里 都
会有两个问题 .
~
第一 个 问 题 是 唯 一 性 问 题 .我 们要 证 明 , 若 f1 ( z ) 可 以 解 析 延 拓 到 D2 中 成 为 f 2 ( z ) 与
≈ ~ ≈ ~ ≈
f 2 ( z) , 或者说可以在 D1 ∪ D2 中定义 F ( z) , F ( z ) 如上 , 而 且 f 2 ( z ) = f 2 ( z ) 于 D1 上 , 这时 必
~ ≈ ~ ≈
有 f 2 = f 2 于 D2 上 , 或者 F = F 于 D1 ∪ D2 上 .更广泛一点我们有
定理 6( 唯一性定理 ) 若 f ( z ) 在一 个连 通开集 ( 即区域 ) Ω 中解析 , 而 在 Ω 之 一个 非空 开
子集 D 上 f ( z ) = 0 , 则在 Ω 中 f ( z) = 0 .
( n)
证 取 a∈ D , 则由假设易见对一切非负整数 n , f ( a) n ! = 0 , 故在 某个圆 | z - a | < R
1 28 第三章 微 分 学
上
∞ ( n)
f ( a)
∑
n
f ( z) = ( z - a) = 0 .
n=0 n !
( n)
在此圆中取一点 a1 , 又有 f ( a1 ) n ! = 0 , 从而在某圆 | z - a1 | < R1 中又有 f ( z ) = 0 .因为 Ω
是连通的 , 对任一点 z0 ∈Ω 都可以找到一串 ( 有限多个 ) 如上的圆使 z0 落在某一圆中 , 在所有 这
些圆中 , f ( z ) = 0 , 因此 f ( z 0 ) = 0 , 而定理得证 .
~ ≈ ~ ≈ ~ ≈ ~
把这个定理应用于 F - F , 即知 F - F = 0 于 D 上 , 从而在 D2 上也有 F - F = 0 , 亦即 f 2 ( z)
≈
≡ f2 ( z ) .
上面的证明本质地依赖于 Ω 的连通性 .如果要把证明的细节都写出来 , 还 相当繁冗 , 而与 前
面多次用过的连续拓展法是一样的 .我们不来重复这个证明 , 但是给出一个一望即知的“反例”说
明连通性之不可少 : 令 Ω = D1 ∪ D2 , D1 , D2 是两个互相分离的区域 , 例如 | z | < 1 与 | z - 3 | < 1 .
令
0, | z | < 1 ,
f ( z) =
1, | z - 3| < 1,
f ( z ) 显然在 Ω 中解析 , 在它的一个非空开 子集 D1 上为 0 , 但是 并不 恒为 0 .这个 例子中 的函 数
时常称为分片常值函数 , 时常用它来检验连通性的假设是否必不可少 .
唯一性定理是解析函数最重要的性质之一而且十分有用 , 所以我们给出它的两个推广 .不但
上述 f ( z ) 不能在 Ω 之非空开子集 D 上为 0 , 否则 f ≡0 , 而且如果 f ( z ) 有一串零点{ z k } → z0 , 且
z0 是 Ω 之内点 , 也会得 到 f ( z ) ≡0 .换言之 , 若 f ( z ) 在 区域 ( 即连 通开集 ) Ω 中 解析 , 且不恒 为
0 , 则其零点在 Ω 中必是孤立的 .
推论 7 若 f ( z ) 在区域 Ω 中解析且 f ( z ) á 0 , 若 z0 ∈ Ω 是 f ( z ) 之零点 , 则必 有 z0 的一 个
充分小邻域 U , 使 f ( z ) 在 U 中除 z0 以外没有其他零点 .
证 因为 Ω 是开集 , z0 ∈ Ω 必为其内点 , 不妨设 z0 = 0 , 因为 f ( z ) á 0 , 故以 f ( z ) 的 0 为 心
( k)
的泰勒级数必有第一个非 0 系 数 f ( 0 ) k ! = ak ≠0 , k 为某 正整数 ( 注 意 0 是 f ( z ) 之零点 ) .
k - i
而 f (0 ) ( k - i ) ! = ak - i = 0 , i = 1 , 2 , … , k .因此 , 这个泰勒级数可以写为
k
f ( z ) = ak z [1 + zφ( z ) ] ,
其中 φ( z ) 在 0 附近是解析的 , 因而在某个圆 | z | ≤ R( 含于收 敛圆内 ) 中 连续而 有界 : | φ( z ) | ≤
1
M , 取一个 0 < ρ< R , 使 Mρ< , 则在 | z | ≤ρ时
2
k 1 k
| f ( z ) | ≥ | ak z | [ 1 - | zφ( z ) | ] ≥ | ak z | ,
2
所以推论得证 .
推论 8 区域 Ω 中的不恒等于 0 的解析函数 f ( z ) 只有有限阶零点 .
( k)
证 用反证法 .设某一点 a∈Ω 是 f ( z ) 之无限阶零点 , 则 f ( a) k ! = 0 , k = 0 , 1 , … .所 以
f ( z ) 的以 a 为中心的泰勒级数恒为 0 , 从而 f ( z ) ≡0 于 Ω 中 .证毕 .
解析延拓是一个我们时常用到而没有注意的概念 .例如 在复域 中我 们用 ( 14 ) 与 ( 15 ) 来定 义
ln (1 + z ) 与 arctan z , 并由它们得出这两个函数在 | z | < 1 中的幂级数展开式 , 则在其 外ln(1 + z)
∞
§4 解析函数与 C 函数 1 29
其中
z - z0
ζ= .
1 + z0
此式当 | ζ| < 1 即 | z - z0 | < | 1 + z0 | 时有效 .因此在{ z; | z | < 1}∩ {ζ: | ζ| < 1}中
z ζ ∞ n
dz dζ ( - 1) n
ln( 1 + z ) - ln( 1 + z0 ) =∫ z
0
1+ z
= ∫ 0 1 +ζ
= ∑n=1 n
ζ,
所以
∞ n n
( - 1) z - z0
ln( 1 + z ) = ln( 1 + z0 ) + ∑
n= 1 n 1 + z0
. (16)
z - z0
但是右方的级数在 < 1 亦即在 | z - z0 | < | 1 + z 0 | 中收敛 , 所以是 | z - z 0 | < | 1 + z0 | 中
1 + z0
的解析函数 .而左方如果用 ( 14 ) 式表示 , 则只在 | z | < 1 中收敛 .所以 ( 16 ) 式 是 ln ( 1 + z ) 由 | z | <
1 向 | z - z0 | < | 1 + z0 | 中的解析延拓 .以上我们用 了一些 积分 记号 , 但其 实都 是原 函数的 记号 ,
我们用到的一些计算规则也都是原函数的计算规则 , 例如变量的变换等等 .(16) 这样的式子确实
告诉了我们 ln( 1 + z ) 的解析延拓 , 但是使用起来并不方便 , 所以最好的办法仍 然是看到 , 若用 w
= ln (1 + z ) 表示解析延拓后的函数 , 由积分式得
dw 1
= , w = ln (1 + z 0 ) .
dz 1+ z z= z
0
即得 ) , 用二项级数 , 我们可以得到
1 1 1 1 2
1+ z=1+ z+ ( - 1) z + … .
2 2! 2 2
它的收敛 圆是 | z | < 1 , 而 在收敛 圆周 上有 奇点 z = - 1 .如 果仿 照第
二章的作法 , 从 D1 : | z | < 1 依次作解析延拓回到 DN ≡ D1 时将得到
1 1 1 1 2
1+ z= - 1+ z+ -1 z +…
2 2! 2 2
( 图 3 - 4 - 2) .在第 二章中 我们 说 , 这个函 数常 被 人们 说成 是多 值函
数 , 其实是黎曼曲面 上的 单值 函数 .所以 , 一个 如 ( 3 ) 那 样 的 幂级 数 ,
经过一切可能的解析 延拓 , 将得 到一 个 定义 于 其 黎曼 曲 面上 的 单值
函数 .我们把这样得到的函数称为整体解析函数 .
定义 2 从某一具有正收 敛半 径的 幂级 数 ( 3 ) 开 始 , 经 一切 可能
的解析延拓所得到的定义于其黎曼曲面 上的 函数 称为一 个整 体的解
析函数 . 图3- 4 -2
读者们可能会感到黎曼曲面是一个虽然有趣但是过于玄妙的东西 .不过我们要问一问读者 ,
我们生活于其中的空间当真是那么简单吗 ? 20 世纪下半叶的 全部科学 的发展 都表明 , 空间是 极
为玄妙的 , 至今我们都说不清它的构造 .所以 , 如果有朝一日发现黎曼曲面有深刻的物理意义 , 或
者有助于说明这个深刻的物理问题 , 我们不必感到吃惊 .
4. 柯西 - 黎 曼方程、共形 映射 现在读 者已经可 以感到了 , 复 变量函 数的解析 性是一个 内
涵非常丰富的概念 .复变量函数 w = f ( z ) 是从 z 平面的 开集 ( 我 们只 考虑开 集 ) Ω 到 w 平面 的
2 2
映射 , 可是 z 平面也就是 R 平面 z = x + i y , w = u + i v 平面 也就 是 另一 个 R 平面 : ( u , v ) 平
2 2
面 .因此从几何上看 w = f ( z ) 也是一个映射 : Ω R →R .而 f ( z ) 的解析 性的 要求就 包括 了 u
Δf
与 v 在 Ω 中有连续的偏导数 u x , uy , vx , vy . f′( z ) 的存在说明当 z + h 以任 何方式趋 向 z 时 ,
Δz
当 Δz = h→0 时都有相同极限 .现在我们看 h = h1 + i h2 , h1 , h2 为实数 , 以 特定方式 趋向 0 的 后
果 .一是 h1 = 0 , h2 → 0 , 这时我们有
Δf u( x , y + h2 ) - u( x , y ) v ( x , y + h2 ) - v ( x , y )
lim = lim + i
h→0 Δz h→ 0 i h2 i h2
1 u v
= +i .
i y y
同样 , 令 h2 = 0 , 而 h1 →0 , 这时我们有
Δf u( x + h1 , y ) - u( x , y ) v ( x + h1 , y ) - v ( x , y )
lim = lim +i
h→0 Δz h 1 → 0 h1 h1
u v
= +i .
x x
1
比较这两个式子即得 : f′( z ) 存在而且连续意味着 u , v∈ C ( Ω) 而且
u v u v
= , = - . (18)
x y y x
(18) 式称为柯西 - 黎曼 ( Cauchy-Riemann , 以下简记为 C - R) 方程组 , 或 称为 C - R 条件 .所以 上
∞
§4 解析函数与 C 函数 1 31
1
面我们证明了若 f ( z ) 是 Ω 中的解析函数 , 则必有 f ∈ C ( Ω) 而且其 实部虚 部适合 C - R 条件 .
1
读者自己也容易证明其逆 : 若 f ( z) = u + i v 之 实部 虚部 均为 C ( Ω) 函 数 , 而且适 合 C - R 方 程
Δf u v u
组 , 则 f ( z) 必 是 Ω 中的 解析 函数 , 因 为容易 证明Δlim 存 在且连 续 , 且 +i (或 - i +
z→ 0 Δz x x y
v
) 即是这个极限 , 所以也可以用 C - R 条件来作为解析性定义的基础 .
y
2 2
上面我们把 w = f ( z ) 看成是 Ω R →R 的一个映射 , 但这个映射一般并不是微分同胚 .因
为它的雅可比行列式
ux uy 2 2 2
J= = ux vy - uy vx = u x + u y = | f′( z ) | (19)
vx vy
可能在某些孤立点为 0 .我们来看当 J≠ 0 时这 个映射 的几 何本 质 .在此映 射下 , 线 段 ( z , z + h)
的像是一曲线 , 这个线段与实轴的交角是 arg h .按微分学的基本思 想 , 其 像在忽 略了一个 与 | h |
比较为高阶的无穷小量之后 , 仍是直线 , 即过 w = f ( z ) 点的切线 ( 即图 3 - 4 - 3 之虚线 ) :
f ( z + h) - f ( z ) = f′( z) h + o( h ) , ( 曲线 )
w = f ( z ) + f′( z ) h , ( 切线 )
图3 - 4 - 3
这条直线的倾角是
arg f′( z ) h = arg f′( z ) + arg h .
所以原线段 ( z , z + h) 之像 , 略去一个高阶无穷小 量后 , 其方 向是 原直 线段的 方向 再旋转 一个 角
度 arg f′( z ) .在这里我们看到了 f′( z ) ≠ 0 这个条件的作用 .因为若 f′( z ) = 0 则 arg f′( z) 没有
意义 .若过 z 点作另一条直线段而与原直线段交 角为 α, 则 它在 映射 w = f ( z ) 下 之像 , 过 f ( z )
点的切线也将旋转一个角度 arg f′( z ) 而与 上一 直线段 之像 的交 角仍为 α.总 之 , 由复变 量的 解
析函数 w = f ( z ) 生成 的 映 射 在 f′( z ) ≠ 0 之 处 保 持 角 度 不 变 , 所 以 称 为 共 形 映 射 ( conformal
m apping) .
这一种研究复变量的解析函数的几何方法始自 黎曼 , 时为 19 世纪中 叶 .当时 电磁学 的问 题
正是整个物理科学的中心问题 .我们可以从静电学的角度来看 C - R 条 件的重 要性 .如果我们 在
平面上放上一些电荷 , 平面上 原来 已有 的电 场 在放 上电 荷后 将立 即 变化 , 而 终于 会 达到 一种 稳
态 , 即与时间无关的状态 .这就是静电 场 .在此 平面上 取一 个区 域 Ω, Ω 内的 平面 静 电场 可以 用
一个二维向量 E 来表示 : E = ( E x , Ey ) , 但是 二维 向量与 复数 是一 回事 , 所以 这个 平面静 电场 可
以用 ( x , y ) 的复值函数 Ex ( x , y ) + i Ey ( x , y ) 来表示 .在静电场的情况应该存在电位 u ( x , y ) 使
1 32 第三章 微 分 学
E = grad u , (20)
亦即
u u
Ex = , Ey = . (21)
x y
除了有电位 u ( x , y ) 以外 , 还有一个重要的关系式如下 :
如果在 Ω 内没有电荷 , 则由高斯定理知应有 ,
Ex Ey
div E = + =0 . (22)
x y
2 2
φ φ
现在我们要介绍一个重要定理 .众所 周知 , 对 适当光 滑的 函数 φ, = .所 以 , 如 果上 面
x y y x
的 E x 与 - Ey 分别是某 一 函数 v 的 偏 导数 , 则上 式 自然 成 立 .这 里 有一 个 重要 定 理 ( 庞加 莱 引
Ψ2 Ψ1 Φ Φ
理 ) 若 Ψ1 , Ψ2 适合 = , 则它 们一 定是 某个 函数 Φ 的 偏导 数 : Ψ1 = , Ψ2 = .这 个
x y x y
结论的证明以及必须加上的条件将 在第 七章 中详 细讨 论 .将 它用 于 Ex 与 - Ey 即 知 , 一 定存 在
一个函数 v ( x , y ) 使
v v
Ex = , - Ey = . (23)
y x
与 (21) 比较 , 即知 , u + i v 适合 C - R 条件 .因此 , 再附上适当的光滑 性要求 即知解析 函数是描 述
平面静电场的适合的数学工具 .其 实 , 类 似的 情况 还不 只 出现 在静 电学 中 , 例 如 18 世纪 的欧 拉
( 还有 18 世纪的达朗贝尔 ) 在流体力学中也遇到过它 , 所以 C - R 方程也称 为欧拉 - 达朗贝尔 方
程 x特别是我们容易看到 , 由 C - R 方程可得
2 2 2 2
u u v v
2 + 2 = 0, 2 + 2 = 0 .
x y x y
即解析函数的实部虚部都适合拉普拉斯方程 .而这是拉普拉斯在研究重力场的位势时得出的 .
值得注意的是 , 本章§1 讲的几个数学物理中的偏微分方 程的导出 都比较 简单 , 利用守恒 律
———甚至傅里叶犯了一个错误 , 把热当成一种流质 来看待 时 , 也还 是在利 用守 恒律 , 然后 再略 去
高阶无穷小量即得 .现在却不同了 .两次利用了位势的存 在———后面用 庞加莱引 理得出 v 时 , 虽
然 v 的物理意义并不清楚 , 但和电位的存在十分相似 , 这不是牛 顿的微 分学所能 概括的 .比之 后
来的麦克斯韦方程来说 , 静电场的研究还只是最 简单的一 步 .我们 在这本 书中 , 还 要追随 着整 个
数学的发展 , 最后看到用数学来刻画电磁现象 ( 包括光学 ) 时 , 整个数学的发展已经远远地超越了
牛顿 .
还是回到本章主题 , 有了微积分 , 把它推广到复域 是最直 接也 是最重 要的 一大 发展 .我们 就
看到了复变量的解析函数的内容多么丰富 .等到我 们看到了 复域 中的 积分学 又给 我们带 来什 么
惊喜的时候 , 对这一发展之大就更有体会了 .
∞ ∞
5. C 函数 现在回到实变量 x = ( x1 , … , x m ) 的 C 函 数的 研究 .与复 变量 的解析 函数 形
成鲜明对比的是 : 后者 ( 多个复变量情况也一样 ) 只要知道其在某一点不论多么小的邻域中的值 ,
则可通过解析延拓知道其在整个定义域上的值 , 不可以任加修饰 .所以如果有一个复变量解析函
∞
数在某一点附近恒等于 0 , 则拓 展后 也只可 能是 恒为 0 , 此即 唯一性 定理 .而 C 函 数 , 哪 怕是 毫
不相干的 , 也可以通过稍加修饰拼在一起 .这里重要的是应用一个在相当大区域中为 0 但又整体
∞
§4 解析函数与 C 函数 1 33
∞
上不恒为 0 的 C 函数 .本节开始时讲过了一个 .但是以后用得最多的是
1
2
e | x| - 1
, | x | < 1,
f ( x) = (24)
0 , | x | ≥1 .
∞
它在球面 | x | = 1 上也是 C 的 , 这是很容易证明的 .
在往下讲之前 , 先介绍一个概念和记号 .
m
定义 3 设 f ( x ) 定义于 Ω R 上 , 我们称 使得 f ( x ) ≠0 的点 x 之集合 的闭 包为其 支集 ,
并记为 supp f = { x ; f ( x ) ≠0} .
supp f 一定是相对于 Ω 的闭集 .要注意 , 并不是 f ( x ) 在 supp f 上不为 0 , 例如定 义在 x ≠0
1 1 1 1 1
处的 f ( x ) = sin , f( ) = 0 , 但在 的 任意小 邻域中都 有使 sin ≠ 0 的 x 点 , 所以 虽然
x nπ nπ x nπ
使 f ( x ) = 0 却属于其支集 , 而且是支集 J = { x ; x ∈R , x ≠ 0}的 内点 .还 要注 意 , 这个例 子中 的
Ω= { x ; x∈R, x ≠0} , J 对于 R 并非闭集 , 而是开集 , 但是对于 Ω 却是一个闭集 .一 个集合为 开
为闭需视相对于哪个集合而定 .这对我们理解何 为开集 , 何为 闭集 大有关 系 , 这就 是子空 间拓 扑
∞
问题 .我们在第六章中会解释这个问题 .总之 , C 函数与解析函数是完全不同的对象 .
∞
我们下 面用 得最 多的将 是具 有紧支 集的 C 函数 .所谓 紧就 是有界 闭 .Ω 的紧 子集 K 当 Ω
为开时必与 Ω 之边缘 Ω 有一个正的距离 .这个正距 离的存 在关系 极为 重大 .从§ 3 讲阿 贝尔 定
∞
理就可以看到这一点 .请读 者务 必 十 分注 意 .具 紧 支 集的 C ( Ω) 函 数 之集 合 ( 或 称空 间 ) 记 为
∞ ∞
C0 ( Ω) .在不发生误会时就记为 C0 .( 24 ) 的支集是单位球 | x | ≤1 , 但是我 们可以作 出支集几 乎
∞
是任意集合的 C0 函数 , 而且涉及数学分析中一个常用的技巧———磨光 ( mollifying) 技术 .
m
设紧集 K R , 而且其边界比较规则 .我们定义其特征函数 χK ( x ) 为
1, x∈ K ;
χK ( x ) = (25)
0 x| K .
K 之边界比较规则是为了保证 χK ( x ) 可积分 .规则到 什么 程度才 能保 证 χK ( x ) 可积 , 下 一章 中
关于多重积分的介绍中会讲到 .
任取 δ≥0 , 我们定义
1
2 2
jδ ( x - y ) = e
[ | x - y| δ - 1]
, | x - y | < δ, (26)
0, | x - y | ≥δ.
于是
1
∫ ∫
m 2 m
jδ ( x - y) d y = δ e | x| - 1
d x = Lδ .
m m
R R
这里
1
∫e
2
| x| -1
L = dx > 0 .
m
R
现在作积分
1
Φδ ( x ) =
Lδ
n
∫j ( x - m
δ y) χK ( y) d y . (27)
R
1 34 第三章 微 分 学
∞
利用积分号下求导很容易看 到 Φδ ( x ) ∈ C .今证 它有 紧支集 .为 此要 注 意 , ( 27 ) 式 实际 上只 在
K 上积分 , 所以 (27) 中的 y 只在 K 中 .注意 x , 如果 x 离 K 的距离大于δ, 即
x| Kδ = { x ; dist ( x , K ) ≤δ} ,
∞
则 (27) 中的 | x - y | ≥δ, 从而 jδ ( x - y ) = 0 , 而积分 (27) 为 0 , 所以 supp Φδ Kδ , 而 Φδ ∈ C0 .
δ
Kδ 是一个比 K 更大的紧集 : 它 包含 K , 而且 我们 记另 一 个比 K 较 小 的紧 集 K 为含 于 K
内 , 且到 K 之距离不小于δ的集合为
δ
K = { x ; x∈ K , dist( x , K ) ≥δ} .
δ δ
设 δ充分小时 K ≠ , 则对 x∈ K , 以 x 为心 ,δ为半径之小球 Bδ ( x ) K,且
1
Φδ ( x ) =
Lδ
n
∫ B ( x)
δ
jδ ( x - y ) d y = 1 .
1
f( x ) =
Lδ∫j ( x
n δ - y) f ( x) d y .
一族开 集 且 覆 盖 K : ∪U λ
λ K , 则 从 { Uλ } 中 必 可 找 出 有 限 多 个 : U1 , … , U N 仍 可 覆 盖
N
K: ∪U
i=1
i K.
(3 ) ∑
j=1
Φj ( x ) = 1 , (29)
∞
{ Φj ( x )}称为 K 的从属于覆盖{ Ui }的 C0 单位分解 .
证 任一点 x∈ K 必含于某个 U i 中 , 从而也必含 于一个开 的小 球 Kj 中 , 这里 Kj Ui , 所
k
以{ Kj } 也成了 K 的一个开覆盖而必可以从其中选出有限多个 : K 1 , … , Kk , 使 K ∪
j=1
Kj , 而每
1 36 第三章 微 分 学
中 , 而且必要时稍微缩小 Kj , 当 x∈ Kj 时有
1 1
0≤φδj ( x ) =
Lδj∫j
m δ
j
( x - y ) χK j ( y ) d y =
Lδj
m
∫j δ
j
( x - y )d y = 1 .
因为 ∪K j
j K , 故对任意 x∈ K , 必至少有一项 φδj ( x ) = 1 , 从而
∑φj
δ
j
( x) > 0 .
Φj ( x ) = φδj ( x ) ∑φ j
δ
j
( x),
易见{ Φj ( x )}即是所求的单位分解 .
以上我们只对紧集的开覆盖证明了单位分解 的存 在 .实际 上即令 K 不是 紧集 , 单位 分解 也
是有的 , 但其概念要稍作微改 .详细的讨论见第六章和专门的参考书籍 .
∞ k
以上我们讲 的是 C0 单位 分 解 .也可 以 构造 C0 单 位分 解 , 但 是不 可 能作 出解 析 的单 位 分
∞
解 , 因为解析函数除非恒为 0 是不会有紧支集的 .这里也表现了解析函数与 C 函数的区别 .
§5 反函数定理和隐函数定理
m n
1. 重温线性代数 前两节中我们讨论了映射 f : Ω R → R 所生成 的无 穷小 量 f ( x + h)
∞
- f ( x ) 按 h 之幂分 解的问 题 , 并 由此引 出了解析 函数与 C 函数 的区别 的详细讨 论 .现在再 回
到 f ( x + h ) - f ( x ) 之线性部 分即一 阶微 分的 讨论 .我们 在前 面一 再强 调线 性部 分 的研 究可 以
提供有关这个映射的局部的 ( 即 在 x 点附 近 , 以下 我们限 于在 原点附 近 ) 性态 的信 息 .现 在再 回
到这个主题并讨论一个极重要的问题即如何求解
f( x ) = y . ( 1)
- 1
这个问题把我们引导到一个更广泛的问题 , 即讨论 y = f ( x ) 的逆映射 f .更准确一些说是讨论
n
y∈R 是否在映射 f 下有原像 .因为只有在这个原像是存在而且唯一的条件下 , 才能说有逆映射
- 1
f .
现在在 x = 0 附近把 f ( x ) 线性化 , 即令
f ( x ) = f ( 0) + Ah + o( h)
m n n
并用 f (0 ) + Ah 取代 f ( x ) .这里的 A 是由 Ω 的切空间 TΩ = R 到 R 的 切空间 ( 仍 为 R ) 的 线
性映射 .如果用坐标表示 , 则有
( f1 , … , fn )
A= ( 0) .
( x1 , … , x m )
以下为方便起见 , 恒设 f ( 0) = 0 .于是映射 y = f ( x ) 将被线性映射
n m
k = A h, k∈R , h∈R ( 2)
§5 反函数定理和隐函数定理 1 37
m = n = rank A . ( 7)
反过来由 ( 7) , 一方面 rank A = dim im A = n , 故 A 为满射 , 另一方面 dim ker A = m - rank A = 0
故 A 为单射 , 总之 A 为同构 .这样可以看到 ( 7) 是 A 为同构的充分必要条件 .
由 (7 ) 看到 , 若 n≠ m , 则 A 不 可能是同 构 .下面就分
别来讨论 m < n 与 m > n 的情 况 .但 不 论如 何 , ( 7 ) 是一
种秩已达到最大可能的允许值的情况 .所以下面我们在每
个情况下都 只 讨 论 rank A 达 到 最 大 可能 的 允 许 值 的情
况 .由 ( 6) 可知 , 这就是 m < n 而 rank A = m , 以及 m > n
而 rank A = n .
m
先看 m < n , rank A = m .这时 , A 把源空间 R 映为
靶空间的 m 维子空间 , 而 且由 ( 5 ) 知 dim ker A = 0 , 所以
A 是一个单射 .图 3 - 5 - 1 上 一行画 出了 这个映 射 .然而
m
我们可以在靶空 间中 作了 一个 坐 标变 换 T 使 得 AR 成
为一个“坐标平面”.图 3 - 5 - 1 右 侧一列 画出 了 T , 这样
我们就可以想像到 , 在这 样的 坐标系 下 , A 应 该有 特别简
单的表示 .下面我们引 用坐 标表 示 , 并且 设 在源 空间 与靶 图3 - 5- 1
空间中都已选 好 了 坐 标 系———即基 底 , 从 而 h 和 k 都表
示为列 ( 竖 ) 向量 :
t
h = ( h1 , … , hm ) , ( 上角的 t 表示转置 .)
t
k = ( k1 , … , kn ) ,
而 A 表示为
A = ( ai j ) , i = 1 , 2 , … , n , j = 1 , 2 , … , m .
n
如果在靶空间 R 中作一个坐标变换 , 而把 k 变成 l
t
l = ( l1 , … , ln ) .
应当有
l = Tk = ( T A ) h ,
T = ( tij ) 是一个 n× n 非异矩阵 ( n 阶非异方阵所成的空间在 数学中极 为重要 .这个 空间按习 惯
m
记为 GL ( n , R) . n 表示方 阵阶数 , R 表示其元 为实数 ) .原来的 R = {( h1 , … , hm )} , 而 现在 的
m
( T A )R = { ( l1 , … , lm ; 0 , … , 0) } .因此经过坐标的选择 , 映射 A 就成了
li = hi , i = 1 , 2 , … , m ,
lm + j = 0 , j = 1 , … , n - m . ( 8)
如果用矩阵来表示 (8 ) , 它就是
I
. ( 9)
O
这是一个 n× m 矩阵 , 而它的子矩阵 I 则是 m × m 的单 位矩 阵 .从 几何 上看 , 这 就 是把 源空 间
“浸入”或“嵌入”在靶空间 中 .但 是在 数学 中 , 浸 入 ( immersion ) 与 嵌入 ( embedding) 这 两个 名词 ,
虽然是描述的这种映射 , 但都有确切的定义 , 而且二者 又有比 较细 微但十 分重 要的 区别 .它们 属
§5 反函数定理和隐函数定理 1 39
-
因此 , 当 x∈ Bρ (0 ) 且 ρ充分小时 , 必有‖ ( d g) ( x ) ‖ < η, η是任意小的正数 .
现在我们用迭代法去解方程
x = y - g( x ) . (16)
但是这个方程的解就是映射 y - g( x ) 的不动点 : y - g(・) : x → x .因为这个 x 必适合
x = y - g( x ) = y + x - f ( x ) 或 f ( x ) = y .
求解 (16) 可以使用古典的逐次逼近法 .即对 0 附近的 y, 任取 x0 ∈ Bρ (0 ) 作为零次近似 .以 x0 代
入 (16) 右方 , 并记所得为 x1 :
x1 = y - g( x0 ) = y + x0 - f ( x0 ) ,
然后逐次地做下去 , 即令
xl + 1 = y - g( xl ) , … (17)
- -
这样得到一个序列{ xl } .我们希望{ x l }有极限 x , 而且 x 即是 ( 16 ) 的不动点 .
这样做要解决两个问题 : 一是要保证每次得到 的 x l 都在 g( x ) 之定 义域 ( 亦即 f 之定 义域 )
中 .例如适合 xl ∈ Bρ ( 0) .然后再证{ x l }收敛 .为了做 到这两 点 , 首 先是取 y∈ Bρ2 ( 0 ) , ρ待 定 , 然
后证明映射 g 在 Bρ (0 ) 中适合
* * * 1 * * *
‖ g( x ) - g( x ) ‖≤ ‖x - x ‖ . (18)
2
这个式子的证明见后 .
于是对于固定的 y .如果已作出了 xl , 则对于 xl + 1 = y - g( xl ) , 因为 g (0 ) = 0 , 故有
ρ 1
‖ x l + 1 ‖≤‖ y‖ + ‖ g( x l ) - g(0 ) ‖ < + ‖ xl - 0‖
2 2
ρ ρ
≤ + = ρ.
2 2
即是说 , 只要‖ xl ‖ < ρ, 必有‖ x l + 1 ‖ < ρ .但 x0 是取在 Bρ ( 0) 中的 , 所以 一切 xl 都在此 球中 ,
从而也在 f ( x ) 与 g( x ) 之定义域中 .
其次由 (18) 式
1
‖ x l + 1 - x l ‖ = ‖ g( x l ) - g( x l - 1 ) ‖≤ ‖ xl - xl - 1 ‖ .
2
即是说每经 一次映 射 g , xl + 1 与 xl 之 距离 比 xl 与 xl - 1 之距 离至少 减半———所 谓压 缩映 像即 指
此 .而反复应用它 , 有
l
1
‖ xl + k - xl ‖≤ ‖ x k - x0 ‖ .
2
n - -
所以{ xl } 是 R 中的柯西序列 , 而必有极限 x ∈ Bρ ( 0) .在 ( 17 ) 中求极限 , 即得
- - - -
x = y - g( x ) = y + x - f ( x ) ,
亦即
-
y= f( x ) .
-
从而 x 是方程 y = f ( x ) 对固定于 Bρ (0 ) 中的 y 的解 .
1 42 第三章 微 分 学
= = - = -
再证这个解是唯一的 .设有 x 也是 y = f ( x ) 之解 , 则 f ( x ) = f ( x ) , 于是 g ( x ) - g ( x ) =
= -
x - x .但由此有
= - = - 1 = -
‖ x - x ‖ = ‖ g( x ) - g( x ) ‖≤ ‖ x - x‖ .
2
= -
所以 x = x .
* * * *
余下的只是证明 (18 ) 式 了 .在 Bρ ( 0 ) 中作 直线 段 { t x + (1 - t ) x , 0 ≤ t≤ 1} 连接 x 与
* *
x 两点 .在这个直线段上 g 成为 t 的光滑函数 , 从而
1
d
∫ d t g( tx
* * * * * *
g( x ) - g( x )= + (1 - t ) x )d t
0
∫(x
* * * * * *
= - x ) ( d g ) ( t x + (1 - t ) x )d t .
0
-
由于在 Bρ ( 0) 中‖d g‖ < η,η是任意小数 , 故当 ρ充分小时
* * * 1 * * *
‖ g( x ) - g( x ) ‖≤ ‖x - x ‖ .
2
这就是 (18) 式 .
- 1
现在证明 f 也是可微的 .事实上 , 由 f 为连续可微 , 可设 x = x1 + h 应有
f ( x ) = f ( x1 ) + ( d f ) ( x1 ) h + o( h ) . (19)
- 1
这里 ( d f ) ( x 1 ) 当 x1 在 0 附近时 , 由假设是非退化的 .用 A( x1 ) 表示 ( d f ) ( x1 ) , 则 A ( x1 ) 是存
- 1
在的 .用 A ( x1 ) 作用于上式两侧有
- 1 - 1
A ( x1 ) [ f ( x ) - f ( x1 ) ] = x - x1 + A ( x1 ) o( x - x1 ) .
- 1
若记 y = f ( x ) , y1 = f ( x1 ) , 则 x1 = f ( y1 ) , (19) 式可以写为
- 1 - 1 - 1 - 1
f ( y) = f ( y1 ) + A ( x1 ) ( y - y1 ) - A ( x1 ) o( x - x1 ) . (20)
- 1
不过由前面的 假 设 ( 即 已 用 A ( 0 ) 遍“ 乘”方 程 y = f ( x ) 双 方 ) , 可 以 设 A ( 0 ) = I .所 以 当
x , x1 ∈ Bρ ( 0) 从而 y , y1 ∈ Bρ2 ( 0) (ρ已设为充分小 ) , 有两个正常数 λ与 Λ 存在使
‖ x - x1 ‖
0 < λ≤ ≤Λ .
‖ y - y1 ‖
- 1
这样知道 o( x - x1 ) 即 o( y - y1 ) .代入 (20) , 注意到‖ A ( x1 ) ‖≤ M ( M 是一个适当正数 ) , 我
们有 ( 记 y - y1 = k )
- 1 - 1 - 1
f ( y) = f ( y1 ) + A ( x1 ) k + o( k ) . (21)
- 1 - 1
这就是说 f ( y) 在 y1 处连续可微 .但是 y1 = f ( x1 ) 可以选为 Bρ2 (0 ) 中任一点 , 所以 f 在 y=
0 附近连续可微 .
- 1
定理中是说逆映射 f 与 f 有相同的光滑程度 .但这只要利用泰勒公式即可得证 .证明的 大
l
意如下 .如果 f ( x ) 在 x = 0 附近属于 C , 则在 Bρ ( 0 ) (ρ充分 小 ) 中任 取一 点 x1 , 并记 x = x1 +
h , 这里 h = ( h1 , … , hn ) 是一个 n 维向量 , 我们应有
l
α
∑
l+ 1
f ( x ) = f ( x1 ) + A ( x1 ) ( x - x1 ) + Aα ( x1 ) h + o( h ) .
| α| = 2
§5 反函数定理和隐函数定理 1 43
- 1 - 1
这里 h = x - x1 = f ( y) - f ( y1 ) .令
l
β l+1
x - x1 = B( y1 ) ( y - y1 ) + ∑
| β| = 2
Bβ ( y1 ) ( y - y1 ) + O ( ‖ y - y1 ‖ ), (22)
- 1
以它代入上式 .注意到我们已经得出 B( y1 ) = A ( x1 ) .现用待定系数法计算 Bβ ( y1 ) , 注意到 为
- 1
此只需利用 A ( x1 ) 即可 , 而不必考虑其余的 Aα ( x1 ) 是否为退化 .于是即可 得到 ( 22) 式而知 逆
- 1 l
映射 x = f ( y ) 在 y = 0 附近 , 至少在 Bρ2 (0 ) 中是 C 可微的 .
∑ ∑
2 2
f = x -
i xλ+ j 后, 说 x = 0 是一个奇点———临界点 , 即 指该函数的所有 的一阶偏导数在 x
i= 1 j= 1
n
坐标变换 g 把 f ( Ω) 拉平 .总之 , 顺着图 3 - 5 - 3 的斜线看 , 我们有 一个由扩大的源空 间 R 到 作
n
为靶空间的 R 的映射 , 它是由 g F 实现的 .如果 g F = id , 则 g 必适合所求 .所以 g 是 F 的 逆
映射 .这样一来 , 我们会得到一个什么样的定理 , 又如何去证明它也就十分清楚了 .定理 3 的记号
与前面讲的一样 .
图3 - 5 - 3
m n
定理 3( 单射定理 ) 设 m ≤ n . f : Ω R →R 是一个光滑映射 , 且 f ( 0) = 0 .若 ( d f ) ( x ) 在
n
x = 0 附近恒取最 大可能秩 , 则 必有由 0∈ R 的某个 充分小邻 域 ( 即设为 Ω) 到 0 的 另一个邻 域
的微分同胚 g , 使得 g( 0) = 0 , 而且
x1
…
xm
( g f ) ( x1 , … , x m ) = ( 后 n — m 个元为 0 ) . (23)
0
…
0
证 不妨设 f 的雅可比矩阵的左上角子矩阵
fi
J1 =
xj 1 ≤ i , j≤ m
n - m
在 x = 0 附近是非 退 化 的 “扩
. 大”源 空 间 , 即引 入 新 的 R , 令 其 中之 点 的 坐 标 是 ( x m + 1 , … ,
x n ) , 并定义新的映射 :
t t n n
F( x1 , … , xn ) = ( f1 ( x1 , … , x m ) , … , fn ( x1 , … , x m ) ) + (0 , … , 0 ; xm + 1 , … , xn ) : R →R .
(24)
显然 F(0 ) = 0 , 而且它在 x = 0 处的雅可比矩阵是
fi
(0 ) 0 J1 ( 0) 0
J (0 ) = xj = .
* I
* I
§5 反函数定理和隐函数定理 1 45
- 1
由于已设 det J1 ( 0) ≠ 0 , 所以 det J (0 ) ≠0 , 而由反函数定理 . F 必有局部逆 F = g , g(0 ) = 0 , 而
n n n
g F = id : R →R .R 既是 扩 大的 源空 间 , 又 是靶 空 间 .把 g 用 局 部坐 标 写 成 gi = gi ( y1 , … ,
yn ) , 1 ≤ i≤ n , 则 g F = i d .即
g1 ( F( x1 , … , x n ) ) = x1 , (25)
…………
gn ( F( x1 , … , x n ) ) = xn .
再由扩大的源空间回到原来的源空间 , 即令 xm + 1 = … = xn = 0 .由 (24) 知这时 Fi 变成 f i , 而 ( 25 )
即成为 (23) .定理证毕 .
注 我们不说 ( d f ) ( x ) 在 x = 0 处之秩为 m , 却说 ( d f ) ( x ) 在 x = 0 附近 的秩均为 m , 这 是
x 0
因为秩是一个可以突然变化的量 .例如二阶矩 阵 在 x≠ 0 处的 秩是 2 , 而在 x = 0 时却 突
0 1
1
然变为 1 .这 个 情 况 正 是 我 们 想 要 避 免 的 .本 来 , 假 设 了 f 光 滑 , 至 少 f ∈ C , 则 rank A =
rank ( d f ) ( x ) 是 x 的连续函数 .若 rank( d f ) (0 ) = m , 则在 x = 0 附近均有 rank ( d f ) ( x ) = m , 而
上面的情况不会发生 .( 但若 rank A 在 某点 小于 最 大可 能值 m , 在 其附 近则 不一 定 不发 生突 变
了 .这种情况我们的说法是 : 非退化性是稳定的 , 而 退化性 则是不 稳定 的 ) .我 们对 定理的 陈述 在
“ x = 0”后面画蛇添足地加了“ 附近”二字 , 无非是提醒读者注意这件事 .
下面我们再来看 m > n 的 情 况 .我 们 仍从 几 何说 明 开 始 , 现 在 情 况就 简 单 多 了 .在 映 射 f
- 1
下 , 靶空间 中的 原 点 0 之 原像 f ( 0 ) 是 源空 间中 过 x = 0 的 一 个“ 曲 面”.其维 数是 m - n .图
3 - 5 - 4中画的是一条曲线 , 这是因为更高维数的几何图形画不出来 .问题在于它会不会有奇点 ?
在讲单射定理时 , 我们以 m = 1 的特例 ( 这时映射 f 成了一条曲线 ) , 比照着曲线上有没有临界点
n
的情况 , 说 f ( Ω) 是 R 中的曲面 .现在不妨也看一个特例 , 设 n = 2 , 于是映射 f 成为
y1 = f1 ( x1 , x2 , … , xm ) ,
y2 = f2 ( x1 , x2 , … , xm ) . (26)
- 1
而 f ( 0) 就是将上式左方的 y1 , y2 换成 0 , 并求其全部解而得 .例如设可从 f1 = 0 , f2 = 0 中解出
x1 , x2 :
x1 = φ1 ( x3 , x4 , … xm ) ,
x2 = φ2 ( x3 , x4 , … , x m ) (27)
- 1
( 下面我们会看到 , 当“最大秩”假设 rank d f (0 ) = n 成立时这总是可以作到的 ) , 由此可见 f ( 0)
是一个 m - n 维“曲面”, 它是 没有“奇 点”的 , 而 (27 ) 是 它的 参数表 示 .到了 这一步 , 下面 就应 考
- 1
虑如何把 f “ 拉平”.办法仍是作坐标变换 .不过现在要在源空间中 作变换了 , 这就 是图3 - 5 - 4
- 1
左侧 , 由下到上是 h , h 当然不会是 线性的 , 否 则它 不会把 弯曲 的 f ( 0 ) 拉直 .但 是 再加 上一 个
n n
向右的非线性的 f , 却成为由直的源空间 R 到直的 靶空 间 R 的 f h .我们 想到 是否可 以通 过
m n
“扩大”靶空 间 , 把 两个非 线性映射 复合成 一个线性 的投影映 射 π: R →R ? 办法和 上面是一 样
m
的“扩大”
: 靶空间为 R , 同时“ 扩大”映 射为 F , 使 F 成为一 个微 分同 胚 , 再作其 逆 h , 然 后再 限
制 F 为 f 即可 .
m n
定理 4( 投影定理 ) 设 f : Ω R →R , 是一 光滑映 射 , Ω 是 0 的一 个充 分小邻 域 , f (0 ) =
m
0 . m≥ n , 若 ( d f ) ( x ) 在 x 附近恒取最大可能秩 n , 则必有由 Ω 到 0 在 R 中的另一邻域的微分
1 46 第三章 微 分 学
图3 - 5 - 4
同胚 h , h(0 ) = 0 , 使得
( f h) ( x1 , … , x m ) = π( x1 , … , xm - n ; xm - n+1 , … , xm ) = ( xm - n+ 1 , … , xm ) . (28)
- 1
它将 f ( 0) = {( x1 , … , x m - n ; 0 , … , 0 )} 零化 .
证 ( d f ) ( x ) 是一个 n× m 矩阵 ,
f1 f1
…
x1 xm
J= … … ,
fn fn
…
x1 xm
设它的后 m - n 列所成的子矩阵
f1 f1
…
xm - n+1 xm
J1 = … …
fn fn
…
xm - n+1 xm
非退化 .现在把靶空间扩大为 m 维空间 ( 在每个向量前面加 m - n 个坐标 ( y1 , … , ym - n ) ) .同 时
把 f 扩大为
x1
…
xm - n
F( x1 , … , x n ) = ,
f1 ( x)
…
fn ( x)
即成为
§5 反函数定理和隐函数定理 1 47
yi = Fi ( x ) = xi , 1≤ i≤ m - n ,
yj = Fj ( x ) = f j ( x ) , m - n + 1≤ j≤ m .
容易看到 F 对 x 之雅可比矩阵是
I 0
,
* J1
m n
它在 x = 0 附近是非退化的 , 而由反函 数定理知 F 在 0 附 近有局部逆 h , 令 π是由 R 到 R 的
m n
投影线性映射 , π: R →R , ( x1 , … , x m - n , x m - n+ 1 , … , xn ) → ( x m - n+1 , … , x m ) , 则 f = π F .从
而
( f h) ( x1 , … , xm ) = ( π F h) ( x1 , … , x m ) = π( x1 , … , xm ) = ( xm - n+1 , … , xm ) .
定理证毕 .
由于定理 2 , 3 , 4 极为重要 , 我们要多花一些功 夫加以 解释 .定 理 3 , 4 都涉 及“ 曲面”, 但是 什
么是曲面我们除了在古典的微积分教本中有不甚明确的描述以外 , 还没有认真讨论过 .这要等到
第七章才知道 , 它们都是某个欧氏空间中的子流 形 .但 现在我 们就 已看到 , 确 定一 个子流 形有 两
n m
个方法 .其一是 R 中的 m 维子流形 ( m < n) , 局部也都是 R 中某点的邻域 Ω 的像 , 所以可以局
部地表示为
yi = fi ( x1 , … , x m ) , i = 1 , 2 , … , n , m < n , (29)
m n
这里 f i 是光滑函数 .而对于 fi 所构 成的 映射 f : Ω R → R , 要求 局部 地适 合最 大 秩条 件 , 即
rank ( d f ) ( x ) = m .但是 ( d f ) ( x ) 即 上述 映射的 雅可 比矩阵 , 所 以 , 最大 秩条 件现 在 是 : 存在 某
一个不为 0 的子行列式 .
f i1 f i1
…
x1 xm
det … ≠0 . (30)
f im f im
…
x1 xm
(30) 表示 (29) 中有 m 个函数{ f i }是互相独立的 , 即不会有例如
f i1 = Φ( fi 2 , … , f i m )
m 1 m
邻域 ω到 R 的 C 映射 g∶ω→R 使得 a ) f g = id 于 f ( 0) 附近 , 即 g 为 f 之局部右逆 , b) g f
= id 于 0 附近 , 即 g 为 f 之局部左逆 ; c) g f = id , 于 0 附近 , 且 f g = i d 于 f ( 0) 附近 , 即 g 为 f
n m
之局部逆 .其 充 要 条 件 是 存 在 一 个 线 性 映 射 A : R → R 使 得 a′) ( d f ) ( 0 ) A = idR n ; b′)
A ( d f ) (0 ) = ( i dR m ; c′) ( d f ) (0 ) A = idR n 同时 A( d f ) ( 0 ) = idR m . a′) 等价于 ( d f ) ( 0 ) 为满 射 ; b′)
等价于 ( d f ) (0 ) 为单射 ; c′) 等价于 ( d f ) (0 ) 为一一映射 , 且 g 在 f (0 ) = 0 附近是唯一的 .
证 .a′) , b′) 与 c′) 之必 要性均可 由链式法 则直接 得出 .所以下 面只证明 它们的 充分性 . c ) 中
g 的唯一性可以从以下事实看到 : 若 g1 与 g2 是存在的 . f g1 = id , g2 f = id 已经得证 .则 g1 =
g2 f g1 = g2 ( f g1 ) = g2 i d = g2 .故 所有左逆 g2 均等于 某一指定的右逆 g1 , 从而 左逆唯一 .
同理右逆也唯一 .因此 , 定理归结为由 a′) 、b′) 证明 g1 、g2 存在 .这可由逐步逼近法完成 .今设 a′)
或 b′) 成立 , 若必要时用 ( d f ) (0 ) 去左乘或右乘 A , 可以假设 ( d f ) ( 0 ) = I .取 δ> 0 充 分小可以 设
1
当‖ x ‖ < δ时‖d f ( x ) - I‖ < .因 此 , 若 x1 , x 2 均在 Bδ2 (0 ) 内 , 由 f 之可微性 , 令 h = x1 -
2
x2 , 有
1
‖ f ( x1 ) - f ( x2 ) - I( x1 - x2 ) ‖≤ ‖ x1 - x2 ‖ . (33)
2
1
故若 f ( x1 ) = f ( x2 ) , 则上式成为‖ x1 - x2 ‖ ≤ ‖ x1 - x2 ‖ , 而当 x1 ≠ x2 时这 就是矛 盾 .因
2
此 , 若 a′) , b′) 成立 , 则 a) , b) 中的 g 若存在必为唯一的 .现在只需证明对任一个 y∈ Bδ2 (0 ) , 一定
xk = xk - 1 + y - f ( xk - 1 ) , k = 1 , 2 , … , (34)
其中 x0 = 0 .于是
δ
‖ x1 - x0 ‖ = ‖ x1 ‖ = ‖ y‖ < .
2
如果已证得‖ x j ‖ < δ, j = 0 , 1 , … , k - 1 , 则
‖ xk - xk - 1 ‖ = ‖ xk - 1 - f ( xk - 1 ) - xk - 2 + f ( xk - 2 ) ‖
1 1 δ
≤ ‖ xk - 1 - xk - 2 ‖≤…≤ k - 1 ‖ x1 ‖≤ k .
2 2 2
因此一方面有
‖ xk ‖≤‖ xk - xk - 1 ‖ + ‖ xk - 1 - xk - 2 ‖ + … + ‖ x1 - x0 ‖ < δ,
一方面又有{ xk } 是一个柯西序列 , 所以有极限 x ∈ Bδ2 ( 0) Bδ ( 0 ) .在 ( 34 ) 中求 极限 即知 f ( x )
= y.
1
余下只需证明 g∈ C .现在 g( y ) 已定义于 Bδ2 (0 ) 中 , 令
g( y ) = x , g( y + k ) = x + h ,
则
k = f ( x + h) - f ( x ) = ( d f ) ( x )・h + o( ‖ h‖ ) .
1 50 第三章 微 分 学
它在 (0 , 0 ) 处的雅可比矩阵是
I 0
J= .
* ( d y f ) (0 , 0 )
- 1 - 1
它自然是非退化的 .于是由 反函 数 存在 定理 知道 φ 在 ( 0 , 0 ) 附 近 存在 : φ [ ( x , f ( x , y ) ) ] =
- 1
( x , y ) .由 f ( 0 , 0) = 0 , 可知 φ( 0 , 0) = (0 , 0 ) , 今证 φ ( x , 0) 就是隐函数 y = g( x ) 的图 ( graph ) .
一个函数 y = g( x ) , x ∈ U , y∈ V 的图 就是 U× V 的一个 子集 {( x , y ) } U × V , 而其 中不 会
含有两个形如 ( x , y1 ) , ( x , y2 ) 的元 ( y1 ≠ y2 ) .即是说同一个 x 不会对应于两个不 同的 y1 和 y2 .
- 1 - 1
这正是函数定义之所以必须的 .φ {( x , 0 )}是隐函数图的证明如下 : φ ( x , 0 ) 是一个 m + n 维
- 1
向量 , 它的 前 m 个 分 量 就 是 ( x , 0 ) 的前 m 个 分 量 x , 若 记 后 n 个 分 量 为 y , 则 φ ( x , 0 ) =
( x , y ) .因此 ( x , y) 由 ( x , 0) 单值地决定 , 从而 y 由 x 单值 地决定 , 不会发 生同 一个 x 对 应于 不
同的 y1 ≠ y2 的情况 .所以 y 是 x 的某个函数 g( x ) 之 值 : y = g( x ) .今证这 就是方 程 ( 36 ) 决定 的
隐函数 .事实上 , 由 φ( x , y ) = ( x , 0 ) , 而 φ之定义给出φ( x , y ) = f ( x , y ) .所以
( x , 0) = φ( x , y ) = φ( x , g( x ) ) = ( x , f ( x , g( x ) ) ) ,
即是说 g( x ) 适合 (36) 式 , 而且由 φ把 (0 , 0 ) 一对一地映为 ( 0 , 0) 知 φ( 0 , g(0 ) ) = (0 , 0 ) , 即 g( 0)
- 1
= 0 .总之我们有{φ ( x , 0) } {隐函数 g( x ) 之图} .
- 1
反过来还要证明{隐函数 g( x ) 之图} {φ ( x , 0) } .事实上 , 若由 ( 36 ) 定 义的 隐函数 存在 ,
记为 g( x ) , 这里 g(0 ) = 0 .则 由 f ( x , g ( x ) ) = 0 有 φ( x , g) = ( x , f ( x , g) ) = ( x , 0 ) .所 以
- 1
( x , g) ∈{φ ( x , 0 )} , 而上述包含关系得证 .
- 1
总结以上所述可知由 φ之逆映射φ 存在且为唯一即知 ( 36 ) 决定的且适合 g( 0) = 0 的隐函
- 1 - 1
数是存在与唯一的 .现在由 φ及 φ 之可微性证明 g( x ) 在 x = 0 附近可微 .由 φ 在 ( 0 , 0 ) 附 近
可微即知
- 1 - 1
( x + h , g( x + h) ) - ( x , g( x ) ) = φ ( x + h , 0 ) - φ ( x , 0 )
- 1
= ( dφ ) ( x , 0 ) h + o( ‖ h‖ ) .
它们后 n 个分量就给出
- 1
g( x + h ) - g( x ) = ( d nφ ) (0 ) h + o( ‖ h‖ ) .
- 1 - 1
这里 ( d nφ ) (0 ) 表示由 ( dφ ) ( x , 0 ) 之后 n 行所 成的 矩 阵所 代表 的线 性映 射 .因 此 g 是 可 微
的 .
k k
与定理 2 一样 , 当 f∈ C 或为复解析时 , g( x ) 也是 C 光滑或复解析的 .
5. 牛顿方法 上面我们提到了反函数问题与 隐函 数问 题都涉 及方 程 f ( x ) = y 或 f ( x , y )
= 0 的求解问题 .定理 2 证明了一个基本存在定理 , 其基础是逐步 逼近法 .实际 上 , 我 们首先是 把
求解方程 f ( x ) = y 的问题化为求映射 x→ y - g ( x ) ( g( x ) = f ( x ) - x ) 的不 动点 , 然后 给出 了
一个迭代程序 .
自 Bρ2 ( 0) 中的任意 x0 开始 ,
. (37)
令 xk + 1 = y - g( xk )
为了证明{ xk } 的收敛性 , 我们看到 d g(0 ) = 0 从而‖ ( d g) ( x ) ‖在 Bρ2 ( 0) 中可以 任意小 ( 这里 用
* * * 1 * * *
的是‖ g( x ) - g( x )‖≤ ‖x - x ‖ ) , 在 这里起了决定作 用 .适合 这种条件的映射 称
2
1 52 第三章 微 分 学
简化牛顿方法 牛顿方法
x0 = 2 x0 = 2
图3- 5- 6
( ex tremum) 相区别 .
m
现在我们要考虑这样一个极值问题 .设在 x0 的某邻域 Ω R 中 定义一个 函数 f ( x ) , 可 是
我们并不是在 x0 的邻域中求 f ( x ) 之极值或平稳值 , 而是在一些补充条件
φi ( x ) = 0 , i = 1 , 2 , … , k (41)
下求 f ( x ) 之极值或平稳值 .当然我们设 x0 适合条件 (41) .这在 物理上是 很自然 的 , 条 件 ( 41 ) 称
为约束条件 ( constrain ts) .如果 k = 1 , 则条件 ( 41 ) 下求 f ( x ) 之极值就是求 f ( x ) 在曲面 φ1 ( x ) =
m
0 上的极值 .这种极值 问 题 称为 条 件 极 值 问 题 .R 中 的 ( m - 1 ) 维 曲 面称 为 一 个 超 曲面 .如 果
m
k > 1 则 (41) 定义一个 ( m - k ) 维曲 面 ( 或者 准确一 些说 是 R 的一 个 ( m - k ) 维 子流 形 ) .当然 ,
(41) 中的 k 个条件应该是独立 的 .曲面、子 流形 等概念 是以 放 在光 滑函 数的 框架 下 处理 最为 方
便 , 因为我们有完整的微分学的理论 作为工 具 .因 此 , 以下 我 们的 目标 函数 f ( x ) 以 及约 束中 的
k ∞
函数均设为光滑函数 ( C 甚至 C , 这一点前面已经说过 , 但是现在不能讨论复值函数问题 , 因 为
复数不能比较大小 , 也就无所谓极值 ) .上面说的“ 独立性”也是不清楚的 .模仿前面关于单射定理
( φ1 , … , φk )
与投影定理的讨论 , 我们把它定义为雅可 比矩 阵 在 x0 附近有 最大 可能 的秩 k .这
( x1 , … , x m )
( φ1 , … , φk )
时自然会有 k < m .不可能 k > m , 一方面是 因为 矩 阵之秩 ≤ min ( m , k ) .同 时 , 一
( x1 , … , x m )
个点 x0 只有 m 个坐标 .所以不可能满足多于 m 个独立的方程 . k = m 也是没有意义的 , 因为 在
x0 附近满足 (41) 中的 m 个方程的点只有一个 x0 , 这是反函数存在定理的简单推论 .有了这样的
约定后 , 我们就可以把 ( 41 ) 中的 k 个函数看成一个映射
m k
Φ: Ω R →R , ( x1 , … , x m ) → ( φ1 , … , φk ) , (42)
- 1 m
于是适合 (41) 之点的集合就是 Φ (0 ) .在最大可能秩的条件下 , 它是 R 的一个 ( m - k ) 维子流
形 Mm - k .且 x0 ∈ M m - k .而所 谓条 件 极 值 问 题就 是 在 ( m - k ) 维 子 流 形 M m - k 上之 x0 附 近 求
f ( x ) 之极值或平稳值 .
一个自然的想法是 , 既然映射 ( 42 ) 在 x0 附近 有最大 可能 秩 k, 我 们可以 假设 雅可比 矩阵 的
k 阶子矩阵
φ1 φ1
…
x1 xk
J= … …
φk φk
…
x1 xk
在 x0 处非退化 , 从而由隐函数定理 , 由 ( 41 ) 可以解出
xi = Ψi ( xk + 1 , … , x m ) i = 1 , 2 , … , k (43)
适合
0 0 0
x i = Ψi ( x k + 1 , … , x m ) .
0 0 m - k
( x1 , … , x m ) 是 x0 的 m 个坐标 .以 ( 43 ) 代入目标函数 , 并记 x′= ( xk + 1 , … , xm ) ∈ R , 我们 会
m - k
得到定义于 x′= x′
0 ∈R 附近的新目标函数
F( x′) = f [ Ψ1 ( x′) , … , Ψk ( x′) , x′] . (44)
§5 反函数定理和隐函数定理 1 55
于是条件极值问题就化成了通常的极值问题 .
但是我们总是想避免应用隐函数定理 , 因为把 ( x1 , … , xk ) 解出成为 x′的函数 (43) 是太困难
了 .好在我们有
m
定理 6 设 Ω R 是 0 的一个充分小的邻域 . f 在 Ω 中光滑 .又设有 ( 42 ) 式定义 的由 Ω 到
k
R 的光滑映射 Φ, Φ(0 ) = 0 , 且在 Ω 中适合最大秩条件 .若 f 在 约束 φi = 0 下在 x = 0 处取局 部
极值 ( 平稳值 ) , 则必存在 k 个常数 ( λ1 , … ,λk ) , 使得
k
d[ f - ∑ λφ ] ( 0) = 0 .
i= 1
i i (45)
Q: ∑
i, j = 1
aij x i xj = 1 , ai j = aji . (48)
写成
Q :〈A x , x〉= 1 , A = ( aij ) . (48′)
m
∑
2 2
现在在 Q 上求一点使‖ x‖ =〈x , x〉= x i 取平稳值例如极大 .这就是一 个条件极 值问题 ,
i =1
2
目标函数是 f ( x ) = ‖ x‖ , ( 48 ) 就是约束条件 , 所以 k = 1 .如果直接应用拉格朗日乘子方法 , 就
应考虑
2
F( x ) = ‖ x ‖ - λ
〈A x , x〉 .
为了说明拉格朗日乘子的意义我们可以把它化为一个对偶问题 .为此令
〈A x , x〉
G( x) = 2 ,
‖ x‖
2
而原来的问题 : 在〈A x , x〉= 1 上求一点 x , 使‖ x‖ →极大 , 现在变成设法去找 x0 使
G( x0 ) → min .
2
如果记 y = x ‖ x ‖ , 则必有‖ y‖ = 1 , 而 G ( x ) 变成
H ( y ) =〈A y , y〉 .
2
易见 H ( y) = G( x ) .求 G( x ) 之极小值 , 就化为在约束条件‖ y‖ = 1 下 , 求 H ( y ) 的极 小值 .关
于 H 的极值问题称为原问题的对偶问题 , 于是我们对
~
2
F ( y ) =〈Ay , y〉 - μ‖ y‖
应用拉格朗日乘子法 , 而有
~ m
F
yi
=0 即 ∑j=1
ai j yj - μyi = 0 , i = 1 , 2 , … , m .
用矩阵表示 , 即
( A - μI) y = 0 . (49)
然后再求 m + 1 个未知数 ( y1 , … , ym , μ) .由线性代数知识可见 , 上式之解中 μ是 A 的特征 根 , y
1
是相应的范数为 1 的特征向量 .回到 F , 则拉格朗日乘子 λ相当于 .而 x 仍表示同 一个特征 向
μ
2
量 , 不过‖ x‖ 不再是 1 .现在 A 是对称矩阵 , 它一定有 m 个实特征根 , 依大小排列为
μ1 ≤μ2 ≤…≤μm .
我们用以上方法求出的拉格朗 日 乘 子就 是 这些 μ 和 相 应的 λ .如 果已 求 出拉 格 朗 日乘 子 λ1 =
1 ( 1) (1 ) (1) (1) (1) 2 ( 1) (1)
, 相应的 x 和 y 记为 x 和 y , 约束条件成为〈A x , x 〉= 1 和‖ y ‖ = 1 . x 和 y 是
μ1
(1) ( 1) (1) (1 )
相应于相同特征根的特征向量 . x 适合〈A x , x 〉= 1 就是 说向量 x 的 两个 端点一 个在 是
0 , 另一端在二次曲面〈A x , x〉= 1 上 .这样一 来 , 原来 的条件 极值 问题 就成为 在此 二次曲 面上 求
一点 .使由原点 ( 即二次曲面的中心 ) 到此点之距离为极大 .以上 所得的结 果就是 : 所求 的 x 是 一
个特征向量 , 而利用 G ( x0 ) → min 知这个距离的平方即特征根的倒数 , 这样求出的特征向量称为
二次曲面的主半轴 .但是有一些特征根为负 , 就表示有 一些主 半轴 之长的 平方 为负 , 这种 主半 轴
就称为虚轴 .
以上我们只求出了一个主轴 , 但实际上有 m 个主 轴 .其 它主 轴可 化为再 附加 另一些 约束 条
件的条件极值问题 , 我们就不在这里讨论了 .
§6 变分法大意 1 57
§6 变分法大意
1. 变分原理 本章一开始 就举 了两 个古 典 的例 子 , 它 们 不但 是 微分 学 历 史上 两 个重 大 例
子 , 确切地体现了微分学的基本思想———舍去高阶 无穷小 , 而 且还 有更深 刻的 含意 : 它们 表现 了
两种不同的方法论 .第一个例子是牛顿对面积速度不变原理 ( 即角动量守恒 ) 的证明 .牛顿把时间
分成一小段一小段 .第一个小段结束瞬间的运动状况 ( 即质点的位置和速度 ) , 即下一小段时间起
始时的初始状况 .如此推演下去即可穷尽这个质点运动的历史 .我们一向认为这是机械论的决定
论的典型表现 .当时 , 科学的发展也只能使人们得到这样的结论 .但是实际情况并不如此简单 .例
如我们在§1 中讨论开普勒三定律 时 , 只讨论 了一 个太 阳对一 个行 星的作 用 .实际 上 其它 行星、
卫星的影响都忽略不计了 .开普勒主要是从对火星的观测中得到的他的三个定律 , 如果他观测的
是金星和水星 , 则比较容易发现天体的实际运动与他所主张的椭圆有不可忽略的差距 .拉普拉斯
与拉格朗日都知道 , 理论上的椭圆轨道会受到“ 微扰”( pert urbation) .到了 19 世纪末 , 庞加莱开始
研究 : 微扰的长期积累的后果会是什么 ? 他的研究汇集成他的名著《天体力学的新方法》, 开辟了
数学的新篇章 .其实后来人们研究得很多的“ 混沌”现象等 等在 这里 都已出 现 .在此 以前 , 牛顿 力
学意味着宇宙的一切从初始时间 , 即上帝的 手作了“第一 次推动”( t he first blow ) 以 后 , 就 一切 都
决定了 , 再无任何变化 .所以说“阳光之下没有新事物”( 这句话源出圣经 ) .用数学的语言表述 , 这
种“机械论的决定论”其实就是微分方程的柯西问题
dx
= f ( t , x) ,
dt
x | t = 0 = x0
的解的存在性与唯一性 .到了 19 世纪末 , 就提出了新问题 : 这些解确实 可以一直 到 t→ + ∞时 都
存在 , 还是在某一时刻 t→ T 就会发现“ 爆破”( blow up) ? 解当 t→ + ∞ 时的渐 近状 况如何 ? 全
局状况如何 ?“机械论的决定论”一定意味着可以精确地计算解吗 ? 随机性是否以某种方式存在
于决定性之中 , 或者二者以某 种方 式相 联 系 ? 总 之 , 现时 人们 对“ 机械 的决 定论”的 习惯 的理 解
中 , 这些问题都没有提出来 .但是自牛顿以来的这种方 法论今 天的 内涵自 非当 年之 可比 .可惜 的
是 , 本书不可能再对此稍作介绍了 .
第二个例子却是另一种方法论的典型问题 .当 费马 研究光 由 A 到 B 的折 射时 , 他遵 循了 另
一种方法论 .当光才离开 A 点后 , 下一个时刻 t 光的位置在哪里 ? 我们现在知道 , 光的“位 置”一
说很不清楚 , 只 能说光的 波前是 以 A 为心 , ct 为半径 ( c 是光速 ) 的 球面 .再往后 , 则 光的波前 上
的每一点都成了次级光源 , 于是再经 过时 间 τ这些 次级 光源 又各 产 生自 己的 波前 : 以次 级光 源
为心 , cτ为半径 的球面 , 把这 些新波 前的包 络找出 来 , 得 到一个 以 A 为心 , c ( t + τ) 为半 径的 球
面 , 是为光在时刻 t + τ的波前 .大家都知道 , 这 就是惠更 斯原理 .它的 出发点是 : 光 是一种 波 , 用
这个方法也可以讨论光的直线行进 , 光的折射反 射 , 但完全 是用 几何方 法 , 主要 是用包 络 .但是 ,
关于光的本性还有另一种学说即粒子说 , 它认为 光的本性 是粒 子 .牛顿虽 然是 粒子 说的拥 护者 ,
但是没有见到谁把牛顿的运动定律用于光的粒子的解说 .代替它 , 费马提出了关于光的传播的最
短时间原理 ( 即费马原理 ) “
: 光在一切可能 的路 径中 必取耗 时最 短的路 线”. 所谓 可能的 路径 即
1 58 第三章 微 分 学
∫
B 2
J= 1 + [ f′( x ) ] d x 2 gf ( x) . ( 1)
0
这里有一个重要的说明 : u 的光滑性与 F 的 光 滑性 极为 重要 , 而且 带来 了数 学分 析 中极 细致 的
问题 .下面我们只讨论这个影响整个数学发展的问题的基本思想 , 关于其技术细节方面则把条件
放得很宽 .请注意 , 读者可能需要从其它文献中找到所 需的细 微的 处理 , 而这 些处 理时常 是很 难
的 .现在则应把注意力放在基本思想上 .
d 3
于是设有 R 中 曲 线 u ( t ) = ( u1 ( t ) , … , ud ( t ) ) .设 u ∈ C ( [ a , b ] ) , F ( t , u , p ) ∈
C ( [ a , b] ×R ×R ) .如果 p = ・
u ( t ) = (・
u1 ( t ) , … , ・
ud ( t ) ) 则 F ( t , u( t) , ・
2 d d
u ( t ) ) 对 t 为 二阶 连
1
续可微 .记 M = { u ( t ) = ( u1 ( t ) , … , ud ( t ) ) ∈ C ( [ a , b] ) , u( a) = A , u( b) = B} , 即 M 是经 过
1
( a , A ) , ( b , B) 两点的 C 曲线之集合 , 这里 a≤ t≤ b 是这些曲线的 参数的变 化域 . M 称为可 容
许函数集 .在 M 上积分 (2 ) 是 有意义 的 , 所以 ( 2) 是 M 上的一 个泛 函 .现在的 问题 是求 M 中 一
个元 u0 , 使 J( u0 ) = min ( 或 平 稳 值 ) , 准 确 些 说 是 要求 J ( u0 ) 在 u0“ 附 近”( 粗 略 地 说 , 即 适 合
・ ・
| u ( t) - u ( t0 ) | 及 | u( t) - u ( t0 ) | 都对 t 一致地很小的函数 u ( t ) 之集合 ) 是 J ( u ) 的极小 值 , 即
局部极小值 .这就是古典的一维变分问题 .一维 , 这 里说一维 是指 M 中之 元是 一维 曲线 , 与上 面
所说变分问题是无穷维空间中的极值问题并不矛盾 .所以也可 以考虑 n 维变 分问题 .这时 (2 ) 中
n d
F = ( x , u , p ) , x∈ Ω R , u∈R , 而 p 是一个 d 维向量的各分量之一阶偏导 数所成的 向量 , 所
nd d nd
以 p∈R .而 F 在 Ω×R ×R 中具有二阶连续偏导数 .
M 中的附加条件
u ( a) = A , u ( b) = B ( 3)
是一组边值条件 .在 n 维变分问题中 , 这个条件要代以 u 在 Ω 上适合的某种条件 , 例如
u| Ω = g , g 是定义在 Ω 上的已知函数 . ( 4)
(3 ) 和 ( 4) 都是所谓的狄利克雷条件 . M 中的边值条件可以是多种多样的 .甚至有 时对 M 中的 元
在边界 ( t = a , t = b 或 Ω) 上可以不加任何条件 .这就是所谓“自由边值条件”.要注意 M 一般 地
说并不是线性空间 .因为边值条 件 ( 3 ) 或 ( 4 ) 一 般都 是非齐 次的 , 因 此 u 中任 意二元 之和 一般 不
§6 变分法大意 1 61
b
d
=∫(F a
u - F ) φd t = 0 .
dt p
( 7)
2
现在要解释一下为什么对 F 及 u 之光滑性作如上的假设 .首先是 F 对其一 切变元 属于 C ,
d d
这样保证了例如 Fp 有意义 .但是 Fp 中含有对 u 的二阶导数 , 而我们只假设了 M 中之元 u ∈
dt dt
1 2
C .为什么不在一开始就规定 M 中的元 u ∈ C 呢 ? 因为这样 M 就太小 , 而在 M 中找我们需要
的解就难多了 .所以数学中为了解决存在性问题 , 考虑的范围以大一点为宜 , 而不能搞“ 武大郎开
店”的办法 .反过来 , 要解决唯一性问 题时 , 武 大郎的 办法 就起作 用了 .症 结在 于适当 选 M .这 就
1
是为什么本节中的 M 中之元 u∈ C .但这样一来就有矛盾 , 这个矛盾的解决即所谓正则性问题 ,
1 62 第三章 微 分 学
下面还要说 , 这些情况在讲到狄利克雷原理时会看得更清楚 .
再往下我们证明一个重要的引理 ( 前面我们 说过 , 数学中 似乎 有一个“ 规矩”, 大凡重 要的 结
果总是称为“引理”的 , 这里又是一例 ) .
引理 1( 变分学的基本引理 .杜・波瓦・雷蒙 D u Bois-Reym ond) 设 H ( x ) 是定义 于 [ a , b] 上
d
的连续 d 维向量值函数 : H: [ a, b] →R .若对一切 适合 φ( a) = φ( b) = 0 的连续 d 维向 量函 数
φ( x ) 均有
b
∫ H ( x ) φ( x ) d x = 0 ,
a
则必有 H ( x ) ≡0 于 [ a , b] 上 .
证 用反证法 .设 H ( x ) 有一个分量 H1 ( x ) 在 x0 ∈ ( a , b) 处为 正 , 则 必可选 δ> 0 充分小 ,
使 ( x0 - δ, x0 + δ) ∈ [ a , b] , 而且 H1 ( x ) 在 ( x0 - δ, x0 + δ) 中仍为正 .今取 φ( x ) = ( φ1 ( x ) , … ,
φd ( x ) ) 如下 :
0 , | x - x0 | ≥δ,
φ1 ( x ) =
正 , | x - x0 | < δ,
φi ( x ) = 0 , i = 2 , … , d .
于是一方面由假设
b
∫ H ( x ) φ( x ) d x = 0 ,
a
另一方面
x +δ
0
b
∫ H ( x )φ( x ) d x = ∫ H
a
x +δ
1 ( x ) φ1 ( x ) d x > 0 .
0
这个矛盾证明了引理 .
把这个引理用于 (7 ) 式即有
定理 2( 极值函数的必要条件 ) 设 F( t , u , p) 及 M 已如上述 .若 u ( t ) 使 J ( u ) → min .则 必
有
・ d ・
Fu ( t, u , u ) - FP ( t , u , u ) = 0 . ( 8)
dt
(8 ) 式是 一 个 二 阶 常 微 分 方 程 组 , 称 为 上 述 变 分 问 题 的 欧 拉—拉 格 朗 日 方 程 组 ( Euler-
Lagrange, 以下简记为 E - L 方程组 ) .
1
上面已经提出了一个问题 , 即 M 中的元 u ∈ C , 则它怎么可能满足 二阶的 E— L 方 程组呢 ?
2
这里有以下的有 关 正 则 性 的 结 果 : 如 果 F 关 于 其 各 个 变 元 是 C 的 , 而 且 适 合 以 下 的 勒 让 德
2
( Legendre) 条件 det [ Hess p F( t , u ,ρ) ] ≠ 0 , 则若 u ∈ M 使 J( u) →min ., u 必属于 C , 而且在古典
意义下 ( 即按通常 微积分教 本的意 义 ) 满足 E—L 方 程组 (8 ) .这 个结果并 不困难 .有的 书上把 它
归功于希尔伯特 , 而希尔伯特本人与柯朗特合写的名著《数学物理方法 , Ⅰ》第四章中又将它归功
于杜・波瓦・雷蒙 , 且 证法 完全 相同 ( R .Courant and D .Hilber t, Met hods of Mat hematical P hysics ,
Vol .1 .p .2 00 ) , 但是只限于一个自变量 t .多个自 变量时 正则性问 题是一 个十 分严 重的问 题 , 下
面讲到狄利克雷原理时会稍加介绍 .但无论如何 , 我们 不把注 意力 放在这 类问 题上 , 而来 看一 下
§6 变分法大意 1 63
捷线问题是怎样解的 .
前面已说过 , 对于捷线问题 , 由 (1 )
1
x 2
1 + [ f′( x ) ] 2
∫
B
J= dx .
0 2 gf ( x)
于是相应的 F 是
・ 2
F( t , u , u ) = 1 + [ f′( x ) ] 2 gf ( x) . ( 9)
・
不过 ( t , u , u ) 换成了 ( x , f ( x ) , f′( x ) ) .
一般说来 , 求解一个 E L 方程并非易事 , 不过在 (9 ) 这 个特例下 F 不 显含自变 量 t ( 即现 在
的 x ) .这样 , 我们可以得出
d ・ ・・ ・d ・ ・・
( u Fp - F) = u Fp + u Fp - Fu u - Fp u
dt dt
・ d
= u( F - Fu ) = 0 .
dt p
因此
・ ・ ・
F( u , u ) - u Fp ( u , u ) = C . (10)
有一些解常微方程经验的读者都会知道 , 我们 得出了方 程 ( 8 ) 的一个 初积 分或 称首次 积分 .
每一个初积分就是一个守恒律 .有了一个初积分就可以把方程降低一阶 .例如 (10) 就表明其左方
的函数 ( 这是一个物理量 ) 在 E— L 方程的积分曲线 ( 这是一个轨道 t→ u( t ) ) 上守 恒 .因 此 , 找 出
一个初积分在物理上与数学上有重大的意义 .在§1 中我们就 指出 , 开普勒 的三定律 就是关于 太
阳和一个行星的牛顿运动方程的解及其性质 .其实 , 求解这组运动方程的方法也是去找它的初积
分 .其中之一是面积速度 ( 开普勒 第二定 律 ) , 它就是 角动 量守恒 定律 ( § 1 .定理 2) , 然后 再利 用
定理 4 所表述的能量守恒 .那么 怎样看 出有 守恒 律呢 ? 关 键在 于 F 在某些 变换 下有 不变 性 , 即
对称性 .这个例子中 F 中不显含 t 就 是一 种对 称性 .发 现一 个 力学 系统 的守 恒律 与 对称 性的 联
系是德国女数学家爱米・诺特 ( E .N・o・t her , 1882— 1935 ) 的卓越贡献 .
再回到 (10) .把 F 的表达式代入其中 , 把 2 g 并入 常数 C , 并且改 一下 记号 , 我们 有 ( 用 y 表
f( x))
2 2
1 + y′ y′ 1
- 2
=
y y 1 + y′ C1
化简后有
2 C1 - y
y′ = .
y
C1 C1
作一个变换 y = ( 1 - cos u ) , y′= u′sin u , 代入上式得
2 2
C1
( 1 - cos u) d u = ± d x ,
2
对 u 积分后有
C1 C1
x= ( u - sin u ) + C2 , y = ( 1 - cos u ) .
2 2
1 64 第三章 微 分 学
我们要求捷线过 A ( 原点 ) 与 B .为使它过原点 , 应有 C2 = 0 , 故
C1 C1
x= ( u - sin u) , y = (1 - cos u) . (11)
2 2
C1 由 B 之坐标决定 , 但是 (11) 正是以 u 为参数的旋轮线 ( cycloid) 方程 .
旋轮线是一个非常重要的曲线 .在大约与伯努利研究捷线问题差不多的时间 , 惠更斯也研究
过所谓等时曲线 ( tau tochrone ) 问题 , 所谓等时曲线 L 是这样一条曲
线 : 任一质点在重力作用下沿 L 下 滑 , 不论起 点 A 位 置何 在 , 滑到
最低点 B 所需 的时间 总是相同 的 ( 图 3 - 6 - 3 ) .惠更斯 证明了 , 等
时曲线也一定是旋轮线 , 正是因为这个原因 , 旋轮线又称摆线 .旋轮
线还有许多其它的有趣性质 .
3. 最小作用原理 变分 学中 有许 多 很细 致的 问 题 , 需 要 作相
当艰难的数学处理 .下面 我们 将不涉 及这 类问 题 , 而介 绍 它在 数学
其它分支与数学物理中的一些应用 .对每一个应用我们又都 只能开
一个头 , 因为深入下去一 步就 会进入 柳暗 花明 又一 村的 境 地 , 只有 图3- 6 -3
求助于专门著作了 .
首先是力学系统的基本规律可以用变分原理来表述 .力学系统在我们这里就指一个质点组 ,
这个质点组可以是有限的 , 例 如有 N 个 质 点 , 第 i 个 质 点的 质 量 为 m i , 位 置为 ( xi ( t ) , yi ( t ) ,
・ ・ ・ 3 N
zi ( t ) ) , 速度为 ( x i ( t ) , y i ( t ) , z i ( t ) ) .在每一 时刻 , 这 N 个质点 的位置可 以用 Rx 中的 一个 点
( x1 , y1 , z 1 ; … ; x N , yN , z N ) 来表示 .它们的集 合称 为构 形空间 ( configuration space ) .它们 的速 度
3 N 3 N 3 N
也是另一个 Rv 空间中的一个点 ( u 1 , v1 , w 1 ; … ; uN , v N , w N ) .我们称 Rx ×Rv 为这个质 点组
的相空间 ( phase space ) .注意 , 时间总被认为是一个独立的 参数 , 而不进 入相空间 中 .但是这个 质
点组可能受一定的约束 .力学中的约束是多种多 样的 .例如考 虑一 个骰子 在碗 里的 运动 , 如果 把
骰子看成一个质点 , 则其三个坐标不会是独立的而要适合这个碗的曲面方程 .所以 , 一般情况下 ,
3 N
一个力学系统的构形空间不一定是 Rx , 而可以是一个维数较低的“曲面”( 准确些说 是一个微 分
・ ・
流形 ) M .它的各点的局部坐标我们写成 ( q1 , … , qN ) , 称 为广义坐 标 , 而 ( q1 ( t ) , … , q N ( t ) ) 称 为
3 N
广义速度 .广义速度之空间 ( 相应于 Rv ) 就 是 M 的切空 间 , 这些 概念 我们将 在第 七章中 详细 讨
3 N
论 .但不论如何 , 时间 t 总是在相空 间以 外的 独立 参 数 .需要 提醒 的 只有 一件 事 , 在 Rx 的情 况
下 , 例如 ( x1 , y1 , z1 ) 都是同 一个 质点 的三 个 坐标 , 因而 相 应于 同 一个 m1 .现 在 就不 一 定了 .因
此 , 我们就直接写 m1 , … , m N ( 如果有必要的话 ) , 而 m i 与 m j 可能代表同一个质点的质量 , 也可
能代表不同质点的质量 .
牛顿把整个力学建筑在他的三个定律上 .而且 , 正如 他在《原 理》一书 中所 说的 , 他要 尽可 能
完全地仿照欧几里得的方法论 , 所以专门在全 书之首写 了两节 , 一是“ 定义”.
“定 义”了何 谓物 质
的量 ( 即质量 ) 、运动 ( 其实是动量 ) 、惯性、外力……然后第二节是“ 运动的公理或定律”, 把三大定
律分别记为定律Ⅰ , Ⅱ , Ⅲ , 即全部公理只有这三条 .其它一切 , 甚至力的平行四边形定律都是“ 推
论”.牛顿说“
: 迄今为止我叙述的原理已为数学家所 接受 , 也得 到大量 实验 的验 证”.因 此 , 其“ 真
理性”应是无可置疑的 ( 其实牛顿并不那么简单从事 , 他本人对这个体系中的许多问题 , 如绝对空
§6 变分法大意 1 65
极值问题 .由定理 2 有
d L L
・ - = 0, j = 1 ,2 , … , N, (14)
dt qj qj
( i)
qj ( ti ) = q j , i = 1 , 2 .
(14) 称为拉格朗日方程 .从数学上说 , 问题已经完全清楚了 , 但是从物理上说 , 拉格朗日函数究竟
是什么还完全不清楚 , 甚至什么是质量 , 什么是能量也 完全没 有谈 .在 拉格朗 日改 进莫培 督的 工
作时 , 他从一些特例发现 ,
L = T - V, (15)
T 与 V 分别是动能与位能 .而在朗道的著作中则从时间与空间的均匀性以及运动方 程在任何 惯
性系中应该有相同形式出发 , 首先指出 , 对于一个自由粒子
・2 ・2 ・2 ・2
L = αv = α( x + y + z ) .
m 1 ・2
于是记 α= , 并称 m 为质量 , m v 为动 能 .如 果是 考虑 质点 组 , 若 一个 力学 系统 由 A 和 B
2 2
1 66 第三章 微 分 学
d L L d 2・ V
・ + ≡ m ( r θ) + =0 .
dt θ dt θ
θ
d 2・
特别重要的是位能 V 不依赖于θ, 这时我们得到有心力场 , 而上 面第二 个方程成 为 ( r θ)
dt
= 0 亦即
2 ・
r θ= const .
但是这就是面积速度 ( 亦即角动量 ) 守恒 , 所以我们十分简洁地得到了开普勒第二定律 .
L L
我们要介绍一 个 重 要 的 概 念 .即 定 义 一 个 力 学 系 统 的 广 义 动 量 是 p = , … , =
・ ・
q1 qN
q L .这与牛顿力学中动量 = 质量×速度不同 , 广义动量 ≠质量 ×广 义速度 .如果 拉格朗日 函
grad・
N
・ ・・ ・
数 L = T - V , 而动能 T 是 q 的二次型 : T = ∑
i, j = 1
gi j ( q) q i q j , gi j = gji , V = V ( q) 与 q 无关 ( 我 们
m1
由此可见 , 仅当 ( gi j ) 是对角矩阵 , 即 ( gi j ) = w 时 , 我们才能得到与
mN
1
动量 = 质量×速度 , 速度 = ×动量
质量
“一样”的关系式
・ ・ 1
pi = m i qi , qi = p , (20)
mi i
・
否则只能得到矩阵关系式 ( 18 ) 、(19) .实际上 , 广义动量 p 与广义速度 q 、广义坐标 q 是性质不同
的向量 , 二者之间有一个对偶关系 .我们将在第七章中详细讨论这个区别 .这样 , 要描述一个力学
・ ・
系统应该给出 q与 p 用 ( p , q) 的表达式 .这正是哈密顿力学需 要解决的 问题 .现在我 们只看到 一
L 2・
个事实 : 上面的例子中 L 中不含θ, 于是相 应于 θ的广义动量分量 ・ = mr θ守恒 , 从而得到 角
θ
动量守恒 .一般说来 , 若拉格朗日函数 L 中不含某一个广义坐标例如 qj , 则 拉格朗日 方程将给 出
d L
= 0 , 从而相应于 qj 的广义动量必守恒 .这种 L 中不显含的坐标称为循环坐标 ( cyclic coor-
dt ・
qj
dinates) , 只要找到了一个循环坐标就 会得到 一 个守 恒律 p j = const .前面 已经 说过 , 找到 一个 力
学系统的守恒律对研究这个力学系统有重大的意义 .这样一些在牛顿力学中不易得到的关系 , 在
以最小作用原理为基础的拉格朗日力学与哈密顿力学中却是显而易见的结论 .尤其重要的是 : 这
1 68 第三章 微 分 学
些结果在物理学其它分支中同样很重要 .
4. 测地线 现在提出另一个问题 : 在曲面 S 上有两点 A , B 怎样找出连接 A , B 两点的最短
m
的曲线 ? 首先的问题是 , 曲面 S 上如何定义长度 ? 仿照上一节 , 我们把曲 面规定 为由源空 间 R
n
中的开集 Ω 到靶空间 R 中的一个光滑的映射 , 如果用局部坐标来表示 , 就是
φ: yα = φα ( x1 , … , x m ) , α= 1 , 2 , … , n . (21)
以下我们规定 : 若用拉丁字母如 i, j 等作下标 , 总是由 1 变到 m 而与源空间中的坐标维数一致 ;
若用希腊字母如 α,β等作下标 , 则由 1 变到 n 而 与靶空 间的 坐标 维数一 致 .( 21 ) 适合最 大秩 条
2
件 .我们还规定这些函数属于 C ( Ω) , 而不去设法减少其光滑性的要求 .在靶空间中 , 弧长
n
∑
2 2
ds = d yα ,
α= 1
如果限制在 S = φ( Ω) 上 , 就给出了其上的弧长为
n m n m
φα φα φα φα
∑∑ ∑∑
2
ds = d x i・ d xj = d x i d xj
α= 1 i, j = 1 xi xj α= 1 i, j = 1 x i xj
m
= ∑
i, j = 1
gij d x i d xj , (22)
这里
n
φα φα
gi j ( x ) = ∑
α= 1 xi x j
. (23)
b m
1 ・・ ・ d xi
JE R ( C) =
2 ∫∑ a i, j = 1
gij ( x ) x i x j d t , x i =
dt
(25)
b
= 2 ( b - a)・ E( C) .
于是等号成立时 , 参数 t 恰好就是弧长 .这时 L ( C ) = b - a , 于是 (26) 给出
L ( C) = 2 L ( C)・ E( C) 即 L ( C) = 2 E( C) . (27)
1
引理 3 中我们限制了只讨论 C 曲线 .前面在讲到可容许函数集时 , 总是作这样的假设的 .
引理 3 告诉我们 , 为了求 L ( C) 的极 值曲 线 , 最好是 求 E ( C) 的极 值曲线 , 因 为 在以 弧长 为
参数时 , 能量的极值即弧长之极值 .这样 , 我们就可以对 E( C) 求其 E - L 方程如下 :
m m
・・ ・
・ ∑
i, j = 1
gi j x i x j = 2 ∑ gi k x i ( 注意 g ik = gki ) ,
i=1
xk
m m
・・ gij ・ ・
xk ∑
i, j = 1
gij x i x j = ∑
i, j = 1
x x .
xk i j
注意到 gij ( x ) 中不含 t , 就有
m
・・ m
gik ・ ・ ・・
m
d
dt ・ ∑ gij x i x j =2 ∑ xj
x i x j + 2 ∑ gik x i .
x k i, j = 1 i, j = 1 i=1
ij - 1
和前面一样 , 用 ( g ) 表示 ( gij ) , 则 E - L 方程成为
m
1 ・
・ gik gi j ・ ・
∑
kl
0 = xl + g 2 - xi xj
2 i, j, k = 1 xj xk
m
・
・1 kl gik gjk gij ・ ・
= xl +
2 ∑
i, j, k = 1
g
xj
+
xi
-
xk
xi xj .
引入著名的克里斯托费尔 ( Christoffel ) 记号
m
1 gik gjk gij
∑
l kl
Γ = ij g + - , (28)
2 k=1 xj xi xk
则 E - L 方程成为
1 70 第三章 微 分 学
m
・
・ l ・・
xl + ∑
i, j = 1
Γij x i x j = 0 , l = 1 , 2 , … , m . (29)
它还是 L ( C) 的 E L 方程 .我们给出
定义 1 ( 30 ) 的解称为 S 关于度量 ( gij ) 的测地线 . ( 29 ) 则称为关于能量的测地线 .
当 t 即 s 时 , 这两种测地线是一致的 .
5. 狄利克雷原理 ( Dirichlet principle) §4 中讲 到解析 函数 时曾 提到黎 曼的 解析函 数理 论
是一个几何理论 , 而它是与黎曼关于静电场理论的研究密切相关的 .如果我们把牛顿关于力学的
理论看成人类对自然规律的认识 , 特别是物理学的第一次伟大的综合 , 则麦克斯韦的电磁理论毫
无愧色的是物理学的第二次大综合 .也正如牛顿 力学是一 个时 代的 产物一 样 , 在麦 克斯韦 之前 ,
许多数学家和物理学家都极为关注电磁现象 , 其中就包括黎曼 .黎曼甚至考虑过电与引力的统一
问题 .当时 , 黎曼关心的是静电场问题 , 这与法拉第—麦克斯韦的电磁理论 ( 其中涉及电场和磁场
的动力学问题 ) 是不同的 .关于静电场 , 黎 曼时 常引述 狄利 克雷 的如下 论述 : 平 面区 域 Ω 中的 拉
2 2 2 2
u u u u
普拉斯方程 2 + 2 = 0 的 适合 边 值条 件 u = g 的解 , 必使 + d xd y →
x y Ω Ω x y
min ( 准确些说是平稳值 ) .这个积分 ( 现在称为狄利克雷积分 ) 表示静电场的位能 , 而 从物理的 观
点看来 , 如果在 Ω 上放置一些电荷而使电场的电 位 u 适合 u | Ω = g , 则这些 电荷 的分布 必然 是
使位能达到极小时才能稳定下来 , 而一旦电场稳定了以后 , 它必然适合Δ u = 0 .其实在 19 世纪中
叶就已经有许多数学家和物理学家理解到这一点了 , 狄利克雷并非第一人 .狄利克雷原理的称号
是黎曼给的 .
现在我们来证明狄利克雷积分
2 2
u u
D( u ) = + d xd y (31)
Ω x y
在可容许函数类
-
M = { u , u 在 Ω内适当光滑 , u | Ω = g}
中的 E - L 方程正是拉普拉斯方程 .和前面一样 , 考虑
2 2
D ( u + λφ) = [ ( ux + λφx ) + ( uy + λφy ) ]d xd y,
Ω
( ux φx + u yφy ) d xd y = 0 .
Ω
应用格林公式 , 有
Ω
( u x φx + uy φy ) d xd y = ∫ [ u cos( n , x ) + u cos( n , y ) ] φd x -
x y
Ω
Δu・φd xd y .
Ω
Δ u・φd xd y = 0 .
Ω
用变分法的基本引理 ( 它对高维情况也是成立的 ) 即得
Δu = 0 . (32)
所以上述变分问题的解也就给出了 (32) 的狄利克雷问题 ( 就是再附加边值条件 u | Ω = g) 的解 .
以上我们对 M 中的函数所应有的光滑性以及 Ω 的光滑性 都有意 地模糊了 , 而 其实这正 是
关键所在 .
那么如何去找 u0 ∈ M 使 D( u0 ) → min 呢 ? 从 ( 31 ) 看到 D( u ) ≥ 0 , 所 以inf D ( u ) 必 存在 .可
M
就此给出了反例 , 大体如下 : 令
1 2
du
∫
2
I( u) = t d t,
- 1 dt
M = { u = u( t ) , u( t ) 在 [ - 1 , 1 ] 上连续可 微而且 u( - 1 ) = - 1 , u (1 ) = 1} .当然 I( u ) ≥ 0 .今 证
t 1 d uε
inf I( u ) = 0 .任 取 ε> 0 并 令 u ( t ) = uε ( t ) = arctan arctan .很 明 显 uε ( t ) ∈ M , =
M ε ε dt
1 1 ε 1
・ 2 = , 所以当 ε→ 0 时 ,
1 t + ε2
2
1 t
εarctan arctan
ε 1+ ε ε
2 2
ε
1 1
d uε dt
∫ ∫
2 2
I( uε ) < ( t +ε ) = 2 2 2
- 1 dt 1 - 1 t +ε
arctan
ε
1
= 2ε arctan →0 .
ε
1 2
d u0
∫
2
这就表明inf I( u) = 0 .但这个下确界是不能达到的 .因为若 I ( u 0 ) = 0 , 应有 t = 0 .因
M - 1 dt
2
d u0
此 ≡0 而 u 0 ≡const .但是常值函数不可能适合边值条件 u( ±1) = ±1 .
dt
2 2
所谓直接方法还有另一个困难 , 下面是阿达玛举出的例子 : 设 Ω 是单位圆 x + y < 1 . M 中
的边值条件是
∞
1
u| Ω = u( 1 ,θ) = ∑
n= 1 n
2 cos( n ! θ) . (33)
上式右方的级数是一致收敛的 , 因此代表一个连续函数 .
1 72 第三章 微 分 学
之实部 , 而这个级数又是
∞ ∞
1 n! 1 n ! i n !θ
∑
n= 1 n
2 z = ∑ n=1 n
2 r e
-
就在 Ω 内调和 , 在 Ω上连续且适合边值条件 ( 33 ) , 即为阿达玛例子之解 .现在我们来计算它的 狄
2 2 2 2 2 -
利克雷积分 .注意到 , 由 C—R 方程 u x + u y = u x + v x = | ux + i vx | = f′( z ) f ′( z ) .所以
2 -
D ( u) = | f′( z ) | d z = ρ→
lim1 f′( z )・ f ′( z ) d z
| z| < 1 | z | ≤ ρ≤ 1
∞ ∞
( m - 1 ) ! m ! - 1 i( m ! - 1) θ ( n - 1) ! n ! - 1 - i ( n ! - 1 ) θ
= ρ→
lim1 2π r∑ r e ・∑ r e d rdθ
| z| < ρ m= 1 m n= 1 n
ρ 2 ∞ 2
[ ( m - 1 ) !] 2 m ! - 1 [ ( m - 1) !] 2 m !
= ρ→
lim1 2π ∫ 0
∑
m
2 r lim1 2π ∑
d r = ρ→
m =1 2m ! m
2 ρ
∞
m !
= 2π∑ 4 = + ∞ .
m=1 2m
i kθ
这里在对 θ积分时要利用{e }之正交性而发现 只余下 m = n 的 各项 .要把lim 移 到求和 号下 要
ρ→ 1
一些特别的技巧 , 我们略去了而只写出结果 .
这就是告诉我们 , 这个解没有有限的 D( u ) .所以不可能从 inf D ( u) 中找到它 .
尽管这个方法有许多缺点 , 但是它是如此有说服力 , 所以人们一直努力“挽救”它 .到 1901 年
才由希尔伯特完全地证明了狄利克雷原理 .为此 , 他附加了一个条件 : M 中 一定能找 到一个函 数
u 适合其边值条件 , 而且使 D ( u ) < + ∞ .这 显然 是针对 阿达 玛 的例 子而 来的 .这 里 的过 程大 体
如下 : 先看极小化序列{ uk } .至少要找到一个收敛的子序列 , 不 妨假设就 是{ uk } , 不 但使 hlim uk =
→∞
uk u0 uk u0
u0 , 而且使得 klim = , klim = , 还 使得 k→
lim∞ D ( uk ) = D ( u0 ) .这就 要求 在 积分 号下 和
→∞ x x →∞ y y
微分号下求极限 , 我们的经验告诉我们这已经是很困难的事 .但这还没有完 , D ( u0 ) 中只 出现 u0
的一阶导数 , 狄利克雷问题则涉及 u0 的二阶导数 , 那么极限函 数 u0 是 否有这 样高的正 则性呢 ?
在最简单的一维变分问题中 , 我们指出了有希尔伯特的正则性定理 .在高维情况下也有这样的结
果 .但是为了要完满地回答这些问题 , 我们就要推广导数的理论 , 推广积分的理论 , 推广收敛性的
理论 .可以说是风云际会 , 在 20 世纪二三十年代一大批数学家 , 其中突出的有前苏联的索波列夫
( S .L .Sobolev) , 完成了这个任务 .可以说 这是 现代 分析数 学突 出的一 章 .附带 说一 下 , 索 波列 夫
又把自己最重要的结果称为“引理”, 不过一般人 却称之为 嵌入 定理 .这里 涉及 的问 题 , 我 们将 在
以下几章中部分地讨论 .正因为如 此 , 我们 现在就 对 M 中 函数的 光 滑性 与 Ω 的 光 滑性 略去 不
§7 不可求导的函数 1 73
讲 , 而有意地模糊了 .
以上我们举了三个例子 , 看见了变分学所开辟 的三个 广阔 的新 天地 .可惜 , 每 一个例 子的 参
考文献都是篇幅巨大的大著 .
§7 不可求导的函数
这一节只是一个简单的介绍和一些可以争论的议论 .
我们首先讨论两件似乎无关的事 : 第一件是回顾一下 19 世纪中分析数学发展的困难是怎样
解决的 .第二件是 19 世纪末 , 20 世纪初物理学中的一件大事 .
我们时常说 19 世纪是分析数学中注入了严密性的时代 .这个时代的一位有重大贡献的代表
性人物阿贝尔在 1826 年说过 “
, 人们在分析中确实发现了惊人的含糊不清之处 .这样一个完全没
有计划和体系的分析 , 竟有那么多人能研究过它 , 真是奇怪 .最坏的是 , 从来没有严格地对待过分
析 .非常奇怪的是这种方法只导致极少几个所谓 悖论”( 引 文转引 自克莱 因《古今 数学 思想》中 译
本 , 第四 卷 , 40 章 .上海 科技 出版 社 , 1981 年出 版 ) .阿贝尔 这样 说是 很自然 的 , 即以 函数 概念 为
例 , 我们认识函数确实是由我们的感觉经验而非 严格的公 理化 定义 开始的 .但 是 , 这种感 觉经 验
与大自然的规律符合到何种程度 ? 它归根结蒂是不是 也只是 某种 观测仪 器给 我们 的经验 曲线 ?
人们总是不自主地想对“函数”加上种种限制 .人们最容易接受的首先是连续性 , 连续性局部地看
b
度理论的首创者之一 ) 的一篇评论 “
: 分子理论及其数学”, 可惜无法找到原文 .布朗运动的重要性
早就不限于研究花粉的随机活动 , 而在随机现象的数学与物理理论乃至金融理论中都极为重要 ,
而几乎所有布朗运动的轨道又都是处处不可求导的函 数 .当 然这 不是 说不可 求导 函数的 研究 都
正是这些“实际需要”的“期货”.这样说 , 不仅不真实 , 而是不 严肃 .到了 20 世纪 70 年 代末、80 年
代初 , 数学中出现了所谓分形几何学的研究 , 指出处处 没有切 线的 曲线等 等 , 在大 自然中 是十 分
普遍而且重要的 .分形几何学在数学中也有长久 的源流 , 与许 多数 学分支 有关 , 所 以我们 没有 力
量去涉及有关的问题 , 而只想指出 , 正是由庞加莱开创 的天体 力学 的研究 中 , 在研 究天体 运动 轨
道的渐近状况时 , 就会出现构造极为奇特的集合 .分形理论与它有密切关系 .可见 , 数学走到了这
一步 , 这种严格化、公理化的倾向其实标志了对大自然 探索的 深化 .正 是庞加 莱自 己的研 究不 但
不是“为了指出我们祖先推理的错误”, 反而证明了这种批判性的态度的远见 .更令人吃惊的是布
朗运动的轨道确与魏尔斯特拉斯的构造的不可求导的连续函数颇为相近 !
魏尔斯特拉斯构造的函数是
∞
∑
n n
f ( x) = b cos( a πx ) , - ∞ < x < ∞ , 0 < b < 1 . ( 1)
n=0
图3 - 7 - 1
下面把这些讨论“数学地”讲明白 .
k 2k+1 n+ 1 k 2k+1
首先看 Tn ( x ) 的 零点 xn = n .其中 k 是 整数 .这时 a xn = a 也 是一个 奇数 的
2a 2
k n+ 1 n+ 1 k n+ 1 2k+ 1
一半 , 所以 Tn + 1 ( xn ) = b ・cos( a xnπ) = b cos aπ = 0 .所以 T n ( x ) 的零点 一定 是
2
T n + 1 ( x ) , T n + 2 ( x ) , … 的 零 点 , 但 不 一 定是 T0 ( x ) , … , T n - 1 ( x ) 的 零 点 .在 函数 ( 1 ) 的 图 像 中
k
T n ( x ) 的零点总是把 Tn + 1 ( x ) , Tn + 2 ( x ) , …的零点纠合在一起 , 所以我们称 x n 为 f ( x ) 之结点 .
并以
§7 不可求导的函数 1 77
2k+ 1
N= n , k = 0, ±1, ±2, … , n = 0, 1, 2, …
2a
记结点之集合 , 我们看到
引理 1 N 是 R 的一个可数的稠密子集 .
~ k n+1 ~ k ~ k
k n k n
再看 T n ( x ) 之极值点 xn = n , k 是整数 , 这时 a xn = ak 故 T n ( xn ) = b cos kπ= ( - 1 ) b
a
~ ~
k n+ 1 k n+1 k
是 Tn ( x ) 之极大 ( 小 ) 值 , 而 Tn + 1 ( xn ) = b cos akπ= ( - 1 ) b , 故 xn 也使 T n + 1 ( x ) 达 到极 大
~
k
( 小 ) .而且与 Tn ( xn ) 有相同符号 , 所以极值点也是纠结在 一起的 , 不会 互相抵消 ; 又 因为各有 不
~
n k
同因子 b , 0 < b < 1 , 求和以后也不会变为正负无穷 .我们称 xn 为 f ( x ) 的峰点 , 并以
k
M= n , k = 0 , ±1 , ±2 , … , n = 0 , 1 , 2 , …
a
记峰点之集合 , 也很容易看到
引理 2 M 是 R 的一个可数稠密子集 .
现在来证明函数 ( 1 ) 处 处没有导 数 .为此任取 一点 x0 并记 ( 1 ) 在 x0 之 值为 y0 = f ( x0 ) , 并
α α+ 1
且考虑 Tn ( x ) . x0 必在 T n ( x ) 的两个峰点之间 ; 即有一个整数 α使 n ≤ x0 < n .在这两个峰
a a
αn
点中取更接近 x0 的一个为 n ( 若 x0 是中点 , 则取左方的一个 ) , 则有
a
1 αn 1 1 n 1
- n < x0 - n ≤ n ,或 - < a x0 - αn ≤ . ( 4)
2a a 2a 2 2
αn αn - 1 αn + 1
n 也有两个相邻峰点 x′= n , x″= n .令函数在这两点上之值为 f ( x′) = y′, f ( x″) = y″,
a a a
于是得到两个差商
y′- f ( x0 ) y″- f ( x 0 )
, . ( 5)
x′- x0 x″- x0
为了证明 f ( x ) 在 x0 没有导数 , 只需证明当 x′, x″→ x0 时 , 上述两个差商没有相同极限 , 也不 趋
向同号的无穷大 .具体说来 , 我们要证明
引理 3 若 0 < b < 1 , a 为大于 1 的奇数且
3
ab > 1 + π, ( 6)
2
则 (5 ) 中的两个差商不可能有相同的极限 , 也不趋向同号的无穷大 .
n 1
证 记 x n + 1 = x0 a - αn , 由 ( 4) 有 | x n + 1 | ≤ , 而且
2
n
αn - 1 - x0 a 1 n 1
x′- x0 = n = n [ - 1 - ( x0 a - αn ) ] = n ( - 1 - xn + 1 ) ,
a a a
n
αn + 1 - x0 a 1 n 1
x″- x0 = n = n [1 - ( x0 a - αn ) ] = n (1 - xn + 1 ) .
a a a
因为 a > 1 , 故当 n 充分大时 , | x′- x0 | 与 | x″- x0 | 皆可任意小 .
再注意到
1 78 第三章 微 分 学
n- 1 ∞
m m m m
f( x) = ∑
m =0
b cos( a πx ) + ∑
m= n
b cos ( a πx )
= S n - 1 ( x ) + Rn ( x ) .
所以
n- 1 ∞
∑ ∑b
m m m m - n
f ( x′) = b cos( a πx′) + cos[ (αn - 1) a π]
m= 0 m= n
n- 1 n- 1
α ν
∑ ∑
m m n
= b cos( a πx′) - ( - 1) b n
b ,
m= 0 ν= 0
n-1 ∞
m m m m - n
f ( x″) = ∑m= 0
b cos( a πx″) + ∑b
m= n
cos[ (αn + 1) a x]
n-1 n-1
α ν
∑ ∑
m m n
= b cos( a πx″) - ( - 1 ) b n b .
m= 0 ν= 0
m- n m - n α ±1
注意我们这里利用了 a 为 奇数 2 l + 1, 故 cos [ (αn ± 1) a π] = cos[ ( αn ± 1 )π] = ( - 1 ) n =
α n - n
- ( - 1) n (αn 是整数 ) .同 样 f ( x0 ) 也可以 分成两项 : 利用 xn + 1 = x0 a - αn , 而 x0 = a ( xn + 1 +
αn ) , 故
n- 1 ∞
∑ ∑b
m m m m - n
f ( x0 ) = b cos( a πx0 ) + cos[ a π( xn + 1 + αn ) ]
m= 0 m= n
n- 1 ∞
m m α n ν ν
= ∑m= 0
b cos( a πx0 ) + ( - 1 ) b n
∑
ν= 0
b cos( a πxn + 1 ) .
于是 (5 ) 中的两个差商可以写成
n- 1 m m
y′- f ( x0 ) m cos( a πx′) - cos( a πx0 )
=∑ b
x′- x0 m =0 x′- x0
∞ ν
ν α +1 1 + cos( a πxn + 1 )
∑
n
+ b b ( - 1) n ,
ν= 0 x′- x0
n- 1 m m
y″- f ( x0 ) m cos( a πx″) - cos( a πx0 )
=∑ b
x″- x0 m =0 x″- x0
∞ ν
ν α +1 1 - cos( a πxn + 1 )
∑
n
+ b b ( - 1) n .
ν= 0 x′- x0
现在分别估计各个差商的两项 .对每一个差商的第一个和式利用和差化积公式有
n-1 m m
cos( a πx′) - cos( a πx0 )
∑
m
b
m=0 x′- x0
n-1 m
b x′+ x0 x0 - x′
∑
m m
= 2sin a π sin a π
m=0 x′- x0 2 2
x0 - x′ m
n-1 sin a π
2 x′+ x0
∑
m m m
= - a bπ sin a π .
m=0 m x0 - x′ 2
aπ
2
x0 - x′
m
sin a π
2 x′+ x0
因为 ≤ 1 , sin amπ ≤1 , 考虑到
m x0 - x′ 2
aπ
2
§7 不可求导的函数 1 79
m m
a b π> 0 , 所以这一和式的绝对值
n-1 n n n n
a b - 1 πa b
≤π∑
m m
a b =π < .
m= 0 ab - 1 ab - 1
因此存在一个常数 ε, - 1 < ε< 1 , 使
n n
επa b
第一个和式 = . ( 7)
ab - 1
1
第一个差商的第二个和式是一个收敛的无穷级数 .因为 x′- x0 = - n (1 + x n + 1 ) , 所以
a
∞ ν
ν α + 1 1 + cos( a πxn + 1 )
∑
n
b b ( - 1) n
ν= 0 x′- x0
∞ ν
α n n 1 + cos( a πx n + 1 )
ν
= ( - 1) n
a b ∑ ν= 0
b
1 + xn + 1
.
现在新级数第一项即 ν= 0 的一项是
1 + cos(πxn + 1 ) 2
≥ .
1 + xn + 1 3
1 3 2
这是因为 | xn + 1 | ≤ , 从而分子 1 + cos(πxn + 1 ) ≥1 , 而分母≤ .总之新级数第一项≥ , 其余 各
2 2 3
2 2
项则为非负 , 所以其和≥ .记其和为 η′
・ , 应有 η′≥ 1 .合并以上的结果 ,
3 3
n n
επa b α 2 n n
第一个差商 = + ( - 1 ) n η′a b .
ab - 1 3
α
( - 1) n
α
如果把 ε写成ε= ( - 1) η′
ε′, 则 ε′= n
ε, |ε′| = | ε|/ η′< 1 , 而
η′
α n n 2 ε′π α n n
第一个差商 = ( - 1 ) n
a b + η′= ( - 1 ) n a b p′. ( 8)
3 ab - 1
2 ε′π 2 π
这里 p′= + η′> - > 0 .这里我们应用了 ( 6) 式 .
3 ab - 1 3 ab - 1
1
第二个差商可以类似地处理 , 注意到这时 x″- x0 = n (1 - x n + 1 ) , 我们将得到
a
α +1 n n 2 ε″π α + 1 n n
第二个差商 = ( - 1) n
a b + η″= ( - 1 ) n a b p″. ( 9)
3 ab - 1
2 ε″π 2 π
这里 p″= + η″> - >0 .
3 ab - 1 3 ab - 1
总结以上即知 :
α
若( - 1 ) n = 1,有
y′- f ( x0 ) n n 2 π
≥a b - ,
x′- x0 3 ab - 1
y″- f ( x0 ) n n 2 π
≤ - a b - .
x″- x0 3 ab - 1
α
当( - 1 ) n
= -1时
1 80 第三章 微 分 学
y′- f ( x0 ) n n 2 π
≤ - a b - ,
x′- x0 3 ab - 1
y″- f ( x0 ) n n 2 π
≥a b - .
x″- x0 3 ab - 1
由于 x′, x″属于 R 上的一个可数稠密集 M , 故知函数 ( 1) 的差商不可能有极限 , 也不 可能趋向 于
同符号的无穷大 .魏尔斯特拉斯的函数 ( 1) 在任一点 x0 都没有导数得证 .
第四章 积 分 学
§1 这样评论黎曼公正吗 ?
这里
π π
1 1
an =
π ∫ -π
f (ξ) cos nξdξ, bn =
π ∫ -π
f (ξ) sin nξ dξ. ( 2)
∫ f ( x ) d x = lim∑ f (ξ) ( x
a
i i - xi - 1 ) ( 6)
∫ f ( x ) d x =∫ f ( x ) d x +∫ f ( x ) d x .
a a c
∑i= 1
f (ξk ) ( x i - xx - 1 ) ( 7)
既不构成序列 , 也不是某连续变量的 函数 .为 了明 确地 了解 它 , 我 们首 先要 求 f ( x ) 定义 在有 限
区间 [ a , b] 上 , 而且 f ( x ) 不可以无界 .对 [ a , b] 作一个分划 P : a = x0 < x1 < … < xn = b, 并以 δP
表示m ax( xi - xi - 1 ) , 因为 f ( x ) 在 [ a , b] 上有界 , 从而在每个小区间 [ x i - 1 , x i ] 上也有界 , 从而 有
1 84 第四章 积 分 学
SP = ∑
i=1
M i ( xi - xi - 1 ) ,
n
sP = ∑
i =1
mi ( x i - x i - 1 ) . ( 8)
很清楚
sP ≤ SP . ( 9)
但对不同的分划 P′与 P″, sP′与 SP″ 可否比较 ? 首先我们注意到 , 若在分划 P 中加一个分点 x′( 称
为 P 的“加细”, 加细后的新分划为 P′) 例如 , x i - 1 < x′< x i , 则 sP 和 SP 变成
i-1 n
sP′ = ∑j=1
m j ( xj - xj - 1 ) + m′
i ( x′- xi - 1 ) + m″
i ( x i - x′)+ ∑
j = i+1
mj ( x j - x j - 1 ) ,
i- 1 n
SP′ = ∑j= 1
Mj ( x j - x j - 1 ) + M′
j ( x′- xi - 1 ) + M″
i ( x i - x′)+ ∑
j = i+1
Mj ( xj - xj - 1 ) .
这里 m′
i = inf, x′] f ( x ) , m″
i = inf f ( x ) , M′ i 意义自明 .于是 mi = min( m′
i , M″ i , m″
i ) , Mi = max
[ x [ x′, x ]
i- 1 i
I = sup { sP } ,
- P
-
同理 , { SP }有下界而有下确界 I :
-
I = inf { SP } .
P
而且
-
I≤ I .
-
-
I 和 I 分别称为 f ( x ) 在 [ a, b] 上的下积分与上积分 .它们是某集合 的上、下确界 , 而不是 序
-
列的极限 .看下面的定义即知 , 说积分是积分和的极限是不准确的 .
-
定义 1 若 I = I , 则称 f ( x ) 在 [ a , b] 上黎曼 可积 ( R - 可积 , 在 不产 生误解 时就 说可积 ) ,
-
-
其公共值 I = -I = I 称为 f ( x ) 在 [ a , b] 上的定积分 , 记作
b
I= ∫ f ( x )d x
a
(11)
SP - sP = ∑(M
i=1
i - mi ) ( xi - xi - 1 ) .
0 < SP - sP = ∑
i= 1
( Mi - mi ) ( xi - xi - 1 ) < 2ε( b - a ) .
0 均可找到有限多个平行于坐标轴的长方体{ U1 , … , U m }使 A ∪ Uk ,
k= 1 ∑ vol ( U
k= 1
k ) < ε.
Bε [ a , b] , 所以在这个开覆盖中能取有限多个{ U1 , … , Um } 覆盖 Bε , 且 ∑ vol( U
k=1
k ) < ε.把 每
一个 Uk 换成 珡
Uk 仍可覆盖 Bε 且总长度不变 , 所以不妨设这些 Uk 均为闭区间 .
对于任一个分划 P , 有
m
SP - sP = ∑(M
i=1
i - mi ) ( xi - xi - 1 ) .
正如前面已指出的 , 为使 SP - sP 充分 小 , 我们 或者要 求 Mi - mi 对 大多 数子 区间 充 分小 , 或 者
要求使 Mi - m i 不太小的区间总长度很小 , 所以我们把 P 中的小区间分成两组 :
S1 : 与 Bε 不相交的小区间 .
S2 : 完全含于某个 Uk 内的小区间 .
若一个小区间既不全含于任一 Uk 内又 与 Bε 相交 , 则可 将 它细 分 为两 部 分 , 一 部 分与 Bε 不 相
交 , 另一部分含于某个 Uk 内 .所以将 P 的小区间分为两组是可能的 .
对 S1 中的小区间 , 因 O ( f , x ) < ε, 故由引理 2 , 必要时对 P 加细为 P′即可知 , 对 P′中 S1 类
小区间有
∑ ( M i - m i ) ( x i - x i - 1 ) < 2ε( b - a) .
对 S2 中的小区间 , 因为 f ( x ) 在 [ a , b] 上有界 , 故 ( Mi - m i ) ≤ 2 [sup | f ( x ) | = 2 M , 而对 这些 小
a, b]
区间
m
∑ ( Mi - mi ) ( x i - x i - 1 ) < 2 M ∑ vol |
k= 1
Uk | < 2 Mε.
把这两个式子加起来即有
0≤ SP′ - sP′ < 2ε( b - a ) + 2 Mε.
因此 , f ( x ) 在 [ a , b] 上可积 .
反过来设 f ( x ) 可积 , 今证 B 有 0 测 度 .但 是 B = B1 ∪ B 21 ∪ … ∪ B 1m ∪ … , 所 以 今证 每 个
2
细 , 则在其上 Mi - mi > , 把这些小区间合并起来 , 有
m
2 ε
∑vol ( Uk ) ≤∑ ( Mi - mi ) ( xi - xi - 1 ) = SP - sP < .
m m
ε
所以∑vol ( Uk ) < .由 ε之任意性可知 B 1m 为 0 容度的 .把可数多个 0 容度集并起来自 然可得 0
2
测度集 .所以 B 为 0 测度集而 f ( x ) 几乎处处连续 , 定理证毕 .
至此为止我们都是应用达布的上、下和 .怎样转到黎曼所用的积分和 (7 ) 呢 ?
定理 4 设 f ( x ) 在 [ a , b] 上有界 , 对任一 ε> 0 , 均存在 δ> 0 , 使对任何分划 P , 只要 δP < δ,
-
就有 sP > I - ε, SP < I + ε.
-
-
证 不失一般性可设 f ( x ) ≥ 0( 必要时用 f ( x ) + C 代 替 f ( x ) , C 是充 分大 的正 数 ) , 由 I
1 88 第四章 积 分 学
- ε
之定义 , 必有 分划 P0 : a = x0 < x 1 < … < xn = b , 使 SP 0 < I + , 设 M = [sup f ( x ) , 今 证 δ=
2 a , b]
ε 4 ( n + 1 ) M 即合于所求 .
设 P 是任 一分 划 , 和 证明 定理 3 一样 , 把 P 的 小区 间分 为两 组 : 一 组是 完全 含 于 [ xi - δ,
(1) (2) (1 )
x i + δ] 的 , 其余列入第二组 .于是 SP 也分成了两项 S P 和 S P , S P 中最多有 n + 1 项 , 每一项都
含了 P0 的一个分点 ( P0 一共有 n + 1 个分点 ) , 所以这些 项相应 于 P 中的 n + 1 个小区 间 , 总 长
ε
为 2( n + 1)δ= , 第二组的 小区间由于规定其 中不能含有任一 个分点 , 而且其长均不大 于 δ,
2M
所以必全位于某个小区间 [ xx - i , xi ] 内 , 因此
n
ε ε - ε -
∑
(1 ) (1 )
SP = S P + SP ≤ M・ + Mi ( x i - x i - 1 ) < + I + = I + ε.
2M i=1 2 2
同理 sP > I - ε, 引理证毕 .
-
定理 5 设 f ( x ) 在 [ a , b] 上有 界并可 积 , 则对 任一 ε> 0 , 必可 找到 δ> 0 使 若某 一分 划 P
的δP < δ, 不论如何选 (7 ) 式中的 ξk ( xk - 1 ≤ξk ≤ xk ) 都有
n b
∑
i= 1
f (ξi ) ( xi - xx - i ) - ∫f( x)d x
a
< ε.
其逆亦真 .
证 因为 m i ≤ f (ξi ) ≤ Mi , 所以
n
sP ≤ ∑ f (ξi ) ( xi - xi - 1 ) ≤ SP .
i= 1
- ε
另一方面 , 由于已设 f ( x ) 可积 , 故 I = I = I , 而定理 4 又推出 , 只要 δP < δ, 必有 sP > I - , SP
- - 2
-
< I + ε所以当δP < δ时
n
-
I - ε= I - ε< sP ≤ ∑ f (ξi ) ( xi - xi - 1 ) ≤ SP < I + ε= I + ε,
- i= 1
而定理得证 ( 逆定理是明显的 ) .
这样我们看到 , 不论是用黎曼的积分和或达布 的上下 和来 定义 定积分 , 结 果都 是一样 的 .我
们也由此看到了所谓定积分是积分和的极限这句话的确切含意 .
由定理 5 我们就自然会提出 , 究竟哪一些定义于 [ a , b] 上的函数 是可积 的 ? 当然连 续函数 ,
只有有限多个不连续点的函数 , 乃至有可数多个不连续点的函数都是可积的 .最后这种情况是由
于可数点集均为 0—测度集 , 证如下 : 令不连续点为 x1 < x2 < … < xn < … , 作闭区间 Uk = [ xk -
∞
∞
ε ε
k , xk - k ] , 显然{ x1 , x2 , … , x n , …} ∪U k ( 注意 Uk ∩ Ul 可以是非空的 ) , 而 ∑ vol( U k ) =
2 2 k=1 k=1
k= 1
不连续} , 因为单调不减函数的 每 个不 连 续点 x 都 是 第 一类 间 断点 , 而 O ( f , x ) = f ( x + 0 ) -
§1 这样评论黎曼公正吗 ? 1 89
f ( x - 0 ) , 仿照前面的记号 B = ∪ Bm , Bm = { x : 0 ( f , x ) ≥
M
} , 则 Bm 必 为有 限集 .因若 不然 ,
m=1 m
∞ ∞
M
Bm 中至少有可数多个点 x1 < x2 < … 而 f ( b) - f ( a) ≥ ∑i=1
[ f ( x i + 0 ) - f ( x i - 0) ] ≥ ∑
i= 1 m
=
+ ∞ .B 作为可数多个有限集之并当然最多是可数的 .
推论 6 [ a, b] 上的单调函数必为可积的 .
3. 微积分的基本定理 以上我们系 统地讨论了函数 可积性问题 , 下面转向另 一个问题 : 积
分和微分的关系问题 .人们心目中都以为二者关 系很简单 , 即 二者 互为逆 运算 .认 识到二 者互 为
逆运算十分重要 , 因为微分表反过来看就是积分表 .自此以后 , 人们就知道积分是怎样计算的 .如
果没有这样一个表 , 遇到任何一个问题都得利用第一章里介绍的希腊人的穷竭法去处理 , 微积分
就决不可能成为研究种种实际问题的工具 , 不可能为物理学家与工程师所掌握 .所以牛顿和莱布
尼茨把他们“发现”的这个公式
b
∫ F ( x ) d x = F( b) -
′
F( a) (12)
a
∫ a
代以 ∑
i= 1
Δf f ( xi ) - f ( xi - 1 )
f′( x ) 代以 =
Δx i xi - xi - 1
dx 代以 (Δx ) i = x i - x i - 1
这样一来 , ( 12 ) 就化为一个几乎自明的公式
n n n
Δf
∑
i= 1 Δx i
(Δx ) i = ∑ i= 1
(Δf ) i = ∑ [ f( x )
i=1
i - f ( xi - 1 ) ]
= f ( xn ) - f ( x0 ) = f ( b) - f ( a) .
可见 , ( 12 ) 原来是一个很简单的组合学公式 .组合学成 分是积 分的 重要因 素 , 在本 书最后 一章 我
们还要讨论这一件事 .但现在我们把极限成分放进去 , 这时就会发现 (12) 中其实包含了两个不同
的问题 .
x
密的点集{ an } , 例如有理点的集合 即是 一个 可 数的 而且 处处 稠密 的 点集 .再 看一 个 收敛 的正 项
∞
级数 ∑ pk = p < + ∞ .我们定义一个函数 f ( x ) 如下 :
k=1
f ( x) = ∑
x≥ a
pi k . (13)
i
k
项 pi k 列入 (13) 右方 , 因为 ∑k=1
pk = p < ∞ 是正项 级数 , 故 其部 分项 ( 尽管是 无穷 多项 ) 所 成的 级
≤ x 的 ai k 更多 , 因此 (13) 中还要多加几个项 :
f ( x + h) - f ( x ) = ∑
x + h≥ a
pik - ∑
x≥ a
pi k
i i
k h
= ∑
x + h≥ a > x
pi k ≥0 . (14)
i
k
因此 , f ( x ) 不减而为单调函数 .从而 f ( x ) 可积 .
x
但是 ∫ f ( x ) d x 不可能是原函数 , 因为若它是原函数
0
F( x ) , 当有 F′( x ) = f ( x ) .但单调 函
F( b) - F( a) = ∫ f ( x )d x .
a
(16)
F( b) - F( a) = ∑i =1
F( xi ) - F( xi - 1 ) = ∑i=1
F′(ξi ) ( xi - xi - 1 ) ,
x i - 1 < ξi < xi .
b
之值不随分划的选择而变 , 从而 ( 16 ) 成立 , 证毕 .
§1 这样评论黎曼公正吗 ? 1 91
样 f ( x ) 自然可积 .为了证明 ∫ f ( t ) d t 是 f ( x ) 的 原 函数 , 他 应用 了 积分 中值 定理 , 而这 就用 到
a
∫
=
a
f ( t ) d t 而为 f 的原函数 .但是因为 f ( x ) ≠ f ( x ) 于一个零测度集上 , 而在这个集上 F( x ) 同
~
时为 f ( x ) 与 f ( x ) 的原函数 .显然这是不可能的 .这样 看来在可 积函数 类中 , 只能考 虑几乎处 处
意义下原函数 .即是说 : 所谓 F( x ) 是 f ( x ) 的原 函数 .即指 几乎 处处 有 F′( x ) 存在 , 只是 几乎 处
处有 F′( x ) = f ( x ) .现在要问 , 在这样的理解下 , 定理 7 是否仍成立 .肯定不对 , 因为有一个著 名
的反例 ( 我们在第二章就讲过了 ) , 这就是著名的赫维赛德函数 ( 只看区间 [ - 1 , 1 ] ) .
1 , 0≤ x ≤1 ,
H( x) =
0 , - 1≤ x < 0 .
很明显 H′( x ) = 0 几乎处处成立 ( 只差 x = 0 一点 ) .但是当 x > 0 时
x x
1 = H ( x ) - H ( - 1) ≠ ∫ - 1 ∫
H′( t ) d t =
- 1
0d t = 0 .
是对的 , 下一节将就 f ( x ) 为勒 贝 格可 积 ( 黎 曼可 积 只是 它 的 特例 ) 的 情 况证 明 这一 点 .于 是 要
x
SP = ∑
j =1
Mj m ( I j ) , sP = ∑ j= 1
m j・m ( Ij ) .
A=∫f ( x ) d x
I
.
∫f ( x )d x =∫( χ ・f ) ( x ) d x
C A
C . (18)
这里有两点 值 得 注 意 , 首 先 若 是 选 不 同 的 A1 与 A2 均 包 含 C 则 因 χC | A
1
- χC | A
2
= 0 .易 见
∫( χ ・ f ) ( x ) d x =∫( χ ・ f ) ( x ) d x , 所以定义 ( 18 ) 是与
A
C
A
C A 的选择无关的 .其次 , 若 f ( x ) 本来
1 2
要 χC ( x ) 可积 .这样看来 χC ( x ) 的积分是特别有意义的 .
§1 这样评论黎曼公正吗 ? 1 93
如果 C 是一个区间 : C = { x : ai ≤ x i ≤ bi , i = 1 , 2 , … , n} , 很明显
n
∫χ ( x )d x = ∏ ( b
C
C
i= 1
i - ai ) = m ( C)
= 0 .所以上和为 ∑
σ ∩ C≠
m (σi ) , 就是与 C 相 交的 闭区间 的体 积和 .这 就相当 于求 圆面积 时所 用
i
-
的外切正多边形面积 .上积分 I 就是这些“外 包多边形”之“面积”的 下确界 .同样 , 下积 分是下 和
n
∑
i =1
mi・m (σi ) 的上确界 .这里 m i = 1 , 若 σi C; 否则 m i = 0 .所以下和是 ∑ m (σi ) 即含于 C 内
σ C
i
-
况 , 所以我们称 m ( C) 为 C 的若尔当测度 . I 与 -I 也分别称为 C 之外与内若尔当测度 , 并分别记
-
为 m ( C) 与 m ( C) .并不是任何的 C 都有若尔 当测度 ( 或 者说 C 为若尔 当可 测 ( J 可测 ) ) , 因 为
-
并不是 χC ( x ) 在一切情况下均可积 .例如 设 C = { x : 0 ≤ x ≤ 1 , x 为有 理数 } , C [ 0 , 1 ] 是有 界
h
定理 10( 若尔当 测 度 的 有 限 可 加 性 ) 设 C1 , … , Cm 均 为 若 尔 当 可 测 集 , 则 C = ∪
j= 1
Cj
也是 , 而且
m
m ( C) ≤ ∑
j= 1
m ( Cj ) . (19)
等号成立的充分必要条件是
m ( Ci ∩ Cj ) = 0 , i≠ j . (20)
证 我们只对 m = 2 的情况给出证明 .容易证明 , 当 C1 , C2 均为简单集 ( 即有限 多个闭区 间
之并 , 而任两个相邻的闭区间只交于边界上 , 下同 ) 时定理成立 , 而且
m ( C1 ∪ C2 ) = m ( C1 ) + m ( C2 ) - m ( C1 ∩ C2 ) . (21)
若 C1 , C2 是若尔当可测的而不一定是简单集 , 则对任意 ε> 0 必可找到简单集 Q1 , Q2 分别包含
C1 , C2 且
ε
m ( Qi ) ≤ m ( Ci ) + , i = 1, 2 .
2
因为 C1 ∪ C2 Q1 ∪ Q2 , 对简单集 Q1 , Q2 应用 (21) 式有
-
m ( C1 ∪ C2 ) ≤ m ( Q1 ∪ Q2 ) = m ( Q1 ) + m ( Q2 ) - m ( Q1 ∩ Q2 )
≤ m ( C1 ) + m ( C2 ) + ε- m ( Q1 ∩ Q2 ) .
-
再由 Q1 ∩ Q2 C1 ∩ C2 , 知 m ( Q1 ∩ Q2 ) ≥ m ( C1 ∩ C2 ) , 故
- -
m ( C1 ∪ C2 ) ≤ m ( C1 ) + m ( C2 ) + ε- m ( C1 ∩ C2 ) . (22)
与此类似 , 又可作含于 Ci 内的简单集 Q′
i , i = 1, 2 使
ε
i ) ≥ m ( Ci ) -
m ( Q′ , i = 1, 2 .
2
由于 Q′
1 ∪ Q′
2 C1 ∪ C2 , 所以
m ( C1 ∪ C2 ) ≥ m ( Q′
1 ∪ Q′
2 ) = m ( Q′
1 ) + m ( Q′ 1 ∩ Q′
2 ) - m ( Q′ 2 ) ,
-
≥ m ( C1 ) + m ( C2 ) - ε- m ( Q′
1 ∩ Q′
2 ) ,
再由 Q′
1 ∩ Q′
2 C1 ∩ C2 , 知 m ( Q′
1 ∩ Q′
2 ) ≤ m ( C1 ∩ C2 ) , 代入上式即有
-
m ( C1 ∪ C2 ) ≥ m ( C1 ) + m ( C2 ) - ε- m ( C1 ∩ C2 ) (23)
- -
§1 这样评论黎曼公正吗 ? 1 95
- -
比较 (22) 和 (23) , 注意到 m ( C1 ∩ C2 ) ≤ m ( C1 ∩ C2 ) , m ( C1 ∪ C2 ) ≤ m ( C1 ∪ C2 ) , 利 用 ε的 任
- -
意性 , 即有
-
m ( C1 ∪ C2 ) = m ( C1 ∪ C2 ) ,
-
-
m ( C1 ∩ C2 ) = m ( C1 ∩ C2 ) .
-
即 C1 ∪ C2 与 C1 ∩ C2 均为若尔当可测 , 而且 (21) 式成立 :
m ( C1 ∪ C2 ) = m ( C1 ) + m ( C2 ) - m ( C1 ∩ C2 ) .
定理证毕 .
注 我们不但证明了 C1 ∪ C2 若尔当可测 , 而且还证明了 C1 ∩ C2 也若尔 当可测 .用类似 的
方法还可证明 C1 \ C2 也是若尔当可测的 , 而且
m ( C1 \ C2 ) = m ( C1 ) - m ( C1 ∩ C2 ) , (24)
(21) 与 (24) 给出了在集合的运算 : 并、交、差之下 , 若尔当测度的相应的代数运算结果 .
现在我们可以再回来看 高维情况下黎曼 积分的定义 .上面我们通 过采用 χC ( x ) 把积分 区域
A 化为一个区间 , 而每一次分划都是把 A 分为有限多 个小区 间 .现在 有了若 尔当 测度的 概念 我
们可以更直接 地从定义 在有界 区域 Ω 上的有 界函数 f ( x ) 着手 .这 时唯一 需要附加 规定的是 设
°
Ω 为若尔当可测 .我们把 Ω 分划为有限多若尔当可测集 Ωj , j = 1 , 2 , … , N , 这里 我们规定 Ωi ∩
°
Ωj = ( i≠ j ) , 于是可以作达布下、上和 :
N
sP = ∑
j=1
mj・m ( Ωj ) , mj = inf
Ω
f ( x) ,
j
N
SP = ∑
j= 1
Mj・m ( Ωj ) , Mj = sup
Ω
f( x ) .
j
-
然后把分划加细 , 证明{ sP }有上确界 , 即下积 分 -I , { SP } 有下 确界 即上 积分 I , 唯 一需要 注意 之
L
j
尔当测度的有限可加性 , 有
L
j
m ( Ωj ) = ∑
k= 1
m ( Ωjk ) .
于是
L L
j j
mj・m ( Ωj ) = ∑ k= 1
mj・m ( Ωjk ) ≤ ∑ k= 1
mj k・m ( Ωjh ) .
∑ f (ξ ) m ( Ω )
j= 1
j j - I < ε,
N
° °
不论 ξj ∈ Ωj 如何取法 , 也不论 Ω= ∪ Ω , Ω∩Ω =
j= 1
j i j ( i≠ j ) 具体如何分法 .重要的是 要看到 ,
1 96 第四章 积 分 学
为了使这个做法 有 效 , 必 须 要 求 Ω 为 若 尔 当 可 测 , 以 及 Ω 只 能 分 划 为 若 尔 当 可 测 的 子 集 合
{ Ωj } .这样就可以利用若尔当测度 的有 限可 加性 .以后 我们 会 看到 黎曼 积分 的不 足 之处 正好 来
∞
°
自于此 .关于测度 ( 面积、体积 ) , 我们直观地会想到把 Ω 分为可数多个子集之并 : Ω= ∪ Ω ,Ω
j= 1
j i
°
∩Ωj = ( i≠ j ) , 而且希望
∞
m ( Ω) = ∑
j= 1
m ( Ωj ) . (25)
故其内测度必为 0 : m ( Ω) = 0 , 但 若 用 有 限 多 个 区 间 覆 盖 Ω, Ω
- ∪i= 1
[ ai , bi ] , 很 容 易 看 到
N
-
∑( b
i =1
i - ai ) ≥ 1 , 所以 m ( Ω) ≥1 ( 但若许可用可数 多个区 间覆 盖 Ω, 则 结果 反而 不同 , 请读 者
∑ f (ξ , η ) m (σ )
i, j
i j ij = ∑ ∑
i=1 j= 1
f (ξi , ηj ) ( yj - yi - 1 ) ( xi - x i - 1 ) ,
求极限后 , 即得到大家熟知的二重积分化为逐次积分的公式
b d
A
f ( x , y ) d xd y = ∫ d∫
x f ( x , y) d y .
a c
(26)
m (σi j ) = ( x i - x i - 1 ) ( yj - yj - 1 ) .
现在我们来看 f ( x , y ) 在 A 上的下和 .记 gx ( y ) 为 f ( x , y ) 中固定 x 所得的 y 的函数 , 显然有
§1 这样评论黎曼公正吗 ? 1 97
m ij = inf f ( x , y ) ≤ y inf gx ( y) = m j ( gx ( y) ) ,
σ ≤ y≤ y
ij j- 1 j
从而
m
∑j
mi j ( yj - yj - 1 ) ≤ ∑
j =1
mj ( gx ( y ) ) ( yj - yj - 1 )
∫- g ( y) d y .
≤ x
首先限制 x i - 1 ≤ x≤ xi , 再对右方取下确界 , 有
∑
j
mi j ( yj - yj - 1 ) ≤ x
i -1
inf
≤ x≤ x ∫- g
i
( x) ( y) d y .
双方再乘以 x i - x i - 1 并对 i 求和 , 即有
∑i, j
m ij ( x i - x i - 1 ) ( yj - yj - 1 ) ≤ ∑ i
x
i- 1
inf
≤ x≤ x∫- g ( y) d y・( x
i
x i - xi - 1 ) ,
-
f ( x , y ) d xd y≤ ∫- d ∫
x g ( y) d y .
-
x (27)
与此相似 , 可得
- - -
f ( x , y ) d xd y≥ ∫d x∫ g ( y )d x . x (28)
A
f ( x , y ) d xd y ≤ ∫- d x∫- g ( y ) d y≤∫d x∫- g ( y ) d y
x x
- -
≤∫d x∫ g ( y ) d y≤ x
A
f ( x , y ) d xd y .
-
注意 , 我们在中间插入了一项 ∫d x∫- g ( y ) d y .因为不等式两端的项相同 , 这就证明了
x
- - - -
样的方法也可证明 ∫g x ( y) d y 作为 x 的函数在 I 上可积 , 且 ∫- d x∫g ( y ) d y =∫d x∫g ( y ) d y .
x x
以化为逐次积分如下 :
-
A
∫d∫
f ( x , y) d xd y = x g ( y) d y =∫d ∫
I -
x g ( y) d y
x
I J
x
∫d ∫
= y h ( x ) d x =∫d ∫
J
y h ( x)d x .
-
y
J I
y (29)
I
-
注 若 f ( x , y ) 是连续函 数 , 则容 易证 明 gx ( y ) , hy ( x ) 也 都是 连 续的 , 从 而 ∫ g ( y) d y =
x
重积分为逐次积分的公式
A
f ( x , y )d xd y = ∫d ∫
I
x g ( y ) d y =∫d ∫
J
y h ( x)d x .
x
J I
y (30)
x 为有理数时不连续 , 它的不连续点的集合是可数多个线段之并 :
{( x , y ) : x 为有理数 , 0≤ y≤ 1} .
读者自己可以证明它是一个 0 测度集 , 因此
R( x ) χ( y ) d xd y
I× J
二重积分 f ( x , y ) d xd y 时 , 是取 一 个较 大 的 区 间 A , C A 而以
C
(这里要 用 到 一 个 著 名 的 庞 加 莱 不 等 式 , 因 为 超 出 我 们 的 能 力 , 所 以 不 证 了 ) .但 是 即 令 由
2
| u n - um | d xd y → 0 想证明 u n — u m →0 在 Ω 内一 致成 立就 已 是不 可能 的事 了 .即 令我 们
Ω
1 ∞ ∞
∫∑
0 n= 1
gn ( x ) d x .实际上 ∑
n= 1
gn ( x ) 可能不可积 .
但是有一个很有意思的定理 :
∞
定理 12 若 gn ( x ) 在区间 A 上非负可积 , 而且 ∑ n= 1
gn ( x ) 在 A 上收敛 , 则有
∞ ∞
∫- [ ∑n= 1
gn ( x ) ] d x = ∑∫g
n= 1
A
n ( x) d x .
∫g ( x ) d x →0 .
A
n
2 00 第四章 积 分 学
§2 勒贝格积分的初步介绍
① 关 于勒贝 格积 分的历 史 , 请参 看 J .- P . K ah ane 的《Lebesgue 积 分的产 生及 其影响》, 数学 进展 , 2002 , 31( 2 ) , 97~ 106
§2 勒贝格积分的初步介绍 2 01
I≈ ∑ ηi m ( Ei ) , ( 2)
i= 1
∪
( k) ( k) ( k)
的子集拼成的情况 : E i = Ei , 即令 每个 E i 简单 , 以至 于我们可 以定义 m ( E i ) , 那么 能
k= 1
否规定
∞
( k)
m ( Ei ) = ∑
k= 1
m( Ei ) ?
图4 - 2 - 1
为至多可数多个区间之并 : E = ∪ i=1
( ai , bi ) , bi ≤ ai + 1 , 这时各个 小区间 之长 bi - a i 之和必定 构
∞
成一个收敛级数 , 因为 ∑(b
i=1
i - ai ) ≤ b - a .因此这时我们定义
2 02 第四章 积 分 学
m ( E) = ∑(b
i =1
i - ai ) . ( 3)
个区间 I1 , … , Ik , …之并 ; F = ∪
k=1
Ik , 而且适合 ∑ k= 1
m ( Ik ) < ∞ , 令 me ( E ) = inf ∑ m ( Ik ) , 并
k=1
∑
k= 1
m ( Ik ) ≥ b - a ,
n
∑
k=1
m ( Ik ) ≤ m ( F) + m ( F′) ,
故
c
b - a≤ me ( E ) + me ( E ) + 2ε.
由 ε之任意性有
c
b - a≤ me ( E) + me ( E ) ,
所以
m i ( E) ≤ me ( E) .
综合上述 , 我们给出
定义 1 若 E 是包含于一区间 [ a , b] 内之任意集 合 , 且其内、外测 度相等 , 则称 E 为勒贝 格
可测集 , 而内、外测 度 之 公 共值 称 为 E 之 勒贝 格 测 度 ( 简 称 为 L 测 度 甚 至 就 说 是 测 度 ) , 记 为
m( E) .
c c c
如果我们对 E 求其内外测度 , 应用 (5 ) 式 , 而且注意到 ( E ) = E , 即有
c
mi ( E ) = ( b - a) - me ( E ) . ( 6)
若 E 为可测 , me ( E) = m i ( E ) , 以 (5 ) 代入 ( 6) 即有
c c
me ( E ) = mi ( E ) ,
c
因此 E 也可测 , 而且 (5 ) 成为
§2 勒贝格积分的初步介绍 2 03
c
m ( E) + m ( E ) = b - a . ( 7)
于是我们得到如下的
c
定理 1 令 E 是含于区间 [ a , b] 中的集合 , 则 E 与 E = [ a , b] \ E 必 同时可测 或同时不 可
测且
c
m ( E) + m ( E ) = b - a .
在进一步讨论集的运算与其可测性的关系之前 , 我们可先提几个明显的结论 .
命题 1 闭区间 [α,β] [ a, b] 与半闭区间 (α,β] , [ α,β) , 开区间 (α,β) 同样可测 , 且测度 同
为 β- α .
命题 2 [ a, b] 内之 0 测度集均为可测集 , 而且其测度为 0 .
证 设 E 为 0 测度集 .由定义 , 对任意 ε> 0 均可找到可数多个闭区间 U1 , … , Uk , … , 使 E
∞
∞
ε
∪U
k=1
k , 而且 ∑ vol( U k )<
2
.例如令 Uk = [αk - δk , αk + δk ] , 长 度为 2δk , 作 Ik = (αk - 2δk ,
k= 1
∞ ∞ ∞
∪
k=1
Ik , 所以由外测度之定义 me ( E) < ε, 由 ε之任意性知 me ( E) = 0 , 但任 何集均有 非负的内 测
度 m i ( E) ≥0 , 由 m i ( E) ≤ me ( E) 知 , 0 = m i ( E ) = me ( E) .证毕 .
现在我们来讨论集运算下测度的运算 .首先我们给出具有基本重要性的
定理 2( 测度的可数可加性 ) 设 E1 , … , Ek , …为有限区间 [ a, b] 中的可测集 .则
∞
( i) E = ∪ k=1
Ek 也是可测集 , 而且
∞
m ( E) ≤ ∑
k= 1
m ( Ek ) . ( 8)
( ii) 若再规定 Ei ∩ Ej = , i≠ j, 则有
∞
m ( E) = ∑
k= 1
m ( Ek ) . ( 9)
这个定理将与以下定理同时证明 .
定理 3 设 E1 , … , Ek , …为有限区间 [ a, b] 中的可测集 , 则
∞
E=∩ Ek
k= 1
也是可测的 .
这两个定理的证明较长 , 分成几步进行 .
∞
( A ) 先证若开集 O = ∪ k= 1
Ok , Ok 均为开集 , 则
∞
m( O)≤ ∑
k= 1
m ( Ok ) . (10)
右方是收敛的 , 否则 ( 10 ) 式是不足道的 , 设 Ok = ∪
m=1
( am , k , bm , k ) , O 则由开 区间 ( A l , Bl ) 并成 :
2 04 第四章 积 分 学
∞
1
O= ∪(A
l= 1
l , Bl ) , 令 ε<
2
( Bl - A l ) , 则 [ Al + ε, Bl - ε] 之每一点为某个 ( am , k , bm , k ) 之内点 , 所
= ∑∑
k m
( bm , k - am , k ) = ∑m( O
k
k ) .
故 (10) 得证 .
若小区间 ( am , h , bm , h ) 互 相 均 不 相 交 , 则 ( Al , Bl ) 只 是 ( am , k , bm , k ) 以 另 一 次 序 排 列 , 从 而
(10) 中有等号成立 .
( B) 若开集 O , O′覆盖 [ a , b] 则
m ( O∩ O′) ≤ m ( O ) + m ( O′) - ( b - a) . (11)
可以从构成 O 的开区间中选用有限多个 ( 记其集为 Q ) , 从 O′中选取 Q′也由有 限多个区 间
构成 , 使 Q∪ Q′ [ a , b] , 而且
O = Q∪ R , O′= Q′∪ R′, m ( R) < ε, m ( R′) < ε.
但是
O∩ O′ ( Q∩ Q′) ∪ R∪ R′,
从而
m ( O∩ O′) ≤ m ( Q∩ Q′) + m ( R ) + m ( R′) ≤ m ( Q∩ Q′) + 2ε.
但因 Q 与 Q′中都只有有限个区间 , 从而
m ( Q∩ Q′) ≤ m ( Q ) + m ( Q′) - ( b - a) ≤ m ( O ) + m ( O′) - ( b - a ) ,
代入上式 , 由 ε之任意性即得 ( 11 ) 式 .
∞
∪
k
< m e ( Ek ) + ε 2 , 记 O = Ok , 则 O 为开集 , 利用 ( 10 ) 有
k= 1
m( O)≤ ∑ k
m ( Ok ) ≤ ∑ k
me ( Ek ) + ε.
但 O E , 故 m ( O ) ≥ me ( E) , 代入上式 , 令 ε→0 即得 .
( D) 当 Ek 互不相交时 , 定 理 2 的 证 明 .先设 E1 , … , Ek , … 只 有 有 限 多个 .对 于 E = E1 ∪
E2 , 我们已知
me ( E) ≤ me ( E1 ) + me ( E2 ) = m ( E1 ) + m ( E2 ) ,
下面只需证明 m i ( E) ≥ m ( E1 ) + m ( E2 ) , 亦即
c c c
me ( E ) ≤ m ( E1 ) + m ( E2 ) - ( b - a) (12)
c c
即可 .为此分别作包含 E1 与 E2 的开集 O1 与 O2 并使
c c
m ( O1 ) ≤ m ( E1 ) + ε, m ( O2 ) ≤ m ( E2 ) + ε.
c c
因为 E1 ∩ E2 = , 所以 E1 ∪ E2 = [ a , b] , 从而 ( B) 中的 ( 11 ) 式给出
§2 勒贝格积分的初步介绍 2 05
m ( O1 ∩ O2 ) ≤ m ( O1 ) + m ( O2 ) - ( b - a) .
c c c c
但 O1 ∩ O2 E1 ∩ E2 = ( E1 ∪ E2 ) = E , 所以
c
me ( E ) ≤ m ( O1 ) + m ( O2 ) - ( b - a)
c c
≤ me ( E1 ) + me ( E2 ) - ( b - a) + 2ε.
令 ε→0 即得 ( 12 ) .因此 E = E1 ∪ E2 为可测且
m ( E) = m ( E1 ) + m ( E2 ) .
n
由此 , 对有限多个 E1 , … , E n 也有 E = ∪k=1
Ek 为可测 , 且
n n
m( ∪
k= 1
Ek ) = ∑
k= 1
m ( Ek ) .
n n
余下就要看 n→∞的极限情况 .记 S n = ∪
k=1
Ek , 则由上所述已知 S n 是 可测的 , 且 ∑
k= 1
m ( Ek ) =
n ∞
m( ∪
k= 1
Ek ) = m ( S n ) ≤ b - a, 从而 ∑ k=1
m ( Ek ) 收敛 , 其和≤ b - a .
由关于外测度的证明 ( C) 可知
∞ ∞
me ( E) ≤ ∑ me ( Ek ) = ∑ m ( Ek ) ≤ b - a , (13)
k= 1 k= 1
所以余下的只需证明
∞
mi ( E) ≥ ∑
k= 1
m ( Ek ) (14)
即可 .证如下 :
c c
Sn E, 故 E S n , 但 S n 作为有限多个可测集 S1 , … , S n 之 并 , 前 已证明 为可测的 , 故其 余
集亦然 .即
n
c c c
me ( E ) ≤ me ( S ) = m ( S ) = ( b - a) -
n n
∑
k=1
m ( Ek ) .
∞
令 n→∞ , 由 ∑
k=1
m ( Ek ) 收敛即得 ( 14 ) 式 .
c c
( E) 有限多个 Ek 时定理 3 的证 明 .因 为 E1 , … , E n 可 测等 价于 E1 , … , En 可 测 .但 上面 的
c c
证明已告诉我们 , E1 ∪…∪ En 为可测 ( 各项不相交时并集 之测度等 于各项 测度之和 这一点虽 不
成立 , 我们也未用到 ) , 所以
c c c
( E1 ∪…∪ En ) = E1 ∩…∩ En
也可测 .至于无限多个 Ek 之交的情况将在后面给出 .目前我们先给出一个
推论 4 若 E1 与 E2 均 为 可 测 , 则 E1 \ E2 与 对 称 差 E1 △ E2 也 可 测 .若 E2 E1 , 则
m ( E1 \ E2 ) = m ( E1 ) - m ( E2 ) .
c
证 E1 \ E2 = E1 ∩ E2 , 故 当 E1 , E2 为 可 测 时 E1 \ E2 也 可测 .对 称差 E1 △ E2 = ( E1 \
E2 ) ∪ ( E2 \ E1 ) 是两个不相交的可测集之并 , 所以是可测的 .最后
c
E1 = ( E1 ∩ E2 ) ∪ ( E1 ∩ E2 ) = ( E1 ∩ E2 ) ∪ ( E1 \ E2 ) .
当 E2 E1 时 , E1 ∩ E2 = E2 , 再用 ( D) 即得推论 .
2 06 第四章 积 分 学
推论 5 空集 可测而且其测度为 0 .
证 任取可测集 E , = E \ E .由推论 4 即得 .
( F ) 证明的终结 .令
c
E′ 2 = E2 ∩ E1 , …
1 = E1 , E′
c
n = En ∩ ( E′
E′ 1 ∪ E′
2 ∪…∪ E′
n - 1 ) , … .
显然
1 ∪ E′
E = E′ 2 ∪…∪ E′
n ∪… ,
而且 E′
i ∩ E′
j = ( i≠ j ) .所以 , 应用前面的证明 ( E) 可知 E 是可 测的 .关于测 度的不等 式 , 则 可
由关于外测度的证明 ( C) 得出 .因为这时外测度就是测度 .定理 2 至此证毕 .
定理 3 则可以由关系式
∞ ∞
c
∩ ∪
c
Ek = Ek
k= 1 k= 1
以及定理 2 直接得出 .
上面的证明中我们用到“集合的极限过程”, 这在有关测度的问题中是很有用的 .为此我们给
出
定义 2 若有一串集 E1 , …, En , … , 而且 E1 E2 … En … ( 或 E1 E2 … En …) ,
∞ ∞
则 E= ∪
k=1
Ek ( 或 E = ∩
k=1
Ek ) 称为其外极限 ( 内极限 ) .
由上面的定理易见可测集序列的内外极限均为可测集 , 且
lim m ( En ) = m ( E) . (15)
n→ ∞
μ ∪ n=1
En = ∑ μ( E
n=1
n ) . (16)
1
c- ) = E( f < c) 为可测 .其余集 E( f≥ c ) 当然也可测 .
n
注 2 若 f 是可测的 , 则对任意 a < b, E( a < f < b) , E ( a < f ≤ b) , E ( f = a) 均为可 测 .证
c
明很简单 , 例如 E( a < f < b) = E ( f > a) ∩ E ( f < b) = E ( f > a ) ∩ [ E( f ≥ b) ] , E ( f = a ) =
E( f ≥ a) \ E ( f > a) , 当然都是可测的 .
可测函数的性质有一些很简单 , 例如说 f 为可测函数则对任 意实数 h , h f 也是可测 的 , 这 一
些我们都不加证明 .但有一些涉及不等式应该注意 , 例如
命题 3 若 f 与 g 均可测则 F( f > g) = { x : x ∈ [ a , b] , f ( x ) > g( x )} , 也是可测集 .
证 若在某一点 x , f ( x ) > g( x ) , 则必 可找 到一 个 有理 数 r 使 f ( x ) > r > g ( x ) .反 之 亦
然 , 所以 E( f > g) = ∪
r = 有理 数
E( f > r > g) = ∪
r =有理数
E( f > r ) ∩ E( g < r ) 是可测的 .
命题 4 若 f 与 g 均为可测 , 则 f± g 与 f g 也是可测的 .
证 因为 g 可测 , 则 - g 也可测 , 常数 c 与它的和当然也是可测的 , 但
E( f± g > c) = E( f > cê g) ,
故由命题 3 , f ± g 是可测的 .
2
又若 f 可测 , f 必可测 .实际上
2
E( f > c) = [ a , b] , 若 c≤0 .
2
E ( f > c) = E( f > c ) ∪ E ( f < - c)若 c > 0 .
2
所以 f 可测 .利用明显的关系式
1 2 2
fg = [ ( f + g) - ( f - g) ]
4
以及前证即知 f g 可测 .
一个十分重要的性质是关于极限的 .设有一个 可测函 数序 列{ fn ( x )} , 在每一 点 x 处 , 它 不
一定有极限 , 但一定有上极限 nlim f n ( x ) 与下极 限 lim f n ( x ) ( 即所有收 敛子序 列之 极限的 上下 确
→∞ n→ ∞
界 ) , 这时我们有
定理 6 [ a, b] 上的可测函数序列{ f n ( x )} 之上、下极限 nlim f n ( x ) 与 lim fn ( x ) , 如果是有 限
→∞ n→ ∞
证 对任意实数 c, 定义
∞
1
Em , n = ∪k= 0
E ( fn + k > c+
m
),
∞
Em = ∩
n= 1
Em , n .
2 08 第四章 积 分 学
于是由可测函数的定义以及定理 2 , 3 知 Em , n 与 Em 均为 可测集 .对 于 x ∈ Em , 对任 意 n 都可 找
1 1
到一个 k 使 f n + k ( x ) > c + , 即有充分大的 ν使 fν ( x ) > c + .所以在 Em 上 , nlim fn ( x ) ≥ c +
m m →∞
1
> c .令 E = E1 ∪ E2 ∪…∪ En , E 当然是可 测集 , 今证 E = { x : nlim fn ( x ) > c} .实际上 上面 已
m →∞
1 1
找到充分大的 ν使 fν ( x ) > c + , 所以任取一个 n 都可以找到 k 使 f n + k ( x ) > c + .因此这 个
m m
x∈ Em , n , n = 1 , 2 , … , 从而 x ∈ E m E .即 是说 , 若 x 使 nlim fn ( x ) > c, 必 有 x ∈ E .所 以 E =
→∞
性证明类似 .
定理 7 连续函数 f ( x ) 必为可测 .
证 E( f > c) 即 值域 空间 中 之开 集{ f > c} 在定 义域 x 的空 间 [ a , b] 上之 原 像 .因 为 f 连
续 , 故这个原像也是开集 .开集自然是可测的 .
这个定理的重要性在于 , 我们实际上遇到的函数多是连续函数序列的极限 , 甚至如狄利克雷
函数 χ( x ) 也可写成连续函数的序列如下 :
2n
χ( x ) = mlim lim [ cos( m ! πx ) ] (18)
→ ∞ n→ ∞
p m !
( m , n 取正整数值 ) .因为若 x 是有理数 , 则当 m > q 时 , cos ( m !π x ) = cos( p・ ・π) = ± 1 ,
q q
2n
因此当 m 充分大时 , [ cos ( m π
! x) ] = 1 , 而上式之极限也是 1 .若 x 是 无理数 , 不论 怎样取正 整
2 2 n
数 m, m π
! x 均非 π之整数倍 , 因而 ( cos m π
! x ) = θ< 1 , 固定了 x 和 m 以后 , [ cos( m π
! x)] =
n 2n 2n
θ , 而 lim [ cos( m !πx ) ] = 0 , 再对 m 取极限为 0 .因为 [ cos m !πx ] 是 连续函 数 , 对 m , n 求 逐
n→ ∞
Rn (σ) = ∪E
k= n
k (σ) ,
∞
M= ∩n=1
R n (σ) .
时
| f k ( x0 ) - f ( x0 ) | < σ.
换言之 x0 | Ek , 只要 k≥ N .也就是说 x0 | RN ( σ) 从而 x0 | M .因 为已 设 Q 为零 测度集 , 故 其
子集 M 也是零测度集 , 而由 ( 20 ) 式有
lim m ( R n (σ) ) = 0 .
n→ ∞
注 证明到此 已 经 得到 了 一 个 重 要结 果 : 若 一个 可 测 函 数 序列 { f n ( x ) } 与 一 个 可 测 函 数
f ( x ) 对一切 σ> 0 均有 (21) 式成立 , 就说{ f n ( x ) }按测度收敛于 f ( x ) , 因此至 此为止 , 我们已 得
到了一个结论 :
定理 9( 勒贝格定理 ) 若可测集 E 上的可测函数序列{ f n ( x )} 几乎处 处收敛于 一个几乎 处
处取有限值的可测函数 f ( x ) , 则{ f n ( x ) }必在 E 上按测度收敛于它 .
这个定理本身就很有用 , 下面我们
继续叶果洛夫定理的证明 现在取一串下降趋于 0 的正数{σi } , σi → 0 , 再 取一串正 数 ηi 使
∞
∑ η<
i= 1
i + ∞ .于 是 由 于 m ( Rn ( σ) ) → 0 对 一 切 σ 成 立 , 故 令 σ= σi 时 , 一 定 可 以 找 到 n i 使
∞ ∞
e= ∪
t= i
R n i (σi ) .
0
∞ ∞
e 当然是 E 的子集 , 而 m ( e ) ≤ ∑
i= i
m ( Rn i (σi ) ) < ∑ η < δ, 记
i= i
i
0 0
Eδ = E \ e
今证 Eδ 即适合所求 .
当然
m ( Eδ ) = m ( E) - m ( e) > m ( E) - δ .
在 Eδ 上 , fn ( x ) 必一致收敛于 f ( x ) , 事实上任给 ε> 0 总可以找到一个 i , 适合 i≥ i0 , σi < ε, 对
Eδ 中的 x , 因为 Eδ = E \ e, 故 x| e, 当然 x| Rn i (σi ) .由 Rn i (σi ) 之定义可知 , 当 n≥ n i 时 x |
E( | fn - f | ≥σi ) , 亦即
2 10 第四章 积 分 学
| fn ( x ) - f ( x ) | < σi < ε n ≥ n i .
因为 n i 与 x 无关 , 故定理证毕 .
这个定理本身固然重要 , 它的证法 , 即分 析集 合 { x : fn ( x )/→ f ( x )} 之构 造这 个方法 更是 很
重要的 .
可测函数在勒贝格积分理论中的地位很像连续函 数在黎 曼积 分理论 中的 地位 .它当 然是 连
续函数的推广 , 但其实又不相差太远 .下面我们给出一 个有关 可测 函数的 构造 的重 要定理 , 但 其
证明略去 .
定理 10( 鲁金 ( N .N .Luzin ) 定理 ) 若 f ( x ) 是可 测集 E 上的 可测 函数 , 则 对任一 δ> 0 , 必
可找到一个在 E 上连续的函数 φ( x ) , 使
m E( f≠φ) < δ,
而且若 | f ( x ) | ≤ K , 也有 | φ( x ) | ≤ K .
4 .勒贝格积分之定义与基本性质 有了关于测度 与可测 函数 的准备 , 就 可以 着手建 立可 测
集 E 上的可测函数的勒贝格积分理论了 , 我们首先设 E 是一维区间 I .
建立这个理论分成三步 , 首先考虑 有界的 可 测函 数 f ( x ) 之 积分 ; 其次 考虑 非负 ( 但 不一 定
有界 ) 的可测函数之积分 ; 最后考虑一般情况 .
在开始讨论积分理论前 , 我们先作一个约定 , 即把 + ∞与 - ∞ 作为两 个数 来对 待 , 这 样做 的
必要性可以从讨论可测函数序列{ f n ( x )} 几乎处 处收敛于 f ( x ) 中 看到 .允许{ fn ( x ) }在 某点 不
收敛 .但如果 fn ( x0 ) → + ∞我们 最好规定 f ( x0 ) = + ∞ , 这样可 以和 fn ( x0 ) 收 敛一样来 对待 .
读者会记得 , 在第一章我们就 指出 极限 理论 实 际上 建立 在潜 无限 的 基础 上而 不承 认实 无 限 , 到
19 世纪下半叶有了以上这些积 分理论 等等 以后 , 集合 论也 建立 起来了 .这 时实 无限 又一 次摆 在
数学面前 , 而且成果丰硕 , 成了整个数学的基础的一部分 .对此我们没有篇幅来介绍了 .在这里我
们处理±∞的方法只是一种方便的约定罢了 .我们约定
±∞ + a = ±∞ ( a 为有限数 ) ;
±∞ , k > 0 ,
k・( ±∞ ) =
ê ∞, k < 0,
0( ±∞ ) = 0 ;
( ±∞ ) + ( ±∞ ) = ±∞ ;
( ±∞ )・( ±∞ ) = + ∞ ;
| ±∞ | = + ∞ ;
a
= 0 ( a 为有限数 ) ,
±∞
a
但是 ( ±∞ ) - ( ±∞ ) , 都认为没有意义 .
0
现在设 f ( x ) 是区 间 A 上 的有 界可 测函 数 , 而 m , M 是其 下、上 确界 : m = inf f( x), M =
A
sP = ∑y k= 1
k- 1 m ( Ek ) ,
n
(23)
SP = ∑y k= 1
k m ( Ek ) .
误会时就略去记号 R 或 L .
定理 11 区间 A 上的有界可测函数必为勒贝格可积 .
证 对某一分划 P
n
SP - sP = ∑ k=1
( yk - yk - 1 ) m ( Ek ) ,
-
当分划足够细使 | yk - yk - 1 | < ε m ( I ) 时易得 | SP - sP | < ε,ε是任意小数 .因此 -I = I .
举一个例子 .令 E A 是一个可测集 , χE ( x ) 是其特征函数 , 容易看到 E 的可测 性与 χE ( x )
的可测性是等价的 , 而且 , 由定义即得
∫χ ( x )d x =
A
E m ( E) ,
∫f ( x ) d x =∫χ ( x ) f ( x ) d x .
E A
E (24)
( L) ∫ χ( x ) d x = 0 .
0
所以 , 勒贝格积分确实比黎曼积分更广泛一些 .
下面我们进一步考虑非负可测 ( 但不一定有 界 ) 函 数 f ( x ) 的勒 贝格 积分 .取 N 为任 意大 的
正整数 , 并定义
f ( x ) , 若 0≤ f ( x ) < N ,
[ f ( x) ] N = (25)
N , 若 N≤ f ( x ) .
于是 [ f ( x ) ] N 是 有 界 可 测 的 , 从 而 ( L ) ∫[ f ( x ) ]
A
N d x 有 意 义, 很 容 易 看 到, 当 N 增 加 时
∫
{( L ) [ f ( x ) ] N d x } 不会下降 ( 读者不妨自行证明一下 , 这就会看到 有些对 于黎曼积 分似乎自 明
A
∫f ( x ) d x = lim∫[ f ( x ) ]
( L)
A
N→ ∞
A
N d x, (26)
上面我们是取 N 为正整数的 , 因此 {( L ) ∫[ f ( x ) ]
A
N d x } 确实 是一个 序列 , 但 是容易 看到 取
N 为任意上升趋向 + ∞的数也是可以的 .
最后我们来看一般的可测函数 f ( x ) .我们定义
f ( x ) , f ( x ) ≥0 ,
f + ( x) =
0, f( x ) < 0;
0, f ( x ) ≥0 ,
f- ( x) =
- f( x ) , f ( x) < 0;
于是 f ± ( x ) 都是非负的 , 而且容易看到它们都是可测的 .而且
f ( x) = f + ( x ) - f - ( x ) ; | f ( x ) | = f + ( x ) + f - ( x) .
我们规定 , 若 f ± ( x ) 均为 ( L ) 可积的 , 则定义 f ( x ) 为 L 可积 , 而且定义
∫( x ) d x = ( L∫
( L)
f
) f
A
+ ( x )d x - ( L) ∫f A
- ( x) d x . (27)
∫
就是说, 我们不但不允许( L) f ( x) d x = a±∞的情形出现, 尤其不允许( L ) f ( x ) d x = ( + ∞ ) - ( +
A
∫ A
∞) 的情形出现, 因此我们有很重要的 .
定理 12 可测函数 f ( x ) 为可积当且仅当 | f ( x ) | 为勒贝格可积 .
§2 勒贝格积分的初步介绍 2 13
证 若 f ( x ) 为 勒 贝 格 可 积 , 则 f± ( x ) 均 为 可 积 , 即 ( L ) ∫[ fA
± ( x) ] N d x 分 别收敛 于
∫
( L ) f ± ( x ) d x , 从而
A
( L) ∫| f ( x ) | d x = ( L ∫
A
) f
A
+ ( x )d x + ( L) ∫f A
- ( x)d x
有意义 , 而 | f ( x ) | 为勒贝格可积 .
反过来 , 若 | f ( x ) | = f + ( x ) + f - ( x ) 可 积 , 则 因 f ( x ) 可 测 , 故 有 A = E ( f ( x ) ≥ 0 ) ∪
E( f ( x ) < 0) = A1 ∪ A2 , 而 A 1 , A2 均为可测集 , 而
( L) ∫| f ( x ) | d x = ( L )∫ | f ( x ) | d x + ( L )∫ | f ( x ) | d x ,
A A A
1 2
这两个积分都是有意义的 , 从而
∫χ A
A
1
( x ) f( x )d x = ( L) ∫ f ( x ) d x = ( L∫
A
) f
A
+ ( x)d x ,
1
∫χA
A
2
( x ) | f ( x) | d x = - ( L) ∫ | f ( x) | d x =
A
- ( L) ∫f A
- ( x)d x
2
都是有意义的 , 因此由
( L) ∫f ( x ) d x = ( L )∫ f ( x ) d x + ( L )∫ f ( x ) d x
A A A
1 2
知 f ( x ) 在 A 上可积 .
不过要注意 , 上面的证明中我们又用了两个对于黎曼积分似乎自明的性质 : 若将积分区域分
成两块 , 则一个积分成为两小块上积分之和 ( 积分的可加性 ) , 还有函数和的积分等于函数积分之
和 ( 积分的线性 ) .但是对于勒贝格积分 , 这两个性质下面都将要重新证明 .否则定理 12 的证明中
有了很大的漏洞 .这个证明我们放在下面 , 现在我们则要指出黎曼积分与勒贝格积分的另一个重
要区别在于 : 考虑无 界 函数 的 积 分 即 所谓 反 常 积 分 时 , 勒 贝 格 积 分与 黎 曼 积 分 实际 上 都 是 用
[ f ( x ) ] N 的积分之极限来处理这个 问题 , 不过 黎曼 积分 并 不区 别 f + ( x ) 与 f - ( x ) 而是 合并 处
理 , 因而在出现 ( + ∞ ) - ( + ∞ ) 的情况下可能 有正负抵 消而使 黎曼 积分存 在 .因此 , 有些 反常 积
分使 ∫f A
± ( x ) d x 都是有限数而得到 绝对 收敛 性 ; 另一 些则 是虽 然 ∫f A
± ( x ) d x 都 是 + ∞ , 但可 以
∫
用正负抵消使得 f ( x ) d x 有意义即是条件收敛 .勒贝格积分则只允许绝对收敛而无 所谓条件 收
A
1 2 1
敛 .例如考虑 2 xsin 2 - cos 2 在 [ 0 , 1] 上的积分 , 这 个函 数在 x = 0 附 近是 无界 的 , 但 是是 可
x x x
1 2 1 d 2 1
测的 .其黎曼积分可计算如下 : 因为 2 xsin 2 - cos 2 = ( x sin 2 ) , 所以
x x x dx x
1 1
1 2 1 d 1
∫ ∫ d x ( x sin x
2
( R) (2 xsin 2 - cos 2 ) d x = εlim ( R) 2 )d x
0 x x x →0 ε
1
2 1
= εlim ( x sin 2 ) = sin1 .
→0 x ε
2 14 第四章 积 分 学
1 -
1
1 -
1
但是 , 因为在 [ (2 n + )π] 2 ≤ x≤ [ (2 n - )π] 2 时
3 3
1 2 1 2 1 1
2 xsin 2 - cos 2 ≥ cos 2 - 2 x≥ - 2 x,
x x x x x x
由此易见
1
1 1 1
∫ 0
[2 xsin
x
2 -
2
cos 2 ] N d x > Aln N ,
x
1
1 1 1
这里 A 是一个适当的正数 .从而 ( R ) ∫ 0
2 xsin
x
2 -
x
cos 2 d x = + ∞ .所 以这 个函数 在黎 曼
x
意义下条件收敛但非绝对收敛 , 而在勒贝格意义下则是不可积的 .
下面我们讨论勒贝格积分的性质 .读者可能会怀疑 , 何以在黎曼积分情况下似乎不言自明的
性质 , 现在要花那么多力量去证明 ? 其部分原因在 于黎曼积 分的 积分 和的每 一项 对被积 函数 都
是线性的 , 而勒贝格积分则不然 .这一点将在下面说明 , 而且 正好 表明 了两种 积分 确是很 不相 同
的 .我们以下只讨论非负可测函数 , 因为一般的可测 ( 而不一定有界 ) 的函数可以分为两个非负可
测函数之差来处理 .证明完了这几个性质以后 , 定理 12 才最终得证 .我们把这些性质分为几组最
基本的性质来讨论 .
( i) 正性 若 f ( x ) 在 E 上可积而且 f ( x ) ≥0 , 则
( L) ∫f ( x ) d x ≥0 .
E
(28)
反之 , 若上式中的等号对 f ( x ) ≥0 成立 , 则 f ( x ) = 0( 几乎处处 ) .
证 考虑 [ f ( x ) ] N , 并将 [0 , N ] 分划为
P: y0 = 0 < y1 < … < yl = N
作∫[ f ( x ) ]
E
N d x 之下和 , 有
l -1
sP = ∑ ν= 1
yν m ( E( yν ≤ y < yν+ 1 ) ) ≥ 0 .
所以sup
P
{ sP } = ( L ) ∫[ f ( x ) ]
A
N d x≥0 , 令 N→∞即得 (28) .
反之 , 设 f ( x ) ≥0 而且 ( L ) ∫ f ( x) d x = 0, 作[ f ( x ) ]
E
N 之值域的划分
1
P : y0 = 0 < y1 = < … < yl = N ,
n
则因
l-1
0 = ( L)∫[ f ( x ) ]
E
N d x ≥ ∑ yν m ( E( yν ≤ y≤ yν+ 1 ) ) + N m ( E( N≤ y ) ) ,
ν= 1
1 1 1
m ( E( ≤ y) ) = 0 , 而在 E 上 只有 m ( E( 0 ≤ y < ) 可 能为 正 .但 m ( E) = m ( E (0 ≤ y < ) ∪
n n n
1 1 1
E( ≤ y ) ) = m ( E (0≤ y < ) ) .因此 E ( ( 0≤ y < ) ) 之 内极限 即 E( ( y = 0 ) ) 与 E 测度 相同 .
n n n
§2 勒贝格积分的初步介绍 2 15
从而 f ( x ) 在 E 上几乎处处为 0 .
我们要提醒一下 , 对于黎曼积分 , 这个结果虽然是对的 , 却不太容易证明 .
用同样的方法可以证明 , 若在 E 上有界可测的函 数 f ( x ) 适合不 等式 α≤ f ( x ) ≤β, 则有 中
值定理
αm ( E) ≤ ( L ) ∫f ( x ) d x≤βm ( E) .
E
(29)
( ii) 可加性 如 果 固 定 f ( x ) 为 A 上 的 可 积 函 数 , 则 对 A 的 每 个 可 测 子 集 E , 可 以 定 义
积 , 而且 E = ∪
k= 1
Ek , E i ∩ Ej = , 若 i≠ j, 则有
∞
( L) ∫f ( x ) d x = ∑ ( L )∫f ( x ) d x .
E k= 1 E
(30)
k
( L) ∫[ f ( x ) ]
E
N dx= ∑ k= 1
( L) ∫[ f ( x ) ]
E
N d x≤ ∑ ( L )
k=1
∫f ( x ) d x .
E
k k
( L) ∫f ( x ) d x≤ ∑ ( L )∫f ( x ) d x .
E
k= 1
E
(31)
k
但对任意的正整数 K 有
K
( L) ∫[ f ( x ) ]
E
N d x≥ ∑
k=1
∫[ f ( x ) ]
E
N dx .
k
K
先令 N→∞ , 有 ( L ) ∫ f ( x ) d x≥ ∑ ( L )∫f ( x ) d x , 再令
E k= 1
E
K→∞又得到相反方向的不等式
k
∞
( L) ∫f ( x ) d x≥ ∑ ( L )∫f ( x ) d x .
E
k= 1
E
(32)
k
∫
(1 ) (2)
而 m ( E( yν ≤ f ( x ) < yν+ 1 ) ) = m ( Eν ) + m ( Eν ) .作 f ( x ) d x 之下和
E
∑ [y
(1 ) (2 ) ( 1) ( 2)
sP = sP + sP = ν m ( Eν ) + yν m ( Eν ) ] .
ν
2 16 第四章 积 分 学
( L) ∫f ( x ) d x≤ ( L )∫ f ( x ) d x + ( L )∫ f ( x ) d x .
E E E
1 2
SN = ∪k=1
Ek , R N = E \ S N ,
( L) ∫f ( x ) d x = ( L )∫ f ( x ) d x + ( L )∫ f ( x ) d x .
E S R
N N
∫f ( x) d x = ∑ ( L ∫
( L)
S
) f ( x) d x .
k=1
E
N k
令 N→∞即得 (30) .
( iii) 线性性质 这里包括两个性质 , 首先是
∫[ f ( x ) + g( x ) ] d x = ( L∫
( L)
E
) f ( x ) d x + ( L∫
) g( x ) d x .
E E
(33)
我们的证明又要分几步进行 .
先设 f ( x ) 与 g( x ) 均为非负 , 记 Φ( x ) = f ( x ) + g( x ) , 有
[ Φ( x ) ] N ≤ [ f ( x ) ] N + [ g( x ) ] N ≤ [ f ( x ) + g( x ) ] 2 N .
如果对有界可测函数勒贝格积分的线性得证 , 则由{ [ f ( x ) ] N + [ g ( x ) ] N } - [ Φ( x ) N ] ≥0 , 利 用
正性有
∫{[ f ( x ) ]
E
N + [ g( x ) ] N }d x - ∫[ Φ( x ) ]
E
N d x≥0 .
对第一项再一次应用有界可测函数的勒贝格积分之线性 , 有
∫[ Φ( x ) ]
E
N d x≤ ∫[ f ( x ) ]
E
N dx+ ∫[ g( x ) ]
E
N dx .
同理
∫[ f ( x ) ]
E
N dx+ ∫[ g( x ) ]
E
N d x≤ ∫[ Φ( x ) ]
E
2 N dx .
令 N→∞ , 即得 ( 33 )
再看 f 与 g 有不同符号 , 例如 f ( x ) ≥0 , g( x ) < 0 的情况 .先考查 集合 { x : Φ( x ) ≥ 0} , 在 其
上 f ( x ) = Φ( x ) + ( - g ( x ) ) , 因 此除 了 需 证明 ( L ) ∫[ -
E
g( x ) ] d x = - ( L) ∫g ( x ) d x 之 外 ,
E
直接应用 上 面 的 结 果 即 可 .在 另 一 个 集 合 { x : Φ ( x ) < 0 } 上 , 则 利 用 - g ( x ) = f ( x ) +
[ - Φ( x ) ] . f ( x ) < 0 , g( x ) ≤0的情况化为 - f ( x ) > 0 , - g ( x ) ≥0 的情况 , 以及负号可以从积分
§2 勒贝格积分的初步介绍 2 17
下取出 .
最一般的情况则是
E = E( f ( x ) ≥ 0 , g( x ) > 0) ∪ E( f ( x ) < 0 , g ( x ) > 0 ) ∪ E ( f ( x ) ≥0 , g( x ) ≤0 )
∪ E( f ( x ) < 0 , g( x ) ≤0 )
于是可以看见 , 线性性质之证明归结为 f ( x ) , g ( x ) 均 为有 界可测———这 一点 我们 马上来 证明 .
以及负号可以由积分号下提出———这一点属于线性性质的另一部分 .
设
a < f ( x ) < b , A < g( x ) < B .
作 [ a , b] 与 [ A , B] 的分划
P : a = y0 < y1 < … < yn = b ,
- - -
Q : A = y0 < y1 < … < y n = B .
- -
令 ek = E( yk ≤ f ( x ) < yk + 1 ) , Ej = E( y j ≤ g( x ) < y j + 1 ) . T kj = ek ∩ E j ,
于是有
E= ∪ k, j
T kj ,
∫[ f ( x ) + g( x ) ] d x = ∑∫ [ f ( x ) + g( x ) ] d x .
E k, j T
kj
但在 T kj 上
- -
yk + y j ≤ f ( x ) + g( x ) < yk + 1 + y j + 1 .
对上式应用积分中值定理并求和 , 有
- -
∑ (y
k, j
k + y j ) m ( T kj ) ≤ ∫[ f ( x ) + y ( x ) ] d x≤ ∑ ( y
E k, j
k+1 + y j + 1 ) m ( T kj ) .
但是由测度的可加性又有例如
∑k, j
yk m ( T kj ) = ∑
k
yk ∑ j
m ( T kj ) = ∑ k
yk m ( ek ∩ [ ∪ Ej ] ) = ∑
k
yk m ( ek ) ,
这是 ( L ) ∫ k, j
f ( x ) d x 的一个下和 .同理 上式 右方 是一 个 上和 .求 了上、下确 界后 , 利用 f ( x ) 与
g( x ) 之可积性 , 即得
( L) ∫[ f ( x ) + g( N ) ] d x = ( L∫
E
) f ( x )d x + ( L ∫
) g( x ) d x .
E E
∫cf ( x ) d x = ∫
E
c f ( x) d x .
E
(34)
0= ∫[ cf ( x ) + ( -
E
c) f ( x ) ] d x = ∫cf ( x ) d x +∫( -
E E
c ) f ( x )d x .
2 18 第四章 积 分 学
∫cf ( x ) d x = ∫
E
c f ( x) d x
E
( c < 0) .
∫ f ( x )d x = 0 .
lim
k→ ∞
E
k
∫{ f ( x ) - [ f ( x ) ]
E
N }d x < ε.
固定 N 以后 , 我们有 , 只要 k 充分大 ,
∫[ f ( x ) ]
E
N d x≤ N m ( Ek ) < ε.
k
于是
∫f ( x ) d x =∫{ f ( x ) - [ f ( x ) ]
E E
N
∫[ f ( x ) ]
}d x +
E
N dx .
k k k
≤∫{ f ( x ) - [ f ( x ) ]
E
N
∫[ f ( x ) ]
}d x +
E
N d x < 2ε.
k
于是结论得证 .
在这个证明中 , 我们利用了 f ( x ) ≥0 , [ f ( x ) ] N ≥0 , f ( x ) - [ f ( x ) ] N ≥ 0 .
( v) 零测度集的作用 .若 E 是零测度集 , 或 f ( x ) 几乎处处为 0 , 都有
∫f ( x ) d x = 0 .
( L)
E
(35)
( L) ∫f ( x ) d x = ( L )∫ f ( x ) d x + ( L ) ∫
E E E \ E
f ( x) d x = 0,
1 1
§2 勒贝格积分的初步介绍 2 19
第二个积分是因为被积函数 f ( x ) 在 E \ E1 上为 0 而 等于 0 , 第 一个积分 则由 m ( E1 ) = 0 而 为
0 .
这个性质告诉我们 , 在作积分时 , 积分区域变动一个零测度集或者被积函数在一个零测度集
上变动都不会影响积分值 .所以零测度集和几乎 处处为 0 的函 数都 是可以 忽略 的 .这样一 来 , 若
f ( x ) - g( x ) = 0 几乎处处成立 , 则 f ( x ) 和 g( x ) 并没有实质 上的区别 .这 种关系是 一个等价 关
系 , 而几乎处处相等的函数属于同一等价类 .在研究积 分问题 时 , 我们 关心的 并不 一定是 某一 特
定的函数 , 而是一个等价类 .在讨论有界函数时 , 这一点尤其重要 , 可能 f ( x ) 在一个零测度集 E1
上无界 .删去了 E1 , f ( x ) 在 E \ E1 上可能有 界 : Esup | f ( x ) | < ∞ .这 样的 f ( x ) 是 本质 上有 界
\ E
1
的 .因 此应 该 定 义 其 本 质 上 的“ 界”.但 为 此 就 要 删 去 一 个 适 当 的 E1 , 删 错 了 一 个 E2 , 仅 是
m ( E2 ) = 0 , 仍有可能 f ( x ) 在 E \ E2 上无界 .所以我们给出
定义 5 若 f ( x ) 在 E 上可测 , E1 E 适合 m ( E1 ) = 0 , 我们定义 f ( x ) 在 E 上的本质上 界
与下界分别为
ess sup f ( x ) = inf{ a∈R∪ { + ∞} , f ( x ) ≤ a 于 E \ E1 上 , m ( E1 ) = 0} .
ess inf f ( x ) = sup{ a∈R∪ { - ∞} , f ( x ) ≥ a 于 E \ E1 上 , m ( E1 ) = 0} .
右方是对一切零测度集 E1 和 a 取上、下确界的 .
若 ess sup f ( x ) 与 ess inf f ( x ) 均为有限数 , 则称 f ( x ) 为本质有界的 .本质有界可测函数之集
∞
合记为 L .
关于可积函数还有一些简单的性质均可由上面的 ( i) - ( iv) 推出 , 其中有常用的
∫ E
∫| f ( x ) | d x ,
( L) f ( x ) d x ≤( L)
E
(36)
∫f ( x ) d x = ( L∫
( R)
A
) f( x )d x .
A
(37)
∑ k
mk m ( A k ) ≤ ( L ) ∫f ( x ) d x≤ ∑ M m ( A ) ,
A k
k k
∫
这个定理很重要 : 当我们要计 算 ( L ) f ( x ) d x 时 , 只 要 f ( x ) 黎 曼可积 , 就 可以 把它 当作 黎
A
( R) 或 ( L ) .
我们讲的“这些强有力的定理”就是涉及黎曼积分局限性的一些定理 .首先要证明基本的
定理 14 ( 勒 贝 格 控 制 收 敛 定 理 ) 设 可 测 函 数 序 列 { f n ( x )} 在 A 上 对 n 一 致 有 界 , 即
| f n ( x ) | ≤ M , 又在 A 上几乎处处有 nlim f n ( x ) = f ( x ) , 则 f ( x ) 在 A 上 也是 勒贝 格 可积 的 , 而
→∞
且可以在积分号下求极限 :
∫f
lim
n→ ∞
A
n ( x) d x = ∫f ( x ) d x .
A
(38)
故 f ( x ) 为有界可测从而勒贝格可积 .
对任意 ε, 由 叶果 洛 夫定 理 必可 找 到 A 的 子 集 E , 使 E 上 f n ( x ) 一 致收 敛 于 f ( x ) , 而 且
ε
m ( A \ E )≤ , 于是
4M
∫[ f
A
n ( x ) - f ( x) ] d x ≤ ∫ E
fn ( x ) - f ( x ) d x + ∫
A \ E
fn ( x ) - f ( x ) d x
ε
≤ ∫| f E
n ( x) - f ( x) | d x +
2
.
ε
由 f n ( x ) 在 E 上一致收敛于 f ( x ) , 故有 N (ε) 存在 , 使 n > N (ε) 时 | f n ( x ) - f ( x ) | < ,
2 m ( A)
代入上式即知当 n > N (ε) 时
ε ε
∫ A
fn ( x ) d x - ∫ A
f ( x )d x < m( E) + ≤ε.
2 m( A ) 2
定理证毕 .
这个定理的用处可以从下例得知 .微积分里有一个复杂的论题 , 就是含参变量积分的性质和
运算 .其中常要求讨论积分对参变量的一致收敛 性 , 而 这时常 又是 一个困 难问 题 .有了勒 贝格 控
制收敛定理后 , 问题时常会变得容易处理 .但为此就需要进一步讨论相应于反常积分的勒贝格积
§2 勒贝格积分的初步介绍 2 21
分 .积分区域 E 为有限测度的可测集 而 f ( x ) 在 E 上不 一定 有界 的 情况 前已 讨论 过了 : 我们 用
∫[ f ( x ) ]
E
N d x 之极限作为 ∫f ( x ) d x 之定 义 , 这一 作法其 实与 黎曼 积分情 况是 一致 的 ; 而 另一 类
E
者均 有 定 义 ( 即 均 收 敛 ) 时 , 我 们 定 义 ∫f ( x ) d x =∫f
E E
+ ( x)dx - ∫fE
- ( x ) d x .这 样 做 即 知
∫|E
f( x) | d x = ∫f E
+ ( x) d x + ∫f
E
- ( x ) d x 也有定义 ( 即也收敛 ) .所以 , 和 E 为有 限测度 可测 集
次 E 的任一紧子集必包含在某一 Ωk 0 中 , 所以 ∪ Ωk = E ; 其次 Ek = E∩ Ωk 具有有限测度 , 而 E
n=1
∞
= klim
→∞
Ek = ∪ k= 1
Ek , 即为{ Ek } 之外极限 .( 当然 , 我们可以利用区间 Ik ———其中心在 x = 0 , 边长为
若不存在 , 必有 ∫f ( x) d x → + ∞ ) , 就说
E
f ( x ) 在 E 上勒 贝格 可积 , 而且 定义 ( L ) f ( x ) d x = ∫ E
k
lim ( L )
k→∞ ∫ f ( x ) d x .( 我们再提一下 , 如果不用
E
Ik 而 用 Bk 来 作 Ek , 则 关于 f ( x ) 之可积性 与积 分
k
∞
sin x
值只会得到相同结果 ) .勒贝格积分一定是绝对可 积的 , 这是 一个 重要性 质 , 例如 ∫ -∞ x
dx 作
为黎曼积分是存在的———条件收敛 , 但作为勒贝格积分则是不存在的 .
前面讲的关于勒贝格 积 分的 性 质大 部 分 在此 仍 成 立 , 当 然 也 有例 外 , 如 中值 定 理 αm ( E)
∫
≤ f ( x ) d x ≤βm ( E) , 因为现在 m ( E) = + ∞ , 这一 切读 者都容 易判 断 .重要 的是要 指出 , 勒 贝
E
格控制收敛定理仍成立 , 但 | f ( x ) | ≤ M 这个条件要代以 | f ( x ) | ≤ Φ( x ) , 这 里 Φ( x ) 在 E 上 可
积 .
n
现在我们开始讨论含参变量的 积分 .设有 函数 f ( x , t ) , 这里 x = ( x1 , … , x n ) ∈R , t 是 参
m
数 : t = ( t1 , … , t m ) ∈ U R , f ( x , t ) 可以取±∞为值 .于是我们有
n
定理 15 ( i) 设对任一固定的 t∈ U , f ( x , t ) 对 x 在 R 上可积 .
n
( ii) 对几乎所有 x∈R , f ( x , t ) 作为 t 的函数在 t0 ∈ U 处连续 .
n
( iii) 存在一个 R 上可积的函数 Φ( x ) , 使对一切 t∈ U , 对于 x 几乎处处有
| f ( x , t ) | ≤ Φ( x ) ,
则 g( t ) = ∫f( x , t) d x 在 t
n
0 处连续 .
R
2 22 第四章 积 分 学
n→ ∞ ∫f ( x , t
lim g( tn ) = nlim
→∞
n
n )d x =∫f( x , t
n
0 ) d x = g( t0 ) .
R R
定理证毕 .
n
注 定理中 x ∈ R 可 以 改 为 x ∈ E , 而 E 具有 上 面 讲 的 性质 , 为 此 只 需将 f ( x , t ) 改 为
χE ( x ) f ( x , t ) 即可 .
m
定理 16 ( i) 仍设 f ( x , t ) 对固定的 t∈ U 为可积 .但现在设 U R 是一个开集 .
( ii) 对几乎所有 x , f ( x , t) 作为 t 的函数是 U 中的可微函数 .
n f ( x , t)
( iii ) 存在一个 R 上 可 积 的 函 数 Φ( x ) , 使 对 所 有 的 t = ( t1 , … , t m ) ∈ U , ≤
ti
n
Φ( x ) ( i = 1 , 2 , … , m ) 对几乎所有 x ∈R 成立 .
则 g( t ) = ∫f ( x , t ) d x 对 t 在 U 中可微 , 而且
n
R
g( t ) f ( x , t)
ti
= ∫ n
ti
d x, i = 1 ,2 ,…, m .
R
g( t )
证 我们只需证明对任一个 ti , 为 连续 且可以 在积 分号下 求导 .所 以 , 不 失一 般性 不
ti
妨设 U 是一维空间中一个开区间 ( t0 - h , t0 + h) , 而 证明 g( t ) 在 t0 处连续 可微 .令 hi 为一 个
趋于 0 的实数列 , hi ≠0 , 而记
f ( x , t0 + hi ) - f ( x , t0 )
fi ( x ) = ,
hi
f ( x , t0 )
f0 ( x ) = .
t
于是由拉格朗日定理
f i = f′( x , t0 + θi hi ) , 0 < θi < 1 .
仿照定理 15 的证法令 i→∞立即可得如上的结果 .
定理 15 与定理 16 比之黎曼积分中的相应定理显然更简单好用 .读者可 能认为 , | fn ( x ) | ≤
Φ( x ) 这个条件很像微积分中的 M 判别法 .但实际不然 , 因为我们并未得出{ f n ( x )} 的一致收 敛
性 .在我们的证明中 , 叶果洛夫定理起了基本作用 .它指 出除 了一 个测度 可以 任意小 的集 合———
但我们不知道其位置何在———{ f n ( x )} 是一致收敛的 .而 Φ( x ) 恰好在这个破坏了一致收敛性的
集上 , 控制了 fn ( x ) 的积分 , 而不管这个“坏”集合的位置何在 .这是黎曼积分理论所做不到的 .在
勒贝格积分理论中 , 证明这一类黎曼积分理论中不成立的定理时常有多种方法 , 但仔细分析这些
方法就会发现我们利用了一些在勒贝格积分理论中起 基本作 用 , 而在 黎曼积 分理 论中没 有的 思
想与方法 , 例如在证明叶果洛夫定理中分析不一致收敛点的集合之构造的作法 , 在黎曼积分理论
§2 勒贝格积分的初步介绍 2 23
∫f ( x ) d x≤ lim∫f
E
n→ ∞
E
n ( x)d x . (39)
证 很容易证明 , 在 E 上几乎处处有
lim [ fn ( x) ] N = [ f ( x) ] N ≤ N .
n→ ∞
故由勒贝格控制收敛定理
∫[ f
lim
n→ ∞
E
n ( x) ] N d x = ∫[ f ( x ) ]
E
N d x, (40)
但对左方的积分有
∫[ f E
n ( x) ] N d x≤ ∫f E
n ( x)d x .
∫[ f ( x ) ]
E
N d x≤ lim
n→ ∞∫f E
n ( x) d x .
∫
总是非负可测的 ( 定理 8 ) , 若它不可积 , 有 f ( x ) d x = + ∞ , 这 时必有 lim f n ( x ) d x = + ∞ , 因 此
E
n→ ∞ ∫ E
∫f
lim
n→ ∞
E
n ( x)d x = ∫lim f
E
n→ ∞
n ( x) d x = ∫f ( x ) d x :
E
(41)
f ( x ) 不可积 , 因 f ( x ) ≥ 0 , 故 ∫f ( x ) d x =
E
+ ∞ , 由 法 图 引 理 知 lim f n ( x ) d x = + ∞ , 从 而 ∫
n→ ∞
E
∫
lim f n ( x ) d x = + ∞ 而 (41) 式仍成立 .
n→ ∞
E
2 24 第四章 积 分 学
勒维定理常用于正项级数 的 情况 , 即 将 f n ( x ) 表为 ∑
n= 1
gn ( x ) 的 部 分和 , f1 ( x ) = g1 ( x ) ,
f n ( x ) - f n - 1 ( x ) = gn ( x ) , 这时我们有 : 若 gn ( x ) ≥0 为可积函数 , 则
∞ ∞
∫∑ E
n= 1
gn ( x ) d x = ∑∫g
n=1
E
n ( x)d x . (42)
使当 n , m > N 时 , ∫|N
um ( x ) - un ( x ) | d x < ε, 这 时 是 否 有 一 个 可 积 函 数 u ( x ) 存 在 , 使
∫|
E
un ( x ) - u ( x ) | d x < ε, 亦即在某种意义下 nlim
→∞
u n ( x ) = u( x ) ? 这样提出问题 很像极限 理
∫| f
E
n ( x ) - f m ( x ) | d x→0 , 当 n , m→∞时 , (43)
∫| f E
n ( x ) - f ( x ) | d x→0 . (44)
反之 , 由 ( 44 ) 也可得到 ( 43 ) .
- k
证 取 εk = 2 , 则 一 定 可 以 找 到 一 串 上 升 的 正 整 数 nk , 使 当 n , m ≥ nk 时 ,
∫|
E
f n ( x ) - f m ( x ) | d x < εk . 特别是
§3 勒贝格积分的初步介绍 (续 ) 2 25
∫
- k
| f n k + 1 ( x ) - fn k ( x ) | d x < 2 .
E
令 uk ( x ) = f n k + 1 ( x ) - fn k ( x ) , u0 ( x ) = f n 1 ( x ) , 则 uk ( x ) 勒贝格可积 , 而且
∞ ∞
∑∫ ∑
- k
| uk ( x ) | d x < 2 < +∞ .
k=0 k= 1
E
∞ ∞
由勒维定理 , ∑k= 0
| uk ( x ) | 几乎处处收敛 , 其和 F( x ) 也是勒贝格可积的 .进而看级数 ∑u
k= 0
k ( x),
它必几乎处处绝对收敛 .令其部分和为 SN ( x ) , 则 N→
lim∞ SN ( x ) = f ( x ) 几 乎处处成 立 , 而且是可 测
函数 , 但是
N ∞
| SN ( x ) | ≤ ∑
k= 0
| uk ( x ) | ≤ ∑
k=0
| uk ( x ) | = F( x ) .
∞
而且 | f ( x ) - S N ( x ) | → 0 , 几乎 处处成立 , | f ( x ) - SN ( x ) | ≤ ∑
k = N +1
| uk ( x ) | ≤ F ( x ) , 再用 一次
勒贝格控制收敛定理有
∫| f ( x ) -
E
SN ( x ) | d x = ∫| f ( x ) -
E
f n N + 1 ( x ) | d x→0 ,
特别是
∫| f ( x ) -
E
fn ( x ) | d x≤ ∫| f ( x ) -
E
f nN + 1 ( x ) | d x
∫| f
+
E
N
n +1
( x ) - f n ( x ) | d x→ 0 .
定理证毕 .
如果 E 不一定有有限测度而与定理 15 , 16 一样 , 这个定理仍成立 .
关于勒贝格积分的基本概念和性质 , 我们就介 绍至此 .数 学中 还有多 种其 它积 分理论 , 但 是
都适合同样的框架 : 每 个 积分 都 是 一个 泛 函 , 即 对某 一 函数 类———可 积 函数 类———的 一个 元 f
给定一个值 I( f ) .如果 I ( f ) 具有 某 些性 质 , 则 可以 利 用这 些 性质 来 对积 分 理 论作 公 理化 的 处
理 .例如我们可以要求
( i) I( f ) 是线性泛函 , I( a f + bg) = aI ( f ) + bI( g) , 这里 a , b 是实数 .
( ii) 正性 : f≥0 时 , I ( f ) ≥0 .
( iii) 关于单调收敛的连续性 : 若 f n ( x ) 下降趋于 0 , 则 I( fn ) 也下降趋于 0 .
黎曼积分和勒贝格积分都具 有这 些性 质 , 其 中的 ( iii ) , 对于 黎曼 积分即 是迪 尼定 理 , 对于 勒
贝格积分即是勒维定理 .进一步我们可以称适合它们的泛函就是积分 , 这样就为积分理论提供了
一个公理化框架 .它与勒贝格积分理论不同 , 它不是以 测度理 论为 基础的 .这 种积 分有时 称为 丹
尼尔 ( Daniell 积分 ) , 它是很有用处的 .
§3 勒贝格积分的初步介绍 ( 续 )
∫ f( x )d x =
a
F( b) - F( a) . ( 1)
Ⅰ .若 f ( x ) 在 [ a, b] 上勒贝格可积 , 则 F( x ) = ∫ f ( t) d t 是否 f ( x ) 的原函数 , 而 ( 1) 成立 ?
a
∫ f ( t) d t + C ?
=
a
作V= ∑ i= 0
| f ( x i - 1 ) - f ( xi ) | , 则sup
P
V 称为 f ( x ) 在 [ a , b] 上的全变差 .
b
定义 1 若 Va ( f ) = sup V < + ∞ , 则称 f ( x ) 是 [ a , b] 上的有界变差函数 .
P
这时 , | f ( xi + 1 ) - f ( x i ) | = f ( xi + 1 ) - f ( xi ) ≥0 , 因此
V = | f ( x n ) - f ( x n - 1 ) | + … + | f ( x1 ) - f ( x0 ) |
= [ f ( xn ) - f ( xn - 1 ) ] + … + [ f ( x1 ) - f ( x0 ) ] = f ( b) - f ( a) .
b
所以 , V ( f ) = sup
a V = f ( b) - f ( a ) < + ∞ , 从而单调 函数 f ( x ) 具有有 界变差 .重 要的是 其逆 在
P
某种程度上也成立 , 我们有
定理 1 [ a, b] 上的有界变差函数 f ( x ) 必可写为两个单调不减函数之差 .
证 任取 c∈ [ a , b] , 于是得到 [ a, b] = [ a , c] ∪ [ c, b] , 当我们作 [ a, b] 之任一分 划 P 时 都
不妨把 c 当作一个分点 : c = x m , 于是
n-1 m- 1 n-1
∑
i=0
f ( xi + 1 ) - f ( x i ) = ∑
i= 0
f ( x i + 1 ) - f ( xi ) + ∑
i= m
f ( xi+ 1 ) - f ( xi ) . ( 2)
现在从左、右双侧来对分划 P 取上确界 .
先看右方 , 固定 c 不动 , 而得到 [ a , c] 的分划 P1 , [ c, b] 的分划 P2 , 因此
m- 1
∑
c
f ( x i + 1 ) - f ( x2 ) ≤ Va ( f ) ,
i= 0
n-1
∑
b
f ( x i + 1 ) - f ( xi ) ≤ Vc ( f ) . ( 3)
i= m
∑
c b
| f ( xi + 1 ) - f ( xi ) | ≤ Va ( f ) + Vc ( f )
i= 0
此式对任何以 c 作为一个分点 的分 划 P 均成 立 .对 于不 以 c 为分 点的 分 划 , 在增 加一 个 分点 c
以后 , 其相应的变差 V 不减 , 所以上式对任意分划 P( 不论是否含 c 作为分 点 ) 均成立 .取上确 界
以后即得
b c b
Va ( f ) ≤ Va ( f ) + Vc ( f ) ( 4)
另一方面 , 从 ( 2) 的左方看应有
m- 1 n- 1
∑ ∑
b
f ( xi+ 1 ) - f ( xi ) + f ( xi + 1 ) - f ( xi ) ≤ Va ( f )
i= 0 i= m
m-1
∑
c
作适当分 划 , 总 可 以 使 | f ( x i + 1 ) - f ( xi ) | ≥ Va ( f ) - ε, ε > 0 是 任 意 小 正 数 , 同 样
i =1
n- 1
b
∑
i= m
f ( xi + 1 ) - f ( x i ) ≥ Vc ( f ) - ε, 代入上式再令 ε→ 0 , 又有
c b b
Va ( f ) + Vc ( f ) ≤ Va ( f ) . ( 5)
比较 (4 ) , (5 ) 两式即有
b c b
Va ( f ) = Va ( f ) + Vc ( f ) . ( 6)
b
现在把 V ( f ) 中的 b 代以变量 x , 则得到一个 函数 V ( x ) , V ( x ) 显然是 不减 的 , 因为 若 x1
a
< x2 , 则由 ( 6)
x
V ( x2 ) = V ( x1 ) + V x 21 ( f ) .
2 28 第四章 积 分 学
x
但是 V x 21 ( f ) ≥0 , 这由全变差之定义自明 .考虑差 W ( x ) = V ( x ) - f ( x ) 可以证明这个差 W ( x )
也是不减的 , 这是因为
W ( x2 ) - W ( x1 ) = V ( x2 ) - V ( x1 ) - [ f ( x2 ) - f ( x1 ) ]
x x
= V x 21 ( f ) - [ f ( x2 ) - f ( x1 ) ] ≥ V x 21 ( f ) - | f ( x2 ) - f ( x1 ) | .
x
但是很明显有 | f ( x 2 ) - f ( x1 ) | ≤V x 21 ( f ) , 因为左方 只是 f ( x ) 在区间 [ x1 , x2 ] 对 一个特 殊分 划
或者
n-1
ε
∑
b
V ( f) <
x | f ( x i + 1 ) - f ( xi ) | +
0
i= 0 2
n-1
ε
= | f ( x1 ) - f ( x0 ) | + ∑ i=1
| f ( xi + 1 ) - f ( xi ) | +
2
n-1
∑
b
< ε+ | f ( x i + 1 ) - f ( xi ) | ≤ε+ Vx 1 ( f ) .
i= 1
这样一来
b b
0≤ Vx 0 ( f ) - Vx 1 ( f ) < ε,
而
x b b
V ( x1 ) - V ( x0 ) = V x 10 ( f ) = Vx 0 ( f ) - Vx 1 ( f ) < ε.
n-1
∑
i=0
| [ a f1 ( x i + 1 ) + bf 2 ( xi + 1 ) ] - [ a f1 ( x i ) + b f2 ( x i ) ] |
n-1 n- 1
≤| a| ∑
i=0
| f1 ( x i + 1 ) - f1 ( x i ) | + | b | ∑
i= 0
| f2 ( xi + 1 ) - f 2 ( xi ) |
β β
≤ | a | Vα ( f1 ) + | b | Vα ( f2 )
即知 .
注 也很容易证明 f1 ( x )・f2 ( x ) , f1 ( x ) f2 ( x ) ( 若 f 2 ( x ) ≠0) 也都是有界变差函数 .
下面我们要证明, [ a, b]上的单调函数必在[ a, b]上几乎处处有导数,所以有界变差函数也几乎处
处有导数 .这个重要结论证明较长,我们放在后面 .现在先承认它, 于是就可以回答第一个问题 .
x
为 [ a , b] 上之有界变差函数 , 且几乎处处有
x
d
dx∫ f ( t) d t = f ( x)
a
. ( 7)
证 仿照定义勒贝格可积函数那样 , 把 f ( x ) 写为
f ( x ) = f + ( x ) - f - ( x ) , f± ( x ) ≥ 0 ,
则有
x x
F( x ) = ∫f a
+
∫f
( t)d t -
a
- ( t ) d t = F+ ( x ) - F - ( x ) .
因为 f ± ( x ) ≥ 0 , 所 以 F± ( x ) 均为 单调 不 减 .所以 由 定理 2 , F( x ) 是有 界变 差函 数 , 而且 易 见
F± ( x ) 都是连续函数 .余下的仅是证明 ( 7) 式 .这里我们需要一个引理 .
x
引理 4 若 f ( x ) 在 [ a , b] 上为勒贝格可积 , 且对一切 x ∈ [ a , b] , ∫ f ( t ) d t = 0 , 则在 [ a , b]
a
上 , f ( x ) 几乎处处为 0 .
证 用反证法 , 设结论不成立 , 从而可以找到一个正测度集 E , 使 f ( x ) > 0 ( 或 < 0 ) 于 E 上 ,
c
因为 E 必可含于 [ a , b] 的一个测度小于 b - a 的开子集内 , 从而 E 中必含一个具有正测度的闭
x
∫ f ( t)d t =∫ f ( t) d t ∫ ∫
c k k k
积分的差 .但 E = ∪ (αk ,βk ) , 而 - f ( t )d t = 0 , 从而 c
f ( t) d t = 0 .但这
α a a E
k
所以用勒贝格控制收敛定理有
x x
F( t + l) - F( t )
lim
l→ 0 ∫ a l
dt= ∫ F′( t ) d t .
a
( 9)
x+ l x x+ l a+ l
1 1 1
然而其左方的积分又等于
l ∫ a+ l
F( t ) d t -
l ∫ a
F ( t)d t =
l ∫ -∫ x a
F ( t ) d t .由 F ( x ) 之
x
连续性 , 可以把这两个积分均理 解为 黎 曼积 分 , 而知 其 极限 是 F ( x ) - F( a ) = ∫ f ( t) d t , 代入
a
(9 ) 即得
x
∫ [ F′( t ) -
a
f ( t) ]d t = 0 .
证 因 为 φ( x ) 非 减 从 而 是 有 界 变 差 函 数 , 故 φ′( x ) 几 乎 处 处 存 在 .但 是 另 一 方 面
φ( x + l ) - φ( x )
≥0 , 因为 φ( x ) 是非减的 .故由法图引理
l
β β β
φ( x + l ) - φ( x ) φ( x + l ) - φ( x )
∫
lim
l→ 0 α l
d x≥ ∫ α
lim
l
dx= ∫ φ′( x ) d x .
α
≥0 , 从而 ∫ { f ( t) - [ f( t) ]
a
N }d t 不减 , 连续且几乎处处有导数存在 , 其导数自然非负 .因此
x x
d
∫ f ( t) d t ≥ d
dx a dx ∫ [ f ( t) ]
a
N dt . (11)
d
但 [ f ( t ) ] N 是有界可积的 , 故右方几乎处处为 [ f ( x ) ] N , 左方则由 F( x ) 之定义为 F( x ) , 于是
dx
F′( x ) ≥ [ f ( x ) ] N 在 [ a , b] 上几乎处处成立 .
双方积分 , 再令 N→∞ , 有
b b
∫ F′( x ) d x≥∫ f ( x ) d t =
a a
F( b) - F( a) .
b
但是 , 引理 5 又告诉我们 ∫ F′( x ) d x ≤ F( b) -
a
F( a) , 所以
b
∫ { F′( x ) -
a
f ( x ) }d x = 0 .
由引理 4 即得定理之证 .
2 . 单调函数的导数 定理 3 的证明依赖于单调函数几乎处处有导数这一 重要结果 .现在 我
1
们来给予证明 .它的基本思想是考虑 [ f ( x + l ) - f ( x ) ] 的极限问 题 .这个极限 可能不 存在 .但
l
是分别考虑 l > 0 与 l < 0 , 亦 即考虑左、右 极限 , 如果左 右极限也 不存在 , 则至 少其上、下 极限 存
§3 勒贝格积分的初步介绍 (续 ) 2 31
在 , 于是我们考虑四个数
+ 1
D f ( x ) = l→
lim [ f ( x + l) - f ( x ) ] ;
0+ l
1
D + f ( x ) = lim [ f ( x + l) - f ( x ) ] ;
l→ 0 + l
- 1
D f ( x ) = l→
lim [ f ( x + l) - f ( x ) ] ;
0 - l
1
D - f ( x ) = l→
lim [ f ( x + l) - f ( x ) ] ,
0 - l
±号分别表示右、左极限 , 写在 D 的 上、下角 分别 表示 上、下极 限 .所 以这 四个 数分 别 称为 右上、
……、左下导数 .所谓 f ( x ) 在某点 x 有导数 , 就是指在 x 点的这四个数相等 .而只要有任何两个
不相等 , 则 f ( x ) 在 x 点不可导 .然后 , 我们就分别考虑四个集合 , 例如
-
E = { x : D+ f ( x ) < D f ( x )}
并证明 m ( E) = 0 , 这样我们将证得以下的极重要的定理 :
定理 6( 勒贝格 ) 若定义在 [ a, b] 上的函数 f ( x ) 是单调的 , 则 f′( x ) 几乎处处存在 .
这个定理虽然陈述 十 分明 确 , 其 证 明 则相 当 复杂 .下面 我 们只 对 f ( x ) 单 调 不减 的 情 况 证
明 , 先证一个引理 .
引理 7( 里斯 ) 设 G( x ) 在 [ a , b] 上 连续 , 如 果在 x ∈ [ a , b] 右 方有 一点 ξ在 [ a, b] 中 , 使
G( x ) < G(ξ) , 则称 x 为上升点 , 所有的上升点成为一个开集 , 而 由许多区 间组成 , 若 ( ak , bk ) 是
一个组成区间 , 则必有
G( ak ) ≤ G ( bk ) . (12)
证 因为 G ( x ) 是连续的 , 故上升点 x 的某个 邻域中 之点也都 是上升 点 .因此 , 上升 点之 集
合相对于 [ a , b] 是开集 , 而由若干个开区间 ( ak , bk ) 组成 ( 但 可能 有一个 是 [ a , bk ) 这也是 一个 相
对开区间 ) , 今证对一切 x∈ ( ak , bk ) 均有 G ( x ) ≤ G ( bk ) .然后 , 令 x→ ak 即得 ( 12 ) 式 .在证明 之
前先提醒一下 , 在 [ bk , b] 中的一切 x , 均有
G( x ) ≤ G( bk ) , (13)
否则 , bk 也是一个上升点 , 从而 [ bk , bk + η) ( η> 0 是一个常数 ) 都是上 升点 , 而 ( ak , bk ) 不再是 上
升点集合的组成区间 , ( ak , bk + η) 才是 .
现证在 ( ak , bk ) 内 , ( 13 ) 也 成 立 , 我 们 用 反 证 法 明 它 .若 有 一 点 x0 ∈ ( ak , bk ) 使 G ( x0 ) >
G( bk ) , 寻找 ( ak , bk ) 中等于 G ( x0 ) 的最右一点 :
x′
0 = sup{ x∈ ( ak , bk ) , G ( x0 ) = G ( x ) } . (14)
0 当然不是 bk , 因为上面已设 G ( x0 ) > G ( bk ) 而 G( bk ) 不可能等于 G( x0 ) , 因此 x′
x′ 0 是 ( ak , bk )
的内点 , 这个 x′
0 也是一个上升点 , 而 且有 一个 非空 区间 [ x′
0 , bk ] 使 得在 此区 间内 ( 13 ) 式也 成立 ,
* * *
不然的话 , 应有 x0 ∈ ( x′
0 , bk ] 使 G ( x0 ) > G ( bk ) .如果 G ( x0 ) = G( x′
0 ) = G( x0 ) , 则 与 ( 14 ) 相
~
*
矛盾 , 若 G( x0 ) > G ( x′
0 ) = G ( x0 ) > G ( bk ) , 则 由 连 续 函 数 的 中 值 定 值 理 , 应 有 另 一 点 x ∈
~
*
( x0 , bk ] 使 G( x ) = G( x0 ) , 这又与 ( 14 ) 矛盾 .
总之 , 在 [ x′
0 , bk ] 中 , G ( x ) ≤ G ( bk ) , 在 [ bk , b] 中 ( 13 ) 式即 G ( x ) ≤ G ( bk ) 也 成立 .否 则 bk
2 32 第四章 积 分 学
上升点相矛盾 , 从而引理得证 .
现在开始证明定理 6 , 我们 又 分 成几 个 步骤 .每一 步 分别 考 虑 f′( x ) 不 存 在的 一 种可 能 情
况 , 并且证明每种情况都只能在一个零测度集上 成立 .但是我们 暂且仅 限于 f ( x ) 不仅单 调而 且
连续的情况 .
+
1 .E = { x:D f ( x ) = + ∞}是零测度集 之证 明 .对 E 中的 x , 对任意 固定 的大数 C , 必可 找
f (ξ) - f ( x )
到 ξ> x 使 > C , 亦即
ξ- x
f ( x ) - Cx < f (ξ) - Cξ.
这就是说 , E 中的 x 必 定都 是 f ( x ) - Cx 的 上升 点 , 因 而 E 是一 个 开 集 , 而 E 是若 干 开 区 间
( ak , bk ) 之并 : E = ∪ ( ak , bk ) , 而由里斯引理
f ( ak ) - Cak ≤ f ( bk ) - Cbk , 即 C( bk - ak ) ≤ f ( bk ) - f ( ak ) .
对 k 相加 , 注意到 f 是单调不减的 , 故有
Cm ( E) = C ∑ ( bk - ak ) ≤ ∑ [ f( b ) k - f ( ak ) ] ≤ f ( b) - f ( a) ,
k k
由 C 之任意性即得 m ( E) = 0 .
+
2 .E = { x: D f ( x ) > D - f ( x ) }为零测度集 之证明 .可以取 c, C 为适合 D - f ( x ) < c < C <
+
D f ( x ) 之一切可能的有理数 , 而把 E 分成可数多个集 Ec, C 之并 :
+
Ec, C = { x : D - f ( x ) < c < C < D f ( x )} ,
再来证明每一个 Ec, C 均为零测度集 .
这时我们要把上升点的定义稍加修改 .其实前面讲的 ξ> x 在 x 右方 , 所以确切 一点应该 称
这种 x 为右上升点 .与此相应 , 若在 x 左方某点ξ处 , 即 ξ< x 处 , 有 G (ξ) > G ( x ) , 就称 x 点为
G( x ) 的左上升点 , 而对于结论 G( ak ) ≥ G ( bk ) 里斯引理仍成立 .于是对于 x∈ E , 由 D - f ( x ) <
c 知必有ξ< x 使
f (ξ) - f ( x )
< c,
ξ- x
亦即
f (ξ) - cξ> f ( x ) - cx ( 注意 ξ- x < 0 ) ,
而知 x 是 G ( x ) = f ( x ) - cx 之左上升点 , 仿 照引 理 7 的证 明知 Ec, C ∪ ( ak , bk ) , 而 G ( ak ) ≥
G( bx ) .即
f ( bk ) - f ( ak ) ≤ c( bk - ak ) . (15)
现在我们限制取一个 ( ak , bk ) 来研究 , 以它代替 ( a , b) .注意一个函数 G ( x ) 在 ( a , b) 的右 上
升点之概念与它在 ( ak , bk ) ( a, b) 中的右上升点概念不同 .对于前者 , 一定存在 ξ> x 于 ( a , b)
中适合 G (ξ) > G( x ) , 这个 ξ不一定在 ( ak , bk ) 中 ; 对于 后者 , 则 这个 ξ不 但在 ( a , b) 中 而且 要
求在其一个子区间 ( ak , bk ) 中 .所以前一意义下 的右上 升点不 一定 是后一 种意 义下 的右上 升点 .
所以当我们要求出 G ( x ) 在 ( ak , bk ) 中的右上升 点时 , 将得到 的是 ( ak , bk ) 的若 干个子 区间 ( akj ,
+
bkj ) ( ak , bk ) , 这里 k 固定但 j 可以变化 .现在把这个概念用 于 Ec , C 中 .由于在 Ec, C 中 D f ( x)
§3 勒贝格积分的初步介绍 (续 ) 2 33
而由里斯引理有
f ( bkj ) - f ( akj ) ≥ C( bkj - akj ) .
对 j 求和有
1 1
∑ ( bkj - akj ) ≤
j C∑j
[ f ( bkj ) - f ( akj ) ] ≤
C
[ f ( bk ) - f ( ak ) ] .
再用 (15) 式并且对 k 求和 , 就有
c c
∑∑ ( b
k j
kj - akj ) ≤ ∑
C k
( bk - ak ) ≤ ( b - a) .
C
(16)
+
总之我们看到 , 对 D - f < c 和 D f > C 各用一 次 , 即可 把 Ec, C 放 在一 个很 细的 覆盖 { ( akj , bkj )}
中 , 且 ( 15 ) 成立 .
再取一个 ( akj , bkj ) , 并在其中考查 Ec, C , 又可以得 到更 精细 的覆盖 ( 现在 小区间 下有 4 个 脚
标了 , 因为 D - f < c 与 D + f > C 又都各用了一次 ) :
2
c c
∑ ∑∑ ∑ ( b
k j l m
kjl m - akj lm ) ≤ ∑ ∑ ( akj - akj ) ≤
C k j C
( b - a) .
如此进行 p 个循环会发现
c p
me ( Ec, C ) ≤ ( ) ( b - a) →0 . (17)
C
所以 Ec, C 是零测度集 .再对 c, C 求和 , 因为一共只有可数多个 Ec, C , 所以有 m ( E) = 0 .
-
3 .E = { x: D f ( x ) > D + f ( x )} 为零 测度 集之证 明 .
现在在 与 [ a , b ] 对 称 的 区 间 [ - b, - a ] 上 定 义 函 数
*
f ( y) 如下 ( 图 4 - 3 - 1 ) :
*
f ( y) = - f ( x) , y = - x .
*
显然 f ( y ) 在 [ - b, - a ] 上 是上 升 的 , 而 且 由前 面 的证
明知
+ *
m { y: D f ( y ) = + ∞} = 0 ,
+ * *
m{ y: D f ( y ) > D - f ( y )} = 0 .
但是若取 k 充分小使 y + k 仍在 [ - b, - a] 中 ( y 为端点
时需要作的修改是自明的 ) , 则
* 图4 - 3- 1
f ( y + k ) = - f ( x - k) ,
* *
f ( y + k) - f ( y) f( x - k) - f ( x)
= - .
k k
记 h = - k, 则当 k→0±时 , h→0 ê , 因此上式成为
2 34 第四章 积 分 学
* *
f ( y + k) - f ( y) f ( x + h) - f ( x )
= .
k h
双方取上、下极限 , 即有
± * ê
D f ( y) = D f( x ) .
从而
-
m ( E) = m{ x : D f ( x) = + ∞} = 0
以及
-
m ( E ) = m{ x:D f ( x ) > D+ f ( x ) } = 0 . (18)
4 . 不 连 续 情 况 的 证 明 总 结 前 几 段 得 知 对 于 连 续 单 调 不 减 的 f ( x ) , 1 .几 乎 处 处 有
+ + -
D f ( x ) < + ∞ ; 2 .几乎处处有 D f ( x ) ≤D - f ( x ) ; 3 .几乎 处处有 D f ( x ) ≤D + f ( x ) .再加 上
自然就成立的下极限不大于上极限 , 我们终于得知
+ - +
0≤D f ( x ) ≤D - f ( x ) ≤D f ( x ) ≤D + f ( x ) ≤D f ( x) < + ∞
±
几乎处处成立 .最左方的“ 0≤”来自 f ( x ) 不减的假设 , 使得 D f , D± f ≥0 .由于这个 不等式串 首
+
尾均是有限的 D f ( x ) , 所以在 [ a , b] 上 , 对于连续的不减函数 f ( x ) , 几乎处处有
- +
0≤D - f ( x ) = D + f ( x ) = D f ( x ) = D f ( x ) < + ∞ , (19)
亦即这样的 f ( x ) 在 [ a , b] 上几乎处处有导数 f′( x ) .于是对连续的不减函数 f ( x ) , 勒贝格定 理
( 定理 6 ) 成立 .为了把这个结论 推广 到一 般的非 减函 数 , 需要注 意非 减函数 只有 第一 类间 断点 ,
若 x0 是一个间断点 , 则 f ( x0 - 0) ≤ f ( x0 + 0) 均存在 , 而 f ( x0 + 0) - f ( x0 - 0 ) 是 该点的 跃度 .
注意到∑ [ f ( x 0 + 0) - f ( x0 - 0 ) ] ≤ f ( b) - f ( a ) ( ∑ 是对 所有 间断点 求和 ) , 所 以跃度 ≥ 1 的 间
1
断点为数有限 ; ≤跃度 < 1 的 间断点 也只 有有 限个 .这样 一来 间断点 最多 有可数 多 个 .我们 不
2
要以为这可数多个间断点必将 [ a , b] 分成可 数多 个小区 间 , 在每 一个 小区间 中 f ( x ) 均连 续 , 因
此可以利用上面的证明 .因为这些间断点可能是处处稠密的 , 所以它们把 [ a , b] 划分 为可数多 个
小区间这个很直观的图像并不正确 .§1 就举了一个这样的例 子 .( 其实 , 上 面讲的间 断点可数 的
证明也不严格 .因为 在不 清 楚它 们 是 否可 数 之前 “
, ∑”的 记 号是 不 能 用的 , 但 读 者不 难 自 行 改
正 .) 所以 , 我们需要把里斯引理修改如下 : 设 引理 7 中 的 G ( x ) 只 是单调 不减 而不一 定连 续 .我
们定义 x∈ [ a , b] 为右上升点 : 如果在它的右方有点 ξ> x 存在 , 且使
max[ G( x ) , G ( x - 0 ) , G ( x + 0 ) ] < G (ξ - 0) ,
则称 x 为右上升点 , 这种右上升点仍 成开 集 , 从而由 可数 多个开 区间 ( ak , bk ) 组成 .里斯 引理 指
出
G ( ak + 0) ≤ G ( bk - 0) .
左上升点情况也一样 , 然后定理 6 的证明就不需改变了 .至此定理 6 证毕 .
问题Ⅰ的解答至此已明白了 .下面转向问题Ⅱ .
3 . 原函数 , 绝对 连续性 问题 Ⅱ和问 题Ⅰ 的角度是 不一样的 .问 题Ⅰ 是已知一 个勒贝格 可
x
∫ f ( t ) d t = F( b) -
a
F( a) . (20)
∫ F′( x )d x < F( b) -
a
F( a) .
∑ k= 1
| F( bk ) - F( ak ) | < ε, (21)
就说 F( x ) 在 [ a , b] 上绝对连续 .
绝对连续函数有一些简单的性质 :
(1 ) 它是连续的 , 只要令 n = 1 就可以看到 , 因此它必然是有界的 .
(2 ) 它具有有界变差 , 只要把 [ a , b] 分成若干小区间之并 , 使每一个小区间之长小于 δ, 然 后
在这些小区间 上 任 作 分 划 , 即可 用 ( 21 ) 式 证 明 f ( x ) 在 每 个 小 区 间 上 都 有 有 界 变 差 , 从 而 在
[ a , b] 上也有有界变差 .
(3 ) 绝对连续函数组成一个线性空间 , 两个绝对连续函数之积也是绝对连续的 .
以上性质均容易证明 , 我们略去 .
以下的目的是证明 , 问题 Ⅱ的答 案是 : F( x ) 在 [ a , b] 上绝对连 续 .为了证明 它 , 我们又需 要
一个看来几乎自明但实际上不太易证的引理 .
引理 8 若 F ( x ) 在 [ a , b] 上不 减 , 且 为 绝对 连 续 , 则 当 F′( x ) = 0 ( a .e .) 时 , F ( x ) ≡
const .
证 先说一下这个引理实际上不太易证明的原因 .在通常的微积分教材中 , 由 F′( x ) = 0 得
证 F( x ) = const 是用了拉格朗日定理的 , 而这就要求 F′( x ) 处 处存在 而非几乎 处处存在 . F ( x )
的绝对连续性与单调性都只能保证 F′( x ) 几乎处处存在 .
由于 F( x ) 不减 , 所以它映 [ a , b] 为 区间 δ= [ F( a) , F( b) ] , 今证 m ( [ F ( a ) , F( b) ] ) = 0 ,
从而 [ F( a) , F( b) ] 缩为一点而引理得 证 .设 Z 为 使 F′( x ) 不存 在或 存在 而不为 0 之 点 x 的 集
合 , 于是 m ( Z ) = 0 .记 E 为 Z 之余集 , 于是 m ( E) = b - a , 显然
δ= F( Z) ∪ F( E) .
我们再分别证明 F( Z) 与 F( E) 均为 0 测度集 .
对任一 ε> 0 , 按绝对连续性条件找到 δ(ε) > 0 , 然后用一组 ( 可能有可数多个 ) 长度 < δ的互
不重叠 ( 但 端 点 可 以 相 接 ) 的 小 区 间 {Δk } 把 Z 覆 盖 起 来 , Z Δ1 ∪ … ∪Δn ∪ … , 显 然 F ( Z )
∞ ∞ N N
∪ F(Δ ) , 但 ∪
k=1
k
k= 1
F(Δk ) = Nlim
→∞
k=1
∪ F(Δk ) .由 绝对 连 续性 , m ( ∪
k=1
F(Δk ) ) < ε.它的 外极 限
2 36 第四章 积 分 学
∪ F(Δ ) 之外测度也小于 ε, m
k=1
k e ( F( Z) ) < ε自然也成立 .由 ε之任意性知 F( Z) 有零测度 .
+
至于 F( E) , 则注意到对 x ∈ E , F′( x ) = 0 , 从而 D F( x ) < ε, 所以必有一个 ξ> x 使
F(ξ) - F( x )
< ε.
ξ- x
也就是说 ε
ξ- F(ξ) ≥εx - F( x ) , 而 x 是 εx - F( x ) 之右上升点 .由里斯引理 ( 引理 6) , 所有的右上
升点之集合为若干个开区间 ( ak , bk )之并 , 而且,εak - F( ak ) ≤εbk - F( bk ) .即有 F( bk ) - F( ak ) <
ε( bk - ak ) , 对 k 求和有
∑ [ F( b )
k
k - F( ak ) ] < ε∑ ( bk - ak ) ≤ε( b - a) .
k
但 F( E) ∪
k
[ F( ak ) , F( bk ) ] , 所以 , me ( F( E) ) < ε( b - a) , 而知 F ( E ) 也 是零 测度集 .引 理
证毕 .
这个引理有点怪 : 为什么要 假设“ F ( x ) 不 减”? 似乎 只要 F′( x ) = 0 即 应有 F( x ) ≡ const .
关键是我们没有了拉格朗日公式 .在第三章我们就一再指出拉格朗日公式的重要性 , 这里又是一
个证据 .看来 , 拉格朗日公式有点“娇嫩”, 只要有一点不可求导 , 它就不适用了 .然而 , 最后我们还
是可以抛弃 F( x ) 不减这个假设 , 由下面即将证明的定理 9 , 只要 F( x ) 绝对连续 , 而且 F′(0 ) = 0
( a .e .) , 则
b
F( b) - F( a ) = ∫ F′( t ) d t = 0 .
a
定理 9 ( 勒 贝 格 ) F ( x ) a .e .具 有 勒 贝 格 可 积 的 导 数 F′( x ) 且 使 ( 20 ) 成 立 ( 取 f ( x ) =
F′( x ) ) 之充分必要条件是 , F( x ) 在 [ a , b] 上绝对连续 .
证 必要 性 , 对 于 任 一 ε> 0 , 取 [ a , b] 的 有 限 多 个 互 不 重 叠 的 子 区 间 [ ak , bk ] , 记 E =
N
∪[ a
k= 1
k , bk ] , 则
N N b N b
∑∫ ∑∫ ∫ F′( t)
k k
∑ k=1
F( bk ) - F( ak ) =
k=1 a
k
F′( t ) d t ≤
k= 1 a
k
F′( t )d t =
E
dt .
但是由勒贝 格 可 积 函 数 的 性 质 ( iv ) : 积 分 对 积 分 区 域 之 连 续 性 可 知 , 一 定 存 在 δ(ε) , 而 当
m ( E ) < δ时上式右方小于ε, 因此 F( x ) 绝对连续 .
充分性 .设 F( x ) 为绝对连续 , 它必具有界变差 , 且因 F( x ) 连 续 , 故可写 为两 个连续 不减 函
数之差 .所以 , 不失一般性可设 F( x ) 为连续不减函数 .引理 5 告诉我们 F′( x ) 为可积的 , 而且
β
∫ F′( x ) d x ≤ F(β) -
α
F( α) .
x
它还是不减的 , 因此由引理 5
β
最后
x
d d
dx
[ F( x ) - G ( x ) ] = F′( x ) -
dx ∫ F′( t ) d t = 0 ,
a
( a .e .)
§3 勒贝格积分的初步介绍 (续 ) 2 37
F( x ) = G ( x ) + F( a) - G( a) = F( a) + ∫ F′( t ) d t .
a
连续函数类
∫ 1
C 函数类
d
dx
Ⅱ 黎曼可积函数框架下
x
∫
( R ) 可积函数类 ( ?)
d
dx
Ⅲ 勒贝格积分框架下
x
( L ) 可积函数类
∫ 绝对连续函数类
d
dx
但是在这两 种 积 分 框 架 下 都 得 不 到 人 们 以 为 自 然 会 成 立 的 结 论 : 若 F′( x ) = f ( x ) , 则
x
∫ f ( t ) d t .即是说我们不会得到那么简单的结论 : 积分与微分互为逆运算 .
F( x ) = F( a) +
a
∫ Φ( x ) ψ( x ) d x +∫ φ( x ) Ψ( x ) d x = Φ( b) Ψ( b) - Φ( a) Ψ( a) .
a a
(22)
∫ Φ( x ) ψ( x ) d x = Φ( x ) Ψ( x ) -∫ φ( x ) Ψ( x ) d x .
a a a
(23)
i=1
n
i= 1
2 38 第四章 积 分 学
A
f ( x , y ) d xd y = ∫ d∫
x
a c
f ( x , y) d y = ∫ d∫
c
y f ( x , y) d x .
a
(24)
但若 f ( x , y ) 仅是黎曼可积 , §1 定理 ( 11 ) 则只给出
b d b - d
A
f ( x , y ) d xd y = ∫ d x∫-
a c
f ( x , y) d y = ∫ d x∫a c
f ( x , y) d y
d b d - b
=∫d ∫
y
c
-
f ( x , y ) d x =∫ d ∫
a
y f ( x , y) d x ,
c a
I( x ) = ∫ f ( x , y) d y
c
在 [ a , b] 上勒贝格可积 .
(2 ) 将 x 与 y 对调 , 相应结果也成立 .
(3 ) 二重积分可以化为逐次积分即有
b d d b
A
f ( x , y ) d xd y = ∫ d∫
x
a c
f ( x , y) d y = ∫ d∫
c
y f ( x , y) d x .
a
m ( Ω) = χΩ ( x , y ) d xd y .
A
应用富比尼定理于 χΩ ( x , y ) 有
b d d b
m ( Ω) = ∫ d∫
x χ ( x , y )d y =∫ d ∫
a c
y χ ( x , y) d x .
Ω
c a
Ω
但是例如 ∫χ ( x , y ) d y =
c
Ω mΩ ( x ) 表示 Ω 在直线 x = 常数上截出的一维集合的线性测度 , 因此我
们又有
§4 平方可积函数 2 39
m ( Ω) = ∫m a
Ω ( x) d x = ∫m c
Ω ( y) d y . (25)
1
1 1
∫(-
=
0 x
+ )d x = 0 .
x
但是
∞ 1 ∞ 1 1
1 - 1 - 2 xy
∫ d∫ ∫
- xy - 2 xy xy
y (e - 2e )d x = - e + e dy
0 0 0 y 0 y 0
∞ - y
e
∫
- y
= [e - 1]d y < 0 .
0 y
但是在一定条件下 , 逐次积分仍可交换积分次序 :
定理 13( 托乃利 ( Tonelli) 定理 ) 若 f ( x , y ) ≥0 为可测函数 , 则 (24) 式中的三个积分中只要
有一个存在 , 另外两个一定也存在 , 且 (24) 式成立 .
n n
下一章中我们将再陈述这两个定理 , 但积分区域改为 Rx ×Ry .
最后我们还要提一下 , 多重积分的变量变换公式
1 n
( x ,…x )
∫ f ( x ) d x =∫ f [ x , y ]
Ω Ω
1 n
( y ,…y )
dy
x y
- - 1
对勒贝格积分也成立 , 这里 x = x ( y ) 是由 Ωy 到 Ω x 的 C 映射且 其逆也 是 .这个 结论在 最后 一
章中要反复用到 , 不过其证明涉及如何从测度的观点研究导数 , 于此只好暂略 .
§4 平方可积函数
2
1 . L 空间的定义 现在考虑一个问题 : 要测量某个物理量 ( 例如气体压 力 ) 在不同条 件 ( 例
如不同温度 ) 下的值 .设有 N 个温度值 , 第一次测量的结果是
(1) (2) ( 1)
a1 , a2 , … , a N ,
第二次测量的结果是
(2) (2) ( 2)
a1 , a2 , … , a N ,
应该怎样评估两次测量的偏差 ? 一个最直接的设想是计算每个温度下测量偏差之和 :
N
1 (1) ( 2)
N ∑k=1
( ak - ak ) .
N
1
∑
(1) ( 2)
| ak - ak | .
N k=1
∑
( 1) 2 2
δ= ( ak - ak ) . ( 2)
N k=1
(1) (2)
δ的量纲显然与测量值 a k , a k 一致 , 因此它是合理的 .
Δ 称为方差 ,δ称为标准差 .用方差和标准差来估量偏差 , 早在高斯 以前就 有了 , 而高斯系 统
地发展了它的理论特别是“最小二乘方”方法 .可是我们要从另一个角度来看待它 .
从数学上看采用 (1 ) 或 ( 2) 还有一个极大的好处 , 如果我们视一次测量的结果为 N 维空间 的
(1 ) (2) (1 ) (2) 1
点 : ( a1 , … , a N ) 和 ( a1 , … , a N ) , 则 ( 2 ) 和 ( 1 ) , 除 去 因子 后恰 好是 这两 点的 欧 氏距 离及 其
N
平方 .这样 , 我们就可以用欧氏几何的概念和工具来处理它们 .
以上考虑的是 离 散 的 情 况 , 如 果 把 观 测 压 力 对 温 度 的 变 化 连 续 进行 , 则 会 得 到 两 个 函 数
b
∫[f
(1) (2) (1) ( 2) 2
f ( x)和 f ( x ) , 而 ( 1) 成为 ( x) - f ( x ) ] d x .总 之 , 我们会 得到 函数 平方的 积分 .
a
的每个紧子集 K 都含于某个 Ωk 中 .记 Ek = E∩ Ωk , 于是 E1 E2 …且 E = ∪
k=1
Ek 是{ Ek } 的外
2
现在要问 , 若 f ( x ) ∈ L ( E) , f ( x ) 本身是否勒贝格可积 ? 需知 , 定义中并未要求这 一点 .注
意到
2
1 + | f ( x) |
| f ( x) | ≤
2
1
可见 , 若 E 具有限测度 , 上式右方是可积的 , 因为 是 可积函数 .但 若 E 只 是σ有 限测度 而本 身
2
1
并不具有限 测 度 ( 我 们 也 说 m ( E ) = + ∞ ) , 则 上 式 不 说 明 问 题 .以 E = [ 1 , ∞ ) R 为例,
- 2 3 2
f ( x) = x 是平方可积的 , 但本身并不可积 .定义中一般不要求 L ( E ) 函 数本身为 勒贝格可 积
原因在此 .
2
关于 L ( E ) 的性质 , 我们首先给出
2
定理 1 L ( E) 是一个线性空间 .
2
证 设 f1 ( x ) , f 2 ( x ) ∈ L ( E ) , c1 , c2 是 实 ( 或 复 ) 常 数 , 则 显 然 c1 f1 ( x ) , c2 f2 ( x ) ∈
2 2
L ( E) , 余下只需证明 f1 ( x ) + f2 ( x ) ∈ L ( E) 即可 , 这是很容易的 , 因为
2 2 2 2
| f1 ( x ) + f2 ( x ) | ≤ ( | f1 ( x ) | + | f2 ( x ) | ) ≤ 2 | f1 ( x ) | + 2 | f2 ( x ) | .
而右方是可积的 , 左方至少是可测的 , 而且易证左方也是可积的 .
2
注 若 c 取复值 , 我们当然也应令 f1 ( x ) , f2 ( x ) 为复 值 ( 但 x ∈R 仍 为实的 ) 函数 .复值 函
数的积分很容易定义 : 只需其实 , 虚部均为可积即可 , 而且本章中一切结果 ( 除专门规定适用于实
值函数者———如正性———外 ) 全部适用 .量子物理的最基本的函数类 ( 函数空间 ) 就是复值的 .
2
关于 L ( E ) 函数之积则有
2
定理 2 若 f ( x ) , g( x ) ∈ L ( E) , 则 f ( x ) g( x ) 为勒贝格可积 .
2
证 先看实 L ( E ) 空间 , 因
2 2 2
( | f ( x ) | - | g( x ) | ) = | f ( x ) | + | g( x ) | - 2 | f ( x ) g( x ) | ≥ 0 ,
故
1 2 1 2
| f ( x ) g( x ) | ≤ | f ( x ) | + | g( x ) | .
2 2
左方是可测的 , 右方由定理 1 是两个可积函数之和故为可积的 .因此结论成立 .
2 -
这个证明对复 L 空间自然仍成立 , 但我们习惯说 f ( x ) g ( x ) 可积 .这当然只是 一个记号 问
题 , 但是在量子力学中 , 其中却有深意 .
2
我们在本节之始就提出 , 定义 L 空间有一基本的思想 , 就是希 望它尽 可能与欧 氏空间在 几
(1) ( 1) N
何上接近 .一开始 , 我们就对离散的情况指出 , 一次测量 的结果 ( a1 , … , a N ) 是 R 空间 中一 个
2
向量 , 那么在连续的情况下一个 L 函数 f ( x ) 自然也 可看 作一 个向量 .( 而且 , 现在 x ∈ E 而 E
中一般有无穷多个点 x , f ( x ) 岂非应看作无穷维空间的向量 ( 或点 ) 吗 ? f ( x ) 确实是一个无穷 维
空间中的向量 , 但是完全不是刚才讲的意义 , 这一点下面马上就要讲 .) 欧氏空间的几何学有两个
N 2 1 2
(1)
基本的 量 , 一 是 长 度 , 二 是 角 度 .在 离 散 情 况 下 长 度 是 ∑
k= 1
a k , 那么 现在 是否 应 以
2 1 2 N
∫ f ( x) ∑
(1) (2 )
dx 作为其长度 ? 至于两个向 量的 交角 可以 用 内积 a k ・a k 来 定义 , 现在 是
k=1
E
2 42 第四章 积 分 学
∫
2
否应定义两个 L 函数 f ( x ) , g( x ) 之内积为 f ( x ) g ( x ) d x ? 确实如此 .
E
2
定义 2 设 f ( x ) , g( x ) ∈ L ( E) , 我们定义 f ( x ) 之模 ( 或称范数 , 就是长度 ) 为
2 1 2
‖ f‖L 2
= ∫ f( x)
E
dx . ( 3)
2
定义实 L 空间中 f ( x ) 与 g( x ) 之内积为
〈f , g〉L 2 = ∫f ( x ) g( x ) d x .
E
( 4)
2
复 L 空间中的 f ( x ) 与 g( x ) 之内积则定义为
( f , g) L 2 = ∫f ( x ) g( x ) d x .
E
( 5)
2
注 (4 ) 和 ( 5) 都是对两 个 L 函 数规 定一个 实或 复数与 之对 应 , 都称为 配对 .( 4 ) 有 时称 为
欧氏配对 , 用尖括号表示 .(5 ) 称为埃尔米特 ( C .Hermite———法国数学家 ) 配对 , 用圆括号表示 .但
2 2
是有的书则记号相反 .但不论 是哪一 种配对都 有〈 f , f〉= ‖ f ‖ L2 , ( f , f ) = ‖ f ‖ L2 , 模或范 数
之下标在不发生误会时可以略去 .
N
定义角度的根本公式是余弦定理 , 因为若有 R 空间的两个向量 a , b, 则余弦定律是
a・b = ‖ a‖・‖ b‖cosθ.
| a・b|
所以一定有‖ a‖・‖ b‖≥ | a・b | .反之 , 只要有这样的不等式成立 , 则 ≤1 , 所以 一
‖ a‖・‖ b‖
2
定可找到一个角 θ使 a・b = ‖ a‖・‖ b‖cosθ, 0 ≤θ≤π .所以 , 如果 想把 角度 引入 L ( E) , 就 应
该找一个与余弦定理相应的不等式 .
2
定理 3( 施瓦茨 Sch warz 不等式 ) 若 f ( x ) , g( x ) ∈ L ( E) 为 实值或是复值函 数 , 则有 以下
的不等式成立
2 2 1 2
∫| f ( x ) g( x ) | d x ≤ ∫ f ( x )
E E
d x・ ∫ g( x )
E
dx , ( 6)
而且等号当且仅当 | f ( x ) | 与 | g( x ) | 几乎处处相差一个常数因子时成立 ,
∫(λ| f ( x ) | + | g( x ) | )
2
证 考虑 d x .这里 λ是实数 .它 当然是 非负 的 , 但是可 将它 写成 λ
E
的二次三项式
2
Aλ + 2 Bλ+ C≥ 0 .
∫ ∫ ∫
2 2 2
其中 A = | f( x ) | d x , B = | f ( x ) |・| g ( x ) | d x , C = | g ( x ) | d x .因 此必有 B - AC≤ 0 ,
E E E
2 2
即 (6 ) 成立 .若等号成立 , 即 B - AC = 0 , 则当 A≠0 时 , 必有一个 λ使 Aλ + Bλ+ C = 0 , 即
∫(λ| f ( x ) | + | g( x ) | ) d x = 0 ,
2
E
2
从而 λ| f ( x ) | + | g ( x ) | = 0 几 乎 处处 成 立 , 其 逆 亦 真 .若 A = 0 , 则 由 B - AC = 0 同 时 应 有
B = 0 , 这时应考虑 | f ( x ) | + μ| g( x ) | ≠ 0 , 结论相同 .
当然也就有
|〈f , g〉L 2 | ( 或 | ( f , g) L2 | ) ≤‖ f‖ L 2 ‖ g‖ L2 . ( 7)
§4 平方可积函数 2 43
2
既然 f ( x ) ∈ L ( E ) 看作一个向量时‖ f ‖ L 2 表示其长 , 则‖ f - g‖ L2 应表 示 f 与另一个 g
2
∈ L ( E) 之距离 :ρ( f , g) .但是作为一个距离 , 应该满足以下三个条件 :
( i) ρ( f , g) = ρ( g , f ) ;
( ii) ρ( f , g) ≥ 0 , ρ( f , g) = 0 f = g;
2
( iii) ( 三角形不等式 ) ρ( f , g) ≤ρ( f , h) + ρ( h , g) , h∈ L ( E) .
∫ | f ( x ) - g( x ) |
2 2
用‖ f - g‖作为 ρ( f , g)时 (i)自然是满足的, 至于 ( ii) , 因为‖ f - g‖ = d x,
E
所以自然有 ρ( f , g) ≥ 0 .由 上 一 节 讲 的勒 贝 格 积 分 的 正 性 可 知 , ρ( f , g) = 0 时 必 有 f ( x ) -
g( x ) = 0几乎处处成立 .但是在上一节中我们已经指出 , 两个几乎处处相等的勒贝格 可积函数 应
看作相同的 , 所以 f ( x ) - g( x ) 与 0 应看作相同的 .在这个意义下 f = g .
最后证明三角形不等式
∫| f ( x ) -
2 2
(ρ( f , g) ) = g( x ) | d x ≤
E
=∫[ ( f - h) + ( h - g) ] [ ( f - h) + ( h - g) ] d x
=∫| f - h | d x + 2 Re
∫( f - h) ( h - g) d x +∫
2 2
| h - g| d x
E
2 2
≤‖ f - h‖ + 2‖ f - h‖・‖ h - g‖ + ‖ h - g‖
2
= [ρ( f , h ) + ρ( h , g) ] .
所以 ( iii) 成立 .
2 2
2 . L 空间中的规范正交系 至此 , 我们已 看到 L ( E ) 与欧 氏空间 非常 相似 .欧氏 空间 中
N
的正交坐标系是十分有用的工具 .就是 说 , 在 N 维 欧氏空 间 E 中可 找到 N 个互 相正交 的单 位
向量 e1 , … , eN ; 即适合〈ei , ej〉( 或 ( ei , ej ) ) = δi j .因为 它们 是正交 的 , 所以 一定 线性无 关 , 证明 如
下 : 设有 N 个常数 c1 , … , cN ( 如果考虑实欧 氏空间 , 它 们应 为实数 , 如 果考 虑复欧 氏空 间———亦
称埃尔米特空间 ( Hermitian space) ———则应取复数 ) 使
c1 e1 + … + cN eN = 0 . ( 8)
任取 i , 1 ≤ i≤ N , 并用 ei 与上式作欧氏的或埃尔米特的内积 , 则由〈ei , ej〉= δi j ( 或 ( ei , ej ) = δij )
N
有 ci = 0 , i = 1 , 2 , … , N .因此 e1 , … , eN 线性 无关 .一 个 N 维线 性空 间 R ( 不 一定 是欧氏 空间 ,
N
即我们不一定对它赋以长度与内积 ) 的 N 个线性无关元构成一个基底 .即是说 R 的任意元 f 必
N
可用它们线性表示 .实际上 , 设有任意元 f ∈R , 则 f , ei , … , eN 是 N + 1 个元 因此 必线性 相关 :
即有不全为 0 的常数 c0 , c1 , … , cN 使
c0 f + c1 e1 + … + cN eN = 0 , ( 9)
这里一定有 c0 ≠0 , 否则会有不全为 0 的 c1 , … , cN 使 ( 8 ) 成立 , 而 这与 e1 , … , eN 线性无 关矛盾 .
既然 (9 ) 中的 c0 ≠0 , 则由 ( 9) 必有
n
ci
f= ∑ αe , α =
i=1
i i i -
c0
. (10)
∞ 2
x n
e d 2
∑
- ( s - x) n
= - e s
n=0 n! dx s= 0
∞ n n ∞
( - 1) x 2 d 2 Hn ( x ) n
∑ ∑
- x n
= e e s = s .
n=0 n! dx n=0 n!
§4 平方可积函数 2 45
∞
2 2
1
∑
- s + 2 xs - t + 2 xt m n
为了研究{ Hn ( x )}之正交性 , 考虑 e ・e = Hm ( x ) Hn ( x ) t s .双方乘 以
m, n = 0 m ! n!
2 2
- x - x
e 再对 x 在 ( - ∞ , + ∞ ) 上积分 .因为 Hm ( x ) Hn ( x ) 是 x 的 m + n 次 多项 式 , 乘上 e 后在
x→±∞时函数迅速趋于 0 , 而上 述级 数对 x 一 致收 敛 ( 也可 以用勒 贝格 控制 收敛 定 理 , 但是 视
t, s 为参数 ) 有
∞ 2 2 2
∫
- x - s + 2 xs - t + 2 x t
e e dx
-∞
∞ ∞ m n ∞
2
t s 2
∫ ∑ ∫
2 ts - ( x - t - s) - x
= e e dx = e H m ( x ) Hn ( x ) d x .
- ∞ m, n= 0 m ! n! -∞
∞
2
∫
-ξ
利用著名的高斯积分 e dξ= π( 这个积分太重要了 , 我们下一节专门讨论它 ) , 即知式左为
-∞
∞ 2 ∞ 2
∫ ∫
2 ts - ( x - t - s) 2 ts - ξ
e e dx =e e dξ (ξ= x - t - s)
-∞ - ∞
∞ n
2 n n
= π∑
2 ts
= πe t s .
n= 0 n!
与上式右方比较 , 注意到若两个幂级数相等则其同次幂系数也相等 ( 对于两个自 变量 t 和 s 的 二
∞ m+ n
F(0 , 0 )
∑
m n
重幂级数 am n t s 也容易证明 am n 为其和 F( t, s) 的导数 n n ) , 即有
m, n = 0 m ! n! t s
∞
2
∫
- x n
e Hm ( x ) Hn ( x ) d x = π2 ・n ! δm n . (14)
- ∞
2
- x
我们称此式为{ Hm ( x )} 以 e 为权的正交性 .引入了权函数 ρ( x ) ≥0 后 , 我们定义
〈f , g〉= ∫ρ( x ) f ( x ) g( x ) d x
E
(15)
∫
2 2
‖ f ‖ =〈f , f〉= ρ( x ) | f ( x ) | d x (16)
E
m
1 d 2 m
Pm ( x ) = m m ( x - 1) (18)
2 ・m !d x
是方程 (17) 的解 , 也可证明{ Pm ( x ) }是一个正交系 :
1
2
∫ -1
Pm ( x ) Pn ( x ) d x =
2m +1
δm n ,
2m+1 2m+1
因此 , 添加归一化因子 后, Pm ( x ) 就成了一个 o .n .系 .( 18 ) 称为勒让德多项
2 2
式 Pm ( x ) 的罗德里格斯 ( Rodrigues) 公式 .
2 2
举了以上几个例子以后 , 设已有 L ( E) 的 o .n .系{ f n ( x ) } , 任一个 L ( E) 函数 f ( x ) 可否仿
N
照 R 中的坐标展开式 (10) 写为
∞
f ( x) = ∑αf
n=0
n n ( x) ? (19)
N
如果可能 , 又如何求系数 αn ? 至少在一个情况下可知 ( 19 ) 式是不可能的 : 如果在 R 中从坐标系
{ e1 , … , eN }中删去若干个而得 例如 { e2 , … , eN } , 则 ( 10 ) 式 是不 可能 , 因为 这时 ( 10 ) 式右 方成 为
N N
∑ αe
i =2
i i 是与 e1 正交的 , 它们只构成一个 N - 1 维空间 .所以 ∑ αi ei 只能表示与 e1 正交的 N - 1
i=2
N
维子空间中的 全体向 量 , 而 对 R 中的全部 向量它不 可能成 立 .从 几何上 这是不言 而喻的 .现 在
2
L ( E) 在一定意义下是无穷维 向量空 间 ( 其 o .n .系含有 无穷 多个 元 , 上 面三 个例 子都是 ) .如 果
删除了 o .n .系中的若干个元 , 使 得它“不 完全”了 , 则 至多 它只能 表示 与被 删去的 元 正交 的那 些
向量 .这个删减的 o .n .系称为“不完全的”.在有 限维 空间 , 一个 o .n .系是 否完 全很 容易判 断 : 完
全性的充要条件是系中向量个数等于空间维数 , 但在无限 维情 况 , 删去若 干向 量后 , 余下 的可 能
仍是无穷个 .因此我们要从另一个角度来讨论这个问题 : 设有 o .n .系 { f n ( x ) } , 任给一个 f ( x ) ∈
N
∑
2
L ( E ) , 并且确定正整数 N , 在长度为 N 的线 性组合 ck f k ( x ) 中 , 怎 样选系 数 { c1 , … , cN } 能
k=1
N
使 f - ∑
k= 1
ck f k 最小 ?
∑ ck f k ‖ = ‖ f ‖ - 2 ∑ (αk ck ) + ∑
2 2 2
‖f - ck
k= 1 k= 1 k=1
N N N
∑ ∑ ∑
2 2 2 2 2
= ‖ f‖ - α + k (αk - ck ) ≥‖ f ‖ - αk . (20)
k= 1 k= 1 k=1
N
等式成立 :
∞
∑α
2 2
‖ f‖ ≥ k . (21)
k= 1
证 在 (20) 中令 ck = αx , 因式左非负 , 故
N
2 2
‖ f‖ - ∑
k= 1
αk ≥ 0 .
∞
∑α <
2
令 N→∞ , 即知 k + ∞且 ( 21 ) 成立 .
k=1
2 2
注 如果考虑复的 o .n .系{ f k } , 则 αk 应改为 | αk | .
N 2
注意到在 R 中 , 两个向量之内积 a・b 即 a 在 b 上之投影 .在 L ( E) 中 , 如果我们视 o .n .系
2
{ fn ( x )} 是一组单位长的互相正交的向量 , 即正交 坐标 系 , 则 f ( x ) ∈ L ( E ) 的傅 里叶系 数就 是
N
向量 f 在这些单位坐标向量上的投影 .在 R 中 , 按毕达 哥拉 斯定 理 , 如果这 些单 位正交 坐标 向
2
量没有少取的话 , 则投影的平方和应该就是是 向量长平 方 .与 此类比 , 若对 任意 f ( x ) ∈ L ( E) ,
(21) 式中有等号成立 , 则应该标志着 o .n .系{ fn ( x )} 中没有“缺少”了哪一个向量 .
2 2
定义 4 若{ f k ( x ) }是 L ( E) 中的 o .n .系 , 若再没有一个非 0 ( 即不处处为 0) 的 L ( E) 函数
与一切 f k ( x ) 正交 , 就说 { f k ( x )} 是完全的 o .n .系 .
2
定理 5 o .n .系 { f k ( x )} 为完全的充 分必 要条 件是 ( 21 ) 式对 任意 f ( x ) ∈ L ( E) 有 等号 成
立:
∞
2 2
‖ f‖ = ∑k= 1
| αk | , αk = ( f , f k ) . (22)
αk = ( f , f k ) , 我 们 来 看 级 数 ∑ αfk=1
k k .首 先 的 问 题 是 这 个 级 数 在 什 么 意 义 下 收 敛 .为 此 , 我 们
∞ N
形式地记 g ( x ) = ∑ αf
k= 1
k k ( x ) , 并 取 此 级 数 的 部 分 和 序 列 SN ( x ) = ∑ αf
k= 1
k k ( x ) .易 见
M ∞
2 2 2
‖ SN ( x ) - S M ( x ) ‖ = ∑
k = N +1
| αk | ( 设 M > N ) .由贝塞 尔不 等式 , ∑ k= 1
| αk | < + ∞ , 故 N , M
g( x ) , 此即 g( x ) = ∑ αf
k= 1
k k ( x ) 的意义 .现在再来计算 g( x ) 之傅里叶系数 .因‖ SN ( x ) - g( x ) ‖
→0 .取 N > k, 有 ( g , fk ) = ( g - SN , f k ) + ( SN , f k ) = ( g - SN , fk ) + ak .令 N→∞, | ( g - SN , f k ) | ≤
‖ g - SN ‖ → 0 , 故 得 ( g , f k ) = αk , 而 ( f - g, f k ) = 0 , 由 于 我 们 已 设 { f k ( x ) } 是 完 全 的 , 所 以
f - g = 0几乎处 处 成 立 .上 面 我 们 还 证 明 了 ‖ S N - g ‖ → 0 , 因 此 ‖ SN - f‖→0 .由 下 面 即 将
2 48 第四章 积 分 学
N
2 2 2
证明的 L ( E ) 中的里斯 费希尔定理 , ‖ S N ‖→‖ f‖ , 但‖ S N ‖ = ∑
k= 1
αk , 令 N→∞ 即知 ( 22)
式成立 .
给出了一个 o .n .系 , 怎样判定 它完 全与 否 ? 这时 常是最 吃 力的 问题 , 因 为应 用 定理 5 并 不
i lx 2
方便 , 而且这常是最重要的问题 .下一章我们就要证明{e }是 L ( [ - π,π] ) 中 的完全系 .现在 我
2
们则回到 L ( E) 理论中一个最重要的 定理 .§2 中我 们已 对勒贝 格可 积函数 证明 过 一个 同名 的
定理 ( 定理 19) .
2
定理 6( 里斯 - 费希尔定理 ) 设{ f k ( x )}是 L ( E) 中的 一个柯西序列 , 即对任一 ε> 0, 均有
2
N(ε)存在 , 使当 n , m > N(ε) 时‖ fn - f m ‖ < ε, 则必存 在唯一的 f ( x ) ∈ L ( E) , 使 ‖ f n - f‖→
0 , 而且‖ fn ‖→‖ f‖ .
证 §2 中证明定理 19 时 , 我们是假设了 m ( E) < + ∞的 , 而只 在最后提 了一句 话当 E 为
σ有限时定理也成立 , 现在我们给出完全的证明 .
2
( i) 先设 m ( E) < + ∞ , 注意这时 L ( E) 函数本身也为勒贝格可积 .现在 取 N1 < N 2 < … <
Nk … , 使
1
‖ fN k + 1 - f N k ‖ < k ,
2
而由施瓦茨 ( Sch warz) 不等式
∫| f
1 2
N
k+ 1
- f N k | d x ≤ | m ( E) | ‖ f N k + 1 - f N k ‖ L2 .
E
∞
所以 ∑∫
k= 1 E
| fN k + 1 - f N k | d x < + ∞ , 而 依 照 上 一 节 勒 维 定 理 的 证 明 可 知 , fN1 ( x ) +
∞
∑[ f
k=1
N
k+ 1
( x ) - f N k ( x ) ] 几乎处处收敛于某个函数 f ( x ) , 亦即 { f k ( x )} 有一个 子序列 { f N k ( x )}
2
在 E 上几乎处处收敛于 f ( x ) . f ( x ) 在 E 上显 然是 可测的 , 今 证它 属于 L ( E) .为此 , 也 如§2
证明定理 19 一样 , 可知当 n > N (ε) 时
∫
2 2
| fn ( x ) - f Nk ( x ) | d x < ε .
E
由法图引理即知{ f n k ( x ) }之极限函数 f ( x ) 适合
∫
2 2
| fn ( x ) - f ( x ) | d x < ε .
E
2 2
因此 f n ( x ) - f ( x ) ∈ L ( E) , 从而 f ( x ) ∈ L ( E) , 而且
lim ‖ f n - f ‖ = 0 . (23)
ε→ 0
2
这种意义下的收敛性我们称为 L 收敛 .
(ii) E 为 σ 有 限 , 这 时 上 面 证 明 中 用 施 瓦 茨 不 等 式 这 一 步 不 适 用 了 .我 们 只 有 注 意 到
E = l→
lim E l , 而先在 E1 上看序列{ f k ( x )} .如上所述 , 可知它有一个子序列{ f N k ( x )} 在 E1 上几乎
∞
∫
2
fn ( x ) - f ( x ) dx<ε . (24)
E
k
暂时固定 n , 由 f ( x ) = f n ( x ) + f ( x ) - f n ( x ) , 用三角形不等式有
1 1
2 2 2 2
∫ E
f ( x) dx ≤ε+ ∫ E
fn ( x) dx
k k
1
2
∫
2
≤ε+ fn ( x) dx .
E
2
再令 k→∞ , 即知 f ( x ) ∈ L ( E) .在 ( 24 ) 中先令 k→∞ , 再令 n→∞即知
lim ‖ fn - f‖ = 0 ,
n→ ∞
2
即是说 L 收敛也成立 .
定理的最后一个论断并非此定理之一部分只是顺便放在这里 , 因为证明十分容易 : 利用
fn ( x ) = fn ( x ) - f ( x ) + f ( x ) ; f ( x ) = f ( x ) - f n ( x ) + f n ( x ) .
由三角形不等式有
‖ f n ‖≤‖ f‖ + ‖ fn - f‖ , ‖ f ‖≤‖ fn ‖ + ‖ fn - f‖ ,
亦即
| ‖ f n ‖ - ‖ f ‖ | ≤‖ f n - f ‖→0 .
2 2
至此我们已经完成了对 L ( E) 的讨论 .可是在历史上 , 首先讨论的是另一个空间 l , 这是希尔 伯
2
特与施密特在研究具有对称核的积分 方程 理论 时提出 来的 . l 是一 个由 复数 序列 组 成的 空间 .
2 2
在 L ( E) 中可以找到完全的 o .n .系 ( 这一点证明 尚未 完成 ) { f k ( x )} 后 , 任 意 f ( x ) ∈ L ( E ) 就
都可以展开为以下形状的级数
∞
f( x ) = ∑ αf
k=1
k k ( x ) , αk =〈f , f k〉( 或 αk = ( f , f k ) ) . (25)
∑
1 2
‖ f‖ = αk (26)
k=1 .
2 2
(22) 式是对实的 L ( E) 系数讲的 , 不过这个理论对复值 L 函数也成立 , 这时帕塞瓦尔等式应 改
2
写如上 , 于是我们看见 L ( E) 函数 f ( x ) 与一个序列对应 :
f ( x ) ~ ( α1 , α2 , … ,αk , … ) .
很容易看到 , 这个对应是双方 1 - 1 的 , 而且保持线性空间结构 , 如同线性代数中讲的线性同构一
2 2
样 .式左的 f ( x ) ∈ L ( E) , 故有内积与范数 , 如若还有另一个 g( x ) ∈ L ( E ) 对应 于 (β1 ,β2 , … ,
∞ ∞
βk , … ) , 则由 f ( x ) = ∑ αf
k= 1
k k ( x) , g ( x ) = ∑ βfk= 1
k k ( x ) , 可以证明
2 50 第四章 积 分 学
∞ ∞ ∞
2 2 2 2
〈f , g〉= ∑k= 1
αkβk , ‖ f ‖ = ∑
k= 1
α , ‖ g‖ =
k
∑k= 1
βk .
∫ ∫ ∫
p 1 p q 1 q
| f ( x ) g( x ) | d x≤ ( | f ( x) | d x ) ( | g( x ) | d x ) . (28)
E E E
为了证明这个定理 , 我们先证明
引理 ( 杨 ( Young) 氏不等式 ) 若 a , b≥0 , p , q 同上 , 则
p q
a b
ab≤ + . (29)
p q
α
证 考虑 0 < t < + ∞ 上的 函数 φ( t ) = t - αt, 0 < α< 1 .0 < t < 1 时 φ′( t ) > 0 , 1 < t < ∞
α
时 , φ′( t) < 0 , 所以 φ( t ) 当 t = 1 时 , 达到最大值 , 即 t - αt≤1 - α, 而
α
t ≤αt + (1 - α) .
1
如果 a = b = 0 , 则 ( 29 ) 自然成立 , 所以我们可以限于 b≠ 0 的情况 , 令 α= 1 p , 则 1 - α= 1 - =
p
1 p p( 1 - q) q
,用 t = a b , 代入上式双方再乘以 b , 即有
q
p q
a b
ab≤ + .
p q
赫尔德不等式的证明 在上式中令
p 1 p q 1 q
a = f ( x) ∫ f( x )
E
dx , b= g( x ) ∫ g( x ) E
dx ( 暂设两个分母均不为
0) , 则
∫a d x = 1∫
p q
, b dx= 1 .
E E
以 a , b 代 入 上 式 并 在 E 上 积 分 即 得 赫 尔 德 不 等 式 .若 上 面 至 少 有 一 个 分 母 为 0 , 例 如
p
∫ f ( x)
E
d x = 0 , 则 f ( x ) = 0 几乎处处成立而 (28) 是自明的 .
p
定理 8( 闵可夫斯基 ( Minkowski) 不等式 ) 若 f ( x ) , g( x ) ∈ L ( E) , 1 < p < + ∞ , 则
p 1 p p 1 p p 1 p
∫ f( x ) +
E
g( x ) dx ≤ ∫ f( x )E
dx + ∫ g( x )
E
dx . (30)
p q
证 在赫尔德不等式中把 | g( x ) | 换成 | f + g | , 即有
p q p 1 p p 1 q
∫ f ( x)
E
f ( x ) + g( x ) dx≤ ∫ f( x )
E
dx ∫ f ( x)E
+ g( x ) dx .
p q
类似地 , 把 | f ( x ) | 换成 | f + g | , 又有
p q p 1 p p 1 q
∫ g( x )
E
f ( x ) + g( x ) dx≤ ∫ g( x )E
dx ∫ f ( x)
E
+ g( x ) dx .
p 1 1
两式相加 , 注意到 1 + = p + = p , 所以
q p q
p p 1 p p 1 p p 1 q
∫f+ E
g dx ≤ ∫ f ( x)
E
dx + ∫ g( x) E
dx ・ ∫ f( x) +
E
g( x ) dx .
p 1 q
双方除以 ∫ f( x) +
E
g( x ) dx , 即得 (30) 式 .
1 ∞
注 当 p = 1 时 q = ∞ , L 的意义上面已讲过了 , L ( E) 则定义为适合 esssup | f ( x ) | < + ∞的
2 52 第四章 积 分 学
∞
可测函数空间 , 而如果在定理 7 , 8 中这样来理解 L , 则它们对 1≤ p , q≤ + ∞也是成立的 .
p
闵可夫斯基不等式当 p = 2 时就是三角形 不等式 .因此 , 在 L ( E ) 中我 们仍可 定义 f ( x ) 作
为一个向量是“长度”, 称为模或范数 , 记作
p 1 p
‖ f‖ L p = ∫ f ( x)
E
dx , 1 ≤ p < + ∞,
‖ f‖ L ∞ = esssup | f ( x) | .
E
§5 高 斯 积 分
n n- 1 n -1
= + .
k k k-1
若在 (3 ) 式中令 ( i - j ) h = x , ( n - 1 )τ= t , 就得到
1 1
P( x , t + τ) = P( x + h, t ) + P( x - h , τ) . ( 4)
2 2
1
这里考虑的是粒子向左与向右的概率同为 的情况 .如 果向右 游动 与向 左游动 的概 率分别 为 p
2
和 q = 1 - p , 而且 0 < p < 1 , 则代替上式有
P( x , t + τ) = pP( x + h , t) + qP( x - h ,τ) .
上面画的图的每条水平线 t = nτ给出了初始位置为 x = 0 的粒 子在这 一时刻达 到各个结 点
的概率 , 所以称为一个概率分布 .二项式定理给出了
1 n
∑ P( ( i -
i
j ) h , nτ) = ∑2
k
n
k
=1 . ( 5)
n
( 注意 , 若 k < 0 或 k > n 我们 规定 = 0 , 这 样 在求 和号 下就 不必 具 体指 出 k 的 变化 范 围 .)
k
(2 ) 式这种概率分布称为二项分布 .
上面给出的是一个离散模型 .为了要由宏观量过渡到微观量 , 就需要令 h ,τ→0 , 这样就会得
到一个连续模型 .但为此首先要引 入概 率分布 的密 度的 概念 .如果 一个 粒 子位 于长 为 h 的某 个
区间的概率是 p , 则当区间长 h→0 时就会想到该 粒子 恰好位 于某 一点上 的概 率 , 在合理 的设 想
下它可能为 0 , 这恰好是很容易引起问题的 .因 此我 们引入 概率 密度 q 的 概念 ; 粒 子位于 该区 间
的概率与 h 成正比而为 qh , 这样 , 上面的 ( 5) 式 ( 不妨令 j = 0 , nτ= t ) 将成为
∑ P( i h , t ) = 1 ∫ q( x , t ) d x = 1 .
i
( 6)
∫δ( x ) d x = 1 .
正如我们在第二章最后一节所讲的 , 这个概率密 度应该用 广义函数 来描述 , 而这 个 δ( x ) 正是 著
名的广义函数———狄拉克 ( Dirac) 测度 , 或称 δ函数 .因 此 , 如果 用连 续模 型来 讨论 它 , 我 们就 需
要求解以下的柯西问题
2
q q
= D 2 , q( x , 0 ) = δ( x ) . ( 8)
t x
这种以 δ( x ) 为已知数据的解常称为偏微分方程的基本解 .对于扩散方程 , 基本解是
1 2
q( x , t) = exp{ - x 4 Dt} , t > 0 . ( 9)
2 πDt
这里涉及的广义函数知识在第二章中已讲了一点 , 下一节再仔细讨论 , 至于基本解的问题本书已
经不可能讲了 .
一个概率分布如果其密度是 (9 ) 则称为正态分布或高斯分布 , 因为首先是高斯在讨论观测值
的误差分布时遇到了它 .这是一个极其重要的分布 , 不仅因为它出现在许多似乎全不相似的问题
中 , 还因为概率论中有一个著名的定理 ( 棣莫弗 ( DeMoivre ) - 拉普拉斯 定理 ) , 大意是说 , 当二 项
分布的 n 很大时 , 可以在一定意义下用正态分布去近似它 .现 在我们要 提到的 是 , 麦 克斯韦在 研
究气体的分子运动论时也得到了它 .
麦克斯韦的论证从现在统计物理学的发展来看有不足之处 , 然而其基本思想仍然是正确的 ,
而且只需简单的微积分知识就可以了解它 .
麦克斯韦考虑在一个容器内处于热平衡状态下的气体分子 .由于其相互碰撞 , 分子的速度是
随机的 .因此我们不能说哪一个确定的分子在给定时刻的准确的速度是多少 , 而只能问速度在某
个给定范围 ( 例如 x i 方 向 的 速 度 在 vi 到 vi + d vi 之 间 ) 内 的 分 子 数 是 多 少 .如 果 概 率 密 度 是
3
f ( v ) , v = ( v1 , v2 , v3 ) ∈R , 则它应该适合以下三个条件 :
( i) 规范性条件 :
∫ f ( v )d v = 1, d v = d v d v d v
3
1 2 3 ,
R
2 2
Φ( v ) = B exp ( A v ) ,
2
B 待定 .由可积性条件 A 必须为负 : A = - 1 α ,α待定 .现在求 B , 由以上可知应有
1 3 2
f1 (・) = f2 (・) = f3 (・) = B exp( - ・ α ) .
代入规范性条件有
∞ 3
∫
2 2 2 3
1 = B exp( - v α ) d v = B( απ) ,
- ∞
1 3 2 - 1 2
因此 B = (απ) .而有
2 - 1 2 2 2
f i ( vi ) = (απ) exp{ - v i α } .
而概率密度为
2 - 3 2 2 2
f ( v ) = ( απ) exp{ - v α } .
不过这是一个三维的结果 , 而上面我 们对 一维随 机游 动 所给 出的 结果 是一 维 的 .上式 中的 α麦
克斯韦指出应为
α= 2 kT m,
m 是分子质量 , T 是温度 , k 是一个常数 , 后来称为玻耳兹曼常数 .
由麦克斯韦分布
3 2
m 1 2
f ( v) = exp( - mv kT) (12)
2πk T 2
可以得出关于气体的一些宏观物理量 .就某一个粒子 ( 气体分子 ) 而言 , 要准确地说出它的某个物
1 2
理量 ( 例如动 能 m v ) 是不 可能的 : 因为 我们只能 知道该 粒子速度 在 v 与 v + d v 之间的 概率 .
2
但是要计算大量粒子的某个物理量 f ( v ) 的平均值 是可能 的 : 我 们只要把 f ( v ) 按一定 概率分 布
-
密度 ρ( v ) 求平均即可 , f 的平均值或者记为 f 或者记为〈f〉:
-
f =〈f〉= ∫ f ( v )ρ( v ) d v .
2
( 一个量的方差即它与其平均值 之偏差 之平 均值〈[ f - 〈 f〉] 〉, ) 平 均值 也称 为该 物 理量 的数 学
期望值 .我们现在就来计算一个气体分子的平均动能 .
1 m
∫
2 2
〈 m v1〉= v1 f ( v1 ) d v
2 2
1 2 ∞
m m 1
∫
2 2
= v1 exp( - m v1 kT ) d v1 .
2 2πkT - ∞ 2
1 2
m
令 v1 = t , 有
2 kT
∞
1 m 1 2 kT
∫
2 2 2
〈 m v1〉= ・ ・ t exp( - t ) d t .
2 2 π m -∞
+∞ 2
∫
n - x
In = x e d x , n = 0, 1, 2, … . (13)
0
∞ 2
∫
2 - x
计算平均动能时就要用到 2 I2 = x e d x = π .计算 方法 如下 : n = 0 时 就有 著名的 高斯 积
- ∞
分 . n 为其它值时在计算许多函数的数学期望值时有用 .这里的积分限本可取为 ( - ∞ , + ∞ ) .但
这样一来当 n 为奇数时 , 因被积函数为奇函 数 , ( - ∞ , + ∞ ) 上 之积 分为 0 . n 为偶 数时 , 被积 函
数为偶函数 , 所以 ( - ∞ , 0 ) 上之积分与 ( 0 , + ∞ ) 上之积分相等 , 所以我们只来讨论 (0 , + ∞ ) 上的
积分 (13) .
先看 n = 0 , 利用富比尼定理
2 2 +∞ 2 +∞ 2
∫ ∫
- ( x + y ) - x - y 2
e d xd y = e dx e d y = I0 .
0 0
第一 象限
左方用极坐标表示为
π2 +∞ π2 +∞
2
1
∫ ∫ ∫ ∫
- r - t 2
dθ e rd r = dθ e dt ( t= r )
0 0 2 0 0
π
= .
4
因此
π
I0 = .
2
计算 In 可以用分部积分法 .首先
∞ 2 2 ∞
1 - 1
∫
- x x
I1 = xe dx= - e = .
0 2 0 2
- x
2
1 - x
2
然后利用分部积分法 .当 n≥2 时 , 注意到 xe = - (e )′,
2
∞ ∞ ∞
2
1 n-1 - 2
n -1 2
∫ ∫
n - 1 - x x n - 2 - x
In = x・x e dx = - x e + x e dx .
0 2 0 2 0
n- 1
= In - 2 .
2
因此
(2 m - 1) (2 m - 3) … 1 (2 m - 1) (2 m - 3 ) …1
I2 m = m - 1 I0 = m π,
2 2
1
I2 m - 1 = ( m - 1) ! . (14)
2
上面我们 讲到当 n → ∞时 , 二 项分 布将在 某种 意义下 以高 斯分 布为极 限 , 但是 没有 详细 说
明 .下面我们来看一下物理学家是怎样用近似方法来得到这个结论的 , 这对于我们了解微积分的
基本思想以及如何应用它们 是 很有 益处 的 .其 中我 们还 讲到 著名 的 斯特 林 ( Stirling) 公 式 , 它 也
是很有用的 .以下材料引自 F .瑞夫 , 统计物理学 (《伯克利物理学教程》第五 卷 , 附 录 A .1 , 高斯 分
布 , 437 ~443 页 , 该书由科学出版社 1979 年出版 ) .
1
我们讲 到 一 维 随 机 游 动 时 是 假 定 了 粒 子 向 左、向 右 移 动 的 概 率 均 为 : 而有 (2) 式
2
2 58 第四章 积 分 学
1 n
P( ( i - j) h , n) = n .但若向右与向左游动的概率各为 p 与 q = 1 - p , 则应有如下的概率
2 k
n k n- k n! k n - k
P( k , n ) = p q = p q . (15)
k k ! ( n - k) !
若 n 很大 , 计算 n ! 将是相当困难的 .但是因为 0 < p , q < 1 , 故当 km 1 或 n - km 1 时 , 上述概率
~ 1
仍然很小 , 而 P( k , n) 极大处 k = k总在靠近中间 的地方 ( 当 p = q = 时 恰好 在正 中 .正 如二 项
2
定理之系数在“中点”( n 为偶数时 ) 或紧靠“中点”左 右两点 ( n 为 奇数 时 ) 最大 .所 以当我 们想 找
~
P( k , n) 的 近 似公 式 时 , 除 非 p n 1 , q n 1 , k 总 是 随着 n 同样 取 相 当大 的 值 .现 在我 们 就 来 求
P( k, n ) 关于 k 的极大值 .
k 是一个整数 , 所以每一次 k 的增量至 少是 1 , 这本 来已是 相当 大的 数了 , 但是 如果 k 本 身
就已很大 , 其“增量”1 与 k 相 比仍然 可以 认为是“ 无穷 小”, 而 且它所 引 起的 P 的 变 化也 是极 小
的 ( 这是很值得注意的事 .在物理学家看来 , 甚至 不太小的 数也 可以 看作是 无穷 小 .所以 , 一旦 离
开思辨的天地而进入现实 , 确有“ 海阔天空”之感 .但是 , 这是 不是 说以 前讲的 数学 都是没 有意 义
了呢 ? 暂时不要去争论 , 而是要多向物理学家学一点东西 ) :
| P( k + 1 , n) - P( k, n ) | n P( k, n ) . (16)
所以我们不妨认为 k 是连续变量而 P( k, n ) 是 它的光 滑函数 .我 们又 知道 ln P 比之 P 是 变化 更
缓慢的函数 , 因此 , 取 (15) 之对数
ln P = ln n ! - ln k ! - ln ( n - k ) ! + kln p + ( n - k ) ln q , (17)
而且双方对 k 取导数 : 这里我们要 注意 , 因为 k 是一 个很 大的 整数 , 其增 量 Δk = 1 可以 认为 是
Δln k ! dln k !
“无穷小”, 从而可以认为 k 是连续变量 , 并且可以用 代替 , 于是
Δk dk
dln k ! ln ( k + Δk ) ! - ln k ! ln ( k + 1 ) ! - ln k !
≈ =
dk Δk 1
( k + 1) !
= ln = ln ( k + 1 ) ≈ln k .
k!
所以 , 由 ( 17 ) 对 k 求导即有
dln P
≈ - ln k + ln( n - k ) + ln p - ln q
dk
n- k p
= ln ・ . (18)
k q
为了求 ln P 之极大值应该令上式为 0 , 即有
~
k = k = np ( 注意 p + q = 1) .
~ dln P
现将 ln P 在 k = k 处展为泰勒级数 , 注意到 ~ = 0 , 即得
dk k= k
2 ~
~ ~ 2
1 d ln P( k , n )
ln P = ln P( k , n ) + ~2 ( k - k) ,
2!
dk
2
~
d ln P
3
这里我们略去了 ( k - k ) 以及更高阶的量 .为了计算 2 , 我们对 (18) 再对 k 求导一次 , 有
dk
§5 高 斯 积 分 2 59
~
2
d ln P( k , n) 1 1 n
~2 = - ~ - ~ = ~ ~ ,
dk k n - k - k( n - k)
1
= - .
npq
所以可得 ln P 的近似式
~ 2
~
( k - k)
ln P( k, n ) ≈ln P( k , n ) - ,
2 n pq
~ ~ 2
P( k, n ) = P exp[ - ( k - k ) 2 npq] , (19)
~ ~
这里 P = P( k , n) .为了求它的值 , 我们要利 用规 范化 条件 , 即全 部概 率 ( 从 k = 0 到 k = n ) 之 和
为 1:
n n
∑
k= 0
P( k , n ) = ∑
k=0
P( k, n )・Δk , Δk = 1 .
和上面一样的想法使我们把上式看成一个积分和 , 而有
∫P( k , n) d k = 1 .
~
注意到 k = np , 则得 P( k , n) 之近似式为
1 - ( k - np )
2
2 n pq
P( k , n) = e . (20)
2πnpq
这正是高斯分布 , 所以我们说高斯分布是二项分布的极限情况 .
上面我们讲到如何近似计算一个大整数 n 之阶乘 n ! .实际上利用类似的想法可以得到一个
很方便的近似式 .我们有
n
ln n ! = ln 1 + ln 2 + … + ln n = ∑ ln k .
k= 1
∫
n
ln n ! ≈ ln xd x = [ x ln x - x ] 1 = n ln n - n + 1 .
1
看到 , 主要思想是相同的 .但是关于无穷大、无穷小量的估计在那些书中做得细致得多 .
最后我们讲一下高斯积分的一个简单的推广 .高 斯积分 主要 特点 是被积 函数 是一个 指数 函
数 , 而其指数是一个负的二次式 .因此 , 我们不妨考虑一个 n 重积分
∫
- 〈 A x , x〉
I= e dx, (24)
n
R
这里 A 是一 个 正 定 的 n 阶 对 称 矩 阵 : A = ( ai j ) .规 定 A 为 正 定 的 原 因 在 于 当 | x | → ∞ 时 ,
- 〈 A x , x〉
- 〈A x , x〉→ - ∞而 e 是可积的 .对称矩阵一定可以用正交变换化为对角形 , 即存在一个正
t
交矩阵 T ( T・T = i d) 使
λ1
- 1
T AT = w ,
λn
这里 λ1 , … , λn 是 A 的特征根 .因为 A 是对称矩阵 , 故其特征根均为实数 .而当我们设 A 为正 定
时 ,λ1 ,λ2 , … ,λn > 0 .现在作变量变换
x = T y,
则
t
〈A x , x〉=〈A T y, T y〉=〈 T A Ty , y〉
n
- 1 2
=〈T A Ty , y〉= ∑i=1
λi y i .
又因正交矩阵之行列式等于±1 , 故
d x = | det T | d y = d y .
代入 (24) 即有
n n ∞ 2
∫exp - ∑λ y ∏∫
2 -λy
I = i i dy = e i i
d yi
i=1 i= 1 - ∞
n
R
n
1
= ∏
i =1
(π λi ) 2 . (25)
§6 分部积分法、广义函数、索伯列夫 (Sobolev) 空间
f φ
∫Ω
xi
( x ) φ( x ) d x = ∫φf
Ω
x
i
=0
d x′- ∫f ( x )
Ω
xi
( x) d x ,
x′= ( x1 , … , x^i, … , xn ) . xi 上面加了一个 ^, 表示从 x 的坐标 中把 xi 删 去 .我 们希望 Ω 上的 积
分不出现 , 而这就需要例如假设
φ| Ω =0 .
但是仔细想一下 , 问题并不那么简单 , 因为上式是 n 重积分 , 我们又 用了富 比尼积分 把它化为 逐
1
次积分……等等 .为此 , 对 Ω 的边 缘 Ω 的光滑 性就要有 所限制 .一维 情况则 简单多 了 , 因为 R
中的开集最多是可数多个区间的并 , 所以不妨设 Ω 就是区间 ( a , b) , 而 Ω 就是两个点 a 和 b .为
k
了回避这个问题 , 我们设 φ( x ) ∈ C0 ( Ω) , 下 标 0 表示 φ( x ) 的 支集是 Ω 的紧 子集 .紧集 就是 有
-
界闭集 , 而因 φ( x ) 只定义于 Ω 上而不是 Ω上 , 所以 supp φ( x ) 是 Ω 的一个紧子集, 见图 4 - 6 - 1 .
由它到 Ω 一定有一个正的距离 , 所以φ( x ) 在 Ω 附近为 0( 图 4 - 6 - 1) .
k n
所以若补充定义 φ( x ) 在 Ω 外为 0 , 则其光滑性不变 , 即有 φ( x ) ∈ C0 ( R ) , 而 Ω 可以放 在
suppφ外任何位置 , 可以任意变形而不影响积分 .于是我们有
f φ( x )
∫ Ω
xi
( x )φ( x ) d x = - ∫
Ω
f( x)
xi
dx . ( 1)
k
如果固定 f ( x ) , 而令 φ( x ) ∈ C 变动 , 则上式双方都是 φ( x ) 的线性 泛
0
函 , f ( x ) 与 φ( x ) 处 于互 相 对偶 的地 位 : 左 方是 对 f 求导 , 转 到 右方 则
变成了对 φ求导 . f 是生成泛函之 元 , φ 是泛函 作用 于其上 之元 ; ( 1 ) 式
指出 , 对前者施以 就对应于对后者施 以 - ; f 与 φ 是对 偶的 ,
xi xi xi
图4 -6 - 1
与 - 也是对偶的 , 分 部 积分 法就 建 立了 这 样一 个 对 偶关 系 .这 就 是
xi
我们所说的“对偶性”的一个侧面 .
现在的问题是 , 即令 f ( x ) 不可求导 , 但若能够找到另一个 gi ( x ) 适合
φ( x )
∫ Ω
giφ( x ) d x = - ∫Ω
f( x )
xi
dx,
f Δf
则 gi ( x ) 起了 的作用 , 因此可以把它看 作 f 的某种 广义 的导 数 .尽管它 与 有何关 系并 不
xi Δx i
清楚 . f ( x ) , gi ( x ) 要求某种可积性 , 不过 也很 清楚不 需要 它们 在 Ω 上可 积 , 因为 实际上 积分 是
在 Ω 的紧子集 suppφ上进行的 .而因当 φ变动时 suppφ也在变 , 所以指定 f ( x ) , gi ( x ) 在 Ω 的
某个固定紧子集上可积也不行 , 所以我们给出
p p
定义 1 若 f ( x ) 在 Ω 之任 一紧子 集上 属于 L , 就说 f ( x ) 局部 p 幂可 积 ( 局 部 L ) , 记 作
p
f ∈ Lloc ( Ω) .1≤ p≤ + ∞ .
1 1 1
定义 2 设 f ( x ) ∈ Lloc ( Ω) , 若存在 gi ( x ) ∈ Lloc ( Ω) 使对每一个 φ( x ) ∈ C0 ( Ω) 均有
φ( x )
∫g ( x )φ( x ) d x = -∫f ( x )
Ω
i
Ω
xi
d x, ( 2)
f
则称 gi ( x ) 为 f ( x ) 对 xi 的 ( 弱 ) 广义导数 , 仍记为 gi ( x ) = ( x) .
xi
2 62 第四章 积 分 学
m
我们可以仿此定义高阶 ( m 阶 ) 广义导数 , 为此 , 需设 φ( x ) ∈ C0 ( Ω) , 而有
1 m
定义 2′ 设 f ( x ) 与 gα ( x ) ∈ Lloc ( Ω) , 若对一切 φ( x ) ∈ C0 ( Ω) 均有
α
φ( x )
∫ ∫
| α|
gα ( x ) φ( x ) d x = ( - 1 ) f( x ) α dx, ( 3)
Ω Ω
x
α
f
则称 gα ( x ) 为 f ( x ) 之 m 阶广义导数 ( 弱导数 ) , 记 作 gα ( x ) = α .以 上 α= (α1 , … , αn ) 为重 指
x
标 , 且 | α| = α1 + … + αn = m .
α
f
若对适合 |α| ≤ m 的一切 α, f ( x) 都具有弱广义导数 α ,则称 f ( x )为 m 阶广义可微 (弱可微) .
x
1
由于 Lloc ( Ω) 函数都是几乎处处定义的 , ( 弱 ) 广义导数也都只是几乎处处定义的 .
1
下面举一些例子 , 这里均设 Ω= ( - 1 , 1) R .
例 1 令 f ( x ) = | x | , 很明显 , 按古典定义 f ( x ) 除在 x = 0 处以外均有导 数 : 这 里我们利 用
1
了 φ∈ C0 ( Ω) 所以 φ(1 ) = φ( - 1) = 0 .
df 1, 0 < x < 1 ,
=
dx - 1, - 1< x<0
1
也是 f 的广义导数 .事实上 , 若取 φ( x ) ∈ C ( Ω) 则 0
1 0 1
df
∫ -1 dx
φ( x ) d x = - ∫ -1
φ( x ) d x + ∫ φ( x ) d x
0
0 0
= - xφ( x )
- 1
+ ∫ -1
xφ′( x ) d x
1 1 1
+ xφ( x ) 0
-∫ xφ′( x ) d x = -∫
0 -1
| x | φ′( x ) d x .
df
所以 也是 | x | 的 ( 弱 ) 广义导数 .
dx
例 2 令 H ( x ) 为赫维赛德函数 :
1 x≥0 ,
H( x ) =
0 x<0 .
1
它不会有 ( 弱 ) 广义导数 .实际上 , 若 g( x ) ∈ L ( R ) 是 H ( x ) 的广义导数 , 对 x0 > 0 取 φ( x ) 使其 loc
支集在 ( x0 - h , x0 + h) (0 , 1 ) 中 , 应有
x + h x + h
∫ ∫
0 0
H ( x ) φ′( x ) d x = - g( x )φ( x ) d x ,
x - h x - h
0 0
但式左显然为 0 , 所 以 式 右 对 适 合 以 上 条 件 的 φ( x ) 必 为 0 .用 后 面 讲 的 磨 光 方 法 即 可 证 明
g( x ) = 0在 x > 0 处几乎 处处成立 .同 样可知 g( x ) = 0 在 x < 0 处 几乎处 于处处 成立 .总 之 , 若
H ( x ) 有一个局部可积函数 g( x ) 为其 ( 弱 ) 广义导数 , 则 g( x ) = 0 几乎 处处成立 .于 是由广义 导
1
数的定义 , 对任意 φ( x ) ∈ C ( - 1 , 1 ) ,
1 1 1
0= ∫ - 1
g( x ) φ( x ) d x = - ∫ -1
H ( x )φ′( x ) d x = - ∫ φ′( x ) d x = φ(0 ) .
0
1
所以就会得出结论 : 任意 φ( x ) ∈ C0 ( ( - 1 , 1) ) 都在 x = 0 处为 0 .这个错误结论说明 赫维赛德 函
数没有 ( 弱 ) 广义导数 .它在广义函数意义下却有导数 : 广义函数 δ( x ) .
§6 分部积分法、广义函数、索伯列夫 ( Sobolev) 空间 2 63
∞ 1 φm - φ
一串φm ( x ) ∈ C0 ( Ω) 逼近 φ( x ) ∈ C0 ( Ω) , 使得 在 Ω上一致收敛于 .上式当 φ= φm 时是
xi xi
1
成立的 .令 m→∞即知它对任意 C0 ( Ω) 函数 φ( x ) 也成立 .{φm } 的作 法下面 讲磨 光算子 时会 看
∞ ∞
到 .所以 , 下面我们讲的 φ( x ) 都选自 C0 ( Ω) , 对它们还要 规定一个很特殊 的收敛性 . C0 ( Ω) 在
赋以这种收敛性后称为试验函数空间 .φ( x ) 称为试验函数 .不过要注意 , 我们会需要许多种不 同
∞
的试验函数空间 .上述的 C0 ( Ω) 是最常见的一种 , 我们以后恒记为 D ( Ω) .
现在要详细讨论 D ( Ω) . D( Ω) 的元素 有很 好的 性质 : 它们 可以 任意求 导 ( 但 是 正如 第三 章
中讲 的 , 它 们 决 非解 析 函数 ) .它们 有 很 多用 处 , 第 三 章 §4 中 讲到 如 何利 用 它 们来 作“ 单 位 分
解”———这是一个用于化整体问题为局部问题的有 力工具 , 还 讲到 磨光算 子 .现在 我们就 来详 细
n
讨论磨光算子 , 仍然采用第三章§4 的记号 .令 x , y∈R , 而
2 64 第四章 积 分 学
2 - 1
| x - y|
exp 2 -1 , | x - y | ≤δ,
jδ ( x - y ) = δ ( 4)
0, | x - y | > δ.
∞ n x- y
很明显 j1 ( x ) 是一个支集在球 | x | ≤ 1 中的 C0 (R ) 函数 , 而 jδ ( x - y ) = j1 .令
δ
L= ∫j ( x ) d x ,
n
1
∫
n
则 0 < L < + ∞, 而且 jδ ( x - y)d x = Lδ .我们称(4)为一个磨光核, 而称以下的算子为磨光算子:
n
R
1
Mδ ( f ) ( x ) =
Lδ
n
∫f ( y) j ( x -
n
δ y )d y . ( 5)
R
可以很容易地证明
1 n
定理 1 设 f ∈ Lloc (R ) , 则
∞ n
( i) Mδ ( f ) ( x ) ∈ C (R ) .
n
( ii) 若进一步设 supp f = K R“
( ”表示左方为右方之紧子集, 这个记号也称
“紧包含”) 则
Mδ ( f ) 也有紧支集于 K 之 δ邻域 Kδ = ∪ B ( x) ( B ( x) 表示以 δ为半径的
x∈ K
δ δ n 维球体) 内 .
1
| Mδ ( f ) ( x ) - f ( x ) | ≤
Lδ
n
∫ | f ( y) -n
f ( x ) | jδ ( x - y ) d y .
R
这里我们用到了 jδ ( x - y ) ≥ 0 .令 x - y = z , 上式右方为
1
Lδ
n
∫| f( x -
n
z ) - f ( x ) | jδ ( z ) d z ,
R
注意到
§6 分部积分法、广义函数、索伯列夫 ( Sobolev) 空间 2 65
1 p 1 q
| f ( x - y ) | jδ ( y ) = | f ( x - y ) | ( jδ ( y ) ) ( jδ ( y ) ) ,
对内层积分应用赫尔德不等式知
p q p 1 p
1
‖ Mδ ( f ) ( x ) ‖ L p ≤
Lδ
n
∫d x∫j ( y ) d y ∫ f ( x
n n
δ
n
- y) jδ ( y ) d y .
R R R
∫
n
因为 jδ ( y) d y = Lδ , 代入上式有
n
R
1 p p 1 p
1
‖ Mδ ( f ) ( x ) ‖ L p ≤
Lδ
n
∫d ∫
x f( x
n n
- y) jδ ( y) d y
R R
1 p p 1 p
1
=
Lδ
n
∫j ( y) d∫
n
y
δ f( x
n
- y) dx
R R
= ‖ f‖ L p .
p n p n
这里应 用 了 富比 尼 定理 .这就 是 说 , 磨 光 算子 将 L ( R ) 映 入 L ( R ) 而 且 范 数不 增 .因 此 , 若
p n n ε
f ( x ) ∈ L (R ) , 先作 g( x ) ∈ C0 (R ) , 使‖ f - g‖ Lp < , 于是我们有
3
‖ Mδ ( f ) - f ‖ L p ≤‖ Mδ ( f ) - Mδ ( g) ‖ L p + ‖ Mδ ( g) - g‖ L p
+ ‖ g - f‖ L p .
n
第一项与第三项均小于 ε 3 , 对于第二项 , 因为 g( x ) ∈ C0 (R ) , 利用 ( iii ) 即 知 , 当 δ充分 小时 也
小于ε 3 , 定理证毕 .
p n
我们附带提到 , 若 f∈ Lloc (R ) , 以上讨论仍成立 .
不过 , 上面的讨论当 p = + ∞时失效 .
1 1
现在回到例 2 , 在 那 里 我 们 说 , 若 g ( x ) ∈ Lloc ( - 1 , 1 ) 且 对 任 意 φ( x ) ∈ C0 ( - 1 , 1 ) 有
x + h
∫
0
g( x ) φ( x ) d x = 0 , 则必在 ( x0 - h , x0 + h) 中 , 有 g ( x ) = 0 几 乎处 处成 立 .现 在补 一个 证
x - h
0
1
明 , 因为我们限于在 ( x0 - h , x0 + h ) 中讨论 , 不妨认为 g( x ) ∈ L , supp g [ x0 - h , x0 + h ] , 且
1
∫g( x ) φ( x ) d x
1
= 0 . 把自变量写成 y , 并取 φ( x ) = j ( x - y ) , 这个 条件就 是 Mδ ( g) ( x ) =
Lδδ
R
0 , 但‖ g - Mδ ( g) ‖ L 1 →0 , 所以 g = 0 在 ( x0 - h , x0 + h) 中几乎处处成立 .我们在这里还附带 回
Δf
答一个问题 : 一个函数古典意义 下的导 数 , 作为 之极限 自然 是唯 一的 ( 至 少在 几 乎处 处相 等
Δx i
( 1)
f
的意义下 ) , 而其广义导数之唯一性实有待证明 .事实上 , 设 f ( x ) 有 两个 ( 弱 ) 广义 函数 ,
xi
(2 ) (1 ) (2 )
f f f
, 记 g( x ) = - , 则由定义可见
xi xi xi
0= ∫g ( x ) φ( x )d x
Ω
∞
对一切 φ( x ) ∈ C ( Ω) 成立 , 于是由上面证明的方法可见 g( x ) = 0 几乎处处成立 .
0
f ∞
时 , 是把 (2 ) 式左方作为一个作用在 C0 ( Ω) 上的线 性泛函来 定义的 .凡 用线性泛 函来处理 一
xi
个数学问题时 , 我们常用“ 弱”这个限制词 .与此相对 , 若用范数来讨论问题时则常用“ 强”字 .因此
我们自然会问 , 有没有强广义导数的概念 ? 有 , 而且这 个概念 有很 深刻的 物理 背景 .第三 章变 分
法一节的最后 , 我们讲到从黎曼的时代 , 人们就知道用能量积分
2 2
u u
I( u ) = + d xd y
Ω
x y
来刻画静电场 , 而且指出“ 真正的”静电场必使上述能量积分达到最小值 .由此就提出了“极小化”
1 -
序列{ un } , 即 u n ∈ C ( Ω) , 而 I( u n ) → min 这 个思 想 .但是如 果限 制在 黎曼积 分框 架下 , { u n } 以
un
及 都不一定有极限存在 , 正是因此 , 我 们才 看到 勒贝格 积分 理论何 以优 于黎 曼积分 理论 :
x
un
在 L 意义下有极限 u- 与 -v , 因此 有理 由把 -v 看作 -u 在 某种 意
2
至少我们可以设想{ un } 与
x
义下的导数 , 这样我们就引出了
p 1
定义 3 设 f ( x ) ∈ L ( Ω) , 若存在一个 C ( Ω) 函数 序列 { f k ( x )} 使得 ‖ f k - f ‖ L p →0 , 而
fk p p p fk
且 ∈ L ( Ω) 有 L 意义下 的极限 gi ( x ) ∈ L ( Ω) : - gi p → 0 , 则称 gi 为 f 对于 x i 的
xi xi L
f
( 强 ) 广义导数并仍记以 = gi .
xi
仿此 , 可以定义高阶的 ( 强 ) 广义导数 .
于是产生一个问题 : 强弱广义导数是否一致 ? 答案是肯定的 , 这是一个重要的结论 .
p f p
定理 2 设 f ( x ) ∈ Lloc ( Ω ) 而 且 具 有 强 广 义 导 数 = gi ( x ) ∈ Lloc ( Ω) , 则 gi ( x ) 也 是
xi
f ( x ) 之弱广义导数 .若将强弱二字对调 , 结论仍成立 .以上 1≤ p < + ∞ .
证 前面讲弱广义导数定义时恒取 p = 1 , 实际 上 , 取 1 ≤ p < + ∞也 可以 , 这 一点下 面不 再
赘言 .
1
(强) ( 弱 ) .任取 φ( x ) ∈ C0 ( Ω) , 则由强广义导数定义 , 先 对 f k ( x ) 使用分部 积分法 ( 这 是
1
许可的 , 因为 f k ( x ) ∈ C ( Ω) ) 然后再在积分号下求极限 ( 这里可以应用赫尔德不等式 ) , 于是有
φ( x ) fk ( x )
∫ Ω
fk ( x )
xi
dx = - ∫Ω
xi
φ( x ) d x ,
φ( x )
∫f ( x )
Ω
xi
dx= - ∫g ( x )φ( x ) d x .
Ω
i
1
所以 gi ( x ) 也是 f ( x ) 的弱 广义 导数 .上面 要注 意 , 因为 φ( x ) ∈ C0 ( Ω) 而 在 Ω 附 近恒 为 0 , 故
f ( x ) , gi ( x ) 等仅仅是局部可积也不影响计算 .
1
(弱) ( 强 ) .因为 gi ( x ) 是 f ( x ) 之 弱广 义 导数 , 故 若 令 ( 2 ) 中的 φ( y ) 为 n jδ ( x - y )
Lδ
( x 当作参数 ) 即有
∫g ( y) φ( x -
Mδ ( gi ) ( x ) =
Ω
i y )d y ,
§6 分部积分法、广义函数、索伯列夫 ( Sobolev) 空间 2 67
φ( x - y) φ( x - y )
xi
Mδ ( f ) ( x ) = ∫f ( y )
Ω
xi
dy= - ∫f ( y )
Ω
yi
d y,
Mδ ( f ) ( x ) = Mδ ( gi ) ( x ) .
xi
p p
由前面讲的 Lloc ( Ω) 如何 用 磨 光 算 子逼 近 , 记 Mδ ( f ) ( x ) = fδ ( x ) ∈ Lloc ( Ω) , Mδ ( gi ) ( x ) =
p fδ
giδ ( x ) ∈ Lloc ( Ω) , 即有‖ fδ - f ‖ L p ( K ) → 0 , ‖ giδ - gi ‖ L p ( K ) →0 ( K Ω 是任意紧子集 ) , =
xi
f
giδ .所以 f 之强广义导数 即 gi ( x ) , 证毕 .
xi
这两部分证明的难度显然有区别 .前一部分我 们将在 以后 看到 , 仅只 使用 了泛 函的连 续性 ,
而这是一个很普遍的性质 ; 后一部分则用了磨光 技巧 , 这并不 是处 处都能 使用 的 .因此在 许多 数
学问题中 , 一个概念常有强、弱两种推广 , 证明二者相同是不容易的事 .
以下我们就只说广义导数而不再区分强弱 .
定义 4 定义
k, p p α p
W ( Ω) = { f ( x ) ∈ L ( Ω) , 且其广义导数 D f ∈ L ( Ω) , | α| ≤ k} ( 6)
k, p
并称它为 Sobolev 空间 , 我们也常用记号 H ( Ω) .
k, p ∞
从强弱广义导数一致性的证明中我们看到 W ( Ω) 之元必可通过磨光 得到的 C ( Ω) 函 数
在范数
1 p
∫∑
α p
‖ f‖W h, p = | D f | dx ( 7)
| α| ≤ k
Ω
1 ∞
下求极限而得 .强广义 导数 定 义 中 的 f k ∈ C ( Ω) 改 成 C ( Ω) 也 是 可 以 的 ( 例 如 用 f 之 磨 光
∞
k 代替 f k 即可 ) .所以我 们说 Sobolev 空间是 C
M1 k ( f ) ( x ) = f′ ( Ω) 经 ( 7 ) 完备化而 得 .现在问 ,
k, p
如果取一串 f m ∈ W 再 作 一 次 完 备 化 , 会 不 会 得 到 更 多 新 的 东 西 ? 结 论 是 否 定 的 .因 为 在
‖ f m ‖ W k, p 中取α= 0 的一项可 见 ‖ f m - fl ‖ L p ≤ ‖ f m - fl ‖ W k, p → 0 , 所 以 一 定存 在 一个 函 数
p fm fm fl fm
f ∈ L 使‖ f m - f‖ L p →0 .同理取 , 又有 - p ≤‖ f m - f l ‖ W k, p →0 , 所以 必
xi xi xi L xi
p f k, p
有极限 gi ∈ L .由广义导数定义易知 gi = .仿此类推可知{ f m }必有极限 f∈ W .这就是说
xi
k, p k, p
定理 3 W ( Ω) = H ( Ω) 是一个完备空间 .
∞ k, p k, p
如果用 C0 ( Ω) 来作完备化 , 我们将记 所得空 间为 H0 ( Ω) 或 W0 ( Ω) , 它 也是完 备的 .
k, p
但是其中之元并非具紧支集的函数 .若 k≥ 1 , 可以证明 H0 ( Ω) 中之 元在 Ω 上 按一定 意义 为
0 .以上用到的完备空间与完备化的概念 , 将在第六章详细讨论 .
k, 2 k,2
注 1 在许多文献中, 只在 p = 2 时才用记号 H ( Ω) 或 H0 ( Ω) , 但通常都将上标 2 略去 .
k, p k, p
注 2 我们也时常要用到 Wloc ( Ω) 或 Hloc ( Ω) .
2 .广义函数之定义 以上我们看到利用勒贝格积分理论得出了一系列空 间 .但 与当代分 析
p
数学与数学物理的需要比较 , 我们所得到的虽是很基本的 , 却还有更大的范围有待探索 .这 些 L
空间之元都是函数 , 但在第二章§4 中我们就指出 , 为了描述自然 界 , 这 还是不 够用的 , 并且举 出
2 68 第四章 积 分 学
∫f ( x ) φ( x ) d x =∫ f ( x ) φ( x ) d x
l ( φ) =
Ω n
( 8)
R
1 n
可积函数 .那里尽管是对 Ω R 的情况来证 明的 , 其 实对 高维的 R 也是 成立的 .第二章 §4 中
讲了 ,δ函数其实是一个测度 .这不是偶然的 .由 (9 ) 我们可以看到
|〈δ, φ〉| = | φ( 0) | ≤ssup | φ( x ) | .
upp φ
δ函数可以拓展到更大的空间 C0 ( Ω) D ( Ω) 上 去 .在 C0 ( Ω) 上 我 们 用sup | φk ( x ) | → 0 以 及
suppφk K 来定义 φk ( x ) → 0 in C0 ( Ω) .凡 是适 合这 种不 等 式的 D′( Ω) 广 义 函数 都 是一 种 测
度 , 称为 Radon 测度 .勒贝格测度也是 一种 Radon 测 度 , 这些 我们 都 不能 细讲 了 .但 我们 看到 了
广义函数中不仅包含局部可积函数 , 而且还有很大一类测度 .但是还有更多的东西 , 例如
+∞
1 1
∫
1 ∞ 1
例 6 f ( x ) = , x∈R 不是局部可积的 , φ( x ) d x , 当 φ( x ) ∈ C0 ( R ) 时 , 一般而言
x -∞ x
是没有意义的 .但是我们可以定义这个积分的哥西主值 :
∞ -ε +∞
φ( x ) φ( x )
∫
v .p .
-∞ x
d x = ε→
lim0 ∫ +∫ -∞ ε x
dx . (10)
∞ 1
注意到 φ( x ) ∈ C0 (R ) , 利用在 x = 0 处的泰勒公式
φ( x ) = φ(0 ) + xψ( x ) . (11)
代入上式 , 并令 suppφ [ - A , A] , 有
-ε +∞ -ε + A
φ( x ) φ( 0)
∫ +∫
- ∞ ε x
dx = ∫ +∫- A ε x
dx+ ∫ ψ( x ) d x
A≥ | x | ≥ ε
= ∫
A ≥ | x | ≥ε
ψ( x ) d x
φ( 0)
这里我们用到了 对 x 为奇函数因而第一项为 0 .代入 (10) 求极限 , 有
x
∞
φ( x ) A
v .p . ∫ - ∞ x
dx= ∫ - A
ψ( x ) d x . (12)
〈f , φ〉= ∫ f ( x ) φ( x ) d x ,
n
R
2 70 第四章 积 分 学
〈f , φ〉= ∑ 〈f , φ〉≡ 0 ,
i= 1
i
即 f ( x ) 整体为 0 .
逆定理就不必证明了 .
定义 7 广义函数 f ( x ) 之支集 supp f 定义为
supp f = { x : x 有一个邻域使在其上 f≠ 0} .
supp f 显然是闭集 .
与此类似还可以考虑广义函数 的 光滑 性 .显然 光 滑函 数都 是局 部可 积 的 .若在 x ∈ Ω 之 某
∞
一邻域 U 中 , 广义函数 f ( x ) 与某一 C ( U ) 函数 g( x ) 相等 : 即 f ( x ) - g( x ) 作为广义函数局部
∞ ∞
为 0 , 我们就说 f ( x ) 在 x 附近为 C .若 f ( x ) 在某点附近不是 C 的 , 就说 x 点是 f ( x ) 之奇点 .
定义 8 f ( x ) ∈ D′( Ω ) 之奇支集即其奇点之集合 :
∞
sing supp f = { x : f ( x ) 在其任一邻域中均不为 C } .
奇支集 sing supp f 显然也是闭集 .
3 .广义函数的代数性质 广义函数之空间 D′( Ω) 是线性空间这是 显然的 .现在 要问 , 若“ 自
变量”x ( 上面已经说了 , x 其实是试验函 数的 自变量 ) 经过 线性 变换 , D′( Ω) 之元 相应应 如何 变
化 ? 由于广义函数作为试验函数空间上的连续线性泛 函最简 单的 形式是 积分 , 所 以这里 讲的 自
变量的变换应该推广积分中的积分变量的线性变换 ( 一般 的变量 变换 涉及 很困难 的问 题 ) , 先 不
n n
妨设 f ( x ) 是正则广义函数 , φ( x ) ∈ D( Ω) , 则若 A : R →R 是一个 非奇异线性变换 , 或者 说 A
n n
是一个 n × n 矩阵且 det A≠0 , a∈R , 则对 y∈R
〈f ( A y - a) , φ( y )〉= ∫f ( Ay -
n
a) φ( y ) d y .
R
- 1
令 x = Ay - a, 或 y = A ( x + a) , 代入上式有
1
A∫
- 1
〈f ( A y - a) , φ( y )〉= f ( x ) φ( A ( x + a) ) d x
| det | n
R
1 - 1
= 〈f ( x ) , φ( A ( x + a) )〉 . (13)
| det A |
§6 分部积分法、广义函数、索伯列夫 ( Sobolev) 空间 2 71
- 1 n
这里自然仍有 φ( A ( x + a) ) = ψ( x ) ∈ D ( Ωx ) , Ωx 是 Ry 中的 Ω 在映射 x = A y - a 下的像 .这
里我们要注意开集与紧集在非奇异线性变换下仍 变为 开集 与紧集 , 这 样才 知道 supp ψ( x ) 是 开
集 Ωx 的紧子集 .
对于一般的奇异的广 义 函 数 f ( x ) , ( 13 ) 式中 间 一 项积 分 没有 意 义了 , 但两 端 两 项仍 有 意
义 , 于是我们给出
n n n
定义和定理 9 设 f ( x ) ∈ D′( Ωx ) , A : R →R 是非奇 异线性 变换 , a∈ R , 则定 义 f 在 变
换 x = A y - a 下的像 f ( Ay - a) ∈ D′( Ωy ) 为
1 - 1
〈f ( A y - a) , φ( y )〉= 〈f ( x ) , φ( A ( x + a ) )〉 . (14)
| det A |
我们用“定义和定理”这个说法是因为 f ( A y - a) ∈ D′( Ω) 有 待证明 .但 是上 式右方 已经 是
一个连续线性泛函 , 这一点很容易看出 .所以我们已经证明了这一点 .
现在看定义和定理 9 的一些特例 .
如果 A = I , 就得到平移 x = y - a .就是 说 y 坐 标系 是由 x 坐 标系 向 左移 动 a 而来 .这时 ,
det A = 1 , 故 (14) 成为
〈f ( y - a) , φ( y )〉=〈f ( x ) , φ( x + a)〉 .
φ( x + a) 的图像可由 φ( x ) 的图像向左移动 a 而得 , 所以 , 如果想 把 f ( y ) 向右移 一个 a 而得 新
的泛函 f ( y - a) , 只需将被它作用于其上的试验函数 φ( x ) 图像向左移动 a 就行了 .例如
〈δ( y - a) , φ( y)〉=〈δ( x ) , φ( x + a)〉= φ( a) .
从所附的图 4 - 6 - 2 可以形象地看到这件事 , 而且也可以形象地理解“ 对偶”是什么意思 .
其次看 A = cI, a = 0 , 这里 c > 0 , 即线性变 换是沿向量 x 方向放大或缩小 c 倍 , 这 时 det A =
n
c , 于是 (14) 给出
- n
〈f ( cy ) , φ( y )〉= c 〈f ( x ) , φ( x c )〉 . (15)
图4- 6- 2
研究函数性质时 , 齐性函数是十分有趣———且特别有用的 .λ次齐性函数即适合关系式
λ
f ( cx ) = c f ( x ) , c > 0 (16)
2 72 第四章 积 分 学
α
P( x , x ) =
|
∑
|≤ m
aα ( x ) x
如何作用于一个广义函数上 .这里 包括 了两 个运 算 , 一 是乘 以系 数 , 它 们是 函数 aα ( x ) ; 二是 求
导 .我们依次来讨论 .
首先讨论函数 a( x ) 与 f ( x ) ∈ D′( Ω) 之乘积 , 仿照 f ( x ) 局部可积时广义函数的定义
∫ a ( x ) f ( x ) φ( x ) d x = ∫f( x ) a( x )φ( x ) d x ,
我们应定义 a( x ) f ( x ) 如下 :
〈a( x ) f ( x ) , φ( x )〉=〈f ( x ) , a( x )φ( x )〉 . (21)
∞
但为此就需要 a( x ) φ( x ) ∈ D( Ω) .这就 需要 a ( x ) ∈ C ( Ω) , 还 需要当 φk ( x ) → 0 in D ( Ω) 时
a( x ) φk ( x ) → 0 in D ( Ω) .这也 是容 易的 , 因为 suppφk 均含 于 Ω 之一 个共 同紧 子集 K 中 , 所 以
supp a( x ) φk ( x ) K; 又因 φk 的任一固定阶 导数 一致 收敛于 0 , aφk 的同一 阶导 数当然 也一 致
收敛于 0 , 总之 a( x ) φk ( x ) →0 in D( Ω) , 因此
lim〈a( x ) f ( x ) , φk ( x )〉= klim〈f ( x ) , a( x ) φk ( x )〉= 0 .
k→ ∞ →∞
所以 af ∈ D′( Ω) .总 之 我 们 看到 , 不 是 任 意 函 数 都 可 以 与 f ∈ D′( Ω) 相 乘 , 我 们 需 要 a ( x ) :
D′( Ω) → D′( Ω) ( 下面还要证明这是一个连续映射 ) .适合 这种 要求 的函数 称为 D′( Ω) 乘 子 .上
∞ ∞
面我们看到 C ( Ω) 函数都是 D′( Ω) 乘子 , 也易见 , 若 a( x ) | C ( Ω) , a f 就可能不属于 D( Ω) .
读者自然会想到 : 两个广义函数可否相乘 ? 一般说来这是不可能的 .问题在于我们不能随心
所欲地胡乱定义某个数学概念 .我们想要定义的广义函数之乘积既是通常函数乘积之推广 , 则它
自然应该具备通常函数乘积的某些基本性质 .这里我们希望能保持的是乘法的一些基本运算律 ,
而我们会发现恰好是乘法的结合律 ( A B) C = A( BC) 现在不可能保持 .
如果乘法要有意义 , 我们当然希望 1・f ( x ) = f ( x ) , f∈ D′( Ω) , 因为 1 是 D′( Ω) 乘子 ; 也希
1 1
望 0・f ( x ) = 0 , 因为 0 也是 D′( Ω) 乘子 .同时注意 xδ( x ) = 0 ( x∈R ) , 这是因为 x 也是 D′(R )
1
乘子 , 故对 φ( x ) ∈ D (R ) 应有
〈xδ( x ) , φ( x )〉=〈δ( x ) , xφ( x )〉= xφ( x ) x=0 =0 .
1 1 1 1 1
但这样一来 , ・x δ( x ) = 1・δ( x ) = δ( x ) , 但 ・( xδ( x ) ) = 0 ( 上 面 指 v .p . , ・x = 1 应
x x x x x
该证明 , 但是很容易证 , 故略去 ) .这样一来 , 如果我们勉强去定义广义函数之乘积 , 则连乘子运算
也不能包括在内 .近来的研究表明 , 广义 函数 相乘的“ 障碍”在于 它 的奇 性 .时常 有 人想 求 δ( x )
的“平方”, 按现在的知识水平 , 还没有一种公认的处理方法 .
其次要考虑广义函数的导数 , 这时我们仍然模仿分部积分法而给出如下的
f
定义和定理 10 设 f ( x ) ∈ D′( Ω) , 我们定义 ∈ D′( Ω ) 如下 : 对一切 φ( x ) ∈ D ( Ω) , 有
xi
f φ
〈 , φ〉= ( - 1)〈f , 〉. (22)
xi xi
与此类似 , 对一切重指标 α= (α1 , … ,αn )
α α
f | α| φ
〈 α , φ〉= ( - 1 ) 〈f , α〉 . (23)
x x
当然这里要证明 (23) 式以及 (23) 左方确实是 D ( Ω) 上的 连续 线性泛 函 .线性 泛函是 容易 看
2 74 第四章 积 分 学
∫-∞
φ( t ) d t . 因为已设 supp φ [ - M , M ] , 至少当 x≤ - M 时 ψ( x ) = 0 , 但我们还需要当 x 充
+∞
分大时ψ( x ) = 0 , 所以应要求 ∫ - ∞
φ( t ) d t = 0 .说 来也巧 , 如果 φ( x ) 适合 这个条件 , 则当 x > M
x x +∞ ∞
时 , ψ( x ) = ∫-∞ ∫
φ( t ) d t =
- ∞
φ( t ) d t + ∫ x ∫
φ( t ) d t =
-∞
φ( t ) d t = 0 .这就是我们要求于φ( x )
∫
1
H = φ( x ) ∈ D (R ) , φ( x ) d x = 0 . (24)
-∞
1 ∞
H 当然只是 D( R ) 真 子 空 间 , 问 题 在 于 这 个 φ( x ) 是 否 在 H 中 .φ∈ C 不 成 问 题 , 但 是
1
D (R ) 中的 元 必 可 分 为 两 项 之 和 , 一 项 在 H 中 , 另 一 项 是 φ0 ( x ) 的 倍 数 , 这 里 的 φ0 ( x ) ∈
+∞
∫
1
D (R ) , 而 φ0 ( t) d t = 1 .例如令
-∞
2
αexp 1 ( x - 1) , x ≤1 ,
φ0 ( x ) =
0 x≥ 1 ,
§6 分部积分法、广义函数、索伯列夫 ( Sobolev) 空间 2 75
∫
1
而 α适当选取即得 .事实上 , 若 φ( x ) ∈ D( R ) , 令 A = φ( t ) d t , 则显然
-∞
φH ( x ) = φ( x ) - Aφ0 ( x ) ∈ H ,
1
或者说 , D (R ) 中任一元均可分解如下 :
φ( x ) = φH ( x ) + Aφ0 ( x ) . (25)
1
φH ( x ) 之 D (R ) 原函数是
x x x
ψ( x ) = ∫ - ∞
φH ( t ) d t =∫ - ∞
φ( t ) d t - A ∫ -∞
φ0 ( t )d t . (26)
= - 〈g , ψ〉+ C ∫ - ∞
φ( t ) d t . (27)
中的 φ, 则 A = ∫ - ∞
φ′( t)d t = φ( x ) - ∞
= 0 , 而 (26) 给出 ψ( x ) = ∫ - ∞
φ′( t)d t = φ( x ) , 因此
〈f , φ′
〉= - 〈g , φ〉 .
而 f 确是 g 的原函数 .证毕 .
1 df
推论 6 若 f ( x ) ∈ D′(R ) 且 = 0 , 则 f ( x ) ≡const .
dx
1 n
注 我们是对 D′(R ) 证明了这个定理的 .但实际 上它 对 D′( Ω) 也成 立 , 这里 Ω R 是 一
开集 , 但定理的结论中“ 只相差一个常值函数”要改 成“只 相差 一个局 部常 值函 数”, 即在 Ω 的 不
同连通分支中可能取不同的常数值的函数 .这里强调一下连通分支是必要的 , 例如我们在第二章
d H( x )
§4 中就已看到 = δ( x ) , H ( x ) 是赫维赛德函数
dx
1, x≥ 0 ,
H( x) =
0, x<0 .
于是 H ( x ) 是 δ( x ) 的一个原函数 , 而其所有的原函数即 H ( x ) + C , C 是任意 常数 .但是这是 把
1
H ( x ) 与 δ( x ) 均看作 D′( R ) 中元时的结论 , 若视它们为 D′( Ω) 之元 , 而
Ω= { x : x > 0}∪{ x : x < 0} ,
情况就不同了 , Ω 现在有两个连通分支 x > 0 与 x < 0( 它们不是在 x = 0 处连接起 来了吗 ? 为 什
么算两个连通分支呢 ? 第六章中会解释它 .) 在其中之一 x > 0 处 , δ( x ) = 0( 上面 我们说 了不 能
讲广义函数在某一点等于什么 , 但是可以讲它 在一点 附近 等于 0 .) 所 以由 推论 6 , δ( x ) 在 x > 0
处的原函数是 f ( x ) = C + .同理 , 它在 x < 0 处的原函数是 f ( x ) = C - .没有理由说 C+ = C - .如
2 76 第四章 积 分 学
1
果把这两个连通分支合起来 , 这时得到 Ω= R \ {0} , 我们只会得到
df
= ( C + - C - )δ( x ) .
dx
C + - C - 正是 Ω 上的函数 f ( x ) 在 x = 0 处的跃度 .
这件事绝非偶然 , 在许多物理问题中 , 例如在量子 力学的 散射 问题中 , 我 们常 会遇到 在两 个
不同区域中研究某一个物理量 , 而在两个区域的连接处给出一定的“ 边值条件”把它们连接起来 .
在每个区域中我们实际上并不在 D′( Ω) 中考虑 问题 而是在 通常 的比 较光滑 的函 数之空 间中 考
1
虑问题 , 例如在古典意义下取导数 .如 果不 把 这两 个区 域分 开考 虑 , 而 从整 体上 的 R 上 来看 问
1
题 , 我们应把这些函数都看作 D′( R ) 之 元 , 而在 广义函 数意 义下 求 导数 , 这 样就 会 出现 δ( x ) .
1
因此 , 问题的实质在于我们究竟采取哪一种观点 : D′(R ) 还是 x r 0 处的光滑函数以及连接二者
1
的边值条件 .两者实质是相通的 .由此也就提出了一个 问题 : 设有 R 上的 函数 f ( x ) , 它在 x > 0
和 x < 0 处均有一阶连续导数 ( 这是古典意义的导数, 我们记作 f′
cl .) f ( x ) 在 x = 0 处又有第一类间
者关系如何 ? 有
定理 7 对上述 f ( x ) , 我们有
cl ( x ) + [ f ] 0 δ( x ) .
f′( x ) = f′ (28)
证 考虑函数
F( x ) = f ( x ) - [ f ] 0 H ( x ) .
1 1
显然 F( x ) ∈ C (R \ 0) , 因而其 古典意 义 下的 导数 与广 义函 数 导数 一致 , 但 当 x ≠ 0 时 , F′
cl =
cl , 所以
f′
F′( x ) = f′( x ) - [ f ] 0 δ( x ) , F′
cl ( x ) = f′
cl ( x ) ,
因此当 x≠ 0 时
cl ( x ) = f′- [ f ] 0 δ( x ) .
f′
此即 (28) 式 .不过这里的 f′
cl ( x ) 理解 为古 典意 义下 的导 数所 定义 的 广义 函数 .所 以 我们 不加 注
n
f( x )
∑ i =1
xi
xi
= λf ( x ) , (29)
n
事实上 , 任取一个 φ( x ) ∈ D (R ) , 我们有
n n n
f ( x iφ) φ
〈∑ x i , φ〉= - ∑ 〈f , 〉= - n〈f , φ〉 - ∑ 〈f , x i 〉. (*)
i= 1 xi i= 1 xi i= 1 xi
另一方面 , 由 λ次正齐性广义函数之定义
- (λ+ n ) x
〈f , φ〉= c 〈f ( x ) , φ( )〉, c > 0 .
c
双方对 c 求导 , 再令 c = 1 , 有
n
φ
0 = - (λ+ n)〈f , φ〉 - ∑ 〈f , x
i =1
i
xi
〉,
即
n
φ
- n〈f , φ〉 - ∑ 〈f , x
i= 1
i
xi
〉= λ
〈f , φ〉 .
就说 f k → f in D′( Ω) .
注意 , 这个定义不只是说 klim〈f k , φ〉存在 , 还要求 极限 是 D ( Ω) 上一 个连 续线 性泛 函 .因 为
→∞
多古典的一致收敛性所没有的性质 , 例如
α α
定理 8 若 klim f k = f in D′( Ω) , 则对任意重指标 α, 有 k →lim fk = f .
→∞ + ∞
请读者自行证明 .
这个收敛性 之 所 以 重 要 在 于 每 个 D′( Ω) 广 义 函 数 都 可 以 表 示 成 为“ 很 好 的”函 数 ( 甚 至
D( Ω)函数 ) 之 D′( Ω) 极限 .在物理学上特别重要的是 δ函数可以这样表示 .实际上, 物理学家正是
这样来认识 δ函 数 的, 狄拉 克 的话 就 应该 这 样 理解 .尤 其重 要 的是 δ函数 有 多种 表 示法 .如 果
1 1
D(R ) 函数 f k ( x ) →δ( x ) in D′
(R ) , 我们就称{ f k ( x )}为一个 δ序列 .第二章§4 实际上证明了
2 k
Ik ( 1 - x ) | x | ≤1 ,
fk ( x ) = (31)
0 | x| >1,
2 78 第四章 积 分 学
1 - 1
∫
2 k
Ik = (1 - x ) d x ,
- 1
所以
∞
1
∫
2
φ( 0) = φ( 0) exp[ - x 4 Dt ] d x .
2 πDt - ∞
于是我们有
〈q( x , t ) , φ( x )〉 - φ( 0)
∞
1
∫
2
= [ φ( x ) - φ(0 ) ] exp[ - x 4 Dt ] d x .
2 πDt -∞
1
把积分分为两部分 , 一部分在 [ - δ,δ] 上记作 I1 , 其余的是在 R \ [ - δ, δ] 上的 积分记作 I2 .任
ε
给一个 ε> 0 , 因为 φ( x ) 在 [ - δ, δ] 中 是一致 连续 的 , 故当 δ充分小 时 有 | φ( x ) - φ( 0 ) | < ,
2
| x | ≤δ .因此
δ
1
∫
2
| I1 | ≤ | φ( x ) - φ(0 ) | exp[ - x 4 Dt ] d x
2 πDt -δ
∞
ε 1 ε
∫
2
≤ ・ exp[ - x 4 Dt ] d x = .
2 2 πDt -∞ 2
1
现在固定 δ并令 t→0 .因为 φ( x ) ∈ D (R ) , 故有最大值 M , 而在 I2 中 | φ( x ) - φ( 0 ) | ≤ 2 M .在
2 2 2
I2 中 | x | ≥δ, 从而 exp[ - x 4 Dt ] ≤exp[ - δ 8 Dt ] exp[ - x 8 Dt ] , 因此
2
exp[ - δ 8 Dt ]
∫
2
| I2 | ≤ 2 Mexp [ - x 8 Dt] d x
2 πDt | x|≥δ
2
≤ Cexp[ - δ 8 Dt ] .
这里我们利用了积分的收敛性 , 而有
∞
1 C
∫ ∫
2 2
2 Mexp[ - x 8 Dt ] d x ≤ exp( - y ) d y = C,
2 πDt | x | ≥δ π -∞
ε
于是可以找到 τ0 > 0 , 使当 0 < t < τ0 时 | I2 | < .前面对 I1 的估计是对一切 t 都成立的 , 所以当
2
0 < t < τ0 时
|〈q( x , t ) , φ( x )〉 - φ( 0) | ≤ I1 + I2 < ε,
§7 复 积 分 2 79
而定理证毕 .
上一节中我们说过 q( x , t ) 是扩散方程
2
1 u u
= 2 , - ∞ < x < + ∞, t > 0
D t x
的基本解 .这就是说 , 当 t > 0 时 q( x , t) 适合上面的偏微 分方程 ( 这 一点读者 很容易自 己证 ) , 而
当 t→0 时 , q( x , t ) →δ( x ) in D′( Ω) .这就 是我们上 面证明的 事实 .基本 解是偏微 分方程理 论
的基本工具 .有了广义函数理论就能给出系统的基本解理论 .这是广义函数论之所以重要的一个
很大的理由 .
我们不妨把这里的证明与第二章 §4 关 于魏尔 斯特 拉斯 定理的 证明 比较 一下 , 立刻 可以 见
到它们是十分相似的 .实际上 , 我们常用的 δ序列常是这样的光滑函数序列{ K n ( x ) } :
( i) K n ( x ) ≥0 ;
∞
∫
( ii)
-∞
Kn ( x ) d x = 1 ;
§7 复 积 分
1 - 1 - -
f ( x , y) = f [ ( z + z ) , ( z - z ) ] = F( z , z ) .这 样 w = f ( z ) 只能 是一类 特殊 的二元 实自 变
2 2i
- -
量 ( 但可能是复值 ) 函数 ( 即相应的 F( z , z ) 不依赖于 z ) 了 .本章将一直使用这样的记号 .
b
∫ f ( x ) d x 之积分区域是 R
1
实域中通常的定积分 的一 个区
a
1 1
间 [ a , b] , 但是 R 可以看成是复平面 C 中的一条曲线 .因此 , 要
1
把它推广到复域中就有两种考虑 : 一是考虑 C 中某一 曲线 L 上
1 2
的积分 .二是考 虑 C ( 作为 R 看 待 ) 的 一个 2 维子 区 域 Ω 上 的
边界的光滑性加以限制 . 图4- 7 -1
先看曲线 L , 设其参数方程为
x = x ( t) , y = y ( t) . ( 1)
如果要在 L 上的 AB 弧段上积分 , 仿 照黎 曼积 分 的作 法 , 先选 一些 分 点 A = z0 , z 1 , … , z N = B
( 图 4 - 7 - 1 ) , ( zj 的相应参数值为 tj ) , 然后作积分和
N-1
∑ j= 0
f (ξj ) ( zj + 1 - zj ) , ( 2)
再求极限 .因为 zj = x j + i yj ,
Δzj = zj + 1 - zj = ( xj + 1 - xj ) + i( yj + 1 - yj ) ,
所以
2 2
| x j + 1 - x j | , | yj + 1 - yj | ≤ |Δzj | = | x j + 1 - x j | + | yy + 1 - yj | .
1
一个便利的方法是设 x = x ( t ) , y = y( t ) ∈ C , 于是
2 2
|Δzj | ≤ t <max x′( t ) + y′( t ) ( tj + 1 - tj ) ( 3)
t≤ t
j j+ 1
∫
N 2 2
S AB = x′( t ) + y′( t ) d t . ( 4)
t
0
VP x ( t) = ∑
j= 0
| x ( tj + 1 ) - x ( tj ) | ,
N-1
V P y ( t) = ∑
j= 0
| y ( tj + 1 ) - y ( tj ) | . ( 5)
如果这两个量对一切可能的分割 P 有有限的上确界
V x ( t ) = sup V P x ( t) < + ∞ , V y ( t ) = sup V P y( t ) < + ∞ , ( 6)
P P
§7 复 积 分 2 81
就可以定义 A B之长为
2 2
S A B = V | z ( t ) | = sup VP x ( t) + y( t) . ( 7)
P
这时我们就简单地说 L 是可求长曲线 .
如果一个函数 φ( t ) , t0 ≤ t≤ tN - 1 适合 ( 6) 那样类型的条件 :
N- 1
§1 所述 , 讨论二重积分时需要假设 Ω 若尔 当可 测 .为 此应 要求 Ω 之边 界 Ω 具 有 0 勒 贝格 测
1
度 .若我们已假定了 Ω 是一个分段 ( 其实是分有限 段 ) C 曲线 , 这个条件 是自 然会 满足的 .这 是
1
我们约定恒假设 Ω 为分 段 C 曲线的原 因 .我 们既然要讨论复 积分 , 最 好是使用复记号 .上面 我
- -
们已说了 f ( x , y ) 可写为 F( z , z ) , 为 简单 起见 以下 我 们就 直接 讨论 f ( z , z ) 在 Ω 上的 积分 .
i -
d xd y 也有复记号 : 我们把它写成 d z∧ d z “
. ∧”称为外积 , 关于外积及其与 d xd y 的关 系 , 本 书
2
最后一章要详细讨论 , 我们目前只要记住 : 第一 , 两 个向 量 A 和 B 的外积 , 很 像通 常微积 分教 本
-
中讲的向量积 , 其大小即以这两 个向量 为边 的平 行四边 形面 积 , 所以 d z∧ d z“ 是”一 个面 积 .这
自然十分适合二重积分的需要 .第二 : 外积运算适合分配律和反交换律 :
A∧ ( B + C) = A∧ B + A∧ C ,
A∧ B = - B∧ A , 所以 A∧ A = 0 .
我们目前只需 把它 们 当 作一 种 形式 规 律 , 而且 能“承 认”它“ 很 自 然”就 行
了 .它 很像 通常微 积分 教本中 讲的 向量 积 , 但是它 又比 向量 积极大 地深 化
了 , 这一切我们将在第七章中详细讨论 .有了这两点“约定”, 我们可知
-
d z∧ d z = ( d x + id y ) ∧ ( d x - id y ) = - 2id x ∧d y . ( 9)
图4 -7 - 3
所以凡讲到复的二重积分时 , 我们总把 d xd y 理解 为 d x ∧ d y, 并按 上式 将
2 82 第四章 积 分 学
i -
它写成 d z∧d z .
2
最后还有一点要提醒 , 在讨论 某一简单封闭曲 线 L 上的积 分时, 时常要在 L 上规定一 个“定
向”———通常讲的顺、逆时针方向与左、右手坐标系都是讲的“定向”问题——— L 上的定向是相对于
L 所围的区域而言的, 因为前面介绍的若尔当定理已指出, L 把整个复平面分成 ( 即“围成”) 两个区
域, 现在指定其中一个 , 使当一点沿 L 运动时此区域恒在左方 , 就说此方向对于所指定的区域是正
向 .例如单位圆周对于单位圆而言逆时针方向就是正向 ( 图 4 - 7 - 3) .L 上规定了一个正向后就说
L 是有定向的 .但有时也要讨论 L 不是简单曲线的情况, 这时 L 上的“正向”就纯属一种约定 .
现在我们可以讨论复积分了 .我们现在讨论第一种情况 , 即一维的 L 上的 曲线积分 , 即要 求
1
一个连续函数 f ( z ) = u + i v 沿一分段 C 曲线 L 由 A 点到 B 点的积分 .这里 L 是有定 向的 , 而
由 A 到 B 即为正向 ( 将定向倒转为由 B 到 A 为正向的 L 则记作 - L ) .我们给出
定义 1 f ( z) 沿有向路径 L 由 A 到 B 的积分定义为
B B
∫f ( z) d z =∫
L
A
f ( z )d z = ∫ ( u + i v ) ( d x + id y )
A
B B
=∫ ud x -
A
vd y + i∫ vd x +
A
ud y . (10)
式右的积分是通常的实曲线积分 .
当然我们也可以仿照实积分的方法定义此积分为积分和的极限
B N-1
∫ f ( z ) d z = lim ∑
A j= 0
f (ξj ) ( zj + 1 - zj ) .
这个定义与上面的定义 1 显然是一致的 .
在我们关于 L 的光滑性和 f ( z ) 的光滑性的 假设下 , ( 10 ) 中 的积分 显然是存 在的 , 而且就 是
通常的黎曼积分 .所以下面不再讨论可积性问题 .
1
如果 L 有参数式 ( 1) , 则因其中的 x ( t ) 、y ( t ) 均 为分段 C 的 , 而 A , B 两点 分别相 应于 参
数值 t = a 和 t = b, 若记 z′( t ) = x′( t ) + i y′( t ) , 由 (10) 式立即有 :
b
∫f ( z) d z =∫ f ( z( t) ) z′( t ) d t .
L
a
(11)
1
现在我们将参数变为 t = t (τ) , 而 a = t (α) , b = t (β) .并 且也 设 t = t ( τ) 为 分段 C 函数 , 则 由
上式右方作变量变换又得
β
∫ f ( z ) d z =∫
- L
- b
f [ z( - τ) ] ( - z′( - τ) ) dτ.
§7 复 积 分 2 83
∫ f ( z ) d z =∫ f [ z ( t ) ] z′( t ) d t = -∫ f [ z ( t ) ] z′( t ) d t
- L
b a
= - ∫f ( z ) d z .
L
(12)
这是一个很重要的性质 , 只在 L 上有了定向以后才会有它成立 .
积分 (10) 的许多性质 , 例如对被积函数的线性 性质以及 对积 分路 径的可 加性 都和实 黎曼 积
分一样 .现在我们要讨论关于积分 ( 10 ) 的一个 估计 . L 的参数 式 ( 11 ) 中 的参数 t 自 然是实 的 , 如
果 L 的定向对应于 t 由小变大 , 则由 (11) 有
b
∫f ( z )d z ≤∫ | f ( z ) | | z′( t ) | d t ,
L
a
a≤ b,
2 2 2
但 | z′( t ) | = x′( t ) + y′( t ) , 从而当 d t > 0 时 , | z′( t ) | d t = d s = | d z | .所以我们有
b
∫f ( z ) d z ≤∫| f ( z) | | d z | =∫ | f ( z ) | d s .
L L
a
∫ f ( z ) d s =∫ f ( z ) | d z | = ∫
- L - L a≤ t≤ b
f [ z ( t ) ] | z′( t ) | d t .
∫f ( z ) d s .
=
L
(13)
不论如何取参数 , 最后成为通 常的 定积 分时 总 是由 小的 参数 值积 到 大的 参数 值 .我 们称 它是 在
“不定向”的 L 上的曲线积分 .许多常用的微积分教材中则把它称为“第一 类曲线 积分”而把前 面
讲的称为第二类曲线积分 .其区别在于前者适合 ( 13 ) 式而后者适合 ( 12 ) 式 .由于通常的一维定积
分是在 x 轴上积分的 , x 轴自然是已定向的 , 而且我们都“默认”其正向是 x 由小 变大———向右 ,
∫ f ( x ) d x =∫ f ( x ) x′( t ) d t, a =
a α
x (α) , b = x (β) .
∫f ( z ) d z =∫ f [ z ( s) ] ( sgn
L
a
L ) | z′( s) | d s , a≤ b .
2 84 第四章 积 分 学
∫P( x , y ) d x + Q ( x , y ) d y
L
(14)
的积分 , 我们就从讨论它开始 .
到这个问题 .
现在我们就回到复积分的情况 .首先我们引入格林公式的复表述方法 .现在我们引入两个形
式符号 .
1 1
- = +i , = - i ,
2 x y z 2 x y
z
称为庞贝 ( Pompeiu) 记号 ( Pompeiu 是罗马尼亚数学家 ) 而 f ( z ) = u + i v 为解析的 C - R 条件即
f
- =0 .
z
现在我们有
1 1
定理 1 若 f ( z ) ∈ C ( Ω) 而 Ω 是分段 C 曲线 , 则
∫f ( z ) d z =
Ω Ω
d f ∧d z . (16)
这个 定 理 我 们 不 加 证 明 了 , 因 为 它 就 是 对 ( 10 ) 中 的 两 个 实 曲 线 积 分 ∫ud x
Ω
- vd y 与
∫vd x +
Ω
ud y 应用实的格林定理的结果 .
但若注意到
f f 1 f - 1 f -
df =
dx + dy= (d z + d z ) + (d z - d z )
x y 2 x i y
f f -
= dz+ d z .
z -
z
再利用“外积”∧的反对称性 : d z∧ d z = 0 , 就可以把 (16) 化为
f -
∫ Ω
f ( z) d z =
Ω
- d z ∧d z .
z
(17)
∫ f ( z) d z = 0 .
Ω
1
2 86 第四章 积 分 学
f ( z ) 在 Ω 上 是否 有 定义 尚且 不 知 , 更 说不 上 是否 可 积 了 .如
-
果我们将条件改成“ f ( z ) 在 Ω上 解析”, 则 由 函数 解 析性 的 定
-
义可知 , 它必在 Ω的某一个邻域中解析 .把这 个邻域记 为 Ω 而
把原来的 Ω 改写成 Ω1 即得 .我 们对 此定 理的陈 述还 大有改 进
1 -
的余地 .例如设 Ω 是分段 C 曲 线 , f ( z ) 在 Ω 中解析 , 而 在 Ω
上连续又如何 ? 结果是 : 定理 2 此时仍是 对的 .实际上 , 现 在通
用的许 多关 于复分 析的 书籍中 , 这个定 理的 条件都 放宽 了 , 因
图4- 7- 5
为人们后来把 f ( z ) 在 z0 点解 析的定 义改 成了 : f ( z ) 在 z 0 的
某一邻 域 中 可 求 导 , 而 不 要 求 f′( z ) 的 连 续 性 .这 样 一 来 就 不 能 再 用 格 林 公 式 了 .古 尔 萨 ( E .
Goursat) 在解析性的这个定义下不 用格 林公 式证明 了如 我们 所陈 述 的定 理 , 所以 在 有的 书上 称
-
定理 2 为柯西 - 古尔萨定理 .最后又经许多 人努 力才把 条件 放松 到“ Ω 中 解析 , Ω上 连续 , 且 Ω
是可求长曲线”.证明复杂多了 , 但对问题的理解好处有限 , 所以我们采用现在的讲法 .
真正的问题有二 : 一是积分路径不一定是若尔 当曲线 , 而 可以 自交 .也不 一定 是某区 域的 边
1
缘 .对这个问题的处理的方法如 下 : 曲 线由 曲线 段构成 , 而 曲线 段是 闭间 I = [ 0 , 1 ] R 在某 映
射 φ: I→C 下的像 ( 这里 C 指复数域 , I 中的变元就是曲线段的参数 ) , I 的两个端点 ( 不 妨设为 t
L = A A1 + A1 A2 + … + AN - 1 B , A = A0 , B = AN ,
L = ( A A1 ) + ( A1 A2 ) + … + ( A N - 1 B)
= ( B - A N - 1 ) + ( AN - 1 - A N - 2 ) + … + ( A2 - A1 ) + ( A1 - A )
= B- A .
∫f ( z ) d z = ∑∫f ( z) d z ,
L
j= 1
L
j
§7 复 积 分 2 87
而每一个 Lj 都是一条封闭的若尔当曲线 .
第二个问题是看 L 是 否包 围一个 区域 Ω .为 此我 们又 把 Ω 分
成 k 个小的曲边三角 形△ Aj Bj Cj ( j = 1 , 2 , … , k ) , 所以 我 们形 式地
k
把它记作 Ω= ∑ △A BC
j=1
j j j 并称之为一个 2 维链 ( 图 4 - 7 - 6) .每
个这样的三角形称 为一 个 2 维 单形 .对每 个三 角形 △ Aj Bj Cj , 我们
定义其边缘是
( △ Aj Bj Cj ) = Bj Cj + Cj A j + A j Bj .
边缘的定向的要求是: 其定向必 须与 Ω 原有的定向 相容 .因为把 Ω
划分成三角形是利用 Ω再加上一些曲线段形成的 .在最简单的情况
下, 后加上的曲线段一定位于两个三角形共同的边缘上 .这两个三角
形一在其左 .一在其右 .所以这个加上的曲线一定要走两次且方向相
反: 第一次保持某一个三角 形在其左方 从而定义 了这一 次走的是 正
向 .第二次一定要走反 向以保 持另一个 三角形 在左方 .这 样一来 , 如
果原来的 Ω 被划分成了 Ω1 + Ω2 + … + Ωk , Ωj = △ Aj Bj Cj 则 图4- 7 -6
k
Ω= ∑ j=1
( △ Aj Bj Cj ) .
∫ f ( z) d z = 0 .
Ω
1
下的柯西定理 , 即定理 2 , 于是
2 88 第四章 积 分 学
∫ f ( z)d z = 0 .
ω
j
= Ω1 .
因此我们有
∫ f ( z)d z = ∫
Ω
f ( z)d z = ∑∫ f ( z ) d z = 0
j ω
.
1 ∑ ω
j j
定理证毕 .
定理 3 包含了多连通区域的柯西定理 .那么什么叫做单连通 , 什么叫多连通呢 ? 如果我们不
想多用拓扑学的语言而只来看 Ω 是有界连通区 域的情 况 , 所 谓 Ω 为
单连 通区 域就 是说 Ω 把复平 面分 成两 块 , 一块包 含无 穷远 点 , 不妨
称为外域 , 一块则不包含无穷远 点 , 称为 内域 .如 果 Ω 把 平面 分成 n
+ 1 块 , 则说 Ω 是 n 连通的 .这 n + 1 块中只有一块含无穷远点 , 称为
外域 , 其它 n 块就可能 是 n 个“ 洞”.所 以 , 多连 通 区域 就是 有洞 的区
域 .每一个“ 洞”都 有 自 己的 边 缘 Γ1 , Γ2 , … , Γn .外域 也 有 边 缘 记为
Γ0 .它们都按以前的规定有 各自 的正 向 .例 如 Γ0 的正 向即 是把 无穷
远点置于其右侧的 方 向 , 即逆 时针 向 ; Γ1 , … , Γn 的正 向 则是 顺 时针 图4- 7 -7
方向 ( 图 4 - 7 - 7) .我们再 一次 指出 , 这种 表达 虽 然直 观却 是不 严格
的 .但是下面的概念却是严格的 , 而且具有基本的重要性 .
定义 2 若 1 维闭链 γ是一个 2 维链Ω 之 边缘 , 即 γ= Ω, 就说γ同 调于 0 , 记作 γ~ 0 .若
两个 1 维闭链 γ1 与 γ2 之差是 Ω 的边缘 :γ1 - γ2 = Ω, 就说 γ1 与 γ2 同调 , 记作 γ1 ~γ2 .
“1 维闭链”一语中的“闭”字 , 似乎 是 多余 的 : 既然 γ 已是 边 缘 , 自 然有 γ= 0 ( 前 面已 经 说
了 ) , 再加闭字岂非多余 ? 确实如此 , 但是在 γ1 ~γ2 中 , 我 们只 知 γ1 - γ2 是 闭链 而对 γ1 , γ2 分
别是否闭链并不清楚 , 但是同调关系 是用 来处理 闭链 的等 价 分类 的 , 所以 若 γ1 , γ2 本身 并非 闭
链 , 说 γ1 ~γ2 就只是一种方便说法 .所以在定义中必须指出 γ1 , γ2 是闭链 .
现在回来看柯西定理 .利用上图 , 我们再引 入一 些闭 链 γ0 , γ1 , … , γk .这 一次 γ0 = Γ0 , 即 定
~
向也不变 , 但 γj = - Γj , j = 1 , 2 , … , k, 即内部的那些闭链也改成以逆时针方向为正向 .令 γ= γ1
~ ~
+ … + γk , 则有 Ω= γ0 - γ1 - … - γk = γ0 - ( γ1 + … + γk ) = γ0 - γ .所以 γ0 同 调于 γ, 而定 理
§7 复 积 分 2 89
3 即成为
∫f ( z ) d z =∫ f ( z ) d z -∫ f ( z ) d z = 0 ,
Ω γ ~
0 γ
亦即
∫ f ( z ) d z =∫ f ( z ) d z .
γ ~
0 γ
一般而言 , 我们有
定理 4( 柯西定理的同调论表述 ) 设 f ( z ) 在 Ω 中解析 , γ1 , γ2 为 Ω 中的两个闭链 , 若 γ1 ~
γ2 , 则
∫ f ( z ) d z =∫ f ( z ) d z .
γ γ
1 2
1
Δz
F( z +Δz ) - F( z ) .我们先取一个路径 L 联 结 a 与 z 这样 得出 F( z ) = ∫f ( z ) d z .在计 算
L
F( z +Δz ) 时 , 因为积分与路径无关 , 我 们 取 一个 特 殊路 径 L1 = L + [ z , z + Δz ] , 这 里 [ z , z +
Δz] 表 示 连 接 这 两 点 的 直 线 段 ( 当 | Δz | 充 分 小 时 , 这 个 直 线 段 总 在 Ω 中 ) . 所 以
1 1 1
Δz
F( z +Δz ) - F( z ) =
Δz [ z , z+ Δ z] ∫
f (ζ) dζ= f ( z ) +
Δz ∫
[ z , z+ Δz ]
f (ζ) - f ( z ) dζ.在 计算 第
一项时我们利用了 ∫
[ z , z +Δ z ]
d z = Δz , 这应该由积分的定义算出 , 而不能用牛顿 - 莱布尼茨公式 , 因
= [ z max | f (ζ) - f ( z ) | → 0 .
, z + Δz]
由此得到下面的
z
分路径含在 Ω 中 .
这里要求 Ω 是连通的是因为这个积分只能 在含 a 的 连通分 支中 定义 F( z ) .至于单 连通 问
题下面再说 .
定理 6 单连通区域 Ω 中的解析函数 f ( z ) , 若以 F( z ) 为其一个原函数 , 则 F( z ) + C 就 都
是 f ( z) 的原函数 , 而且给出了其全部原函数 .
证 与实变函数情况一样 , 我们只需证明若 F′( z ) = 0 , 则 F( z ) = C 即可 .但是 这里的证 法
与实的情况不同 , 因为 复 的情 况 下 没有 拉 格朗 日 公式 .这是 实 的 与 复 的情 况 的 重 要 区别 .现 令
F( z ) = u( x , y) + i v ( x , y) , 由于 F′( z ) 之值应与 z + h 趋向 z 的 情况 无 关 .令 h 为实 数 , 即 得
F′( z ) = ux + i vx , 由 F′( z) = 0 即得 ux = vx = 0 于 Ω 中 .由 C - R 条件又有 uy ≡ vy ≡0 , 所以 u ,
v 都是常数 , 定理证毕 .
由此立即可得复情况下的牛顿—莱布尼茨公式 .
定理 7 假设同上 , 我们有
b
∫ f ( z ) d z = F( b) -
a
F( a) .
柯西定理的逆定理仍成立 , 实际上我们有
定理 8( 摩列拉 ( Morera) 定理 ) 若 f ( z ) 在 Ω 中 连续 , 而 Ω 之每一 点 a 都有 一个单 连通 邻
z
附近 F( z ) 均有连续导数 , 故 F( z ) 在 Ω 中解 析 .下 面我 们就 要证 明 , 解 析函 数的 导 数仍 为解 析
的 , 故 f ( z) 在 Ω 中解析而定理成立 .
§7 复 积 分 2 91
多值性呢 ? 试利用积分式 F( z) = ∫ 0
f (ζ) dζ把 F ( z ) 最终 解析
延拓到区域 Ω, 直到不能再继续延拓 , 这时 Ω 称为 F( z) 的 自然
边界 ( nat ural boundary) , 而 Ω 中 有 若干 个 洞 Ω1 , … , Ωk .我们 还
设在 Ω 中可以作一个若尔当曲线 Γ0 包围所有的“ 洞”, 又对 每一
个洞 Ωj 可 以作一 个若 尔当 曲线 Γj 包围 它 .如图 4 - 7 - 8 .于 是
对 a 点和 Ω 中一点 z , 我们先作一条路径 γ1 由 a 到 z .如果再取
另一条路径 γ2 由 a 到 z , 则 γ2 - γ1 , 成为一个闭链 .这个闭 链的
构造可以十分复 杂 .例 如 图 4 - 7 - 8 中 的 γ2 - γ1 实 际 上 绕 过
Ω1 和 Ω2 各两次 .总之
图4- 7 -8
n
γ2 - γ1 ~ ∑ cjΓj .
j= 1
这里 cj 是正负整数或 0 .而由柯西定理的同调论表述 ( 定理 4) 有
∫
γ -γ
f (ζ) dζ = ∫ f (ζ) dζ= ∑ c∫f (ζ) dζ
j
j
Γ
2 1 ∑ c Γ
j j j
j
= ∑ cθ ,
j
j j
∫ a(γ )
2
f ( ζ) dζ= ∫ a( γ )
1
f (ζ) d z + ∑ cθ .
j
j j
Ln z = ln z + k・( 2πi) ,
w
这里的 k 就是整系数 cj , 2πi 就是 θj .不过我们看到其实周期是说的对数函数的反函数 z = e 有
周期 2πi .
细心的读者马上就会看到 , 上面 的讨 论 很不 严格 .怎 样 证明 γ2 - γ1 和 ∑ c Γ 同 调呢 ? 这
j
j j
1 -
当然当 Ω 为分段 C 曲线 , 而 u 在 Ω 中解析 , 在 Ω上连续 , 上式也成立 .
在讨论它的种种应用之前 , 先要注意 , 当 z 在 Ω 之外域中时 , 上式等于 0 .这虽然是柯西定理
1
的一个简单的推论 , 却反映 了核 ———称 为柯 西核———重 要的拓 扑性 质 , 以至 于 我们 要用 一
ζ- z
§7 复 积 分 2 93
个特定概念来刻画它 .
1
定理 11 若 L 为一分段 C 闭曲线 , 而 a| L, 则
1 dz
n ( L , a) =
2πi∫z -L
a
(20)
这里 f ( z ) | L 表示 f ( z) 在 L 上的变幅 : 任取 z0 ∈ L, f ( z) | L 表示 f ( z ) 从 f ( z0 ) 开始 , 再令 z 沿 L
iε 1
解析延拓一周回到 z0 后的终值之增加值 .记 z - a = e , 前一项为 ln r | L = 0 , 后一项为 θ| L , 即是
2πi
1
z - a 的辐角当 z 依正向绕 L 一周(即 z 沿 L 正向绕 a 回到起点)的增值 .所以 θ 即环绕的次数 .
2π L
这个定理虽然简单 , 却 有丰 富的 含 意 .首先 , 它 告诉 我们 , 在前 面 定
理 5~ 8 中我们 一 再强 调 原 函数 从 局 部 观 点看 与 从 整 体 观点 看 是 不 同
1
的 : 这里正说明 了 的原 函数 ln ( z - a) 从整体看 是多值 的 .其次 , 正
z- a
是这种多 值 性 给 我 们 提 供 了 一 个 刻 画 L 的 拓 扑 性 质 的 重 要 的 不 变
量———环绕 数 , 它在 拓扑学 中有 重要 的地位 .本 节一 开始就 介绍 了著 名
的若尔当定理 , 但未给证明 .不证明并不等于说 它不重要 , 而 是由于证 明
太长 , 而且这定理本身未必能很明晰地说明问题 .如果路径比图 4 - 7 - 8
图4 -7 - 9
还复杂 , 怎么能确定哪里是内 , 哪里 是外 ? 给 了一 条闭曲 线 L 就 把复 平
面划分为若干块 , 但不一定是两块 , 图 4 - 7 - 9 就是三块 .这个图形所表示的正是一个复形 , 它由
两部分组成 , 一是整个 最外面的心脏形曲 线所包围的 C 平面上的区域 , 可以写 成Ⅰ + Ⅱ , 另一 部
分则是内部的曲线所围成的 , 它也是Ⅱ , 但却不能 与 C 平面上的 Ⅰ + Ⅱ 混淆 , 否 则按图上所给 的
正向来分别区域的内、外就会有困难 , 所以把它看成一个复形 ( Ⅰ + Ⅱ ) + Ⅱ = Ⅰ + 2Ⅱ最好 .还有
1 1
这时被积函数又有原函数 - , 但它是 单 值函 数 , 而与 的原 函数 ln ( z - a ) 为多 值函 数
z - a z- a
2 94 第四章 积 分 学
d
不相同 .因此 , ln( L, a ) = 0 , 从 而 n ( L , a ) = const , 只要 a 在 变 化中 不 触 及 L 即 可 .就 是 说
da
n ( L , a) 是一个分块常值函数 .例如在图 4 - 7 - 9 中
0, a∈0 ;
n ( L , a) = 1 , a∈Ⅰ ; (21)
2, a∈Ⅱ .
当然也可能有这样的 L , 对于位于不同“ 块”中的 a , n( L , a) 取相同 值 , 但是不论 如何 , 现在用 一
个可计算的积分来刻画 L 的几何性质 , 比之若尔当定理 , 总是更容易理解和捉摸 .
现在再回过头来看柯西积分公式 (19) .那里我们假设了 Ω 是一可求长若尔当曲线 , 因此对何
1 f (ζ) dζ
处是其内域 , 何处是其外域是很清楚的 .但是如果考虑 ∫
2πi L
ζ- z
, 而 L 是一个一般的闭曲线 , 即
-
于是我们会想到 , 若 L 为区 域 Ω中 之闭 链 , 而且 L ~ 0 , 则 对在 Ω 中解 析 , 在 Ω∪ L 上连 续 的
f ( z ) ( 如果 L Ω, 则 f ( z) 在 Ω∪ L 中连续的条件自动成立 ) , 应有 ( 22 ) 式 .它就是一般的柯西积
分公式 .这当然是要证明的 , 而为此就得把同调的概念会仔细讲清楚 , 我们这里就略去不讲了 .
1
注 1 以上的讨论全是以对数函数的多值性为基础的 , 而对数函数 ln( z - α) 则 是 的原
z-α
z z
dz dz
函数 : ln( z - α) = ∫ a z -α
+ C .因此在许多较新的复分析的教材中就直接以 ∫ 1 z
作为对数函数
dw 1
= ,
dz z
w ( 1) = 0 ,
我们也可以用上述常微分方 程 柯西 问题 之解 作为 对 数函 数的 定义 .尤其 是 , 这个 函 数的 反函 数
z = z ( w ) 是下面的柯西问题之解
dz
= z,
dw
z (0 ) = 1 ,
而可以用这个常微分方程柯西问题之 解作为指数函数 的定义 .我们在第 二章中就 是这样 做的 .本
来, 一个函数常有多种不同的定义方式 .采用哪一个方 式全看我们想要 研究的是此 函数的 哪些性
§7 复 积 分 2 95
H( x ) = ∫ - ∞
δ( t )d t
f ( x) = ∫ - ∞
f (ζ)δ(ζ - x ) dζ
也十分相似 .怎样从广义函数 观点 去看 待柯 西 积分 公式 是一 个很 诱 人的 问题 , 而 且 在理 论物 理
———量子场论的发展中起了作用 .
把微积分学引入复域我们在本书中是分成两部分进行的 .在第三章中先把微分学引入复域 ,
并且得到了关于解析函数的两个定义 .一个定义说所谓的解析函数 f ( z) 就是在一点的某个邻域
中连续可微的函数 .由此得到 C - R 方程 .而且从几何上看 , w = f ( z ) 是由 z 平面到 w 平面的 一
个映射 , 且在 f′( z) ≠0 处 , 这个映射保持角度 不变 , 因此称 为共形映 射 .这 种几何 的观点 是黎 曼
的观点 .我们不妨称这样定义的解析函数为 C - R 意义下的解析函数 .第二 种定义的 方式是说 所
谓 f ( z ) 在 z 点解析就是在 a 的某个圆形邻域 | z - a | < r 中 可以 展开为 幂级 数的函 数 .用幂 级
数去研究解析函数是魏尔斯特拉斯的主要方法和贡 献 .由 幂级数 的性质 知道 , 在 收敛圆 内 f ( z )
∞
∑
n
= an ( z - a) 一定可以无限阶求导 ( 自然也是连 续求 导 ) , 所以这 种解 析函数 必为 C - R 意
n= 0
1 f (ζ)
f ( z) = ∫
2πi 2 Ω ζ- z
dζ. (23)
1
因为 z∈Ω 故 z| Ω 而上式中的分母ζ - z≠ 0 .用含参 变量 z 的 积分 对 z 之 可微性 ( 对 z
ζ- z
之可微性在第三章已证明了 ) , 即知由 (23) 定义的 f ( z ) 在 Ω 中连续可微 , 其导数是
1 f (ζ)
f′( z ) =
2πi ∫ (ζ -
Ω
z)
2 dζ,
∑
n=0 n!
( z - a) =
2πi ∑
n= 0 Ω
f (ζ)
(ζ - a)
n+1 d z (25)
1 1 1
= =
ζ- a z - a ζ- z
1-
ζ- a
在 | z - a | ≤ r0 , ζ∈ Ω 上对ζ一致收敛 .这样可以用逐项积分求得 ( 25 ) 之值 , 而有
∞ ( n) ∞ n
f ( a) 1 ( z - a)
∑ ∫f (ζ) ∑
n
( z - a) = n + 1 dζ
n= 0 n! 2πi Ω
n= 0 (ζ - a)
1 f (ζ)
=
2πi ∫ Ω
ζ - z
d z = f ( z) ,
这个式子在 | z - a | ≤ r0 中成立 .但 是我 们不 能说 r0 或 r 就 是 泰勒 级数 的收 敛半 径 R , 后者 是
n - 1
lim | f
( n)
( a) | n ! , 是由 f ( z ) 在 a 点“附近”的状况决定的 .现在我们的 Ω 选得相当任意 ,
n→ ∞
§1 傅里叶级数———从什么是谱谈起
1. 什么是 谱 傅 里 叶 级 数 和 傅 里 叶 积 分 理 论 系 统 地 首 次 出 现 在 傅 里 叶 ( Jean-Baptiste
Joseph Fourier , 1768—1830 ) 的名著《热的 解析理 论》( Théorie A naly tique de Chaleur , 有中 译本 ,
武汉出版社 , 1993) 中 .这是一部伟大著作 .可以毫无疑问地说 , 它开创了 19 世纪数学和物理学的
新篇章 . 麦克斯韦称它是“ 一首伟大的数学诗”. 将近两百 年来它的 理论和 方法渗透 到几乎一 切
数学物理分支中 , 成为一个十分广泛的数学分支———调和分析 , 可以说长盛不 衰 . 其 实傅里叶 这
本书最开始是为了应征巴黎科学院的悬赏求解而在 1807 年提交的一 篇报告 . 到 1822 年正式 成
书 . 书上开宗明义就指出 , 自然哲学 ( 当 时人们 对数 理科学 的称 谓 ) 的 目的就 在于 探讨自 然界 的
规律性 . 牛顿和他的先驱们虽然已取 得伟大 成就 , 星 体的 运动、光 的本性、声 的传 播等等 都被 归
结为几个最基本的规律 , 但 是热 却未 探讨 过 .而 热现 象又 是宇 宙中 最 常见、最 基本 的 物理 现象 .
傅里叶研究它 , 不只着重于国计民生的实际应用 ( 当然他丝毫也未轻视这一切 ) , 而且还有例如下
述的种种问题 : 地球处于太阳的热辐射中 , 既从太阳吸热 , 又把热量辐射到空中 , 怎样才能达到平
衡 ? 因为太阳的热辐射而产生的大气运动 , 怎样 影响气 候 ? 同样 因太 阳的热 辐射 而产生 的洋 流
有什么规律性 ? 傅里叶认为这一切都是牛顿未曾涉足的领域 . 可是在这部 书中同样 地没有回 答
这些问题 , 而且他关于热的基本概念是错误的 , 这一点 我们在 第三章§ 1 中讲 过 . 那么傅 里叶 的
功绩何在呢 ? 他在这本书中引用牛顿在《自然哲学的数学原理》序言中一段话“
: 几何学的荣耀在
于 , 它从别处借用很少的原理 , 就能产生如此众多的 成就 .”这 其实 也是牛 顿的 方法 论 : 把 一切 机
2
d xi
械运动归结为几个根本定律 , 并进而 写成一 个二 阶常 微分 方程 组 : mi 2 = fi ( t , x , x ) . 傅 里
dt
叶也力图采取这个方法论 , 他指 出关 于热 的纷 纭 万象 , 其 实都 可 归结 为热 的贮 存 ( 比 热 ) 与传 导
( 导热率 ) , 然后明确给 出一 个二 阶 偏微 分 方程———热 传 导方 程 . 这 个 方 程我 们 已在 第 三章 §1
中详细讲过 . 其次他为求解这个偏微分方程提出了系 统的方法 . 这 个方法 的要点我 们将在下 面
讨论 . 现在 的问题是 , 经 过将近 200 年的 发展 , 傅里叶 的理论与 方法已 得到极大 的发展 , 我们 可
否回顾一下 , 从中得到一些有助于了解人们认识 自然界 的富有 成果 的思 想 ? 从谱 论的角 度来 看
待傅里叶的理论与方法 ( 以下简称为傅里叶分析或调和分析 ) 无疑是十分有教益的 .
那么什么是“谱”呢 ? 19 世纪关于光谱的研 究是物理 学的最 重要的问 题之一 . 光谱 学 ( spec-
troscopy) 是迈克尔孙 ( Michaelson) 和莫莱 ( Morley) 创立 的 . 当 时他们测 量了镉 的谱 线 , 并 以其 波
2 98 第五章 傅里叶级数与傅里叶积分
图5- 1- 1
2
以上 c = K a , qn = q( x n , t ) .
(1 ) 是一个二阶常微分方程组 , 我们可以把它写成矩阵形式
・
・
ρq = cAq . ( 2)
t
这里 q 是一个列向量 ( q0 , … , qN ) , 除了 (2 ) 以外 , 本来我们还有两个“边值条件”
q0 = q( 0 , t ) = 0 , qN = q( l, t ) = 0 , ( 3)
但是为了讨论问题方便起见 , 我们不妨用 q0 ( t ) = qN ( t ) 来代替 ( 3) , 这就好比我们在考虑 一个首
尾相连的环形杆 , 虽然不自然 , 却能更好地说明我们的方法的实质 . 矩阵 A 是一个三对角矩阵
-2 1
1 -2 1 0
1 -2 1
A= ( 4)
w w w
0 1 -2 1
1 -2
为了求解这个方程组 , 从 数学 上 说 , 我 们 应该 设 法把 未 知向 量 换 成一 个 新 的 未 知向 量 a ( t ) =
t
( a0 ( t) , … , aN ( t ) ) , 而使系数矩阵成 为一个 对角 矩阵 . 现在 , 我 们把 记号整 理一 下 : 设 连同 两
端一共有 N + 1 个点 , 重新编号为 a0 ( t ) , … , aN ( t) , 0 和 N 是两个端点 , 而边值条件是 a0 ( t ) =
aN ( t ) . 这样 , 我们需求的只有 a1 ( t ) , … , aN ( t) .
把 q( t) 换成 a( t ) 就相当于作线性变换
k
qn ( t ) = ∑k
ak ( t ) un . ( 5)
注意 , 我们这里重新编号 , 于是 n 和 k 都从 1 变到 N . 这在 物理 上是 什么 意 义 ? 常 微分 方程 组
(1 ) 是一个“ 耦合”的 ( coupled ) 方程组 , 意即第 i 个质点的运动受到第 i - 1 和第 i + 1 两个质点 的
“牵扯”, 而且仿此 , 所有 N 个质点都牵扯在一起 . 把 A 化成对角形 , 得到一个形如
・
・ c
a= Aa
ρ
t
的常微分方程组 , 其未知函数向量是 a = ( a1 ( t ) , … , aN ( t ) ) , A 是一个对角矩阵
λ1
A= w ,
λN
而方程组成为
・
・ c
a= λa , i = 1, … , N . ( 6)
ρ i i
所有的 ai 都互不牵扯 , 物理上称为“ 解耦”( uncoupled) . 一旦实现了解耦 , 解方程自然很容易 . 可
是在物理上重要的是这个新向量 a 有特殊的物 理意义 , 而反 映了 这个物 理系 统的 物理本 质 . 所
以在物理上 , 这个新 的 未知 函 数 向量 称 为简 正 模式 ( normal modes ) , 其 各个 分 量 称为 简 正 坐 标
k
( normal coordinates) : 即原来的位置向量 q( t ) 对于基函数 ( basis functions) un 的线性 展开式之 系
3 00 第五章 傅里叶级数与傅里叶积分
∑k= 1
u ・un = δn n′ .
n′ (10)
λ1
- 1
U AU = A = w .
λN
λ1 , … ,λN 是 A 的特征根 .故若将向量 q 变化如下 :
q( t ) = U a( t ) ,
方程 (2 ) 就成为 ( 6)
・
・ ・
・ c
ρU a = cA U a 即 a = Aa .
ρ
这就是简正模式所满足的方程组 (6 ) .
现在我们来求解方程组 (2 ) . 为此 , 以 ( 5) 式代入 (1 ) 右 , 并把 (5 ) 中的 k 换成 k′, 代入以后 , 对
k
方程双方各乘以 u n , 并对 n 求和 , 这时 , 利用 ( 9) 式 , 有
・
・ k c - k k′ k′ k′
∑ q n ( t) u n =
n ρ∑k′
∑ n
ak′( t) u n ( u n + 1 - 2 un + un - 1 ) .
k′ ± i k′
α k′
但是由 (7 ) 有 un ± 1 = e un .利用 (5 ) 对 t 求导二次 , 再代入上式左 , 利用 ( 9) 有
・
・ c - k k′ α
i k′ - i k′
α
ak ( t ) =
ρ ∑a ∑
k′
k′
n
un un ( e - 2+e ) .
对上式右方再用一次 (9 ) , 上式右方成为
c i kα - i kα 2
(e - 2 + e ) ak ( t ) = - ωk ak ( t) ,
ρ
2c c kα
| ωk | = ( 1 - cos kα) = 2 sin .
ρ ρ 2
所以简正坐标 ak ( t ) 适合一个完全解耦的方程组
・
・ 2 c kα
ak ( t ) + ωk ak ( t ) = 0 , ωk = 2 sin . (11)
ρ 2
方程 ( 11 ) 即所 谓 谐 振 子 ( harmonic oscillator ) 方 程 , 它 的 解 就 是 本 书 第 二 章 一 开 始 所 介 绍 的 指
数—三角函数
- iω t iω t
k k
ak ( t ) = bk e + b- ke
- i( ω t + θ )
k k
= Ak e , (12)
这里我们取系数为 bk 与 b - k 目的在于保证 ak ( t) = a - k ( t ) , 而这 是保证 最终 qn ( t ) 取实 值之 所
必需 . 这样我们看到 , 杆的纵振动的离 散模 型表 明 : 一 个 N 自由 度的 物理 系统的 运 动实 由一 些
c
谐振子 构 成 . 这 些 谐 振 子 的 频 率 ωk 全 由 这 个 物 理 系 统 决 定 : 决 定 它 的 关 系 式 ωk = 2
ρ
kα
・ sin 称为 色散 关系 , 在研 究这 个物 理系统 的本 性时起 重要 的作 用 . 这些谐 振子 的振 幅 Ak
2
与初始位相则由初始条件决定 . 一根 杆的纵 振动 可以是 多种 多样 的 , 但总是 由这 些简正 模式 合
成的 . 所以 , 分析一个物理系统的状况就应该首先求出这些简正模式 , 这些 简正模式 的频率就 称
为这个物理系统的谱 ( spectrum) , 它刻画了这个系统的物 理本质 . 上 面讲 到的寻 求“隐藏 着的 周
期性”就是这个意思 . 至于一个系统是否有如上类型的隐藏着的周期性 , 在 我们的例 子中全决 定
于一个算子 ( 矩阵就是 一 个算 子 ) 可 否对 角 化 . 如 果可 以 , 我 们 就 看到 , 谱就 是 特征 根 . 如 果 不
3 02 第五章 傅里叶级数与傅里叶积分
行 , 问题将极为复杂 .
重要的是要提到 , 我们虽然只讲了一个机械运动的例子———杆的纵振动 , 但是这样的问题在
研究种种自然现象时都会遇到 , 特别是在量子力学中 . 由于不假设读者知道很 多量子力 学知识 ,
我们只能限于经典物理学中的问题 . 现在只提一下为什么我们就杆的离 散模型讲 这么多 ? 一 根
连续的杆就是 N→∞时的极限状况 , 它是一个具有无 穷自由 度的 物理系 统 . 当过 渡到这 个极 限
状况时 , 许多有趣的性质将会被掩盖 , 特 别是 色散 关系 . 但是 当傅 里叶着 手研 究热 传导问 题时 ,
他确实是从极限状况开始的 . 下面我们就仿照傅里叶 的方法来 考虑连 续杆的纵 振动 . 我们从 方
2
1 2 q
程 (1 ) 开始 , 并令 a→ 0 , 由于 (1 ) 中 c = K a 而 2 [ qn + 1 - 2 qn + qn - 1 ] → 2 , 所以 代替常 微分 方
a x
程组 (1 ) , 我们会得到一个偏微分方程 :
2 2 2 2
q q 1 u u
ρ 2 = K 2 , 或写作 2 2 = 2 .
t x a t x
2 2
这里 a = K ρ, 它不是上面讲到的 a, 写成 a 只 不过 是为了 保证 它取正 值 . 除了 方程以 外还 应
该有边值 条 件 , 如 果 研究 两 端固 定 的杆 , 就 有 q ( 0 , t ) = q ( l, t ) = 0 ; 如 果 研 究 周 期情 况 , 则 有
q(0 , t ) = q( L , t) . 此外 , 因为 (1 ) 是牛顿的动 力学方 程 , 求解 时应 知道初 位移 与初速 , 它 的连 续
极限 , 也就成为相应的初始条件 q( x , 0) = φ( x ) , qt ( x , 0) = ψ( x ) . 总 之 , 我们会有 一个如下 的
初边值问题 ( 我们把未知函数改写为 u( x , t ) 了 ) :
2 2
1 u u
2 2 = 2 , t≥ 0 ,
a t x
(13)
u( 0 , t) = u ( L , t ) = 0 , 0≤ x≤ L ,
u( x , 0 ) = φ( x ) , ut ( x , 0 ) = ψ( x ) .
(13) 中的偏微分方程通常称为弦振动方程 . 这是因为 , 和常见的情况一样 , 数学物理 中同样的 方
程可以刻画不同的物理 系统 , 弦的 横振 动也 适 合同 样的 方 程 . 这 个方 程 也有 很 长久 的 历 史了 .
达朗贝尔研究过它 , 丹尼尔・伯努利 也研 究过 它 , 而且其 解法 与傅 里叶的 方法 是一样 的 . 只不 过
傅里叶作了更系统的贡献 . 这个 方法如 下 : 我们 来看 ( 5) 式 , 这里 q ( t ) 写成 了一 和式 , 其 每一 项
k
都是 t 的函数 ak ( t ) 与一个与 t 无关 , 但与 n 有关 的 un 相乘 , 因为 n 代表离 散模 型中质 点的 位
置 , 所以是一个空间变量 , 这样 , 在连续模型中我们试图求 ( 13 ) 的这样形状的解 :
u( x , t) = X ( x ) T ( t ) .
这里我们当然设 X ( x ) á 0 , T ( t ) á 0 , 否则我们将会得到平凡不足道的解 : u≡0 . 以 u 的这个 表
达式代入 (13) 中的偏微分方程 , 即有
X″( x ) 1 T″( t )
= 2 ,
X( x ) a T ( t)
所以它应该是一个常数 - λ.于是对 X ( x ) 和 T ( t ) 我们分别得到以下的线性常微分方程 :
2
X″( x ) = - λX ( x ) , T″( t ) = - λa T ( t ) .
暂将后一方程放在一边 , 先看第 一个方 程 . 我们 想求它 的一 个非零 解 X ( x ) á 0 , 但 希望 这样 作
出的 u ( x , t ) 能适合 (13) 中的边值条件 . 因此要求
X″+ λX = 0 ,
(14)
X (0 ) = X( L ) = 0 .
§1 傅里叶级数———从什么是谱谈起 3 03
2
如果 λ= - μ < 0 , 则上之方程有解
μx - μx
X( x ) = Ae + Be .
2
但因要求 X (0 ) = X ( L ) = 0 , 就必须有 A = B = 0 , 只能得到无意义的零 解 . 所 以 λ= - μ < 0 是
不可能的 . 若 λ= 0 , 同样又有 X( x ) = A + B x , 而由边 值条件 又得到零 解 . 因 此为 使上式 有解 ,
2 2
必须 λ= μ > 0 , 但是又非一切正的 λ都可以给出非零的解 : 当 λ= μ > 0 时 , X( x ) = Acos μx +
Bsin μx , 由 X (0 ) = 0 , 即有 A = 0 , 再由 X( L ) = 0 , 又有 Bsin μL = 0 . 但是 B = 0 又是没有用的 .
因此 μ必须取得使 sin μL = 0 , 从而 μ= kπ L , k = 1 , 2 , 3 , … , ( k = - 1 , - 2 , - 3 , …给 出同样 的
X( x ) ) . 总之 , 我 们 要 求 参 数 λ之 值 使 ( 14 ) 有 非 零 解 . 这 个 问 题 称 为 斯 图 姆 - 刘 维 尔 问 题
(Sturm-Liouville 简称 S - L 问 题 ) , 即 求 λ 之 特 定 值 , 使 ( 14 ) 有 非 零 解 X ( x ) . 所 得 的 λ =
2 kπ
( kπ L ) 称为其固有值 ( eigenvalue) , 相应 的 X( x ) = Bsin x 称为 相应 的固有 函 数 ( eigenfunc-
L
tions) . 固有值的全体构成 S - L 问题之谱 . 固有值与固有函数在许 多文献 中分别称 为特征值 与
特征函数 . 它与矩阵的特征根实质一样 . 于是我们看到 S - L 问题 (14) 之谱即 一组实的、分离 的
固有值之集合 , 所以我们说这个问题有离散的谱 . 固有函数 X ( x ) 中 含有一 个特定常 数 B , 我 们
2
将这样去取它 , 使 X( x ) 的 L 范数为 1 , 在我们的情况下 , 因为
L L
kπx 1 2 kπx L
∫ ∫
2
sin dx= 1 - cos dx= ,
0 L 2 0 L 2
2 2
故常数 B = , 物理学家喜欢称它为归一化因子 .
L
2
2 2 kπ
在解出了 X ( x ) 后 , 再来看 T ( t ) . 由 T″( t ) + λa T = 0 以及 λ= μ = 即有
L
kπat kπat
T ( t ) = C cos + D sin
L L
kπat
= Mk cos + θk .
L
kπa c
这又是一个谐振子 , 其频率是 相当于离 散模型中 的 ω, 但是现 在的 a 相当 (1 ) 中的 a
L ρ
c
在讨论离 散 模 型 时 , 我 们 的 频 率 ωk 与 两 个 质 点 之 间 的 距 离 a 之 间 有 色 散 关 系 ωk = 2
ρ
ka ka ka c
・ sin . 如果 a→0 因为 sin ~ , 所以 ωk ~ a k , 即 在极 限情 况下 ωk 与 k 成正 比 , 色
2 2 2 ρ
散关系特别简单 , 称为非色散波 . 在连续情况下 , 正是 ωk ~ k 这个简单式子把一般的较为复杂的
色散关系掩盖起来了 .
关于振动与波的讨论我们暂时只能停在这里了 , 下面再回到傅里叶级数的讨论 .
初边值问题 (13) 中方程与边值条件俱已满足 , 余下的只有初值条件 . 为满 足它们 , 需要把 所
得的 X ( x ) T ( t ) 叠加起来 , 得
∞
kπat kπat kπx
u ( x , t) = ∑k=0
Ck cos
L
+ Dk sin
L
sin
L
,
这里 Ck 与 Dk 都是未定数 . 我们需要这样确定它们 , 使得
3 04 第五章 傅里叶级数与傅里叶积分
∞
kπx kπa kπx
φ( x ) = ∑ Ck sin
L
, ψ( x ) = ∑
k=0 L
Dk sin
L
. (15)
由此以下我们转入纯粹数学的讨论 .
2. 傅里叶级数及其收敛性问题 第四章一开始我们就指出了 , 傅里叶 由此提出 了任意函 数
都可以展开为傅里叶级数的 问题 , 这对 于从 18 世 纪以 来就 存 在的 何为 函数 的争 论 正如 火上 加
油 . 其实从 18 世纪以后 , 许多数学大师都参加进来 , 互相问难以至“诋毁”, 终于有了 狄利克雷 的
函数定义 . 黎曼积分的出现与此问题直接相关 , 勒贝格积 分理论也 是这样 . 所以 许多人 说 , 傅 里
叶分析是现代分析数学的起点 . 但是它不仅改变了整个分析数学的面貌 , 而且 与群表示 理论 , 代
数数论、概率论等等都密切相关 , 出现了调和分析这个广大的分支学科 . 集 合论的研 究也始自 这
个问题 , 而集合论的出现改变了全部数学的基础这是没有疑问的了 .
这个问题的中心 , 首先是函数 f ( x ) 在什么条 件下可以 展开为其 傅里叶 级数 ? 因此 , 本节 前
半部分主要是讨论傅里叶 级数 如 何由 谱 的问 题 产生 , 下面 则 要讨 论 其 中心 问 题———收敛 性 问
题 . 以下为简单起见 , 我们在区间 [ - π,π] 上讨论 f ( x ) 之傅里叶级数 , 而且采用复记号 :
∞
i kx
f( x )~ ∑
k= - ∞
Ck e ,
π
1
∫
- i kx
Ck = f( x )e dx . (16)
2π -π
它与常见的实的记法
∞
a0
f( x )~
2
+ ∑ ( a cos k x +
k= 1
k bk sin kx ) ;
π π
1 1
ak = ∫
π -π
f ( x ) cos kxd x , bk =
π ∫ -π
f ( x ) sin k xd x (17)
不同 : 在 ( 16 ) 中 k 从 - ∞变到 + ∞ , 而在 (17) 中 k 则从 0 变到 + ∞ , 而且
ak = Ck + C - k , bk = i( Ck - C - k ) . (18)
1 1
所以积分号前的因子在 (16) 中是 , 在 (17) 中则是 .
2π π
(16) 或 ( 17 ) 都 是适 用于 [ - π,π] 上的 . 但 其 右方 则是 R 上的 以 2π为 周期 的函 数 , 所 以 在
[ - π,π] 外也是有定义的 , 而 f ( x ) 则只在 [ - π,π] 上有定 义 . 因 此我们 说 ( 16 ) 或 ( 17 ) 代 表 f ( x )
在 R 上以 2π为周期的周期 延拓 . 准确 些 说则 是 把 f ( x ) 在 [ - π,π] 中的 一 段周 期 地重 现 到 R
上 . ( 16 ) 或 ( 17 ) 右方以任一长为 2π的区间为基本周期 , 不论这个基本周期是 [0 , 2π] 或 [ - π,π] ,
i kx
只是平移 一 下 e 之图 像 而已 . 但 若 f ( x ) 原 来 就定 义 在 R 上 , 取 其 [ - π,π] 上 的 一段 或 取 其
[0 , 2π] 上的一段作周期延拓 , 其结果就可以完全不同 . 所以作 f ( x ) 之傅里叶展开 (16) 或 ( 17 ) 时
必须先说清是取 f ( x ) 之“ 哪 一 段”来 作 展开 . 我 们 特别 要 注 意 , 即令 f ( x ) 在 R 上连 续 , 取 其
[ - π,π] 上之一段作 周 期 延 拓 后 , 可 能 得 到 不 连 续 的 函 数 . 例 如 若 记 周 期 延 拓 后 所 得 函 数 为
§1 傅里叶级数———从什么是谱谈起 3 05
* * *
f ( x ) , 则 f (π - 0 ) = f (π) , f (π+ 0 ) = f ( - π) , 所以 在 x = π 处会 出 现一 个 第一 类 间 断点 .
对 f ( x ) 之各阶导数也是这样 . 这一点下面应该特别注意 .
既然得出了 f ( x ) 之傅里叶展开式 (16) 或 (17) , 基本的问题自然就是收敛性问题 . 但我们 不
妨从更宽的角度来看待它 , 而问这些级数与 f ( x ) 关系如 何 ? 例如它 们是否收 敛 , 若收敛 是否 其
和一定为 f ( x ) 等等 . 要注意 , 收敛性问题只 是问题 的一 部分 , 所以 我们 在 ( 16) 或 ( 17 ) 中 都未 用
“ = ”号而用“~”. 首先是 , 我们打算在什么框架下讨论这些 问题 . 在 19 世 纪中叶狄 利克雷和 黎
曼的时代 , 自然是在黎曼可积函数类中讨论它 . 如果没有适当的可积性理论 , ( 16 ) 与 (17 ) 中的 傅
里叶系数公式就无法定义 , 而且正如第四章一开始就指出的 , 黎曼积分理论正 是这样出 来的 . 到
19 世纪末 , 有了勒贝格积分理论 ( 它至 少部 分地 也是由 傅里 叶级数 理论 引起 的 ) , 人 们自 然会 在
1 2
L 框架 下讨论 它 . L 空间中的 傅里叶 级数理论 我们已 在第四章 §3 中 讲了一 个头 . 它后来 引
1 2
导到泛函分析、数学物理等很广阔的天地中去了 , 我们也就不再讨论它了 . L 与 L 中的傅里 叶
级数理论都极为细致 , 由于我们分析 数学方 面准 备不 足 , 只好割 爱 . 在本 章中 , 我 们较多 地从 广
1 2
义函数角度来讨论它 , 并适当涉及 L 与 L 理论 .
在进一步讨论 (16) 或 (17) 的收敛性前 , 我们还要作一个约定 , 因为 (16) 可以直接由 (17) 经过
N
讲到 (16) 的部分和时恒指
N
∑
i kx
SN ( x ) = Ck e . (19)
k= - N
π
1
∫
- i kx
= f′( x ) e dx
2 kπi -π
π
1
∫
( m) - i kx
=…= m f ( x) e dx .
2π( ki ) -π
上面我们多次应用了分部积分 .由此直接得出 ( 20 ) .
这个定理看来简单 , 但若 m≥2 , 由它可 以得 证 ( 16) 或 (17 ) 绝 对而 一致地 收敛 ( 有些 文献 上
称为正规收敛 ) , 而这个结果对于很 一般的 S - L 问题 也是 适用 的 , 在那 里我 们没 有 办法 应用 指
数函数和三角函数那么丰富的性质 . 但是即令是如此简单的定理 , 也还有许多 值得挖掘 的地方 .
例如, 如 果 f ( x) 在 x = π 处 有 第 一 类 间 断 点 , 则 Ck 的 表 达 式 的 第 一 项 是
3 06 第五章 傅里叶级数与傅里叶积分
k k+ 1
( - 1) ( - 1)
- f ( - π+ 0) - f (π - 0 ) = f (π+ 0 ) - f (π - 0) ( 注 意 f ( x ) 以 2π 为周 期 ) ,
2 kπi 2 kπi
1 1
从而 Ck = O , 反过来 , 若 Ck = O , 我们可 以猜到 , 函 数会 有第一 类间 断点 .本节 下面 的
k k
例子说明确是如此 .因此产生了一个根本思 想 : f ( x ) 的光滑 性与 其傅 里叶系 数衰 减速度 直接 相
p
关 . 这个重要思想将在本章最后一节中详细讨论 . 现在我们先要再讲一下 L 函数的一个性质 .
p p
我们在上一章中已经看到 , 任 一个 L 函 数 ( 1 ≤ p < + ∞ ) 都可 以 用一 个 连续 函 数去 按 L
系数逼近 . 但我们没有详细证明 , 这不是因为这一性质不重要 , 恰好相反 , 它是 极为重要 的 , 因 此
p
我们将在下一章在子空间的稠密性的背 景下 去讨 论它 . 我 们这 里只 指出 , f ( x ) ∈ L 不 但可 以
∞ p
用连续函数去逼近 , 而且可以通过例如磨光算子 , 用 C0 函数 , 即 D 中的函数去作 L 逼 近 .不 但
如此 , 我 们还可 以用 阶梯 函数去 逼近 . 所 谓区 间 I 上的阶 梯函 数 , 即把 I 分 割成 有限多 个小 区
间:
I : a = a0 < a1 < … < aN = b ( I 即 [ a , b] ) ,
而阶梯函数即在每个小区间上各取常数值的函数 :
φ( x ) = A i ai - 1 ≤ x≤ ai i = 1 , 2 , … , N .
p
此外还可以证明 f ( x ) ∈ L 有所谓平均连续性 , 即对任一 ε> 0 必可找到一个 δ, 使当 | h | < δ时
1 p
∫| f ( x +
p
‖ f ( x + h) - f ( x ) ‖ = h) - f ( x ) | d x < ε.
I
∫
1 - i kx
定理 3( 黎曼 - 勒贝格引理 ) 若 f ( x ) ∈ L (R) 则 f ( x) e d x→0 ( k→∞ ) .
- ∞
1
证 因为 f ( x ) ∈ L (R) , 故对任意 ε> 0 必可找到正数 M , 使
+∞
ε
- M
∫ M
| f( x ) | d x , ∫ - ∞
| f ( x) | d x <
3
.
所以
∞ - M +∞ M
∫ ∫ +∫ ∫
- i kx - i kx - i kx
f( x )e dx= f ( x)e dx + f( x )e d x,
- ∞ - ∞ M - M
p
其中前两项绝对值均小于 ε 3 , 现在看 第三项 . 由 前述 L 函 数的 性 质 , 可以 找到 一 个阶 梯函 数
w( x) ,使
M
ε
∫ - M
| f ( x) - w( x) | d x <
6
,
M a
j
i
∫ ∫
- i kx - i kx - i ka - i ka
而如定理 2 前所述 w ( x )e d x 由有限项 A j e dx= A j e j - e j - 1 相加而得 ,
- M a
j -1
k
∫ ∫
- i kx - i kx
f( x )e dx ≤ f( x ) - w( x ) e dx
- M - M
N a
dx < ε.
j
∑ ∫
- i kx
+ Aj e
j= 1
a
j- 1 3
§1 傅里叶级数———从什么是谱谈起 3 07
因此当 k 充分大时
∞ - M +∞ M
∫ ∫ ∫ ∫
i kx - i kx - i kx
f ( x )e d x ≤ + f ( x)e dx + f ( x )e d x < ε.
-∞ -∞ M - M
1
特别是 , 若 f ( x ) ∈ L ( [ - π,π] ) , 则 f ( x ) 之傅里叶系数 Ck 当 k→∞时 , 必趋于 0 .
由于这个定理的重要性 , 我们不妨分析一下其要点何在 . 实际上 , 重要 的是右方 第三个积 分
的估计 : 我们用 w ( x ) 去逼近 f ( x ) , 而 w ( x ) 至少 在一个小 区间 [ aj - 1 , aj ] 上 是不 变的 . 而另 一
i kx 2π i kx
个因子 e , 因为其周期为 , 这个小区间中包含了它的许多 周期 . 每一个 周期中 e = cos kx +
k
i sin kx 之实虚部都 是正号地 变一段 , 又完 全同样地 反号再 变一段 , 因此 乘上 w ( x ) = Aj 后 , 平
均地完全抵消了 . f ( x ) 虽然不如 w ( x ) 一样在某区间中不变 , 但既可用 w ( x ) 逼近 , 也就可以说
M
∫
i kx - i kx
是缓变的 . 所以 f ( x ) e d x 中既有缓变因子 f ( x ) , 又有急变因子 e ; 二者相乘又 相加 , 就
- M
名的阿贝尔变换 : 如果我们记 Bm = ∑
k= 1
bk , 则 bk = Bk - Bk - 1 ( 规定 B0 = 0 ) , 因此
N N
S = ∑
k=1
ak bk = ∑
k= 1
ak ( Bk - Bk - 1 )
N-1
= ∑
k=1
( ak - ak + 1 ) Bk + aN BN . (21)
∞
现在 , 把这个变换用于无穷级数 ∑k=1
ak bk . 为了证明它的收敛 , 只需应用 柯西准 则 , 即 对 ε> 0 找
一个 M , 使得对任意的 N
M+ N N
∑
i = M+ 1
ai bi = ∑k= 1
a M + k bM + k < ε.
对此式则可再应用上述阿贝尔变换而有以下两个判别法 :
∞
定理 4 ( i ) 阿贝尔判别法 若 ∑
h= 1
bk 收敛而{ ak }是单调有界序列 , 则上述级数收敛 .
∞
| S| = ∑
k= 1
a M + k bM + k ≤2 Aε+ Aε= 3 Aε.
从而原级数收敛 .
在 ( ii) 的情况 , 一切 | Bk | ≤ B , 而 | a M + k | < ε, 应用柯西准则 , 又有
| S | ≤2 Bε+ Bε= 3 Bε.
定理证毕 .
阿贝尔变换在积分中有什么类比 吗 ? 首 先就是 分部 积分法 . 现 在我 们不要 太严 格 , 这样 可
以自由地在积分和和定积分之间 随 意变 换 . 考虑 ∫f ( x ) φ( x ) d x , 通 过把
I
I 分割 成 许多 小区 间
[ x0 , x1 ] ∪ [ x1 , x2 ] ∪…∪ [ x N - 1 , x N ] 把它变成积分和 ∑
k= 1
f (ξk ) φ(ξk )Δk x , 令 ak = f (ξk ) , bk =
m x
m
φ(ξk )Δk x , 则 Bm = b1 + … + bm = ∑
k= 1
φ(ξk )Δk x , 我们又把它写成 B( xm ) = ∫ x
0
φ( x ) d x ( 注 意
B( x0 ) = 0) , 于是阿贝尔变换成了
x
k
∫I
f ( x ) B′( x ) d x = ∑ a(ξk ) - a(ξk + 1 ) ∫ x
0
φ( x ) d x
∫
N
+ a ( xN ) φ( x ) d x . (22)
x
0
但
ξ
∫
k+ 1
a(ξk - 1 ) - a(ξk + 1 ) = - f′( x ) d x ,
ξ
k- 1
∫f ( x ) φ( x ) d x =
I
f ( x ) B( x )
x
0
∫
-
x
0
f′( x ) B( x )d x .
∫ φ( x ) f ( x ) d x =
a
f ( a + 0) ∫ φ( x ) d x +
a
f( b - 0) ∫ φ( x ) d x .
ξ
(23)
b ξ b
∫ φ( x ) F( x ) d x
a
= F( a + 0) ∫ φ( x ) d x + F( b - 0∫
a
) φ( x ) d x
ξ
= F( a + 0) ∫φ( x ) d x ,
a
(24)
将 F( x ) = f ( x ) - f ( b - 0 ) 代入上式即可得到 ( 23 ) .
x
个原 函 数 , 则 G ( x ) 是 [ a, b ] 上 的 连 续 函 数 , 从 而 有 最 小 值 m 和 最 大 值 M . 我 们 要 作
b N
∫ F( x ) φ( x ) d x 的一个积分和 ∑
a i= 1
F(ξi ) φ(ξi )Δi x . ξi 的取法如下 : 对下式应用积分中值定理 ,
x
∫
i
G( x i ) - G( x i - 1 ) = φ( x ) d x = φ(ξi )Δi x ,
x
i-1
并且利用这样 定 出 的 ξi 作 上 述 积 分 和 , 于 是 对 ∑
i= 1
F ( ξi ) φ( ξi ) Δi x 应 用 阿 贝 尔 变 换 , 而 以
i x x
∑∫ ∫ φ( x ) d x =
j i
F(ξi ) 作为 ai , φ(ξi )Δi x 作为 bi , 于 是 Bi = b1 + … + bi = φ( ξi ) d x =
j=1 x a
j- 1
G( xi ) .应用阿贝尔变换有
N N- 1
∑i= 1
F(ξi ) φ(ξi )Δi x = ∑ k= 1
[ F(ξk ) - F(ξk + 1 ) ] Bk + F(ξN ) BN .
因为 F( x ) 是单调下降而且非负的 , Bk 与 BN 均 为 G ( x ) 之值 , 从而 m≤ Bk , BN ≤ M , 代 入上 式
有
N- 1 N
m ∑ ( F(ξ )
k= 1
k - F(ξk + 1 ) ) + F(ξN ) ≤ ∑i= 1
F(ξi ) φ(ξi )Δi x
N-1
≤M ∑ ( F(ξ )
k=1
k - F(ξk + 1 ) ) + F(ξN ) ,
亦即
N
m F(ξ1 ) ≤ ∑
i =1
F(ξi ) φ(ξi )Δi x ≤ MF(ξ1 ) .
取极限后即得
b
m F( a + 0 ) ≤ ∫ F( x )φ( x ) d x≤ MF( a + 0)
a
.
∫ F( x ) φ( x ) d x = φ(ξ) F( a + 0 ) .
a
此即 (24) 式 , 从而定理成立 .
+∞
与关于无穷级数的收敛性相应 , 关于积分 ∫ a
f ( x ) φ( x ) d x , 我们也有相应定理 .
+∞
+∞
∫
则
a
f ( x ) φ( x ) d x 收敛 .
A
+∞
A 有界 ; φ( x ) 当 x → + ∞时单调趋于 0 , 则 ∫ a
f ( x ) φ( x ) d x 收敛 .
π N
1 1
=
π ∫ -π
f ( u) ∑k=1
cos k ( x - u ) +
2
d u,
但是
1
N N cos k ( x - u) sin ( x - u)
1 2 1
∑
k=1
cos k ( x - u) +
2
= ∑
k=1 1
+
2
sin ( x - u)
2
1 1
N sin k+ ( x - u) - sin k- ( x - u)
2 2 1
= ∑
k= 1 1
+
2
2sin ( x - u)
2
1
sin N+ ( x - u)
2
= .
1
2sin ( x - u)
2
令 u - x = t 代入上式 , 有
1
π sin N + t
1 2
SN ( x ) =
π ∫ -π
2sin
t
f( x + t)d t .
2
为了证明 Nlim S N ( x ) = f ( x ) , 只需证明当 N→∞时
→∞
1
π sin N + t
1 2
SN ( x ) - f ( x ) =
π ∫ -π
2sin
t
f ( x + t) - f ( x ) d t (25)
2
趋向 0 即可 , 这里我们需要倒用上面的求和程序 , 而有
1
π sin N + t π N
1 2 1
∫ ∫ ∑e
i kt
dt = dt= 1 .
π -π t 2π -π k = - N
2sin
2
∞
迄今为止 , 我们对 f ( x ) 之光滑性未加限制 . 为简单计 , 暂时固定 x , 并令 f ( t ) ∈ C 且支 集在 x
§1 傅里叶级数———从什么是谱谈起 3 11
附近 , 则有
1 1
[ f ( x + t ) - f ( x ) ] ∈ L ( - π,π) .
t
2sin
2
因此利用黎曼 - 勒贝格引理即知 Nlim S N ( x ) = f ( x ) . 这 样做 似乎 没有得 到好 处 : 我们的 结果 还
→∞
∑
2π k = - ∞
e = δ( t ) in D′(R) .
i kt
如果再注意到〈δ( t ) , e 〉= 1 , 则上式左方又可以说成是 δ( t ) 的傅里叶级数 , 定理 6 就可以改述
为 δ( t ) 之傅里叶级数在 D′( R) 中收敛于 δ( t ) . 这样说法听起来 固然颇 有新意 , 但追究 到底 , 因
为 D′广义函数是 D (R) 上的连续线性泛函 , 所以我们还只是证明了 D( R) 函数 f ( x ) 之傅里叶 级
数必收敛于 f ( x ) ———还远远没有超出定理 2 !
但是 δ( t ) 不仅是 D( R) 上的连续线性泛函 , 在第二章§4 中就指出了 δ( t ) 甚至 是连续函 数
ikt
空间上的线性泛函 :〈δ, f〉= f ( 0) 对连续函数即已成立 , 上面说的〈δ( t ) , e 〉= 1 就 是用的这 个
结果 . 于是傅里叶级数收敛问题就变成 : DN ( t ) 在 什么样 的空 间中可 以看 成 δ序列 ? 为 了回 答
1
这个问题 , 我们还是认为 f ( x ) 定义在 [ - π,π] 上 , 并经周 期延 拓到 R 上 , 于是在 x = ±π处 会
有多余的间断点 . 现在来考虑
1
SN ( x ) - [ f ( x + 0) + f ( x - 0 ) ]
2
1
π sin N + t
1 2 1 1
=
π ∫ 0
2sin
t
[ f ( x + t) -
2
f ( x + 0) -
2
f( x - 0)]d t
2
1
0 sin N + t
1 2 1 1
+
π ∫ -π
2sin
t
[ f( x + t) -
2
f( x + 0) -
2
f ( x - 0) ] d t
2
1
π sin N + t
1 2
=
π ∫ 0
2sin
t
{ [ f ( x + t) - f ( x + 0 ) ] + [ f ( x - t ) - f ( x - 0) ]}d t .
2
3 12 第五章 傅里叶级数与傅里叶积分
今记
1
Ψ( x , t ) = [ f ( x + t ) - f ( x + 0 ) ] + [ f ( x - t) - f ( x - 0 ) ] .
t
2πsin
2
1
固定 x 并 视 Ψ 为 t 的函 数 , 于 是若 Ψ( x , t ) 为 L 函 数即 可 利用 黎曼 - 勒贝 格引 理 证明 级 数
1 t t
(16) 收敛 , 而且其和是 [ f ( x + 0 ) + f ( x - 0 ) ] , 即 左、右极 限的均 值 . 注 意到 sin ~ , 所 以
2 2 2
f ( x± t ) - f ( x± 0) 1
只需 ∈ L 即可 .但是有许 多情 况可以 保证 这一点 , 例 如设 f ( t ) 在 t = x 处
t
适合赫尔德条件
α
| f ( x + h ) - f ( x ) | ≤ C | h | , 0 < α≤1
(α= 1 时称此条件为利普希茨条件 ) 即可 .
从今天的角度来看 , 我们自然知道 , 真正的问题在于在一个尽可能宽的函数空间中寻找一个
δ序列 , 就是找一个含参数的核 . 这种核为数众多 , 我们下面还可以看一个很类似的核
1
sin N + t
1 2
WN ( t ) = . (27)
π t
它与狄利克雷核相近 , 因为
1 1
π sin N + t π sin N + t
2 2
∫ 0
2sin
t
φ( t) d t = ∫ 0 t
Φ( t ) φ( t ) d t ,
2
t2 1 1 sin m t
其中 Φ( t ) = , 它在 [ - π,π] 中是很光滑的 . 我们用参数 m 代 替 N + , 下面 证明
t 2 π t
sin
2
当 m→∞在满足狄利克雷条件的函数类中是 δ序列 , 所谓狄利克雷条件即
( D ) : 若 f ( x ) 在 [ - π,π] 上最多只有有限多 个第一类 间断点 , 而且 可将 [ - π,π] 分为 有限 多
个区间 , 使 f ( x ) 在每个区间上均为单调 , 则称 f ( x ) 适合条件 ( D ) ———狄利克雷条件 .
定理 7 核 W N ( t) 在上述函数类中是 δ序列 , 即是说 , 若 f ( x ) 适合条件 ( D ) , 则有
π
1 1
lim ∫
N→∞ π -π
WN ( t ) f ( t ) d t =
2
[ f ( 0 + ) + f (0 - ) ] . (28)
在证明此式前 , 我们先要提到一个著名的积分公式
∞
sin t π
∫ 0 t
dt=
2
.
1
π sin N + t
1 2
=
π ∫ 0 t
[ f ( x + t ) - f ( x + 0) ] d t
§1 傅里叶级数———从什么是谱谈起 3 13
1
0 sin N + t
1 2
+
π ∫ -π t
[ f ( x + t) - f ( x - 0) ]d t .
1 1
sin N + t π sin N + t
2 2 1
这里 我 们 已 利 用 了
t
是 t 的 偶 函 数, 从 而 ∫ -π t 2
f ( x + 0)dt =
1
π sin N + t
2
∫
0 t
f ( x + 0 ) d t .在后一积分中作变量变换 t→ - t , 则上式可化为
1
π sin N + t
1 2
π ∫ 0 t
[ f ( x + t) + f ( x - t ) - f ( x + 0 ) - f ( x - 0) ]d t . (29)
- f ( x + 0 ) ] d x 应用第二积分中值定理 , 知此积分
1
ξ sin N + t
1 2
I1 = [ f ( x + δ) - f ( x - 0 ) ]
π ∫ 0 t
dt
1
N+ ξ
2
1 sin t
= [ f ( x + δ) - f ( x - 0 ) ]
π ∫ 0 t
dt .
π
后面的 积 分 当 N → ∞ 时 极 限 为 , 所 以 不 论 N 和 δ如 何 取 , 它 总 是 有 界 的 . 再 由 f ( x ) 在
2
[ x , x + δ] 中为单调的假设 ( 单调函数只 有 第一 类间 断点 ) , 对 任 意 ε> 0 必可 找到 一个 δ(ε) 使
1
N+ ξ
ε 1 2
sin t
| f ( x + δ) - f ( x + 0 ) | <
4M
, M = sup
N,δ π ∫ 0 t
dt ,
所以
ε
I1 < .
4
同理当 δ充分小时
1
δ sin N +
1 2 ε
I2 =
π ∫ 0 t
[ f ( x - t) - f ( x - 0) ] d t < 4 .
现在固定这个 δ, 它与 N 无关 , 而 ( 29 ) 中的积分化为
1
π sin N + t
1 2
∫
π δ t
[ f ( x + t ) + f ( x - t ) - f ( x + 0) - f ( x - 0 ) ] d t + I1 + I2
1
= [ f ( x + 0) + f ( x - 0 ) ] .
2
但这只是证明了 W N ( t ) 是 δ序列 , 还未证明 级数 ( 16) 是 否在条 件 ( D ) 下收 敛于 f ( x ) . 于是 我
们还需证明
定理 8( 狄利克雷定理 ) 设 f ( x ) 在 [ - π,π] 中适合条件 ( D ) , 则级数 (16) 必收敛 , 其和为
∞
i kx 1
∑
k= - ∞
ck e =
2
[ f ( x + 0) + f ( x - 0 ) ] . (30)
证 前面已经证明了左方之和为
π
N→∞
lim ∫ -π
DN ( t ) f ( x + t ) d t ,
π
定理 7 则证明了上式右方为 Nlim
→∞ ∫ -π
W N ( t ) f ( x + t ) d t . 所以现在需证的只是
π
∫
lim
N→ ∞ -π
[ DN ( t ) - W N ( t ) ] f ( x + t) d t = 0 .
但是
1 1 1
D N ( t ) - W N ( t ) = sin N + t・ - ,
2 t t
2sin
2
1 1
- 在 t∈ [ - π,π] 中只有一个奇点 t = 0 , 但是
t t
2sin
2
1 1 1 1 1 τ- sin τ
- = - =
t t 2 sin τ τ 2τsin τ
2sin
2
3 5
τ τ
- +… ∞
3 ! 5 ! τ
∑ ατ .
k
= 4 6 = + k
2 2τ 2τ 2・3 ! k=2
2τ - + - …
3 ! 5!
t 1
这里 τ= , 而级数在 τ= 0 即 t = 0 附近收敛 , 所以 DN ( t ) - W N ( t ) = Ψ( t ) sin N + t ,而 Ψ
2 2
1
在 [ - π,π] 上光滑 , 因此 L 可积 . 利用黎曼 - 勒贝格引理即得定理 8 的证明 .
上面我们详细地讨论了级数 (16) 的收敛性问题并且利用了很细密的数学 分析方法 . 当然 读
者会问 , 能不能找到更精密的方法来证明 DN ( t ) 即在连续函数 空间中也 是一个 δ序列呢 ? 答 案
是否定的 , 因为早在 1876 年就有人找到了一个连续函数 , 其傅里叶级数 ( 16 ) 可以在某点不收敛 .
甚至有这样的例子 , 即连续函数的傅里叶级数可以在“ 许多点”上不收敛 . 如果对 f ( x ) 只假设 可
1
积性 , 即 f ( x ) ∈ L , 科 尔 莫 哥 洛 夫 甚 至 构 造 出 几 乎 处 处 ( 甚 至 处 处 ) 发 散 的 例 子 . 如 果 假 设
2 2
f ( x ) ∈ L , 鲁金在 1915 年就猜测 , L 函数 f ( x ) 的傅里叶级数必几乎处处收敛于 f ( x ) ( 此级数
2
必在 L 意义下收敛则上一章§ 4 就已讲过了 , 是一 个非常简 单而又 基本的事 实 ) . 这个 猜测 在
到 1966 年才由瑞典数学家卡尔 孙 ( L . Carleson ) 证 明 . 总之 , 我 们遇 到的 是这 样一 个 问题 , 既 刻
画一个函数类 , 又刻画一个级数 ( 16 ) 之类 ; 即 刻画出 一类 { ck } , 使二者 相互 一一对 应 . 由 此出 现
了许多结果 , 使我们看到傅里叶级数 理论是 一个 内容非 常丰 富而 又十分 困难 的理论 . 但 是我 们
§1 傅里叶级数———从什么是谱谈起 3 15
它在 D′意义下收敛 . 如果应用狄利克雷定理 , 应有
∞
4 1, 0 < x≤π,
∑
k= 0 (2 k + 1 )π
sin k x =
- 1, - π≤ x ≤0 .
(31)
∞ n
∑
k=0
uk , 记其部分和为 Un = ∑
k= 0
uk , 我 们考 虑 序 列 U0 , U1 , … , Un 的 算术 平 均 值 并 记为 σn =
1
( U0 + U1 + … + Un ) , 现在问 σn 之极限 是什 么 ? 如果 Un → U , 用一点 比较 简单的 极限 计
n+1
∞
2π -π
f ( u) ∑
k= - N
e du=
2π -π
f( x + t) ∑
k= - N
e dt .
K N ( t ) 称为费耶核 , 可以证明
2
N+1
sin t
1 2
KN ( t ) = .
N+1 t
sin
2
证法要点如下 :
注意到
2 t 1 1 - it 1 1 it
sin = (1 - cos t ) = - e + - e ,
2 2 4 2 4
所以 , 经过简单计算即有
N
t 1 - it 1 1 it | k| i kt
∑
2
sin ・KN ( t) =
- e + - e 1- e
2 4 2 4 k= - N N+1
1 1 - i( N + 1) t 2 1 1 i( N + 1 ) t 2
= - e + - e
N+1 4 2 4
2 N+1
= sin t .
2
值得注意的是 , K N ( t ) 即使在连续函 数空间 中也 是 δ序列 , 实 际 上 , 对任 何 [ - π,π] 上的 连续 函
数 f ( x)
π
lim
N→ ∞ ∫ -π
f ( u) K N ( u - x ) d u = f ( x ) .
§2 傅里叶变换
1 n
1 . L (R ) 函数的傅里叶变换 傅里叶 级数 出现 后不 久 , 就 有了 傅里 叶 积分———傅 里叶 变
§2 傅里叶变换 3 17
∞
i kx
) 写成” ∑ ck e
换 . 前者把 [ - π,π] 上的周期函数 f ( x “ , 或者也可以说是把一个函数“变成”一
k= - ∞
2
只说问题 (4 ) 有“ 连续谱”. 相应于 λ= - μ , 有
2 2
T′( t ) + a μ T ( t ) = 0 ,
所以
2 2
- a μ t
T ( t ) = Φ( μ) e , μ∈R, t > 0 ,
而问题 (1 ) , (2 ) 之解现在不是对 μ求和 , 而是对 μ求积分 :
∞ 2 2
∫
- a μ t
u( x , t) = Φ( μ) e sin μxdμ .
- ∞
问题就在于如何选择 Φ( μ) , 使当 t = 0 时得到
+∞
ψ( x ) = ∫ -∞
Φ(μ) sin μxdμ . ( 5)
1 - iξx
积分号前多了一个因子 自然无关紧要 , 双方乘以 e , 并对 x 求积分 , 如果我们允 许任意地 交
2π
换积分次序将有
+∞ ∞ ∞
1
∫ ∫ ∫
- iξx i ( μ - ξ) x
φ( x ) e dx= Φ( μ) dμ・ e dx . ( 7)
- ∞ - ∞ 2π - ∞
我们提出 :
∞
1
∫
i ( μ - ξ)
e d x = δ( μ - ξ) . ( 8)
2π -∞
∫ ∫
- iξx
φ( x ) e dx= Φ(μ)δ(μ - ξ) dμ= Φ(ξ) . (11)
-∞ - ∞
这样我们得到一对公式 (6 ) 和 ( 11 ) .
上面的证明当然算不得证明 , 但是它确实是物理学家考虑问题的办法 , 而且它揭示了十分重
要的思想 . 我们以为 ( 6) 和 (11) 是一对变换和逆 变换 , (11 ) 式把 函数 φ( x ) 映到 Φ(ξ) , 而 ( 6 ) 式
就是它的逆 . 如果我们把 φ( x ) 看作一个 信号 , x 表 示时 间 , 则 (11 ) 表示它 是由 各种 不同频 率 ξ
iξx iξx
的谐波 e 构成的 , Φ(ξ) 就是在谐波构成 φ( x ) 这个信号时 , 谐波 e 占了多少分量 . 所以 ( 11 ) 式
是一个谐波分析的公式 . 把它 们 叠加 起 来 , ( 6 ) 则是 表 示这 些 谐波 的 合 成的 公 式 . 但 是不 论 是
φ( x ) 或 Φ(ξ) 都 表示同 一个 信号 , 前 者我们 称为 该信号 在时 域的 表示 , 后者 则是 它在频 域中 的
§2 傅里叶变换 3 19
换则记为 ( F
- 1
^ (ξ) 为 F ( φ) (ξ) ) . (6 ) 与 ( 11 ) 形状不 太对 称 , 因
Φ) ( x ) = f ( x ) ( 有的书上则记φ
1
为 (6 ) 式中多了一个因子 . 为了对称起见 , 许多文献上常把它们写作
2π
∞
∫
- 2πiξx
Φ(ξ) = φ( x ) e d x,
-∞
∫
2πiξx
φ( x ) = Φ(ξ) e dξ.
-∞
这相当于把频率换成了圆频率 .
我们下面的任务就是讨论这种变换的性质 , 特 别是给它 们以严 格的 证明 ( 由 此也就 给 (8 ) 式
以明确的含意 ) . 但是这时首先要问 , 在什 么框 架下讨 论它 们 , 也就 是上面 说的“ 某一 函数空 间”
中的 φ( x ) , 究竟是指哪一个函数空间 .
1
首选的空间自然是 L . 因为 ( 6 ) 式 中出现 了积 分 , 而从傅 里叶 级数 的情况 来看 黎曼 积分 是
1 1 1 n
不够用的 . 下面我们不限于 L ( R ) , 而用一般的 L (R ) , 因此我们给出
1 n
定义 1 设 f ( x ) ∈ L (R ) , 我们称
^ ∫f( x )e
- i xξ
f (ξ) = dx (12)
n
R
n
为其傅里叶变换 , 这里 xξ= ∑
j= 1
x jξj 时常记作 x・ξ,〈x ,ξ
〉或〈ξ, x〉 .
但我们暂时还未宣称
1
∫ ^f (ξ) e
iξx
f( x) = n dξ
(2π) n
R
① 全 国自然 科学 名词审 定委员 会 1988 公布的《物 理学 名词》上 , 改 称“ 不确定 [ 度 ] 关系”.下文 提到的“测 不准 原理”在《物
理学名 词》上改 称“ 不确定 [ 性 ] 原理”.
3 20 第五章 傅里叶级数与傅里叶积分
为逆傅里叶变换 , 因为 f ( x ) ∈ L (R ) 时 , ^
1 n
f (ξ) 在什么空间中并不清楚 , 所 以这个积 分暂时也 没
有定义 .
给出了这个定义后 , 我们要讨论 它的种 种性 质 , 其中最 重要 的是 它关 于 x 的 线 性变 换的 性
质以及关于 f ( x ) 之代数与分析运算的性质 . 其中有一个是在上一节已经证明的定理 3 , 即
1 n
黎曼 - 勒贝格引理 若 f ( x ) ∈ L (R ) 则
lim ^
f (ξ) = 0 .
ξ→ ∞
这个定理下面我们就只直接使用而不再证明了 .
∫ |^
2
f (ξ) | dξ< + ∞ .
n
R
2
再看量子力学的情况 . 这时 φ( x ) 作为波 函数 其物 理解释 是 : | φ( x ) | d x 是粒 子位 于 x 到 x +
d x 之间的概率 . 既然是概率 , 则必有
∫
2
| φ( x ) | d x = 1 .
n
R
2 n 2 n
因此 , 从物理学的角度来看 , (6 ) 和 ( 11 ) 应该 看成是由 L ( R ) 到 L (R ) 的映射 . 上一 章中我 们
2 n 1 n
指出 L ( R ) 有 特别重 要的结构 , 因 此这时我 们除了 要再点明 L ( R ) 中傅里 叶变换的 性质外 ,
2 n
更要从 L (R ) 特有的结构来考察它 .
然后 , 我们又要在广义函数框架下去看傅里叶变换 . 到这里我们才最后完成 ( 6 ) 与 ( 11 ) 的 证
明 , 到那时 ( 8) 式的意义也就明确了 . 我们得到了一个 比较完整 的理论 . 其 实广义函 数理论的 出
现主要理由之一正是为了傅里叶变换理论的需要 .
1 n
现在我们在 L (R ) 中讨论傅里叶变换 .
定理 1 若 f ( x ) ∈ L (R ) , 则 ^
1 n n
f (ξ) 必在 R 上有界、一致连续 , 而且在无穷远处为 0 .
证 易见
| ^ ∫ ∫ | f ( x) | d x = ‖ f ‖
- i xξ
f (ξ) | ≤ | f ( x)e d x| = L
1
,
n n
R R
所以 ^
f (ξ) 之有界性自明 . 又
|^
f (ξ+ h) - ^ ∫| f( x ) | | e
- i xh
f (ξ) | ≤ - 1|dx
n
R
xh
=2 ∫ | f ( x) |n
sin
2
d x = I1 + I2 .
R
我们将此积分分为两部分 , 其一是
xh
I1 = 2 ∫
| x| > R
f ( x ) sin
2
d x≤ 2
|
∫
x| > R
| f( x ) | d x,
xh
I2 = 2 ∫
| x| < R
f ( x )sin
2
dx .
xh 1 R
因为 sin ≤ | xh | ≤ ‖ h‖ ( 注意 这里 xh 是内 积 , 故 | xh | ≤ ‖ x ‖・‖ h ‖≤ R ‖ h‖ ,
2 2 2
n
∑
2 2
‖ h‖ = h i . 但以下 n 维向量的长仍常以 |・| 表示 ) , 故
i =1
ε
| I2 | ≤ R ∫
| x| < R
| f ( x ) | d x・‖ h‖ <
2
.
整数集 Z 上的函 数 ) 就 相 当 于 ^
f ( ξ) . 在 上 一 节 , 我 们 开 始 先 说 f ( x ) 的 傅 里 叶 级 数 f ( x ) ~
∞
∑
i kx
ck e 是形式级数 , 并因此使用了记号~ . 其实现 在的 逆变 换公式 ( 6 ) 也只 是一 个“ 形式 的”
k=H ∞
∑
1
比较浅层的结果 , 也就是说 , L 函 数 f ( x ) 之 傅 里 叶级 数 收敛 于 f ( x ) 即 由 { ck } 可 以 通过
k= - ∞
i kx
ck e 恢复 f ( x ) 的必要充分条件没有找到 . 也就因此 , 才产生了诸如费耶求和等各种方法以恢 复
n
f ( x ) 的问 题 . 现在 的 问题 也 是一 样 , 如果 我 们记 R 上连 续 而无 穷 远 处为 0 的 函 数之 空 间 为
n 1 n n
C0 (R ) , 则定理 1 告诉我们 ( 用 F 表示傅里叶变换 , 并看 作一个 映射 ) F : L ( R ) → C0 (R ) , 而
n
且 F 的“ 像”其实是 C0 (R ) 的一个真子空间 , 而数学家们迄今未 能完全 刻画它 . 所以问 题在于 ,
1 2
如何找到一个空间 T , 它要足够宽广 , 包括 L , L 等等 ; 在 T 上又可定义傅里叶变换 F , 使 F: T
→ T 是一个双方单值的映射 , 广义函数理论很大程度上正是为了回答这个问题而出现的 .
3 22 第五章 傅里叶级数与傅里叶积分
下面来看当 f ( x ) 变化时 , ^
f (ξ) 怎样随 之改 变 . 一个明 显的 结果 是 f ( x ) → ^
f (ξ) 是 线性 映
1 n
射 , 若 fi ( x ) ∈ L ( R ) , ci 是复常数 , i = 1 , 2 , 则
∧
( c1 f1 + c2 f 2 ) (ξ) = c1 ^
f1 (ξ) + c2 ^
f2 (ξ) . (14)
1 n 1 n
L (R ) 函数的乘积一般不再在 L (R ) 中 , 但是有一种运算称为卷积 , 其形式的定义是
( f * g ) ( x) = ∫ f ( t ) g( x -
n
t)d t = ∫f( x - n
t ) g( t ) d t . (15)
R R
1 n 1 n
首先的问题是 , 当 f , g∈ L (R ) 时 , 上面的积分是否仍是 L (R ) 函数 . 当 f , g 为黎曼 可积时 ,
1 n
上述积分仍是一个黎曼可积函数 , 这可以用富 比尼定 理来 证明 , 对于 L ( R ) 函数 , 富比 尼定 理
我们已在第四章中讲到 , 现在再把结果陈述如下 :
1 n n
定理 2( 富比尼 ( F ubini) 定 理 ) 若 f ( x , y ) 是 L ( R × R ) 函数 , 则对 几 乎所 有 x ( 或 y ) ,
∫f ( x , y ) d y ∈ L ∫f ( x , y ) d x ∈
n 1 n 1 n
f ( x , y)∈ L ( Ry ) ( 或 f ( x , y ) ∈ L ( Rx ) ) , 而 且 ( Rx ) ( 或
n n
R R
1 n
L (Ry ) ) , 且
n n
f ( x , y ) d xd y = ∫d x∫ f ( x , y) d y
n n
R ×R R R
∫d y∫f ( x , y )d x .
=
n n
(16)
R R
∫| f ( x - ∫ | f ( x ) | d x∈ L (R ∫| g( t ) | d ∫
n
= | g( t ) | t ) | d x = | g( t ) | t ) .因此 , t | f( x - t) | d x
n n n n
R R R R
x t x
1 n n
< + ∞ , 由托乃利定理即知 | f ( x - t ) g( t) | d xd t < + ∞ , 即 f ( x - t ) g( t ) ∈ L (Rt ×Rx ) , 应
n
R
1 n
用托乃利定理 , 即知 ( 15 ) 所定义的 ( f * g) ( x ) ∈ L (R ) , 而且重复前证的步骤即有
∫ ( f * g) ( x ) d x ≤∫ | g( t ) | d t・∫ | f ( x ) | d x ,
n n n
(17)
R R R
x t x
或写作
‖ f * g‖ L1 ≤‖ f‖ L 1・‖ g‖ L 1 . (17′)
卷积很像是一个乘法 . 它适合交换律 ( 这一点由定义 (15) 式即知 ) 、结合律
( f * g) * h = f * ( g * h)
和分配律
( f1 + f2 ) * g = f1 * g + f2 * g .
1 n
所以 L (R ) 不但是一个线性空间 , 而且其 中还 有适合 以上 运算 律的“ 乘法”, 这 就称 为 一个“ 代
数”. 再考虑到其中的范数适合不等式 (17) , 就称为一个 巴拿赫代 数 . 但是这个 乘法又与“ 普通”
§2 傅里叶变换 3 23
1 1
的乘法有些不同 , 例如 , 其中没有单位元 1( 即与 任一 L 函数 f 之卷 积均等 于 f 本身 的 L 函 数
1
“1”: f *“ 1”= f ) . δ函数 适合 此式 , 但 δ又不 是一 个 L 函 数 . 又 例如 有些 乘法 是 没有 零因 子
的 , 即由 f・ g = 0 必有 f = 0 或 g = 0 . 卷积就没有零因子 .这就是梯其马希 ( Titchmarsh) 定理 : 若
1 n
f , g∈ L (R ) 而且 f * g = 0 , 则 f , g 中至少有一个几乎处处为 0 , 但这并不容易证明 .
卷积是很重要的运算 . 我们实际上早已见过它了 , 例如磨光运算就是函数 与磨光核 的卷积 :
δ序列 Kn ( x ) →δ( x ) in D′就是 f * K n → f 对一切 f∈ D 成立 ( 由此可以想到 δ函数是卷积的单
1 f (ζ) 1 1
位元 .即上述的“ 1”) , 柯西积分
2πi ∫L
ζ- z
dζ即 f 与
2πi ζ
的卷积 ( 复的 ) . 不过我们现在最关心的
是卷积与傅里叶变换的关系 .
1 n
定理 3 若 f , g∈ L (R ) , 则其卷积 h( x ) = ( f * g) ( x ) 之傅里 叶变 换等 于 f 与 g 之傅 里
叶变换之积 :
h^ (ξ) = ^
f (ξ)・g^ (ξ) .
证 应用富比尼定理即有
h^ (ξ) = ∫h( x ) e ∫ d x∫ f ( t ) g ( x -
- i xξ - iξx
dx = t) e dt
n n n
R R R
∫∫
- iξt - iξ( x - t )
= dx f( t)e ・g( x - t ) e dt
n n
R R
∫f ( t ) e ∫g( x ) e
- iξt - iξx
= dt dx
n n
R R
= ^
f (ξ)・g^
(ξ) .
对于 ^
f 与 g^之卷积其傅里叶逆变换也应有类似 公式 . 但 是现在 连 ^
f * g^ 暂 时都 无法定 义 , 所以 只
好在后面用广义函数去讨论 .
这个定理不但在数学理 论 中 有重 要 意义 , 而且 在 实际 工 作 中很 有 用 . 设 有一 个 信号 f ( t )
( 我们使用它的时域表示 ) , 我们已经明白 , 它是由各种不同频率的谐波合成的 . 所谓 滤波就是 希
望从这些成分中删除某些成 分 . 为 了从 数学 上考 查这 个 过程 , 我们 转 到 此信 号 的频 域 表示 , 即
^f (ξ) ,ξ∈R 1
. 现在我们要求删除其中的高频成 分 , 例 如删 除 | ξ| ≥ R0 的 一切 高频 成分 , 能完 成
这个任务的设备就叫做低通滤波器 . 为此 , 我们考虑一个函数
1 | ξ| < R0 ,
F(ξ) = (18)
0 | ξ| ≥ R0 ,
并考虑新的信号 F(ξ) ^ ^ (ξ) ,
f (ξ) , 它就是从原来信号中删除了高频成分的结果 . 如果 F(ξ) = w
则
∧
F(ξ) ^
f (ξ) = w * f (ξ) .
因此回到时域即知
∞
( w * f) ( t) = ∫ - ∞
f ( t ) w ( x - t) d t .
3 24 第五章 傅里叶级数与傅里叶积分
R iR t - i R t
1 e -e
∫
0 iξt 0 0
= F(ξ) e dξ=
2π - R
0
2πi t
sin R0 t
=
πt
就是 (18) 的时域表示 . 而从数学上看 , 上述滤波器就是一个完成卷积运算
1 ∞
sin R0 ( t - τ)
( w * f ) ( t) =
π ∫ -∞
f ( t)
t -τ
dτ (19)
sin R0 t
的装置 . 所以函数 可以称为这个滤波器的仪器函数 .
πt
(19) 也称为“窗式傅里叶变换 ( window Fourier transtorm) .
1
不过我们要注意上面我们并没有规定信号的时域表示 f ( t ) ∈ L (R t ) , 而 F(ξ) 上面已说 过
1 1
了不一定是 L (Rξ ) 函数 , 因此即使逆变换公式 ( 6) 对 L (R t ) 函数得到了证明 , 也不能应用于此 .
所有这一切都表明了完全有必要在 广义 函数 框架下 讨论 傅里叶 变换 . 此 外 , 在上 一节中 我们 正
是针对“窗口函数”(18) 提出了吉卜斯现象 . 同样 , 在窗式 傅里 叶变换 ( 19 ) 中 也一 定会出 现这 种
2
1
sin N + t
2
情况 . 正如在傅里叶级数时我们采用费耶核 来代替狄利克雷核 , 而且这是通过
t
sin
2
N
| j|
将部分 和 S N 改 为 σN = ∑
j= - N
1-
N+1
uj 来 实现 的 .现在 也 一样 , 我 们只 要 把 窗口 函 数 改 为
2
F(ξ) ( 1 - | ξ|/ R) , 从而把 ( 19 ) 改为 ( sin R0 t/ πR0 t) * f 也能实现同样的目的 .
现在回到 傅里叶变 换最引 人注目的 性质 , 即微分 运算在傅 里叶变 换下成为 什么 . 我们先 形
1
式地看一下会有什么结果 , 然后再去证明它 . 为简单计只看 R 的情况 .
由 (12)
∞
^f (ξ) =∫ f ( x) e
- i xξ
d x,
-∞
双方对 ξ求导即得
∞
d ^ 1 1 ^
∫
- i xξ
f (ξ) = x f( x )e dx = ( x f ) (ξ) . (20)
dξ i -∞ i
再由 (6 )
∞
1
∫ ^f (ξ) e i xξ
f ( x) = dξ,
2π -∞
双方对 x 求导 , 有
∞
1
∫ iξf^(ξ) e dξ,
i xξ
f′( x ) =
2π - ∞
iξf^(ξ) ∫
- i xξ
= f′( x ) e dx . (21)
-∞
§2 傅里叶变换 3 25
数属于 L 可以归结为对它在无穷远处衰减速度的限制 . 例如 , 若 ^
1 - 2 - ε
f (ξ) 当 ξ→∞时为 O (ξ ),
则 f ( x ) 可求导 . 于是我们又看到对 ^
f (ξ) 增长速度 ( 即是衰减速度 ) 的限制导致了 f ( x ) 的某种程
度的可微性 . 同样 , f ( x ) 在无穷远处的增长速度决定了 ^
f (ξ) 的可微性 . 这个现象我 们已在上 一
节讲到傅里叶级数的收敛性时强调过其重要性 . 在广义函数框架下处理傅 里叶变换 也是以此 为
基础的 . 现在我们正式提出和证明相关的定理 .
定理 4 ( i ) 设 f ( x ) ∈ L (R ) , xj f ( x ) ∈ L (R ) , 则 ^
1 n 1 n
f (ξ) 对 ξj 可求导 , 而且
^
f^(ξ) .
( x j f ) (ξ) = i (22)
ξj
1 n 1 n
( ii) 若 g ( x ) ∈ L ( R ) 而 它对 某一自 变量 xj 的不定 积分 f ( x ) 为 L ( R ) 函数 , 则 f ( x ) =
∞
∫
-
x
j
g( x ) d x j , 而且
∧
1 ^ 1
(ξ) = ξj f^(ξ) .
g (ξ) = f (23)
i i ξj
证 ( i) 记 hj 为第 j 个分量为 h 而其他分量为 0 的 n 维向量 . 我们有
^ ∫
- i xξ - ix h
f (ξ+ hj ) = f ( x)e ・e j j
d x,
n
R
所以
- ix h
1 e -1
^f (ξ+ ^f (ξ) ∫f( x )e
- i xξ j j
hj ) - = ・ dx .
hj n
hj
R
因为
- ix h xj hj
|e j j
- 1 | = 2 sin ≤ | x j | | hj | ,
2
- ix h
e -1
∫
- i xξ j j 1 n
所以积分 f( x )e ・ d x 之被积函数绝对值不大于 L (R ) 函数 | x f ( x ) | , 于是我们 可
n
hj
R
以应用勒贝格控制收敛定理在积分号下求极限而 (22) 得证 .
3 26 第五章 傅里叶级数与傅里叶积分
∫
j 1
( ii) 由假设 f ( x ) = g( x ) d xj , 现在我们利用 f ( x ) ∈ L 这一条件来确定积分下 限 . 对 任
意 A 与 a有
A
f ( A ) - f ( a) = ∫ g( x ) d x
a
j .
1 n
因为假设了 g( x ) ∈ L ( R ) , 所以 当 A→ ∞时 f ( A ) 有极 限 M : f ( A ) → M , 同理当 a→ - ∞ 时
1 n
f ( a) → m . 又因为假设了 f ( x ) ∈ L ( R ) , 所以必有 M = 0 , m = 0 , 而得
∞
f( x ) = - ∫ x
j
g( x ) d x j .
对于勒贝格积分 , 我们知道不定积分在几乎处处意义下是原函数 , 所以 g( x ) = f′
x ( x ) 几乎处 处
j
成立 . 分部积分公式
A A A
∫ uvd x =
a
uV
a ∫
-
a
V u′d x ( V 为 v 之不定积分 )
+∞
∫ g( x ) e ∫
- i xξ - i xξ
d xj = f′
x ( x )e
j
d xj
a a
A A
∫ f ( x)e
- i xξ - i xξ
= f ( x) e + iξj dx .
a a
令 a→ - ∞ , A→ + ∞ , 前面我们已经证明了 f ( a) → 0 , f ( A) →0 , 所以立即得到
∧
(ξ) = iξj ^
g^
(ξ) = f f (ξ) ,
xj
从而 (23) 成立 .
x
∫ f ( x ) d x 一定 是 f ( x ) 的 原 函 数 , 而 只 能 得 到
1
贝格积分中我们 也 不 能说 只 要 f ( x ) ∈ L , 则
a
定积分条件下才得知 A→
lim∞ f ( A ) = 0 , a →lim f ( a) = 0 的 . 顺便 说 一 下 , 从 这里 还 得知 , 若 g( x ) ∈
- ∞
+∞ x
∫ ∫
1 1
L ,则 g( x ) d x = 0 时才能得到 g ( x ) d x∈ L . 在这 方面还 有一 个很有 趣的 结果 ( 我 们
- ∞ -∞
1 1 ( r) 1 ( 1) ( r - 1) 1
只对 R 的情况来陈述它 ) ; 若 f ( x ) ∈ L , f ( x )∈ L , r > 1, 则 f ( x),…, f ( x ) 都∈ L .
但是证明并不容易 .
以上我 们看 到一个 基本 思想很 清楚 , 而 物理 上又很 重要 的结 论 : 求导与 乘以 自变量 是对 偶
1
的 , 而且通过傅里叶变换来实现 . 但是 如果 在 L 框 架下 来讨论 , 会引起 多少 麻烦事 . 因 为广 义
函数框架在这方面显得更直观 , 物理学家和工程师很可能会乐于接受 , 以为这样就不需任何条件
1 2
了 . 但是情况并非如此 , 见下一节 .而且这丝毫不 能说明 L 和 L 框 架下的 傅里 叶变换 理论 只
是烦琐哲学 , 恰好相反 , 它是内容十分丰富的 .
最后我们再讲几个与自变量的线性变换有关的性质 . 首先 , 也是最常用的 是“ 反射”, 即将 x
变为 - x , 或 ξ变为 - ξ, 我们用一个专门记号来表示它 , 我们定义
ˇ
f ( x) = f ( - x) , ˇ
φ (ξ) = φ( - ξ) .
首先讲一下如果 ^
1 n
f (ξ) 仍在 L (R ) 中 , 对它再作一次傅里叶变换又如何 ? 事实上
^ ∫ f^(ξ) e
^f ( x ) = - iξx
dξ
n
R
= (2π)
n 1
n
∫ ^f (ξ) e
iξ( - x ) n
dξ= ( 2π) f ( - x ) = ( 2π)
n
ˇ
f .
(2π) n
R
注意这里自变量记号的变化 , 所以至少从形式上说 , 有
^
^f ( x ) = ( 2π) n
ˇ
f ( x) . (24)
n
另一个重要的变换是平移算子 . 我们定义平移算子 τh ( h∈ R ) 为
(τh f ) ( x ) = f ( x - h) .
1 n 1 n
很容易看到 , 若 f∈ L ( R ) , 显然 τh f∈ L (R ) , 易见
∧
∫f( x -
- iξx
(τh f ) (ξ) = h) e dx
n
R
∫
- iξh - iξ( x - h)
=e f ( x - h )e dx
n
R
f^(ξ) .
- iξh
=e (25)
- iξh
我们知道 e 的ξh 是相位 , 所以自变量的平移 造成 傅里 叶变换 相位 变化 . 再 看若对 f ( x ) 添 加
ixh 1 n i xh 1 n
一个因子 e , 则当 f ∈ L (R ) 时 , e f ( x ) ∈ L ( R ) , 容易看到
∧
∫ dξ= ^
i xh - i x ( ξ- h)
( e f ) (ξ) = f ( x) e f (ξ- h)
n
R
= τh f^(ξ) .
(26)
2 n 2 n
2. L (R ) 中的傅里叶变换 首先遇到的问题是 L (R ) 函 数不 一定 可积 , 因此 ( 6 ) 式中 的
2 n
积分目前无定义 . 但是 L (R ) 是一个“很好”的空 间 : 它 有内 积以及 由内 积导出 的范 数 ( 因为 现
3 28 第五章 傅里叶级数与傅里叶积分
- iξx
在讨论的函数是取 复 值的 , 如 e , 所 以我 们 应该 讨 论 复的 内 积 , 即 埃尔 米 特 内 积 ) , 它 有 正 交
2
性 , 因此可以定义其中的 o .n .系 .当我们考虑有限区间例如 [ - π,π] 上的 L 空间时 , 还可以找 出
i kx 2
可数的完全 o .n .系如{e } , k 为整数 , 而任一 L [ ( - π,π) ] 函数都可以按它展 为傅里叶 级数 , 且
2 2 n
在 L [ ( - π,π) ] 中收敛 . L (R ) 空间又是完备的 . 这样一些性质使它在数学的许多分支和物理
学中十分有用 . 它是所谓希尔伯特 空间最 常见 的代 表 . 因此 , 我们 将着 重从 希尔 伯 特空 间的 角
2 n
度来研究 L (R ) 中的傅里叶变换 . 我们先从其定义开始 , 而暂时认为 (6 ) 只是一个形式的记法 .
2 n
我们的作法是先取 L (R ) 的一个稠密的子空 间 , 使对于其 中之元可 以定义 傅里叶变 换 , 再
2 n 2 n 2 n
应用 L (R ) 的完备性把 这个 定义 推 广到 整个 L (R ) . 现在 我 们选 取 L ( R ) 中 具 有紧 支 集
[ - A , A] 的函 数 ( 为 方 便 起 见 , 我 们 只 讨 论 一 个 自 变 量 的 情 况 , 但 是 其 结 果 易 见 可 以 适 用 于
n 2
R ) , 并认为这些函数仍定义在 R 上不过在 [ - A , A] 之 外恒为 0 . 记此 空间 为 L (R A ) , 很明 显
2 1 n
L (R A ) L ( R ) , 所以可以在其上定义傅里叶变换 . 我们可以作一个相似变换
A A
z= y = λy , λ= ,
π π
使 [ - A , A ] 中的 z 与 [ - π,π] 中的 y 相对应 , 而 f (λy ) 之傅里叶变换
∞ ∞
1
∫ ∫
- iξy i zξ λ
F[ (λ・) ] (ξ) = f (λy) e dy= f ( z)e dz
-∞ λ - ∞
1^
ξ
= f .
λ λ
2 2
这当然不会影响下面的讨论 . 我们要注意现在我们是在 L ( [ - π,π] ) 中讨论问题 . 在 L [ - π,π] 中
1 i kx
有 o .n .系 e , k = 0 , ±1 , ±2 , … . 在第四章就指出 , 这个 o .n .系 是完全的 , 但未 证明 . 下
2π
2 2
面我们将把证明补出来 , 现在则承认这个结果 . 于是任意的 f ( x ) ∈ L ( [ - π,π] ) 均可展开为 L
2 2
意义下收敛的傅里叶级数 . 于是任意的 f ( x ) ∈ L ( [ - π,π] ) 均可展开为在 L 意义 下收敛的 傅
里叶级数 :
+∞
1 i kx
f ( x) = ∑
k= - ∞
ak
2π
e ,
这里
π π
1 - i kx 1 Ck
∫ ∫
- i kx
ak = f ( x )・ e dx= f( x )e dx= ,
-π
2π 2π -π 2π
而且
π
∫
- i kx
Ck = f ( x)e dx
-π
i kx
正是通常说的傅里叶系数 . 而{ e } 之完全性给出了以下的帕塞瓦尔关系式
+∞ ∞ π 2
1
∫
2 - i kx
∑ 2π k∑
2
‖ f‖L = 2 | ak | = f ( x)e dx ,
k= - ∞ = - ∞ -π
但右方的积分正是 | ^
2
f ( k ) | . 所以我们有
+∞
2 1
^
∑
2
‖ f‖ L 2 = | f ( k) | . (27)
2π k = - ∞
§2 傅里叶变换 3 29
f ( x ) , 0≤λ≤1 , 代替 f ( x ) 则其傅里叶变换成为 ^
- iλx - iλx 2
如果我们用 e f ( k + λ) . 但是‖e f ( x ) ‖ L2
2
= ‖ f ( x ) ‖ L2 . 因此又有
+∞
1
| ^
2 2
‖ f‖ L
2 = ∑
2π k = - ∞
f ( k + λ) | . (28)
2
这是一个极重要的关系式 . 双方 对 λ由 0 到 1 积 分 , 立 即知 道 , 对于支 集在 [ - π,π] 中的 L 函
数,有
∞
1 1
∫ |^ ‖^
2 2 2
‖ f‖ L
2 = f (ξ) | dξ= f ‖ L2 . (29)
2π - ∞ 2π
2 n
利用它 , 首先我们就可以定义 L ( R ) 函数的傅里叶变换 . 仍令 n = 1 , 作
f ( x) , | x | ≤ N ,
fN ( x ) =
0, | x | > N,
考虑 φ( x ) = f N ( x ) - f N′( x ) , 不妨设 N′< N , 于是 f N ( x ) - f N′ ( x ) 之 支集 在 [ - N , N ] 中 . 如
N
上所述 , 作相似变换 x = y = λy , φ( λy ) 作 为 y 的函数 , 支 集在 [ - π,π] 中 , 其傅 里 叶变 换则 成
π
1 ^
ξ
了 φ .
λ λ
N π
∫ ∫
2 2 2
‖ f N ( x ) - f N′( x ) ‖ L
2 = | φ( x ) | d x = λ | φ(λy ) | d y
- N -π
∞ 2 ∞
1 1 ξ 1
∫ ∫
= λ・
2π - ∞
φ^
λ λ
dξ=
2π -∞
^ (ξ) | dξ
|φ
2
1
‖^
f N (ξ) - ^
2
= f N′ (ξ) ‖ L 2 .
2π
^ ∫
- iξx
f (ξ) = l .iN →.m . fN ( x ) e dx .
∞
n
R
1 x - y
然后用磨光核 jη ( x - y ) = j1 对 f A ( x ) 作磨光 :
Cη η
∞
1 x - y
gη ( x ) = ( Jη f A ) ( x ) =
Cη ∫ - ∞
j1
η
fA ( y ) d y .
这里 η< δ, 而 C 的选取使
∞
1
C ∫ - ∞
j1 ( x ) d x = 1 .
∞ ∞
于是 gη ( x ) ∈ C , 而且 gη ( x ) 之支集在 [ - A - η, A + η] 之内 , 所以 gη ( x ) 是 [ - π,π] 中的 C0
2
函数 , 且由前面的说明 , gη ( x ) 在 L 中收敛于 f ( x ) , 故对任一 ε> 0 , 必有 η, 使
ε
‖ gη - f ‖ L2 < .
2
现在我们固定 η.
∞
因为 gη ( x ) ∈ C0 , 所以 gη ( x ) 的傅里叶级数一致收敛于 gη ( x ) . 于是必存在一个 N 0 , 当 N
> N0 时
N 2 N 2
π 2
qk qk ε
∫
i kx
∑
i kx
gη ( x ) - ∑
k= - N 2π
e =
-π
gη ( x ) -
h- N 2π
e dx <
2
.
1 i kx
这里 qk 是 gη 对 o .n .系 e 的傅里叶系数 .
2π
N N
1 i kx Ck i kx qk i kx
但由贝塞尔不等式 , 若 Ck = f,
2π
e 时, f - ∑
k= - N 2π
e ≤ f - ∑
k= - N 2π
e ≤
N ∞
qk i kx Ck i kx
∑ ∑
2
‖ f - g‖ + g- e < ε. 由 ε之任意性 , 知 e 在 L 中收敛 于 f ( x ) , 这
k= - N 2π -∞ 2π
- i kx
e
就是说 是一个完全的 o .n .系 .
2π
(28) 式的另一个应用是以下极重要的
定理 5( 普兰舍利 ( Plancherel) 定理 ) 设 f ( x ) ∈ L ( R x ) , 则 ^
2 2
f (ξ) ∈ L ( Rξ ) , 而且二 者范 数
“相等”.
2
1 2
‖ f‖ L 2 ( R = ‖^
f ‖ L2 (R ) . (30)
x
)
2π ξ
2
这就是说 , 对紧支集的 L 函数 , 普兰舍利定理是成立的 , 令 N→∞ . 即有
1
‖^
2 2
‖ f ‖ L2 = f ‖ L2 (R n )
2π ξ
1
定理中说二者范数“相等”, 实际上相差一个因子 , 只要我们改用圆频率 2πξ, 而有
2π
^ ∫ ∫ ^f (ξ) e
- 2πiξx 2πiξx
f (ξ) = n
f ( x)e d x, f( x) = dξ,
R R
x ξ
§2 傅里叶变换 3 31
1
这个因子就消失了 , 或者在 Rξ 空 间中 用 dξ作 为其测 度 亦可 . 这 只是 一个 习惯 问 题 . 但我 们
2π
1
宁愿用语上“马虎”一些 .例如下面要讲的“ 等距”变换等 等 , 其 实也有 时差一个 因子 , 读 者在 计
2π
算时小心一点就行了 . 又 如上 文 中我 们 作积 分 时 有时 是 把 x 作为 一 维变 量 , 而 积分 限 又 写 为
n
R , 都是如此 . 总之 , 这是一个习惯问题 .
普兰舍利定理意义重大 , 它 告 诉我 们 傅 里 叶 变换 ( 我们 暂 时 改 用 一个 记 号 F : ( Ff ) (ξ) =
^f (ξ) ) 是由
2 2 1
L (R x ) 到 L (Rξ ) 的线性变换 , 而且使得范数不变 ( 其实差一个因子 ) . 不仅如此 ,
2π
它还保持内积不变 ( 注意现在用复值系数 , 所以内积指 的是埃 尔米 特内积 , 其 记号 也采用 埃尔 米
特配对 ) :
1 ^
( f , g) = ( f,^
g) . (31)
2π
由范数不变推导出内积不 变 的 办法 是 标准 的 , 称 为 极 化关 系 式 ( polar relations ) 如下 : 令 f , g ∈
2 n
L (R ) 则
2 2 2
‖ f + g‖ = ‖ f‖ + ‖ g‖ + ( f , g) + ( g , f ) ,
2 2 2
‖ f + i g‖ = ‖ f‖ + ‖ g‖ - i ( f , g) + i( g , f ) .
用 i 乘后式再加到前式 , 有
2 2 2 2 2 2
2( f , g) = ‖ f + g‖ - ‖ f‖ - ‖ g‖ + i ‖ f + i g‖ - ‖ f‖ - ‖ g‖ .
1
把 f , g 分别变成 f^, g^
并在双方都加一个因子 , 再用 ( 30 ) 即得
2π
1 ^
( f , g^
( f , g) = ) .
2π
2 n
一个希尔伯特空间 ( 如 L (R ) ) 到其自身的线性算子 T , 如果是此 空间的 线性同构 , 且能 保
1
持埃尔米特内积不变 ( 在傅里叶变换的情况下要加中一上因子 n , 如 (31) 式 ) :
( 2π)
( T f , T g) = ( f , g ) (32)
2 n
就称为一个酉算子 ( unitary operator) , 所以 , 普兰舍 利定 理启发 我们 , L ( R ) 上的 傅里叶 变换 是
一个酉算子 . 其实在线性代数中我们已经看过了什么是酉矩阵 : 例如 , 如果 f , g 是 n 维复线性空
—
* *
间中的 n 维向量 , T 看成 n× n 复数元矩阵 , 则由伴随矩阵 T = ( ti j ) = ( tj i ) 之定义 , (32) 告 诉
我们
* *
T T = I, TT = I,
* - 1 2 n
亦即 T = T . 所以在有限维情况下 , 酉算子一定可逆 . 现在转到 L (R ) , 它是一个 ( 可 数 ) 无
限维希尔伯特空间 , 一个 复希 尔 伯特 空 间 中的 酉 算子 T 即 一 个保 持 范 数不 变 的线 性 同构 . 那
2 n
么 , 傅里叶变换作为复希尔伯特空间 L (R ) 到其 自身的线 性变换 , 是否 是一个酉 算子呢 ? 当 然
它是一个线性算子 , 而且普兰舍利 定理又 保证 了它保 持范 数不 变 . 余 下的 只有“ 同构”待 考 . 同
2 n 2 n
构包含了两个意思 , 一 是单 射 . 即只 有 0 ∈ L ( Rx ) 才 被 映为 0 ∈ L ( Rξ ) . 这 样 就不 会 有 两 个
L (Rx ) 函数 f1 ( x ) 和 f2 ( x ) 被映为同一个 ^
f (ξ) . 因为 如果 f 1 ( x ) 和 f2 ( x ) 有相 同的 ^
2 n
f1 (ξ) =
3 32 第五章 傅里叶级数与傅里叶积分
^f
2 ^ (ξ) = ^f 1 (ξ) - ^f 2 (ξ) = 0 . 但由定理 5 , 这时
(ξ) , 则 φ( x ) = f1 ( x ) - f2 ( x ) 之傅里叶变换φ
2 1
‖φ‖ L 2 ( R xn ) = ^ ‖2L2 ( Rξn ) = 0 ,
2 ‖φ
(2π)
2 n
所以 φ= f1 ( x ) - f2 ( x ) = 0 . 其 次 要 证 明 它 是 满 射 . 即 任 一 L ( Rξ ) 函 数 φ(ξ) 必 是 某 一
2 n
L (Rx ) 函数 f ( x ) 之傅里叶变换 . 我们来证明
1
∫
iξx
f( x ) = n e φ(ξ) dξ
(2π)
恰好合于所求 . 但这正是反演公式 , 我们现在对 n = 1 的情况来“证明”它 .( 31 ) 左方是
∫ f ( x ) g( x ) d x ,
而右方为
1
∫ ∫ ∫
- iξy - iξx
n dξ f ( y) e d y・ g ( x ) e dx
(2π)
1
∫
- iξ( y - x)
= n dξ d yf ( y ) g( x ) e dx
(2π)
1
∫∫ ∫
iξx - iξy
= n e dξ f( y)e d y・g( x ) d x .
(2π)
比较双方 , 利用 g( x ) 之任意性即有
1
∫ ∫
iξx - iξy
f( x ) = n e dξ f ( y)e dy .
(2π)
这就证明了 (6 ) 确实是 ( 11 ) 的逆变换公式 .
这个“证明”是不合法的 , 因为交换积分次序还需论证 , 我们将在下一节讨论它 .
2 n
以上我们只是对 L (R ) 中的傅里叶变换之定 义及其 基本性质 ( 它 是酉算子 , 并有 普兰舍 利
定理 ) 作了详细讨论 . 但还留下了一个漏洞 , 即逆傅里 叶变换公 式未严 格证明 . 傅里 叶变换的 另
2 1
一些初等的性质 , 对于 L 和 L 是一样的 , 有待证明 , 但其中有一些我们仍留待下一 节用广义 函
数来处理 .
2 n
首先来看卷积 , 若 f ( x ) , g( x ) ∈ L (R ) , 则若视 x 为一参数 , f ( t ) g ( t - x ) 作为 t 的函 数
∞
∫
1 n
是 L (R ) 函数 . 因此 f ( t) g( t - x ) d t 是有意义的 , 它定义了一个 x 的函数 h ( x ) , 但是关于
- ∞
h( x ) 的性质 , 除了易证它是有界的 :
1
+∞ ∞ 1
∫
2 +∞
∫
2
| h( x ) | ≤ ・
∫
2
| f ( t ) | | g( t - x ) | d t≤ | f ( t) | d t 2
- ∞ - ∞ | g( t - x ) | d t
-∞
= ‖ f‖ L 2・‖ g‖ L 2
2 n
以外 , 我们实在所知不多 , 所以我们不考虑如何定义两个 L (R ) 函数的卷积 .
其次看一下求导问题 . 有一些很细致的定理 , 例如 ( 我们只讲一维情况 , n 维的不讲了 )
定理 6 设 f ( x ) ∈ L (R) 是绝对连续的 , 而且 f′( x ) ∈ L ( R) , 则 ^
f (ξ) = iξf^(ξ) , 它自然 仍
2 2
2
在 L (R) 中 .
个有限区间上为绝对连续 ) , 且
g( x ) = f′( x ) ;
+∞
∫
f ( x) = -
x
g( y ) d y .
这些定理我们都未证明 , 留待用广义函数来讨论 .
3 . 傅里叶变换与量子力 学 现在我 们从量子力学角 度来看一下普兰舍 利定理 . 首先 , 我们
想关于量子力学稍微说几句 . 19 世 纪末 的物 理学 的许 多新 的 实验 事实 与经 典物 理 学的 基本 概
念相矛盾 , 使得普朗克在 1900 年提出能量子假说 , 即能量不是连续的 , 而是由一些极小的离散单
位———即能量子———构成的 . 爱 因 斯 坦 在 研究 光 电 现 象 时 进 一 步 发 展 了 这 个 思 想 , 提 出 光 量
子———即光子———不但能量 E 是分立的 , 而且动量 p 也是分 立的 , 而 且能量 与动 量与光 作为 一
种波动的宏观的物理量频率 ν及波长λ有关 :
- 34
E = hν, p = h λ, h = 6 .626× 10 J・s .
这一些都经过了实验的验证 . 这里的 h 称为 普朗克 常量 , 是 量子 现象中 最重 要的普 适常 量 . 另
一个重大问题是原子的构造 . 人们曾经认可的原子行星模型———中间有 核 , 外 层有电子 , 而且 服
从开普勒的行星运动规律———是 1911 年卢瑟 福 ( E . Rut herford) 提 出的 . 然 而按 经 典物 理的 定
- 9
律 , 这样的原子是不稳定的 , 其寿命的数量级只有 10 秒 . 原子辐射的光谱又有明显的明线与暗
线 , 这也与经典物理不相容 . 波尔 ( N . Bohr ) 对此有解释 : 外层电子的轨道并不 是任意的 , 而只 能
处于一系列固定的能级上 . 当电子在一个轨道上运行 时 , 一切都很 正常 , 也不会 辐射能 量 . 但 若
它从一个轨道跃迁到其它能级的轨道 , 则将吸收或辐射出一定的能量 , 等于两 轨道能级 之差 . 这
时就产生光谱中的明线 ( 发射能量 ) 或暗线 ( 吸收能量 ) . 但是当时物理学家 的方法论 还是承认 经
典物理的定律 , 不过要在某些特定情况下加以修正 . 所以波尔称这种理论为“旧量子理论”.
到了 20 世纪 20 年代 , 人们开始认识到微观世界有自己的物理规律 . 所谓 微观世界 , 人们 当
然都知道 , 例如亚原子世界当然是微观世界 . 但是我们更准确地可以说 , 量 子力学处 理的问题 即
普朗克常量 h 不能忽略的问题 . 人们把微观世界的 规律归 结为 若干要 点 , 而在 20 世纪 30 年 代
由冯・诺依曼 ( J . Von Neumann) 归结为几个公设作为 从数学 上处 理量子 力学 的基 础 . 与 牛顿 时
代提出三大定律 ( 牛顿也是把它们当作数学公理 看待的 ) 不同 , 量 子力 学的公 设更 具抽象 性与 某
项具体的物理实验距离更远 . 我们下面就提出几条“ 公设”而不加“ 证明”. 我们没有 用几个基 本
命题的形式来陈述这些公设 , 而是就我们所讨论的问题作了一些解释 .
1 . 量子力学系统的 状 态可 以 用状 态 空间 中 的 波 函 数 Ψ( x , t ) 来 刻 画 .Ψ 取 复 值而 与 cΨ
2 n
( c≠ 0 是一个复数 ) 表示 同 一 个 态 . 在 每 一 时 刻 t, Ψ∈ L ( R ) , 所 以 Ψ 可 以 规 范 化 , 即 适 合
iθ
‖ Ψ‖ L2 = 1 .但即令如此 , Ψ 仍不能唯一决定 : Ψ 与 e Ψ( θ为实 数 ) 仍 表示 同一个 态 . 态空 间
2 n
是一个复希尔伯特空间 , 具体说来即是 L ( R ) .
2 . 我们只研究可 以 观测 到 的物 理 量 . 所 以量 子 力 学讲 的 物 理 量 都称 为 可 观 测 量 ( observ-
ables) . 例如粒子的位置、动量、能量等都是可观测量 . 但是时间 t 则作为一个参数处理而不算是
可观测量 .
微观世界 的对象如 此之小 , 要观 测它们 就不能忽 略观测仪 器对于 对象的作 用 . 观测的结 果
一般的是一个随机变量 , 就是可以取许多值的量 , 但是它取某个范围中的值的 概率是一 定的 . 例
2
如 , 若波函数为 Ψ( x , t ) , 则粒子位于 x 与 x + d x 之间的概率为 | Ψ( x , t ) | d x .
3 34 第五章 傅里叶级数与傅里叶积分
∫
2
x | φ( x ) | d x = ( xφ, φ) ( 最后一项中的 x 是代表算子了 , 它作用 在波函数 φ( x ) 上的结果 是
2 n * - 1 *
4 . L (R ) 上 的 酉 算 子 U 即 适 合 U U = I 的线 性算子 . 这时因 为 U = U 作用 在
2 n 2 n - 1
L (R ) 上 , 所以 U 的值域是 L (R ) 全空间 , 同时 U 的存 在 , 又说 明 U 是 1 - 1 的 , 是 一个 线
性同构 . U 算子又保持内积不变 :
*
( Uφ, Uφ) = ( U Uφ, φ) = ( φ, φ) .
2 n 2 n
所以 , L ( R ) 在经过 U 的作用后 , 其线性构造与度量都不变 , 因此 L ( R ) 没 有改变 . 现在看 傅
2 n
里叶变换在 L (R ) 上的作用 . 普兰 舍利定 理已 证明了 傅里 叶变 换保持 内积 不变 . 在证 明了 逆
2 n
变换定理后 ( 上面我们只是“ 形式 地”推算 了一 下 ) , 又 知道 傅里叶 变换 保持 L (R ) 的线 性构 造
不变 , 而且是 1 - 1 的从而是一个酉算子 . 这样 , φ( x ) 是一个波函数 而表示 一个量子 系统的一 个
^ (ξ) 也应该表示同一状态 . 前者称为 该状 态的 x 表 象 , 后者称 为其 ξ表 象 .按 波函 数
状态 , 则φ
^ (ξ) | 应该表示 ξ的观测值在ξ与ξ+ dξ之 间的概率 密度——— | φ^ (ξ) | dξ表 示
的概率解释 , | φ
2 2
1
概率 . 现在要问 ,ξ在物理上表示什么 ? 为此我们来看动量算子 x 在傅里叶变换下表 示什么 .
i
至少 , 形式的计算告诉我们 , 通过分部积分
1
∫ ∫ ^ (ξ) ,
- iξx - iξx
x φ( x ) e d x = ξj φ( x ) e d x = ξj φ
n
i j
n
R R
1 n
积分号外之项变为 0 , 前面我们已对 L (R ) 证明了 , 若 φ( x ) 和 φ( x ) 均为可积则当 | xj | → ∞
xj
2 n
时 , φ( x ) →0 . L (R ) 的情况下则 需另 证 , 所以在 这里 我们 得到的 只能 算是 形 式推 导 , 即是 说 ξ
1
表象下的乘以ξj 与 x 表象下的动量算子 x 是一样的 . 所以 ξ表象又称动量表象 .
i j
5 . 在经典力学中粒子的位置和 动量 ( 或简单 地就 说是 速度 ) 共 同决 定了 该粒 子的 状 态 . 量
子物理中却只用 x ( x 表象 ) 或 ξ(ξ表象 ) , 这至少是因为 , 如果 x 与ξ共同才决定粒子的状态 , 则
必须要能同时观测 x 与ξ. 但是这是不可能的 . 因为量 子力学的 基础 公设之 一就 是两个 可观 测
量要能同时观测的充分必要条件是 它们 所对 应的自 伴算 子 A 与 B 要可 交换 , 即 A B - B A = 0 .
这里我们引进一个在数学文献中常用的概念“交换子”( commutator) : 两个算子 A , B 的交换子的
记号和定义为 [ A , B] = A B - BA . 所以 , 两个可观测量可同 时观测的 充分必 要条件是 [ A , B] =
0 . 因为上面我们已经说过 , 观测的结果是随机变量 , 要刻画它就必须有一个分 布函数 , 即此量 之
值在某个区域中的概率 . 所 以要 同时 观测 A 和 B 就 必 须有 一 个联 合 分 布函 数 , 而 为 此就 需 要
[ A , B] = 0 .
h
现在把它 应 用 到 位 置算 子 xj 与 动 量 算子 (现在我们在 前添 加 了 因 子 = =
i xj xj 2π
- 34 1
1 .05 ×10 J・s , 以突出表明现在考虑的是微观 世界的 事 . 前面 我们 把动量 算子 写成 实际
i xj
是取了一个新的单位致使 = 1 . 许多数学文献上常这样做 . 而物理文献上则常突 出 h , 这时 , 例
∫f ( x) e
^ (ξ) =
如傅里叶变换也相应地写为φ
- iξx h
d x . 并常 称为 h - 傅 里叶变换 , 并 在讲完测 不
, xk φ( x ) = ( xkφ( x ) ) - xk φ( x ) = δi ・ φ( x ) ,
i x i xj i xj i
3 36 第五章 傅里叶级数与傅里叶积分
Δφ A・Δφ B≥ . (34)
2
证 (33) 的右方现在成为
1
φ, φ = ‖φ‖ = .
2 i 2 2
故 (34) 得证 .
特别是动量与位置恰好是典则共轭的 , 故
Δp j・Δx j ≥ . (35)
2
2 n
本来我们是在讨论 L (R ) 中的 傅里叶 变换 , 但 现在 似乎转 成 了希 尔伯 特空 间中 自 伴算 子的 性
质 . 但是至少在动量与位置的测不 准关系 上 , 确实 只须 用傅 里叶 变 换的 性质 就够 了 . 其 中的 要
点正是普兰舍利定理 . 除此以外又需利用傅里叶变换的简单性质 .下面再就 pj 与 xj 证明一次测
不准原理 (35) . 我们引入 A 1 = A - aφ I , 这 等于假 设了 aφ = 0 , 用 于位置 算子 x j I 就相当 于说 位
0 0 0
置的平均值 x j = 0 . 其实 , 即令 x j 之平均值 x j ≠0 , 我们可以作一个平移 yj = xj - x j , 这时 , 波函
0 0 0
数 φ( x ) = φ( y1 + x 1 , … , yn + x n ) = φ( y + x ) , 于是其傅里叶变换成为
0 0 0
ix ξ
∫ ∫ ^ (ξ) .
0 - i yξ 0 - ( y + x )ξ ix ξ
φ( y + x ) e dx= φ( y + x ) e ・e dy= e φ
0 0
所以 , 在动量表象下波函数将 多一 个因 子 e
ix ξ
,而|e ^ (ξ) | = | φ
ix ξ
φ
2
^ (ξ) | , 所 以动 量 的方 差 不
2
变 .
§2 傅里叶变换 3 37
2 2
1 0
2π 2π 2π
0
^ (ξ+ ξ ) ,
量 ξj 之平均值为 ξj ( j = 1 , 2 , … , n ) , 在 ξ空间中作平移ξj = ξj - ξj , 波函数将成为φ
0 0
0 0
- iξ x - iξ x 2 2
回到 x 表象后将得到波函数 e φ( x ) , 这同样不影响到概率密度 | e φ( x ) | = | φ( x ) | , 所
以 δφ 也不变 :
∫x
2 2
δφ ( xj ) = j | φ( x ) | d x .
现在我们需要证明的只有
2
δφ ( ξj )・δφ ( x j ) ≥ .
4
2 n 2 n 2 n
这里的 φ∈ L (R ) , 而且 xφ( x ) ∈ L (Rx ) , φ( x ) ∈ L (Rx ) . 和前面一样 , 我们 只考虑一 维
xj
( n = 1 ) 的情况 , 而且只对支集在 - N≤ x≤ N 中的φ( x ) 证明上式 , 然后再取极限 即可 . 为此 , 考
虑积分 .
+∞ +∞
∫ ∫
2
I(λ) = | λxφ( x ) + φ′( x ) | d x = [λxφ( x ) + φ′( x ) ] [λxφ( x ) + φ′( x ) ] d x .
-∞ - ∞
∫ ∫ ∫
2 2 2 - - 2
I(λ) = λ x | φ( x ) | d x + λ x ( φφ′+ φφ′) d x + | φ′( x ) | d x ,
-∞ -∞ -∞
- - -
∫ ∫
2 2 2
0≥1 - 4 x | φ( x ) | d x・ | φ′( x ) | d x
- ∞ - ∞
∞ ∞
1
∫ ∫ ^ (ξ) | dξ
2 2 2 2
=1-4 x | φ( x ) | d x・ ξ |φ
- ∞ 2π -∞
4
=1 - 2 δφ ( x )δφ ( ξ) .
所以有
2
δφ ( x )・δφ ( ξ) ≥ ,
4
从而测不准关系 (35) 得证 .
2
现在要问 , 何时 δφ ( x )・δφ ( ξ) 达到其最小值 4 ? 显然 , 当且仅当存 在某个 λ使 I (λ) = 0
时可能 , 但是 I (λ) = 0 可以化为存在一个 φ使
λxφ+ φ′( x ) = 0 .
把它看作 φ的一阶常微分方程 , 即有
2
λx
-
φ= Ce 2
.
3 38 第五章 傅里叶级数与傅里叶积分
§3 急减函数与缓增广义函数
n 1 2
1 . S (R ) 空间 上两节中讲到 L 与 L 上的 傅里 叶级 数与 傅 里叶 变换 时 , 遇 到的 困难 都
在于函数的可积性上 . 由此 , 例如在傅里叶变换理论中 , 变换式
^ ∫
- iξx
f (ξ) = ( F f ) (ξ) = f ( x)e dx ( 1)
n
R
的逆变换式
1
∫ ^f (ξ) e
- 1 iξx
f( x) = ( F F) ( x ) = n dx ( 2)
(2π) n
R
- 1
一直无法证明 . 所以 ( 2) 中的 F 暂时只是一个形式记号 . 傅里 叶变换 的最基本 的性质 : 乘以 自
变量 x 或ξ与对自变量ξ或 x 的求导之关系 , 也显得很不自然 . 多年来 , 数学家和物 理学家都 设
法推广这些理论 , 而得到成功与公认 的仍是 走广 义函数 理论 这条 路来讨 论傅 里叶变 换 . 上一 章
中我们已看到广义函数就是试验函数空间的连续线性泛函 . 它的基本的“ 窍门”可以 说就是把 所
遇到的困难都“转移”到试验函数空间去 . 我们选取了 D( Ω) 作为试验函数 空间的目 的就在于 把
求导运算的困难仿照分部积分法转移到试验 函数 上去 , 而 且使“积 分号 外”的 项都自 动消 失 . 为
∞ α
此我们取 C0 ( Ω) 之元为试验函数 , 而且为了保证求导运算的“ 连续性”———即由 fn → f 得出 fn
α ∞
→ f , 我们在 C0 ( Ω) 中引进了一种特别的收敛性 即定义 f n → f in D ( Ω) 为 : 所有 f n 之 支集 均
α α
位于 Ω 之同一紧子集中 , 而且对每个固定的 α, f n 一致收敛于 f . 现 在问 , 能不能 用同样的 方
n n
法来讨论 D (R ) 上的傅里叶变换 , 再通过对偶 方式把 这种 变换 转移到 D′( R ) 上去 ? 当 然是 可
以的 . 但是当我们问对 f ( x ) ∈ D( R ) 按 ( 1) 作 出的 ^
n
f (ξ) 究竟 在什 么空间 中 ? 因 此例如 在作 逆
1
变换 (2 ) ( 它与变换 ( 1) 的差别无非 是多了一个因子 n , 并 把 i 变 成了 - i ) 时 , 尽管我们下 面就
(2π)
§3 急减函数与缓增广义函数 3 39
要看到这仍是可能的 , 但终究 ^
n
f (ξ) 不再在 D (R ) 中了 , 如何 再利 用对偶 性也 就不 清楚了 . 因 此
要用广义函数理论来处理傅里叶变换时 , 首先遇到的问题是找一个合适 的试验函 数空间 . 当然 ,
n
由此带来的问题是 : 这个新空间与原有的 D( R ) 是什么关系 .
怎样选择试验函数要由所需解决的问题性质决定 . 考虑到乘以自变量 与求导两 种运算在 傅
里叶变换下互变 , 所以试验函数应具有以下性质 : 它应该无穷次可微 , 而且不论求导多少次 , 或乘
以 x 的多少次幂 , 仍然应该是可积的 . 因此我们给出下面的
n ∞
定义 1 S( R ) 空间———以下简记为 S ———由适合以 下条件 的 C 函数 φ( x ) 构成 : 对任 意
重指标 α与β, 必存在常数 Cαβ 使
β α
| x φ( x ) | ≤ Cαβ .
x ( 3)
β α n
S 中的函数序列{φk ( x )} , 若对任意固定的重指标 α与β, { x φk ( x ) }均在 R 上对 x 一致趋 向
x
∫
- iξx - iξh
F(τhφ) (ξ) = φ( x - h) e dx=e F( φ) (ξ) . ( 7a)
n
R
1
∫φ(ξ-
- 1 iξx i xh - 1
F (τhφ) ( x ) = n h) e dξ= e F ( φ) ( x ) . (7b)
(2π) n
R
1 ξ
∫φ(λx ) e
- iξx
F( φ(λ・) ) (ξ) = dx= n F( φ) . ( 8a)
n
λ λ
R
1 1 -1 x
∫
- 1 iξx
F ( φ(λ・) ) ( x ) = φ(λ
ξ) e dξ= n F (φ) . (8b)
λ
n
(2π) n
λ
R
1
( iii) 求导与乘以自变量 凡使用广义 函数 为工具 的文 献中 , 常 考虑 x 以 代替 x , 并记 为
i
1
D x . 即 Dx = x . 这样比较方便 . 于是量子力学中的动量算子现在是 Dx .
i
∫ ( D φ) ( x ) e
α α - iξx α
F( D φ) (ξ) = d x = ξ F( φ) (ξ) . ( 9a)
n
R
∫
β β - iξx | β| β
F( x φ) (ξ) = x φ( x ) e d x = ( - 1) Dξ F( φ) (ξ) . (9b)
n
R
1
∫( D φ) (ξ) e
- 1 α α iξx | α| α - 1
F ( Dξφ) ( x ) = n ξ dξ= ( - 1) x F ( φ) ( x ) , (10a)
(2π) n
R
1
∫
- 1 β β iξx β - 1
F (ξφ) ( x ) = n ξφ(ξ) e dξ= Dx F ( φ) ( x ) . ( 10b)
(2π) n
R
- 1
由这四 个 式 子 可 见 , S 函 数 的 傅 里 叶变 换 与 逆 傅 里叶 变 换 仍 是 S 函 数 , 即 是 说 , F , F :
S→ S .
不但如此 , 我们还很容易证明 : 若{φk }→0 in S , 则 F(φk ) (ξ) →0 in S , 事实上
β α | β| β α
ξ Dx F( φk ) (ξ) = ( - 1) [ F( Dx x φk (ξ) ) ] . (11)
β α γ δ
Dx ( x φ) ( x ) 自然 可以写成 x Dx φ( x ) 之线性组 合 , 这时 γ≤α,δ≤β所以这 个线性组 合是有 限
的 . 现在考虑其中一项 . 我们有
∫x D φ ( x)e
γ δ γ δ - iξx
F( x Dx φk ) (ξ) = x k dx
n
R
- iξx
e
∫
2 N γ δ
= ( 1 + | x | ) x D φk ( x ) 2 N d x .
x
n
(1 + | x | )
R
- iξx
e 1 n
取 N 充分大以至 2 N > n , 则 2 N ∈ L ( R ) , 由于已设 {φk }→ 0 in S , 故对 任意 ε> 0 , 必
(1 + | x | )
2 N γ δ
可找到 K(ε, γ,δ) 使当 k > K 时 , | ( 1 + | x | ) x Dx φk ( x ) | < ε. 因此
- iξx
|e |
∫
γ δ 2 N γ δ
| F( x D φk ) (ξ) | ≤ | (1 + | x | ) x D φk ( x ) | 2 N d x x
(1 + | x | )
dx
≤ε ∫ (1 + | x |
n
2
)
N = Iε .
R
γ δ n
所以 F( x D φk ) (ξ) 在 R 上一致趋于 0 . 代入 (11) 即知 F(φk ) → 0 in S . 所以 F∶S → S 也是 连
ξ
§3 急减函数与缓增广义函数 3 41
- 1
续映射 . 同理 F ∶ S→ S 也是连续映射 . 但是我们还不能说 F 是线 性同构 , 因为 ( 1) 与 ( 2 ) 是 否
- 1
互为逆映射尚未证明 , F 暂时还只是形式记号 . 下面我们就来证明 ( 2) 确实是 (1 ) 的逆变换 .
(iv) 反 演 公 式 我 们 来 证 明 ( 2 ) 确 实 是 ( 1 ) 的 逆 变 换 . 为 此 我 们 先 来 求 高 斯 函 数
n 2
2 - x / 2
- | x| / 2
∏e 的傅里叶变换 :
j
e =
j= 1
n
2 2
∫e ∏∫e
- | x| / 2 iξx - x / 2 - iξ x
j
e dx = e j j d xj .
j= 1
n R
R
所以只要计算右方的一个因子
∞
2
∫e
- x / 2 - i xξ
e d x = E (ξ)
- ∞
2
- x / 2 n
即可 . 上面我们已经说了 , e ∈ S( Rx ) , 所以其傅里叶变换 E(ξ) ∈ S( Rξ ) . 但是
2 2
- x / 2 - x / 2
De = i xe ,
所以 , 利用 ( 9a ) 与 ( 9b) 有
d E(ξ)
ξE (ξ) = - iDξ E(ξ) 或 - ξE(ξ) = .
dξ
此外 ,
∞
2
∫
- x / 2
E( 0) = e dx= 2π .
- ∞
由这两个式子即知
2
- ξ/ 2
E(ξ) = 2πe .
2
- x / 2
这样我们看到高斯函数 e 的傅里叶变换仍是 一个高 斯函数 , 不过因 子有一 些变化 . 对 E (ξ)
- 1
再作变换 (2 ) , 则 ( F E) ( x ) 应适合
d - 1 - 1
( F E ) ( x ) = - x ( F E) ,
dx
+∞
1 2
∫
- 1 - ξ/ 2
(F E) (0 ) = 2πe dξ= 1 ,
2π - ∞
因此
2
- 1 - x / 2
(F E ) ( x) = e .
2
- | x| / 2
我们只计算了 e 的一个因子 , 把它的 n 个因子全部算完 , 即得
2 n 2 n 2 2
- | x| / 2 - | ξ| / 2 - 1 - | ξ| / 2 - | x| / 2
引理1 高斯函数 e 的傅里叶变换是 ( 2π) e 2
, 从而 F (2π) e 2
=e .
2 2
- a| x| / 2 - | λx | / 2
我们时常需要考虑 f ( x ) = e ( a > 0 ) 的傅里叶变换 , 我们不 妨把 f ( x ) 写成 e ,λ
= a再利用 (8a ) 即有
n
2 2
- a| x| / 2 2π 2 - | ξ| / 2 a
F( e ) (ξ) = e . (12)
a
定理 2 当 f ( x ) ∈ S 时 , ( 2) 式定义的变换确是 (1 ) 之逆变换 , 且可写为
3 42 第五章 傅里叶级数与傅里叶积分
^^
f ( x ) = ( 2π) ˇ
n n
f ( x ) = (2π) f ( - x) . (13)
2
证 回忆一下上节中“证明”L 函数之傅里叶变换确是酉变换时 , 实际上已用到了这里的 结
论 . 当时我们就指出 , 其中变换积分 次序 是 不合 法的 . 现 在对 f ( x ) ∈ S , 再 重复 一 下这 个形 式
“证明”, 我们有
1
∫ ∫
- 1 iξx - iξy
(F F) f ( x ) = n e dξ f( y)e dy
(2π) n n
R R
ξ y
1
∫f ( y ) d y∫e
iξ( x - y )
= n dξ.
(2π) n n
R R
y ξ
如果这个形式证明是合法的 , 而且又能证到
1
∫
iξ( x - y)
n e dξ= δ( x - y ) , (14)
( 2π) n
R
ξ
代入上式就有
1
∫ f ( y )δ( x -
- 1
(F F) f ( x ) = n y) d y = f ( x ) ,
(2π) n
R
ξ
iξ( x - y )
而定理得证 . 这个“ 证明”之所以仍只是形式证明 , 在于 e 对于 ξ是不可积的 , 更不是绝对可
积的 , 所以不能应用富比尼定理以改变积分次序 . 对于 (14) 式 , 注意到 F(δ) (ξ) = 1 , 而我们想要
证明的其实是
- 1
(F F) δ( x - y ) = δ( x - y ) , (15)
iξ( x - y )
亦即反演公式对于一个很特殊的广 义函数 是成 立的 . 这 两 点其 实是 一回 事 : e 是一 个急 剧
振荡的函数 ( 当 | ξ| →∞时 ) , 傅里 叶级 数理论 与傅 里叶 变换 理 论都 在相 当大 的程 度 上依 赖于 这
个振荡性质 . §1 中讲的黎曼 勒贝格引理 , 以及它在证明许多基本结果 ( 例如傅里叶级数的狄利
克雷定理 ) 中所起的作用 , 都说明了这种急剧振荡性质起了关键的作用 .
如何解决上面提出的矛盾呢 ? 正如 在§1 中当 傅里叶 级数 收敛 性难 以证 明时 , 我们 引入 了
种种求和法 , 例如引入了 C - 1 求和 以及 费耶 核 .但是 , 引入 费耶 核相 当于引 进了 一个收 敛因 子
以改进收敛性 . 如果函数 f ( x ) 有相当的光滑性 ( 例如适合狄利克雷条件 ) , 则这种收 敛因子将 会
加快收敛速度 , 如果连这样少的光滑性也没有 , 则这种收敛因子会导致种种可求 和性 ( 如相应 于
费耶核的 C - 1 求和性 ) 以推广收敛性 . 所以我们现在也引入一个收敛因子 ψ(ξ) 并考虑
1
∫ ∫
iξ( x - y)
n dy ξ) e
f ( y )ψ(ε dξ,
( 2π) n n
R R
y ξ
- 1
这里 ε> 0 .我们要来看一下 , 当 ε→ 0 时能否得到极 限式 ( F F) ( f ) ( x ) . 为此 , 以下两 条件 是
n
合理的 : ( i) ψ(ξ) ∈ S (Rξ ) , ( ii) ψ( 0) = 1 . 然后我们有
1 1
∫ ∫ ∫ ∫
iξx - iξy iξx - iξy
n e dξ f ( y)e d y = εlim n ψ(ε
ξ) e dξ f ( y)e dy . (16)
( 2π) n n
→0 (2π) n n
R R R R
ξ y y y
n
因为 1 并非 Rξ 上的勒贝格可积函数 , 不能应用勒贝格控制收敛定理 . 但是如果注意到对上式右
方现在可以自由地应用富比尼定理 , 即知
1 1
∫ψ(εξ) dξ∫ f ( y ) e
iξ( x - y ) iξ( x - y)
n dy= n ψ(ε
ξ) f ( y) e d ydξ.
( 2π) n n
(2π) n n
R R R ×R
ξ y ξ y
令ε
ξ= ζ, y - x = εz , 上式右方化为
1 - iζz
n ψ(ζ) f ( x + εz ) e dζd z
(2π) n n
R ×R
z ζ
1
∫f ( x + εz ) d z∫ψ(ζ) e
- iζz
= n dζ
(2π) n n
R R
z ζ
1
=
(2π)
n
∫ n
^ ( z) d z .
f ( x + εz )ψ
R
z
现在求极限 的 过程 全 转到 f 中 去了 , 而 且 f ∈ S , 完 全 可以 转 到在 积 分号 下 求 极 限 , 于 是 代 入
(16) 有
1 1
∫ ∫ ∫ ^( z)d z
iξx iξy
n e dξ f ( y) e d y = lim n f ( x + εz) ψ
(2π) n n
ε→ 0 (2π) n
R R R
ξ y z
1
= f ( x )・
(2π)
n
∫ n
^( z ) d z .
ψ (17)
R
z
1
^ ( z ) 之逆傅里叶变换 ∫ ^( z) e d z 在η= 0 处的 值 . 这 里我们要 用
iηz
其实最后一个积分即ψ n ψ
( 2π) n
R
z
^ ( z ) ∈ S (Rz ) , 而这由 ψ(ξ) ∈ S
到ψ
n n
(Rξ ) 是自然成立的 . 所以 , 只要反 演公式对 ψ(ξ) 成立 , 则
1
上式化为
(2π)
n
∫ n
^ ( z ) d z = ψ(0 ) = 1 , 而定理得证 .
ψ
R
z
2
- | ξ| / 2
但是由引理 1 , 当 ψ( z ) = e 时 , 反演公式确实是成立 , 故定理得证 .
注 上面我们是利用了已知高斯函数的傅里叶变 换来证 明反 演公式 的 , 而一 旦反演 公式 已
1
∫ ^ ( z ) d z = ψ( 0 ) = 1 , 而可 以代 入
经得知 , 则对任意 ψ(ξ) ∈ S 且适合 ψ( 0 ) = 1 者 , 都 有 n ψ
( 2π) n
R
则 (16) 可以写为
lim f ( y ) , Kε ( x - y ) = f ( y ) ,δ( x - y ) = f ( x ) .
ε→ 0
n
所以 Kε ( x - y ) 其实是 一个 δ序 列 . 上一章 中我 们说 , 所 谓 δ序列即 一个 在 D′( R ) 中 收敛 于
n n n n
δ( x ) ∈ D′(R ) 的序列 , 而上式中 f∈ S . 但是因 为 D ( R ) S (R ) , 所以对 f ∈ D ( R ) , 上 式
3 44 第五章 傅里叶级数与傅里叶积分
n n
也是对的 . 即 是 说 Kε ( x - y ) 是 D ( R ) 中 的 δ 序 列 . 但 是 我 们 将 引 入 S ( R ) 的 对 偶 空 间
n n
S′( R ) , 而可以看到 Kε ( x - y ) 也是 S′( R ) 中的 δ序列 . 所以 , 从广义函数角度来看 , 证明定理
2 的过程就是一个构造 δ序列的过 程 . 这和 傅里叶 级数 理论的 情况 是一 样的 : 为 了 证明 傅里 叶
1
sin ( N + )t
2
级数的收敛 性 以 及 可 求 和 性 , 我 们 实 际 上 证 明 的 是 狄 利 克 雷 核、费 耶 核 等 , ,
t
2πsin
2
2 1
sin ( N + )t 1
2 sin( N + ) t
, 2 , …都是 δ序 列 . 还 有许 多 其 它 的 δ序 列 , 相 应于 其 它 求 和
2 t
( N + 1) sin πt
2
法 , 例如泊松求和等等 , 而在各自的问题中都很有用 .
上面说了 Kε ( x - y ) →δ( x - y ) , 所以我们时常就写
1
∫
iξ( x - y )
δ( x - y ) = n e dξ.
( 2π)
于是本来没有意义的形式积分现在理解为广义函数的 极限 , 下面 还可 将把它 理解 为 1 的 逆傅 里
叶变换 , 而且把 1 看作一个广义函数 , 这样理解的积分 称为“振荡 积分”( 在许 多文 献中振 荡积 分
是用其它方法来定义的 , 但与这里添加收敛因子的定义是等价的 ) . 这个公 式还与其 它一些数 学
理论有关 , 特别是还可以从量子力学 的测不 准 原理 来看 待它 : 粗略 地说 , δ( x ) 在 x 表象 中表 示
一个粒子的位置完全确定 , 因此 , 在 ξ表 象中 , 它应 该完 全不 确定 , 而可 以用 各个 方 向的 平面 波
iξx
e 对ξ按完全相同的“权”叠 加而 成 , 所 以我 们才 有 了 (14 ) 式 ( 其 中 令 y = 0 ) . 这 样 也就 可以 理
解 , 为什么 δ序列有的并不是如钟型的曲线 ( 正态分布 ) 而有振荡性 . 现在我们只特别要 提醒 , 在
iωΦ( x , y)
处理含有高频振荡的因子 e ( | ω| m 1) 的 积分时 , 时常 这个积 分并不 绝对 收敛 , 我们 就不 要
iωΦ
轻易地把绝对值符号放在积分号下去 , 那样就会使 | e | = 1 而丧失 了非常 有用的关 于相位的 信
息 , 而宁可“ 形式”地把它当作绝对收敛积分 “
, 形 式”地应用富 比尼 定理 , 再用 广义 函数或 其它 方
法加以解释 . 我们正是这样做的 .
( v) 酉性质 还有几个性质都与 傅里叶 变换 作 为酉 算子 有关 , 因而 是极 重要 的 , 我 们称 之
为酉性质 .
n
定理 3 若 f , g∈ S (R ) , 则
证 由于 f , g ; ^
f , g^ 都是 S 函数 , 利用重积分化为逐次积分立刻就得到这些结果 .
注 1 ( 18 ) 可以写为
*
〈F f , g〉=〈f , F g〉 .
这里用的是欧几里得配对 , 而非埃尔 米特配 对 . 这两 种配对 的区 别在 于对于 后一 变元前 者是 线
§3 急减函数与缓增广义函数 3 45
*
性的 , 后者则是共轭线性的 . 欧几里得配对是用来定义转置算子 F 的 .
注 2 ( 19 ) 可以写为
(^
f , g^
- n
( f , g) = (2π) ),
n
所以傅里叶变换又是等距的 . 但通常讲等距算子 是对希尔 伯特空 间而 言 , 现 在 S ( R ) 并 非希 尔
2 n
伯特空间 . 所以说 F 是等距的 , 或 者是酉 算子 , 都 只是方 便的 说法 , 而在 L ( R ) 中 它才 有精 确
的意义 . 借用这种方便的说法 , (19) 也称 为帕 塞瓦尔 关系 式 , 其实 也可称 为普 兰舍利 关系 式 , 不
过一般说来 , 只当 f = g 时 , 才称为普兰舍利定理 .
注 3 ( 20 ) 是卷积公式 .当 f , g∈ S 时
( f * g) ( x ) = ∫ f ( t ) g( x -
n
t) d t .
R
∞ n
显然积分是收敛的 , 而且因为可 以在 积分号 下求 导 , 所以 ( f * g) ( x ) ∈ C (R ) 也 是 明显 的 , 而
且
∫
α α
x ( f * g ) ( x) = f ( t) x g( x - t ) d t .
n
R
β α | β|
余下只要考虑 x x ( f * g) ( x ) , 因 为 我 们只 在 | x | m 1 处 考虑 它 , 不 妨 用 ( 1 + | x | ) 来代替
| x | , 于是
∫
β α | β| α
| x x ( f * g) ( x ) | ≤ (1 + | x | ) | f ( t) x g( x - t) | d t .
n
R
γ δ α
因为 | x | ≤ | t | + | x - t | ,而 |β| ≥0, 上式右方可以用多项式定理化为 | t | | f ( t) |・| x - t | | x g( x - t) |
之有限线性组合 . 这里 | γ| + | δ| ≤ | β| .由于 f , g∈ S , 即知上式右方是一个绝对收敛积分 , 其值
n
≤ Cα, β . 这样即知 ( f * g) ( x ) ∈ S (R ) , 而 (20) 就容易证明了 .
n n
2. S′( R ) 广义函数 这就是急减函数空间 S (R ) 的对偶 .
n
定义 2 S( R ) 上的线性连续泛函称为缓增广义函数 , 它们 构成一 个复系数 线性空 间 , 记 为
n
S′( R ) .
下面我们举一些例子 .
∫f ( x ) φ( x ) d x
p n n p n n
L (R ) (R ) (1≤ p≤ + ∞ ) , 因为若 f ( x ) ∈ L (R ) , 对 φ( x ) ∈ S (R ) ,
S′
n
R
显然有定义 , 而且由赫尔德不等式
1 1
p q
∫ f ( x ) φ( x ) d x ≤∫ | f ( x ) | ∫ | φ( x ) |
p q
dx dx ,
n n n
R R R
1 1
+ =1,
p q
∫f ( x ) φ ( x ) d x→ 0 , 所以它 是一 个连续 线性 泛
n
由此可知若有一串 φk ( x ) →0 in S (R ) , 必 有 k
n
R
p n n p n
函 , 这样我们得到 L ( R ) S′( R ) . 为 了 证 明 它 是 连 续 嵌 入 , 设 有 一 串 f k ( x ) ∈ L ( R ) ,
p n n
f k ( x ) → f ( x ) in L (R ) .仍旧用上 面的 赫尔 德不 等式 , 即知 f k ( x ) → f ( x ) in S′( R ) ,
n
( S′(R ) 中的收敛性定义 , 下面马上就要介绍 ) , 所以这里的嵌入是连续嵌入 .
3 46 第五章 傅里叶级数与傅里叶积分
n
但是 S′(R ) 中的元不一定都是可积函数 . 实际上 , 若 f ( x ) 是可积函数 , 甚至只是局部可 积
函数 , 但在∞附近适合以下的缓增条件 : 存在正整数 N 以及常数 CN , 使得
N
| f ( x ) | ≤ CN (1 + | x | ) .
N
( 或者写得更简单一些 , 写作 f ( x ) = O ( 1 + | x | ) , 即是说 f ( x ) 之增长速度不 超过 N 次多项 式
n
的增长速度 .) 由于 φ( x ) ∈ S (R ) 是急减的 , 因此例如有
A
| φ( x ) | ≤ N+ n+1 .
(1 + | x| )
所以
CN A
∫ n
f ( x )φ( x ) d x ≤ ∫ n
(1 + | x| )
n+1 d x
R R
仍是有意义的 .
n | x|
但是我们不要以为 S′(R ) 中 的一 切 函数 都必 定是 缓增 的 . 例 如我 们知 道 e 是指 数增 长
x x x n
的 , 它不是缓增的 , 在 n = 1 的情况 , cos( e ) ′= - e sin ( e ) , 也不是 缓增 的 , 但是 它是 S′( R )
1
中的元 . 因为对于 φ( x ) ∈ S(R ) .
∞
∫
x x
〈 cos( e ) ′, φ( x )〉= - cos( e ) φ′( x ) d x ,
-∞
1
它显然是 S (R ) 上的连续线性泛函 .
n n n n
另一方面 , 由 D(R ) S (R ) , 所以每一个 S′(R ) 广义函数一定是 D′(R ) 广义 函数 . 因
此
n n
S′( R ) D′( R ) .
n n n
我们要证明实际上有 S′( R ) D′(R ) . 为此 , 我们先要讲一下什么是 S′( R ) 中的收敛性 . 设
n n n
有 f0 ( x ) ∈ S′(R ) , 而且有一串 f k ( x ) ∈ S′( R ) , f k ( x ) → f 0 ( x ) in S′(R ) 是 什么意义 ? 为
n n
此 , 我们只需了解 f k ( x ) - f0 ( x ) → 0 in S′( R ) 是什么 意义即可 . 为 此我们 仿照 D′( R ) 中
趋于 0 的定义给出 :
n n n
定义 3 S′( R ) 广 义 函 数 f k ( x ) → 0 in S′( R ) 即 指 对 任 意 φ( x ) ∈ S ( R ) , 均 有
〈f k ( x ) , φ( x )〉→0 .
n
所以 S′(R ) 不但是一个线性空间 , 而且还有其拓扑结构 , 不过我们不来讨论这种拓扑结构 .
n n
定理 4 S′( R ) 连续嵌入于 D′(R ) 中 .
n n n n
证 作为两个集合 , S′(R ) D′( R ) 已如上述 . 今设一串 f k ( x ) ∈ S′( R ) 在 S′( R ) 中 趋
n n n
于 0 , 则由定义 3 , 对任一 φ( x ) ∈ S(R ) , 有〈f k , φ〉→0 , 今取 φ( x ) ∈ D (R ) S (R ) , 上式自然
n
成立 , 因此 f k → 0 in D′(R ) .
由此定理知道 , 每一个 S′广义函数也都是 D′广义函数 . 其逆虽然不真 , 但 D′中 有一些广 义
函数特别重要 , 因此我们要问它们是否也是 S′广义函数 . 这里最重要的当然是 δ( x ) . 它显然是
n
一个 S′(R ) 广义函数 , 其定义仍然是
〈δ, φ〉= φ(0 ) .
n n
其实我们可以直接验证它是 S (R ) 上的连续线性泛函 . 不但是 δ( x ) , 其 实凡 D′(R ) 中有紧 支
n ∞ n
集的元 f ( x ) 均可定义成 S′( R ) 之元 . 实际上 , 设 supp f = K 是一个紧集 , 我们作一个 C0 ( R )
§3 急减函数与缓增广义函数 3 47
n n
函数 χ( x ) , 使在 K 附近χ( x ) = 1 , 于是对任一 φ∈ S , ( χφ) ( x ) ∈ D (R ) , 而我们对 φ∈ S (R )
定义
〈f , φ〉=〈f , χφ〉 .
n n
很容易验证 , 这个定义与 χ之选择无关 , 这样 D′(R ) 中的 f 现在拓展成 S′(R ) 中之元 .
∞ n n n
特别重要的是 , 可以证明 , C0 ( R ) 在 D′( R ) 中稠 密 , 所以 在 S′( R ) 中 稠密 . 即是说 , 对任
n ∞ n
意 f ∈ S′(R ) , 必可找到一个 C0 (R ) 序列 f k ( x ) , 使
n
f k ( x ) → f ( x ) in S′( R ) .
这个定理很重要 , 还因为它把 D′广义函数的性质 , 大 都移到 S′广义函数 中来 了 . 我 们不 来
n n
一一列举 , 只举出其中最重要的几个 . 以下我们均设 f ∈ S′(R ) , φ( x ) ∈ S( R )
( i) 平移 τh f = f ( x - h) 的定义是 :
〈τh f , φ〉=〈f ,τhφ〉 . (21)
( ii) 反射 ˇ
f ( x ) = f ( - x ) 的定义是 :
ˇ, φ〉=〈f , ˇ
〈f
φ〉 .
(22)
( iii) 求导之定义现在成为
α | α| α
〈D f , φ〉= ( - 1 ) 〈f , D φ〉 . (23)
注意 , 由于我们引入 S 与 S′是为了傅里叶变换理论的需要 , 所以必须考虑复值函数 , 故定 义
S 上的线性泛函时需要应用埃尔米特配对 ( f , φ) , 它对后一个“变元”φ是共轭线性的 :
-
(λf , φ) = λ( f , φ) , ( f , λφ) = λ( f , φ) .
而在讨论 D ( Ω) 与 D′( Ω) 时 , 如果限于讨论实值函数 , 则应该用欧几里得配对〈f , φ〉, 这时有
〈λf , φ〉=〈f ,λφ〉= λ
〈f , φ〉 (λ为实数 ) .
1
仿此 , 在讨论求导运算时 , 我们一般都引用 D = , 从而有定义 (23) . 而在 D ( Ω) 和 D′( Ω) 中则
i
有
α | α| α
〈 f , φ〉= ( - 1 ) 〈f , φ〉 .
n
但是“乘以函数”的运算在 D′( Ω) 和 S′( R ) 中是不一样的 . 对于 D′( Ω) 的情况 , 任给 a( x )
∞
∈ C ( Ω) , 我们定义 a( x ) f ( x ) , f ( x ) ∈ D′( Ω) 如下
〈a( x ) f ( x ) , φ( x )〉=〈f ( x ) , a( x ) φ( x )〉, φ∈ D ( Ω) .
这是因为不论 a( x ) 在 | x | → + ∞时性态如何 , a( x ) φ( x ) 仍具 有紧支 集 . 因 此 , 对任意 f ( x ) ∈
D′( Ω) , 可以定义 a( x ) f ( x ) , 从而我们称 a ( x ) 为 D′( Ω) 乘子 . 但是对 于 S 空间 则情况 不同 :
∞ n n
对任意 a( x ) ∈ C (R ) , a ( x ) φ( x ) 不 一 定 在 S ( R ) 中 , 所 以〈 f , aφ〉没 有 意 义 . 这 就 是 说 ,
n
S′( R ) 中的乘子问题要另行处理 .
n p n n
现在进入本节的主题 : S′(R ) 上的傅里叶 变换 . 前面我 们已经看 到 L ( R ) S′(R ) , 所
n
以可以希望我们得到的结果将要包括前两节的内容 , 即我们将首先一般地定义 S′( R ) 上的傅里
n n - 1
叶变换 , 并且证明 F : S′(R ) → S′( R ) 是 一个 线 性 同构 : F 与 F 都 是 连续 的 . 然 后 证明 对 于
n p
S′( R ) 的子空间 L , 这个定义就是前两节给出的古典的定义 , 而 F 之同构性质恰好体现在反演
n
公式上 . 至于 S′( R ) 上傅里叶变换的一般定义则依靠前面讲的 ( 18 ) 式 , 其实也就是 把一切困 难
“转移”到试验函数空间 S 上去 .
3 48 第五章 傅里叶级数与傅里叶积分
^ 也是 S 函数 , 若 f ∈ S′( R ) , 则因傅里叶变换 F : S (R ) → S ( R ) 是
今设 φ∈ S (R ) , 于是φ
n n n n
^ 只有 一 个 φ 与 之相 应 , 因 此〈 f , φ
线性同 构 , 对 任 一个 给 定 的φ ^〉是 φ 的 线性 泛 函 . 又 因 F 与
F
- 1 n n
^ k →0 in
: S(R )→ S(R ) , 都是连续的 , 故若有一串 φk ∈ S (R ) , 但 φk →0 in S (R ) , 则φ
n n
n
^ k〉→ 0 , 即是说〈f , φ
S( R ) , 因此〈f , φ ^ k〉其实是 φ∈ S ( R ) 上 的连续线 性泛函 , 因 此必存 在唯 一 n
n
^〉=〈g , φ〉 .因此我们给出
的 S′(R ) 之元 g∈ S′(R ) , 使〈f , φ
n
定义 4 上述 g∈ S′(R ) 称为 f ∈ S′(R ) 之傅里叶变换 , 并记为 ^
n n n
f . 因此 S′(R ) 广义函数 f
之傅里叶变换 ^
n
f 仍为一 S′(R ) 广义函数而定义如下 :
^〉=〈f^ , φ〉 .
〈f , φ
(24)
显然 , F : f → ^
f 是连续映射 .
注 我们是以欧几里得配对作为定义 4 的基础的 , 现在 f 与 ^
f 均可 能为复值 函数 , 故本来 应
该采用埃尔米特配对 , 但因埃尔米特配对 ( f , φ) 对后一变元是共轭线性的 , 故对复常数 C1 与 C2
应有 ( f , C1 φ1 + C2 φ2 ) = C
1 ( f , φ1 ) + C
2 ( f , φ2 ) . 这时 , 定义 4 需 要作一 些改 动 , 我们这 里就 不
讲了 .
n p 1 n
现在回到 S′(R ) 的子空间 L . 先看 p = 1 的情况 . 于是设 f ( x ) ∈ L (R ) , 由前所述
^ 〉= ∫ f ( x ) φ^ ( x ) d x =∫f ( x ) d x∫φ(ξ) e
- iξx
〈f , φ dξ
n n n
R R R
- iξx
= f ( x )φ(ξ) e d xdξ
n n
R ×R
∫φ(ξ) dξ∫f ( x ) e
- iξx n
= d x , φ∈ S (R ) .
n n
R R
1 n n
因为 f ( x ) ∈ L (R ) , φ(ξ) ∈ S( R ) , 可以应用富比尼定理而得到最后一个等式 . 这个等式
~
1 n
我们这样来看 : 由 f∈ L 作为 S′( R ) 之元的傅里叶变换 ( 变 换的结果 我们仍记 为 f ) 之 定义 , 即
∫f ( x ) e
- iξx n
由积分 d x 生成的 S′(R ) 之元 . 因此
n
R
~
n
f 作为 S(R ) 上之连续线性泛函
∫
- iξx n
= f ( x)e d x 所生成的 S (R ) 上的连续线性泛函 .
n
R
∫f ( x ) e ∫f ( x ) e
- iξx - iξx
注意 , 我们在上一节就已讲过 d x 作为一个积分是绝对收敛的 , 因此 dx 确
n n
R R
= f 之古典的傅里叶变换 ( 我们记为 ^
n
f ) 生成的 S′(R ) 之元 .
n 1 n
在这个意义下我们说 S′(R ) 傅里叶变换是 L ( R ) 傅里叶变换的推广 . 并且不必再多用一个 记
~
号 f 而都记作 ^
f .
2 n
其次若 f ∈ L (R ) , 这时若令
f( x ) , | xj | ≤ N , j = 1 , 2 , … , n ,
fN ( x ) =
0, 其它 x ,
于是 f N ( x ) → f ( x ) in L ( R ) . 按 古 典 的 傅 里 叶 变 换 理 论 , 古 典 的 傅 里叶 变 换 ^
2 n
f N (ξ) 在
L (Rξ ) 中有极限 , 这就是 ^
2 n 2 n
f (ξ) , 它仍是 L (Rξ ) 函数 . 普兰舍利 定理告 诉我们 , 古典 的傅里叶 变
换是一个酉算子 .
n
现在转到 S′(R ) . 首先可见
〈f^N , φ〉=〈f N , φ
^ 〉 .
fN = ^
f N . 但当 N→∞时 , f N → f in L ( R ) , 所以 ^
fN → ^
2 n 2 n
于是仍照上面的讲法 珘 f in L (R ) .
n n
不过若把 f N 作为 S′(R ) 之 元 , f N → f 必 导致珘
f N 在 S′(R ) 中 有极限 . 由定义 容易 看出 , 珘
fN 的
n n
S′(R ) 极限即 f 作为 S′( R ) 之元之傅里叶变换 , 记作 珘
f . 于是我们又得到
n n
f ( 作为 S′(R ) 之元 ) 的 S′(R ) 傅里叶变换 珘
f
= ( f 之古典的傅里叶变换 ) ^
n
f 所生成的 S′(R ) 之元 .
n 2 n
所以我们也说 S′(R ) 傅里叶变换是 L (R ) 的傅里叶变换的推广 , 而且我们仍使用同一记号 .
1 n 2 n
从这样的讨论中 , 读者可能会有一个感觉 : 至少在 L (R ) , L (R ) 情况下 , 广义函数理论并
^^ - n n
→ f →乘以 (2π) →反射→ f .所以 , 在 S( R ) 中的反演公式可以写成
^^
f = (2π) ˇ
n
f .
n
现在我们要对 S′(R ) 证明同样的结果 :
- 1 n n
定理 6 F 与 F 都是 S′( R ) 到 S′(R ) 的连续的线性同构 , 而且
^^
f = (2π) ˇ
n n
f, f∈ S′( R ) . (27)
n n n
证 F 是连续的线性映射 : S′( R ) → S′( R ) 已 经明白 . 现 设 f ∈ S′(R ) , 对于任 意的 φ∈
n
S( R ) 有
^^
^ φ〉=〈(2π) ˇ
〈f , φ〉=〈f , φ〉=〈f , ( 2π) ˇ
^ f , φ〉 .
n n
- 1 n n
于是 (27) 得证 . 因此 F 是由三个由 S′( R ) 到 S′( R ) 的连续线性映射合成 ( 两次傅里 叶变换 ,
再加一次反射 ) , 所以自己也是连续线性变换 . 至于傅里叶变换已经由定理 2 得知它 是连续线 性
- 1 n n
映射 . 总之 , F , F : S′( R ) → S′( R ) 都是连续的线性同构 . 定理证毕 .
推论 7 对于逆傅里叶变换有
( i) 线性性质 : 自明 ;
( ii) 平移与放大 :
- 1 ixh - 1
F (τh f ) ( x ) = e F ( f)( x), (28a)
- 1 1 -1 x
F ( f (λ・) ) ( x ) = n F ( f) ; ( 28b)
λ λ
( iii) 求导与乘以自变量
- 1 α | α| α - 1
F ( Dξ f ) ( x ) = ( - 1) x F ( f ) ( x) , (29a)
( ^f ) ( x ) .
- 1 β β - 1
F (ξ f ) ( x ) = Dx F ( 29b)
这些推论我们都不来证明了 .
n n
现在要问关于 S (R ) 中的傅里叶变换的定理 3 , 对 S′( R ) 的傅里叶变换有无对应定理 ? 其
实 (18) 式现在就是以欧几里得配对为基础的定义 4 . 也就是如 何求 F 的转 置算子 . ( 19 ) 式则 可
以说就是以埃尔米特配对为基础 , 求 F 的伴 算子 . ( 20 ) 比较 困难 , 它涉 及如 何定 义 两个 广义 函
数 f 与 g 的卷积 .
广义函数的卷积是一个困难的问题 , 我们这里不打算多讨论它 , 但想从形式推导着手指出其
∫ f ( t ) g( x -
n
困难所在 . 如果 f ( x ) , g( x ) 作为 D′(R ) 之元其卷积仍可用 ( f * g) ( x ) = t) d t
§3 急减函数与缓增广义函数 3 51
n
来定义 , 则对于 φ( x ) ∈ D (R ) 应有
〈f * g , φ〉= f ( t ) g( x - t ) φ( x ) d td x
= f ( t ) g( y ) φ( t + y ) d yd x
∫ f ( t ) d∫
= t g( y ) φ( t + y ) d y
∫f ( x)e
- iξx n
里叶变换 d x , 不论按古典意义去 讨论还 是按 S′(R ) 意义去 理解 都是一 致的 . 按 古
n
R
1
∫^f (ξ) e dξ一般是不成立的 , 因为 ^f (ξ) 不一定可积 ,
iξx
典意义去讨论时 , 我们知道 f ( x ) = n
(2π) n
R
n
所以上式一般而言是不对的 . 那么 S′( R ) 理论是不是可以给我们什么帮助 呢 ? 很遗憾 , 帮助 不
1
∫
iξx 1
同我们愿意接受 δ( x ) = n e dξ那样 , 也许 我们还 可以 把它 解释为 振荡 积分 , 但是 L 函
( 2π)
2
数的傅里叶变换究竟有些什么特性 足以 刻画 它 , 这 个问 题是 无法回 避的 . L 的 情况 好一 些 : 当
是有紧支 集 的 , ^f
N 则 一 定 没 有 紧 支 集, 它 是 一 类 增 长 性 受到 严 格 限 制 的 整 函 数 ) . 至 于
n
S′( R ) 中的其它元素问题就更多 了 . 有 一种 错觉 , 以为 有了 广义 函 数理 论 , 傅里 叶 积分 的任 何
n
困难都迎刃而解了 . 事实当然不是如此 , 有了 S′(R ) 理 论 , 能够 给许 多出现 在量 子物理 中的 奇
∫
- n iξx
怪的对象以合理的解释 , 能算出一些很难算出的傅里叶变换 , 例如 δ( x ) = (2π) e dξ是什么
宁可说 , 大约二百年前傅里叶所开创的数学分支———现在通称为调和分析———一直在蓬勃发展 .
本章的目的只是为读过微积分的读者提供一个简明的介绍 .
1 2 1 2 n
我们还是想就 L 与 L 中傅里叶变换的反演公 式说几句 话 . L 与 L 函数 都是 S′( R ) 之
元 . 因此 ^f = (2π) ˇ
f 都是成立的 . 当 f∈ L 时 , ^f (ξ) =
∫
n 1 - iξx
f ( x) e d x 只是一个连续函数 , 而且
n
ξ→∞时趋于 0 . 因此虽然仍是一 个 S′(R ) 广 义函 数 , 其傅里 叶变 换却 不能 按古 典 的勒 贝格 积
^f ( x ) =
1
∫^f (ξ) e ∫^f (ξ) e
- iξx n iξy
d x = ( 2π) ・ n d y|y= - x .
(2π)
^^
所以 , f ( x ) = (2π) ˇ
n
f ( x ) 就意味着
1
∫^f (ξ) e
iξx
n d x = f ( x) .
( 2π)
此式不论在 S′意义下还是在勒贝格可积函数意义下都对 . 所以有
推论 8 若 f ( x ) ∈ L (R ) , 且 ^f (ξ) ∈ L (R ) , 则以下的反演公式成立 :
1 n 1 n
∫^f (ξ) e
1 iξx
f ( x) = n dx .
( 2π)
^f (ξ) =
∫ ∫
iξx iξx
f ( x ) e d x = l .iN →.m . fN ( x )e d x .
∞
义下都相同 :
^^
. ( ^f )
f ( x ) = l .i .m∫ ∫^f (ξ) e
iξx - iξx
N (ξ) e dξ= dξ.
N→ ∞
^^
由于 f ( x ) = ( 2π) ˇ
n
f ( x ) , 所以
^
∫^f (ξ) e ^
- iξx n
dξ= f ( x ) = (2π) f( - x ) .
于是有
2 n 2
推论 9 若 f ( x ) ∈ L (R ) .则不论在 S′意义下还是在 L 意义下均有
1
∫^f (ξ) e
iξx
f ( x) = n dξ .
( 2π)
n ∞
最后余 下 一 个 问 题 , 即 S′( R ) 乘 子 问 题 . 我 们 要 问 , 什 么 样 的 C 函 数 a ( x ) 与 任 一 个
n n
S′( R ) 广义函数 f ( x ) 之乘积仍 是 S′( R ) 广义 函 数 ? 这 类 a ( x ) 就称 为 S′乘 子 . 我 们 知道 ,
∞ n n n
a( x ) f ( x ) 应由下式定义 : 当 a∈ C ( R ) , f ∈ S′(R ) , φ∈ S( R ) 时 ,
〈a f , φ〉=〈f , aφ〉 . (30)
n ∞
为使此式有意义 , 就应要求 aφ∈ S( R ) . 因此 a( x ) ∈ C 是必不可少的条件 . 但仅此还不够 , 还
§3 急减函数与缓增广义函数 3 53
2 2
| x| - | x| / 2
需要 a( x ) 在 ∞ 处 增 长 不 能 太 急 , 例 如 a ( x ) = e 一 定 不 行 . 因 为 φ( x ) = e 显然 是
2
n | x| / 2 n
S( R ) 函数 , 读者自己可以证明 , 但 aφ= e 显然不在 S (R ) 中 , 这都是因为 a( x ) 是指数增长
的原故 , 于是我们有
∞ n n n
定理 10 设 a( x ) ∈ C (R ) , 对任一 φ( x ) ∈ S( R ) , 均有 a( x ) φ( x ) ∈ S( R ) 的充分必要
条件是 : 对任意重指标 α, 均存在一个多项式 Pα ( x ) , 使
α
| a( x ) | ≤ | Pα ( x ) | . (31)
n
以下我们记这种 a( x ) 所成的空间为 OM (R ) .
∞ n n
于是我们来看 S′乘子空间 : a( x ) ∈ C , 对一切 f ∈ S′( R ) , a ( x ) f∈ S′(R ) , 我们有
n n
定理 11 S′(R ) 乘子空间即 O M (R ) .
这里的几个定理我们都不给证明了 .
第六章 再论微积分的基础
§1 实 数 理 论
上面证明的就是这件事 .
这里附带提醒一下 , 当我们说“ 找到一个有理数序 列{ an }”时 , 这里的 an 可 以按朴素 的有 理
分数 q p 的意义来理解 , 而说 nlim an = a 时 , an 一定是指常驻序列 { an , an , … , a n , …}的等价类 .
→∞
1
证 由推论 1 , 对 { an } 中的每一 个实数 an 都可以找 到一个有 理数 a′
n , 使 | an - a′
n | < ,这
n
1 1
样一来 , | a′ m | ≤ | a′
n - a′ n - an | + | an - am | + | am - a′
m | < + + | a n - am | , 对 任一 ε> 0 , 由
n m
ε
{ an } 为柯西序列可知 , 一定有 N (ε) 在 , 当 n , m > N (ε) 时 | am - an | < , 我们还可以取 N (ε) >
3
3 1 1 ε
, 于是当 n , m > N (ε) 时还有 , < , 因此当 n , m > N (ε) 时
ε n m 3
3 60 第六章 再论微积分的基础
1 1
| a′
n - a′
m | < + + | an - am | < ε.
n m
*
因此 , { a′
n }是一个有理数的柯西序列 , 由基本定理Ⅰ 及推论 1 即有
lim ( an - a) = nlim ( an - a′
n ) + lim ( a′
n - a) = 0 .
n→ ∞ →∞ n→ ∞
证 现在我们用反证法证明 { an } 是柯 西序 列 . 若不 然 , 对 于某 一个 ε0 > 0 , 不 论 N 取多 么
大 , 其后必可找到 an 和 an′ ( n′> n ) 使 an′ - an = | an′ - an | > ε0 .按此法任取一个 N 1 , 于是有 an 1
和 an′1 ( n′
1 > n1 ) 使 an′ - an > ε
1 1
1 , 使其后有 an 和 a n′ 使 an′ - an
0 .然后取 N (ε) = N 2 > n′
2 2 2 2
>
ε0 .这样必可找出 an k 和 an′k ( n′
k > nk ) 而 an′ - an > ε0 .而且
k k
+ ( an 2 - an′1 ) + ( an′1 - an 1 ) + an 1
所以由上式
an′k ≥ kε0 + an 1 .
lim an = c .
n→ ∞
定理证毕 .
当然 , 对于有界的单调下降序列 , 本定理也成立 .
定理 4 有界集必有确界 .
证 我们只证有界集 A 必有下确界 inf A = m . 为方便计 , 用十进小数来表示 A 的下界 , 于
是先设 m0 是整数 , m0 是 A 的 下 界 , 但 m0 + 1 不 是 下 界 .取 m1 为 0 到 9 间 的 某 个 数 字 , 使
m0 + m1 / 10 是 A 的下界 , 但是 m0 + ( m1 + 1 )/ 10 不是下界 .确定了 m1 以后再看小数点后的下
m1 m2 m1 ( m2 + 1)
一位 .再取一个整数 0≤ m2 ≤9 , 使 m0 + + 2 是 A 的 下界 , 但 m0 + + 2 不是 下
10 10 10 10
界 . 仿此 , 可以得到一个无尽十进小数 m0 . m1 m2 … mk … ( 若从某个 k 起 mk + 1 = mk + 2 = … = 0 ,
我们实际上得到的是一个有尽小数 .但是我们仍然视这为无尽小 数 ) .它的 任何“ 一段”m0 . m1 …
mk 都是下界 , 而 m0 . m1 … ( mk + 1) 不是下界 ( 不过如果 mk = 9 , mk + 1 = 10 , 就表示 小数中要 进
一位 ) .但是无尽十进小数必是一个柯西 序列 .因 此由 基本定 理Ⅰ , 它 表示 一个 实数 c, 今证 c 是
A 的下确界 .
任取 A 中一元 a∈ A , 由于 m0 . m1 … mk 是下界 , 所以
m0 . m1 … m k ≤ a .
令 k→ + ∞即有
c≤ a .
所以 c 是 A 的下界 .为了证明它是下确界 , 我们再取任意数 d > c, 今证 d 必不是下界 .因为 d 的
十进小数 n0 . n1 … nk …中至少有一位大于 c 的十进小数的 相应数字 , 设 n i 中第一个 大于 m i 的
是 nk , 即 nk ≥ mk + 1 , 所以
d≥ n0 . n1 … nk ≥ m0 . m1 … ( mk + 1 ) .
但是右边必非 A 之下界 , 所以 d 也不是 A 的下界 , 于是 c = inf A .
同样可以证明上有界集必有上确界存在 .
还有一些重要的定理 , 因为它们 是关 于 实数 空间 R 的 另 一重 要问 题———紧性 问题 的 , 我 们
将在下面再讲 . 我们现在还是把涉及完备性的话说完 .
定理 2~4 与 基本定理 Ⅰ是等 价的 : 即是说 , 不 但可以 由基本定 理Ⅰ证 明定理 2 ~ 4 , 其实 由
定理 2~4 的任何一个也可以证明基本定理Ⅰ和另两个定理 . 其原因是 , 这 些结果都 是以不同 方
式回答了一个问题 : 有理数系 Q 的空隙应该怎样去刻画并 填补起 来 .例 如区间 套定理讲 的就是 :
一个有理数区间套若其各区间长度趋向 0 , 可能会出现在有理数系 Q 中找不到一个公共 元 , 这 样
就出现了空隙 , 而定理 3 告诉我们 : 没有关系 , 有 了这样的 区间套 , 就有 一个柯 西序列 例如 { an } ,
它定义一个新数 ( 实 数 ) a , 把这个 a 填到空 隙里去 , 这个 区间套就 有了唯 一的公共 点 a , 而区 间
套定理就得到了证明 .很自然 , 我们也可以走另 一条路 , 如 果某 个有理 数区 间套出 了空 隙———即
3 62 第六章 再论微积分的基础
设有 珓
r∈R, 则由 Q 在 R 中稠密 , 必可找到 Q 中一个序列{ an } , an →珓
r , 这个{ an } 一定是柯 西
序列 . 因此由 R 之定义 , { an }定义一个元 r∈R, 我们令珓
r 对应于 r , 反过来也一样 , 任给一个 r∈R
也必有一个 珓
r∈R 与它对应 .所以 R 与 R 之间是一一对应的 .而且 若 r~珓 s , 则 r + s~珓
r , s~珓 r +珓
s,
r・珓
r・s~珓 s , 而且域中的运算在此对应下是不变的 . 所以 R 与 R 是 同构 的 . r > s 必有珓
r >珓
s, 所 以
[ a , b] ∪U
j= 1
j . ( 3)
证 在证明此定理之前 , 我们还是先来解释一下它的意义 “
. 覆盖”的含意 很简单 , 这里就 是
说 [ a , b] ∪U
λ
λ .需要注意的是 , { Uλ }不一定是可数多个 Uλ ( 若 Uλ 为可数多 个叫可数 覆盖 , 这
∪U
k
k 是明显的事 , 但是 { Uk }中决没有 R 的有限子覆盖 .因为若要覆盖 R, 就需覆盖 其上的无 穷
( x0 - δ, x0 + δ) 内 ( 准确些说是在 Ux 0 = ( x0 - δ, x0 + δ) ∩ K 内 ) , 有
f ( x0 ) - ε0 < f ( x ) < f ( x0 ) + ε0 . ( 4)
于是{ U x 0 }( 参数 λ现在就是 x0 , Λ 就是 K ) 成为 K 的一个开覆盖 . 而因 K 为 紧 , 可 以找到一 个
有限子覆盖{ Ui } i = 1 , 2 , … , k . 在 U i 中 ,
mi = f ( x i ) - ε0 < f ( x ) < f ( xi ) + ε0 = M i i = 1 , 2 , … , k . ( 5)
令 M = 1 max Mi , m = 1 ≤min mi , 则知在 K 上
≤ i≤ k i≤ k
m≤ f ( x ) ≤ M .
因此 f ( x ) 有界 .
* *
既有界必有上下确界 , 令 μ为其上确界 , 我们用反证法证明一定有一点 x ∈ K 使 f ( x ) =
* 1
μ . 如果这样的 x 不存在 , 则在 K 上必有μ - f ( x ) > 0 . 令 φ( x ) = , 则 φ( x ) 在 K 上
μ- f( x )
1 1
连续 , 而如上所证 , φ( x ) 在 K 上 必有 上 界λ, ≤λ.因 此 f ( x ) ≤μ - < μ在 K 上成
μ- f( x ) λ
立 , 因此 μ不是上确界 .命题得证 .
我们要看一下紧性在这个证明中起的作用 .关键在于 ( 4) 式本来对一切 U ( x0 ) 成立 , 所以 在
任一 Ux 0 中有 m ( x0 ) ≤ f ( x ) ≤ M ( x0 ) . 但只要有无穷多个 x0 点 , 就有可 能有无穷 多个不同 的
δi δi
Ui = xi - , xi + ∩ K , i = 1 , 2 , … , k,
2 2
仍是 K 的开覆盖 . 取
δi
δ= 1 ≤min >0 .
i≤ k 2
= =
并且证明 , K 中任意两点珔
x , x , 只要 | 珔
x - x | < δ, 则这两点 一定位于 同一个 ( x i - δi , x i + δi ) 中 .
=
事实上 , 既然{ Ui }是 K 的覆盖 , 则 x 必在某一个 U i 中 , 不妨设在 U1 中 . 因此
= δ1
| x - x i | < δ≤ < δ1 ,
2
=
珔
x 和 x 同在 ( x1 - δ1 , x1 + δ1 ) 中 , 而由 ( 6) 式
= =
x ) - f ( x ) | ≤ | f (珔
| f (珔 x ) - f ( x1 ) | + | f ( x1 ) - f ( x ) | < ε.
所以 f ( x ) 在 K 上一致连续 .
( iii) 的证明全不相同 .它实际上与紧性无关 , 但我们还 是先利用 紧性来 证明它 .首先 我们 已
知 f ( x ) 必在两点 达到最 大值 M 与 最小值 m : f ( α) = M , f (β) = m .我们不 妨设 α< β, 并且 用
[α,β] 代替 [ a , b] .我们要证 对任 一 μ, M > μ> m , 在 [ a , b] 中 有 一点 c 使 f ( c ) = μ .为此 , 用
φ( x ) = f ( x ) - μ代替 f ( x ) , 则有 φ(α) > 0 , φ(β) < 0 , 因 此我们把 待证明 的命题改 为 : 若 f ( x )
在 [ a , b] 的两个端点异号 , 则一定存在一点 c∈ [ a , b] , 使 f ( c ) = 0 .我们 仍用 反证法 , 设 这样 的
* *
c 不存在 .任取一点 x ∈ [ a , b] , 必有 f ( x ) ≠ 0 .因为 f ( x ) 是连 续的 , 故当 δ充分小 时 , f ( x )
* * * *
在 Ux * = ( x - δ, x + δ) 中与 f ( x ) 符号 相同 .{ Ux * } , x ∈ [ a , b] 构 成 [ a, b ] 的一 个开 覆
盖 , 于是它有一个有限的子覆盖 U1 , U2 , … , Uk . 我 们不妨 将它从左 到右排列 , 而 且假设 它们 都
是开区间 , 这样 a∈ U1 , b∈ Uk 而且相 邻的 两个 Ui 必 定相 交 : Ui - 1 ∩ U i = Ii 是 一个开 区间 .在
每个 Ui 上, f ( x ) 都是不变号的, 于是在 U1 中 f ( x ) 与 f ( a) 同号 , 在 I2 中取一点 x2 , 则 x2 ∈ U1 ,
从而 f ( x2 ) 与 f ( a) 同号 .但是在 U2 中 f ( x ) 也是 不变 号的 , 而 且 x2 ∈ U2 , 所 以在 U2 中 f ( x )
也与 f ( a ) 同号 . 仿此 , 在所有的 U1 , … , Uk 中 f ( x ) 均与 f ( a) 同号 . 从而 f ( b) 与 f ( a) 同号 , 而
这与假设矛盾 , 故命题得证 .
这个命题与前两个有何不同 ? 我们仔细分析一下 .
首先 , 它利用了紧性 , 这样我们只要推理有限步即 可得到 结论 .这 与前面 说的 紧集是 最接 近
*
有限集的无限集合是一致的 .其次证明中利用 f ( x ) 连 续而且 f ( x ) ≠ 0 , 因此 , 只 要 δ充 分小 ,
f ( x ) 在 Ux * 中不变号 . 造成矛 盾的不 只是 f ( x ) 不 变号 , 更重要 的是 , U1 , … , Uk 两两 相连 , 有
公共点 xi ∈ Ui - 1 ∩ U i , 这样才会造成矛盾 . 若不是讨论 [ a , b] , 而是一般的 K , 这种 两两相连 就
可能不出现 , 例如设 K = [ 0 , 1 ] ∪ [ 2 , 3 ] , 它 是 一个 紧 集 , 于 是 由 { Ux * } 中 可 以 找到 有 限子 覆 盖
U1 , … , Uk , 很可能 U1 ∪ U2 ∪ U3 覆盖了 [ 0 , 1] , U4 ∪… ∪ Uk 覆 盖了 [ 2 , 3 ] , 而 U3 与 U4 可 能
不相交 .所以我们利用了 [ a , b] 的另一个重要特性———连通性———连通 性与完 备性、紧性一样 是
非常重要的性质 .许多重要的数学结果 ( 例如这个命 题 ) 来 自连 通性 .因篇 幅的 原因 , 我们 这里 不
再多说 , §3 将专门讨论有关连通性问题 .
总之关于实数系 R , 我们现在知道了它是 一个有 序的 域 , 它满 足阿基 米德 公理 , 而且 它具 有
完备性、局部紧性与连通性 .
§2 度量空间和赋范线性空间 3 67
§2 度量空间和赋范线性空间
∑
2
‖ x - y‖ E = ( x i - yi ) . ( 1)
i=1
此外还有例如
n
‖ x - y‖1 = ∑ i=1
| x i - yi | ,
‖ x - y‖2 = sup | xi - yi |
i
n
两个范数如果适合这样的不等式就说是等价的 .所以 , R 上一切 范数 都是 等价的 .但 是 , 我们 下
n
面只讨论欧几里得范数‖ x‖ E , 因为 只有利 用它 , 才 能最方 便地 把种 种几 何性 质赋 给 R .所 以
n
以后凡说到 R 中的范数 , 若无特别申明 , 总是 指的 这个 范数 , 而‖・‖ E 的下 标 E 以 及 诸如“ 欧
几里得意义下的”等限制语 , 如无特殊需要都一律不用 .
n n
既然讲了 R , 读者会问到 C . 应该指出 , C 可以分 成实、虚部 , 而 由两 个 R 合 成 . 这 当然 只
是一个形式的处理方法 , 而没有涉及更深层的问 题 .但 因本书 范围 不许可 我们 进入 这个领 域 , 所
以本书一直是采取这个形式的处理法 , 以下也是一样 .
n
次于 R , 我们还见到了许多函数空间 . 首 先是某 有界 闭区间 [ a , b] 上的 连续函 数空 间 . 现
在应该考虑紧空间 K 上的连续函数之空间 C ( K ) , 而不 限于 K 为 [ a , b] R . 证 明是完 全一 样
的 , C( K ) 是线性空间是自明的 , 它也是赋范的 , 因为对任一 f∈ C( K ) , 可以证明
‖ f‖ = sup | f( x)|
K
≤sup | f ( x ) | + sup | g( x ) | = ‖ f ‖ + ‖ g‖ .
K K
左方再取一次最大值 , 即有
‖ f + g‖≤‖ f‖ + ‖ g‖ .
但是 , 我们不能先在左方取最大值 , 也不能左、右方同时取最大值 , 因为这样做 , ≤关系无法保持 .
p p
其次要看可积函数空间 L ( I) , 1≤ p < + ∞ , 这时我们可以定义 f∈ L 之范数为
1/ p
∫ | f ( x) |
p
‖ f‖ L p = dx . ( 4)
I
‖ f ‖ L ∞ = ess sup | f ( x ) | .
∞ ∞ ∞
这与 C( K ) 中的范数是“一 样”的 , 所以对 于紧 集 K , C ( K ) L ( K ) . C ( K ) 有 许多 重要 性
∞
质在 L 中也都成立 , 但是终究它们是不相同的空间 .
p 2
L 空间中 L 最为重要 . 它属于这 样一种 赋范 空间 , 即其 范数 是由 内积产 生 的 , 即是 说 , 对
于这个空 间 的 任 意 两 个 元 f , g , 一 定 有 一 个 实 ( 复 ) 数〈 f , g〉, ( ( f , g) ) 与 之 对 应 ,〈f , g〉( 或
( f , g) ) 分别有以下的性质 :
定义 3 设 H 为一实的 ( 或是复的 ) 线性空 间 , 若对 任意 f , g∈ H 可以 定义 一个 实数 ( 或 复
数 )〈f , g〉( 或 ( f , g) ) 而具有以下性质 :
( i) 〈f1 + f2 , g〉=〈f1 , g〉+〈f2 , g〉, 或 ( f1 + f2 , g) = ( f1 , g) + ( f2 , g) ;
〈f , g1 + g2〉=〈f , g1〉+〈f , g2〉或 ( f , g1 + g2 ) = ( f , g1 ) + ( f , g2 ) ;
( ii) 〈λf , g〉= λ〈f , g〉 , λ∈R , 或 (λf , g) = λ( f , g) ,λ∈C;
〈f , λg〉= λ〈f , g〉, λ∈R , 或 ( f ,λg) = λ( f , g) ,λ∈C;
( iii) 〈f , g〉=〈g , f〉, 或 ( f , g) = ( g , f ) ;
( iv) 〈f , f〉≥0 ,〈f , f〉= 0 , 当且仅当 f = 0 ; 或 ( f , f ) ≥0 , ( f , f ) = 0 当且仅当 f = 0 .
则〈f , g〉( 或 ( f , g) ) 称为内积 , H 称为实 ( 或复 ) 内积空间 .
实的内积又称为欧几里得内积或欧几里得配对 ; 复的内 积又 称为 埃尔米 特内 积或埃 尔米 特
配对 . 具有这些性质的内积 ( 即配对 ) , 按以下方式在这个空间中定义范数
1 1
‖ f ‖ = [〈f , f〉] 2 或‖ f‖ = [ ( f , f ) ] 2 . ( 5)
由性质 ( iv) 知道这样定义的‖ f ‖是有意 义的 , 它 是一个 非负 实数 , 而 且适合 范数 所应具 有的 性
质 , 即定义 1 中的 ( i ) ~ ( iii) .( i) ~ ( ii ) 容易证明 , 关键是 要证明三 角形不 等式 ( iii) , 为 此先要证 明
关于内积的一个重要不等式 .
对于实内积空间 , 令 λ为任意实数 , 我们来考虑内积〈f + λg , f + λg〉, 由 ( iv) 它是非 负的 .另
一方面
2 2
0 ≤‖ f + λg‖ =〈f , f〉+ 2λ〈f , g〉+ λ〈g , g〉
2 2 2
= ‖ f ‖ + 2λ〈f , g〉+ λ ‖ g‖ .
式右是 λ的二次三项式 , 它恒非负这一事实等价于其判别式恒非正 , 即有
|〈f , g〉| ≤‖ f ‖‖ g‖ . ( 6)
(6 ) 式称为施瓦茨不等式 .
iθ
对复内积空间 , 证明比较曲折 .首先设 ( f , g) ≠0 , 它可写为 ( f , g) = | ( f , g) | e 而θ有定义 ,
iθ
令 λ= te , t 为实数 , 并考虑内积 ( f + λg , f + λg) , 它也是恒非负的 . 化简后有
2 2
0≤‖ f + λg‖ = ( f , f ) + λ( f , g) + λ( f , g) + | λ| ( g , g)
2 2 2
= ‖ f‖ + 2 t | ( f , g) | + t ‖ g‖ .
这是一个 t 的恒非负的二次三项式且 t 为实数 , 于是又有
| ( f , g) | ≤‖ f‖・‖ g‖ . (61 )
其次看 ( f , g) = 0 的情况 , 这时上式自然成立 .( 61 ) 式也称为施瓦茨不等式 .
有了这个重要的不等式就可以证明由 (5 ) 式定义的范数适合三角形不等式了 .下面我们只看
复内积空间 , 因为实内积空间中证明更容易 .
§2 度量空间和赋范线性空间 3 71
2
‖ f + g‖ = ( f + g , f + g) = ( f , f ) + 2Re( f , g) + ( g , g)
2 2
≤‖ f‖ + 2 | ( f , g) | + ‖ g‖
2
≤ ( ‖ f ‖ + ‖ g‖ ) .
n n
内积空间是最重要的赋范线性空 间 .它是 R 的直 接推 广 . 实 际上 R 也是 内积 空 间 ( 但 这
n
n 2 2 n
时一定要对 R 赋以欧几里得范数‖ x ‖ = ∑
i= 1
| xi | 才行 ) , 因为对于 x , y∈R 我们可定义 内
积为
n
〈x , y〉= ∑ i=1
xi yi .
2 n
L ( I) , ( I R ) 也是内积空间 , 其中的内积当我们限于考虑实值函数时为
〈f , g〉= ∫ f ( x ) g( x ) d x .
I
在考虑复值函数时则为
( f , g) = ∫ f ( x ) g( x ) d x .
I
这个空间有许多重要性质在第四章中 介绍 过 . 我们 现在 要提 醒 , 其 完备 性应 特别 注意 . 如果 在
内积空间中再引入完备性 , 将得到所谓希尔伯特空间 . 它是数学物理中应用最 为广泛的 空间 , 而
2
L ( I) 就是它的典型 ( 这句话的意思也将在以后明确 ) .
2 k α 2
以 L 空间为基础的索伯列夫 空间 H ( I ) = { f ( x ) ; D f ( x ) ∈ L , 当 | α| ≤ k 时} 也 是非 常
α
重要的内积空间 .这里的 D f ( x ) 是指 f ( x ) 之阶数为 | α| 的广 义函数意 义下的 导数 .这个空间 中
的内积及范数可以定义如下 :
k
∫∑D
α α
( f , g) = f ( x )・D g ( x ) d x ,
I | α| = 0
∫∑
2 α 2
‖ f‖ = | D f( x ) | d x .
I | α| = 0
k
第四章中证明了 , H ( I ) 在这个范数下也是完备的 .它也是希尔伯特空间 .
本书中 除了 种种函 数空 间外还 介绍 了一 些数列 空间 .例 如在 傅里叶 级数 一节中 就指 出 , 当
1
f ( x ) ∈ L ( [0 , 2π] ) 时 , 我们可以用它的傅里叶系数{ Cn } 来刻画 f ( x ) .这时
2π
1
∫
- i nx
Cn = f ( x) e d x , n = 0 , ±1 , ±2 , … .
2π 0
其中 c1 , … , cn , …是复数 . c 的范数定义为
∞
1/ p
∑
p
‖ c‖ l = p | cn | .
n= 1
p
它所应满足的三角形不等式就是著名的闵 可夫斯基不等式 : 对于 c = ( c1 , … , cn , … ) ∈ l 和 d =
3 72 第六章 再论微积分的基础
p
( d1 , … , dn , … ) ∈ l 有
‖ c + d‖ lp ≤‖ c‖ lp + ‖ d‖ l p .
p ∞
当 p = + ∞时 , l = l 就规定是有界数列空间 :
∞
l = { c = ( c1 , … , cn , … ) , sup | cn | < + ∞ } .
n
在其中我们也可以定义范数为
‖ c‖ l ∞ = sup | cn | .
n
2 2
l 是特别重要的 , 因为它是内积空间 . 对 c, d∈ l , 我们定义其内积如下 : 当 c, d 是实数列时
∞
当 c, d 为复数列时 ,
∞
( c, d) = ∑ n=1
cn dn .
2
这些级数的收敛性都可以由 c, d∈ l , 以及
k k
∑
j=1
cn + j dn + j ≤ ∑ | cn + j dn + j |
j= 1
k k
1/ 2 1/ 2
2 2
≤ ∑
j=1
| cn + j | ∑
j= 1
| dn + j |
得到 . 上面的不等式就是关于数列的施瓦茨不等式应用于级数∑ cn d n 的一段 .
2 2
l 和 L 一样 , 都具有完备性 , 因此都是希尔伯特空间 .
2. 度量空间的拓扑性质 以上我们 列举了 一些 在本书 中介 绍到 而且在 数学 中很有 用的 赋
范线性空间 .但是我们完全没有涉及有关极限 , 连续性 等拓扑 问题 , 而 只讨论 了这 些空间 的线 性
结构 .现在要进一步讨论拓扑问 题时 , 我们 又必 须以 R 中建立 拓扑 结构 的 方法 为模 式 . 在 R 中
研究连续性时 , 两点的距离起了重要作用 , 例如讨论由 ( a , b) R 到 R 中的连续映射 f ( x ) , 如 果
f 映 x0 ∈ ( a , b) 到 f ( x0 ) ∈R .这一段话 , 在现代数学中时常以很简单的公式表示为 :
f : ( a, b) R→R, x0 → f ( x0 ) .
f ( x ) 在 x0 点连续的定义是 : 对任一 ε> 0 必有 δ(ε) > 0 存在 , 而当
| x - x0 | < δ时 | f ( x ) - f ( x ) | < ε.
这里用的是 x 与 x0 在 x 轴 ( 它是 R, 常记为 R x ) 上的距 离 , 以 及 f ( x ) 与 f ( x0 ) 在 y 轴 ( 另一 个
R, 常记为 R y ) 上的距离 .把这些概念推广到一般 的度量空 间上去 是很容易 的事 .但 为此 , 我们 要
介绍一些名词或概念 : 我们把度量空间 X 中的以 x0 为心, r 为半径的开球{ x∈ X;ρ( x , x0 ) < ε} ,
° ( x ) ; 闭球{ x∈ X ;ρ( x , x ) ≤ε} 记为 B ( x ) .这里开 与闭 的说 法 , 以及 用 上加 一个 小
记为 B ε 0 0 ε 0
°
按照这样的定义 , 开球确实是开集 .事实上 , 若 x1 ∈ Bε ( x0 ) , 则 ρ( x1 , x0 ) < ε.现在 取 ε1 <
° ( x ) 中任一点 x * , 由三角形不等式 .
ε- ρ( x1 , x 0 ) , 则对 B ε 1
1
* *
ρ( x , x0 ) ≤ρ( x , x1 ) + ρ( x0 , x1 ) < ε1 + ρ( x0 , x1 ) < ε.
° (x )
° ( x ) , 所以 B
° ( x ) 是开集 .总之 “
从而 B ε
1
1 Bε 0 ε 0 , 开球”之“开”和“开集”之“开”是一回事 .
( iii) 有限多个开集之交仍是开集 .
证 ( i) X 为开是明显的 .至于空集也是开集是可以证明的 , 但 因涉及 到一些逻 辑方面的 问
题解释起来要费一些功夫 , 我们把它当作一个约定也可以 .
( ii) 若 x0 ∈ ∪ Uλ , 必有 某个 λ0 , 使 x0 ∈ Uλ0 , 所以 由 开集 的定 义知 , x0 有 一个 邻 域 U
λ
Uλ0 ∪U
λ
λ , 所以 ∪ Uλ 是开集 .
λ
N
° (x )
( iii) 若 x0 ∈ ∩ Uk , 则 x0 属于每个 Uk , 从而有开球 B ε 0 Uk .在有限多个正数 εk 中 ,
k
k= 1
N
° (x )
° (x )
° (x )
必有一个最小的 ε0 仍为正数 , 而对一切 k , Bε
0
0 Bε
k
0 Uk , 所 以 Bε
0
0 ∩U
k= 1
k ,而
N
知 ∩ Uk 也是开集 .
k= 1
利用开集之余集即为闭集 , 就可以得到关于闭集的相应基本定理 .
定理 3 度量空间 X 的闭集有以下的性质 :
( i) X 与 均为闭集 .
( ii) 任意多个闭集{ Vλ} 之交 ∩ Vλ 仍为闭集 .
λ
( iii) 有限多个闭集之并仍为闭集 .
证 考虑闭集之余集 , 本定理即归结为定理 2 .
注 1 最容易引起误会是全空间 X 与空集 既是开 集又是闭 集 , 岂非矛盾 ? 我们要 问为 什
么不能既是此又是彼 ? 所谓矛盾 , 由何说起 ? 实际 上 , 说一个 对象 既是什 么又 不是 什么 , 这才 是
矛盾“
, A 是开集”与“ A 不是开集”这两个命 题是矛 盾的 . 二 者之 中有一 个且 仅有一 个成 立 . 说
A 既是开集又是闭集并无矛盾 . 问题在于 , 在空间 X 中这种既闭又开的 集还有多 少 ? 这与空 间
的连通性有关 .下节我们将再讨论 .
注 2 ( ii ) , ( iii ) 两条中要注意“任意多个”与“有 限多个”的 区别 .读者 自己 容易 验证 , R 上 的
3 74 第六章 再论微积分的基础
1 1
开和闭区间分别是开集与闭集 .现在取可数多个开集 Ih = a- , b+ , a < b, 很明显它们 的
h h
∞ ∞
1 1
交 ∩ Ih = [ a , b] 是闭集而非开集 . 又看可 数多个闭集 Jh = a+ , b - , b - a > 0, 则 ∪ =
h= 1 h h h= h
0
2 1 1
( a , b) 是开的而非闭的 .h 要适合 < ( b - a) , 以保证 a + 在 b - 之左 .
h h h
有了开集和闭集的概念后 , 就可以进一步介绍其它一些重要的概念 , 首先是邻域的概念 .
定义 5 空间 X 中一点 x 的邻域 U , 即 X 的这样一个子集 : 不但 x∈ U , 还有一个含 x 的开
集 V 也含于 U 内 : V U .
我们这里讲空间 X 是指度量空间 .但是 下一 节我们 还会 介绍 另一类 更广 泛的空 间 : 拓扑 空
间 , 其中一点之邻域的定义仍然与上逐字相同 , 所以我们就只讲“空间”而不特 指度量空 间 . 下 面
的定理 4~5 , 定义 6~7 也有类似情况 , 请读者注意 .
对于一点的邻域 U , 我们只要求它包含一个开集 V 而 x 属于 V , 而不要求本身为开 , 这样做
在讨论一些数学问题上会带来方便 .如果 U 本身也是开集或闭集 , 就称它为开或闭邻域 .开邻 域
特别值得注意 .因为开集 U 是其中任何 一点的开邻域———我们 只需把定义 5 中的 V 取为 U 本
身也可以看出来了 .许多书上讲邻域总是指的开邻域 , 而且直接就说 , 一点 x 的邻 域就是含 x 的
任一开集 , 这样做在许多问题上会带来方便 .
我们把一点 x 的所有邻域之集合记作 N x , 称为 x 点之邻域系 . N x 是 X 的子集族 , 是“集 合
的集合”, 它的元素不是 X 之点 , 而是 X 的一种子集 U : U 是 x 之邻域 . N x 自然不是空 的 , 就 是
说 , 每一点 x 都有邻域 , 这当然是平凡不足道的 , 因为全空间 X 是任一 点的邻域 , 这时 只要取 U
= V = X 即可用定义 5 来验证 X 是 x 的邻域 , 关于邻域的基本性质 , 我们有下面的
定理 4 空间 X 中任一点的邻域系 N x 有以下性质 :
( i) 若 Uλ ∈ N x , 则 ∪ Uλ ∈ N x ;
λ
N
( ii) 若 U1 , … , U N ∈ N x , 则 ∩ Uk ∈ N x ;
k=1
c
( ii) x 称为 A 之外点 , 如果 x 是 A 之余集 A 之内点 ;
( iii) 若 x 既非 A 之内点 , 又非 A 之外点 , 就说 x 是 A 之边界点 .
很明显 , 若 x 是 A 之内点则 x∈ A( 因为 x 属于它自己的任一邻域 ) ; 若 x 是 A 之外点 , 则 x
| A .若 x 是 A 之边界点 , 则既可能 x ∈ A , 也可能 x| A .
我们还可以这样来描述内点、外点与 边界 点 : 如 果 x 有某 一开 邻域 全含 于 A 中 , 则 x 是 内
点 , 这一点已在 ( i) 中表 述了 .若 x 有某 一开邻域 完全不 在 A 内 , 即与 A 完全不 相交 , 则 x 是 外
点 .若 x 之任一开邻域中都既有 A 中之点 , 也有 A 外之 点 , 则 x 是边 界点 .请读 者注 意现 在“ 某
2
一”改成了“任一”, 如果仍然沿用“某一”就一定会错 . 例如设 A 是 ( x , y ) 平面上 的单位 圆 : x +
<
2 2 2
y ≤1 , 由定义适合 x + y => 1 的 ( x , y ) 分别是 内点、边界点 和外点 .但是内 点 ( 0 , 0 ) 有“某 一”邻
域 U ( 例如以 (0 , 0 ) 为心 , 2 为半径的圆 ) , 其中既有 A 中之点又有 A 外之点 .还要注意 , 边界点的
“边界”二字与我们直观的理解很不相同 .例如 , 设在 A 中除去一个内点 x0 , 并记 A1 = A \ { x0 } ,
则 x0 成了 A1 的边 界点 , 因 为它的 任一 邻域中 , 既有 A1 中之点 ( 这是 明显 的 ) 也 有 A1 以外 的
点 , 即 x0 本身 .同样 , 若取 A 的一个外点 x0 附加到 A 上成为 A1 = A∪{ x0 } , x0 现在是 A1 的一
个孤立点了 , 但是它也是 A1 之 边界点 , 因为在它的任一 邻域中都既有 A1 中 之点 , 即 例如 x0 本
身 , 也有 A1 外的点 , 即与 x0 充分接近而又与 x0 不同的点 .这里用“充分接近”的说法 , 一方面可
以从度量的意义来理解它 , 即有一个很小的 δ> 0 , 而
0 < ρ( x , x0 ) < δ.
但我们上面又说了 , 这里的讲法应该对于一般的拓扑空间也适用 , 所以详细地讲应 该是 : 既然 x0
是 A 之外点 , 则必有 x0 的一个邻域 U∩ A = , U 中与 x0 不同的点就是上面说 的“ 与 x0 充 分
接近而又与 x0 不同的点”.
边界点 中既 有这些 麻烦 事 , 则它 与例如 格林 定理 , 柯西 定理 中讲 的某区 域的 边界就 不相 同
了 .那里讲的某区域的边界 , 例如一条曲线、一个曲 面 , 我们 应该换 一个 名词 , 称为 边缘 . A 之 边
界点之集合记为 bd A , A 的边缘记 为 A .但是 它们 的 英文 术语 是相 同的 即 为 boundary, 这里 作
这样的划分并非过分谨慎 , 而是有重要意义的 . 关于边缘的问题我们将在下一章详细讨论 .
从内点 , 外点和边界点概念可以给出下面几个重要概念
。
定义 7 和定 理 5 设 A 为 空间 X 之 子集 , 则我 们称 A 之内 点的 集合为 A 之内域 , 记为 A
c c c
或 in t A ; A 之内域的余集 [ int ( A ) ] 称为 A 之闭包 , 记为 A ; 边界点 之集合称为 A 的 边界 , 记
。
作 bd A . A 是含于 A 内的一切开集之并 , 所以是含于 A 内的 最大开集 ; A 是一切包 含 A 的 闭
集之交 , 所以是包含 A 的最小闭集 ; bd A 也是闭集 .
。 。
证 先证 A = ∪ Uλ , Uλ 是含于 A 之开集 , 设 x0 ∈ A , 即 x0 是 A 之内点 .由内点 之定义 ,
λ
。
x0 必属于某一开集 ( 即 x0 之开邻域 ) Uλ0 A .所以 x0 属于 ∪ Uλ , 而有 A ∪U λ .设 x0 属于
λ λ
。
右方 , 则 x 属于某一开集 Uλ A , Uλ0 即是 x0 之 邻 域 , 所 以 x0 是 A 之 内点 , 即 x0 ∈ A , 因 此
0
3 76 第六章 再论微积分的基础
。 。
∪ Uλλ
A , 比较这两个结果即得 A = ∪ Uλ .
λ
c
取 A 之余集 A 并作以上推理即得关于 A 的相应结论 .关于 bd A 的结论自明 . 证毕 .
。 。 c
由这个定理即得 A 是开集 , A 是闭集 , 而 bd A = X \ ( A ∪in t ( A ) ) 是闭集 , 而且还看到
。
A = A ∪bd A = A ∪bd A ,
。
A = A \ bd A = A \ bd A .
这些结论的证明都略去了 .
再提一下 , 定义 7 和定理 5 也适用于一般的拓扑空间 .下面我们讨论有关极限和连续性的问
题却只限于度量空间 .在通常的微积分教程中讨论极限和连续问题时 , 基本上是讨论数列与函数
的问题 .说是“ 基本上”是因为有重要的例外 , 如积分 和的“ 极限”就 不是这 两种 类型 .对于 一般 的
度量空间 X , 我们暂时也只限于两种情况 , 即序列 { x n } , x n ∈ X ( 现在 我们 不说数 列 , 因为 x n 一
般地并不是数 ) 和由一个度量空间 X 到 另 一个 度量 空间 Y 的 映射 .我们 先讨 论后 一个 情 况 .设
X 和 Y 中的度量分别是ρX 和ρY .若 f : X→ Y , x0 → y0 , 我们说 f 在 x0 连续即是对任一 ε> 0 ,
必可找到 δ(ε) > 0 使当 ρX ( x , x0 ) < δ时 ,ρY ( f ( x ) , y0 ) < ε.这里 要注 意 , 若 f ( x ) = y , 我们 说
y 是 x ( 在 f 下 ) 的像 , 而 x 是 y 的原像 ( pre-image) . X 中的每一个 x 在 f 下只有一个像点 f ( x )
在 Y 中 , 但 Y 中一点 y 在 f 下的原像则不一定只 有一 个点 .这与 函数 y = f ( x ) 必 须是单 值的 ,
但同一个 y 却可以有许多不同的 x 与之相 应的 是一 样的 .如果 同一 个 y 原像 只有一 点 , 则我 们
- 1 - 1
会得到由 Y 中 f 的值域 ( 下面暂记为 Y , 其 实不准 确 ) 到 X 的另 一个映 射 f , Y→ X, f 称为
- 1
逆映射 , 亦即反函数 .但在 y 之原像多于一个点时 , 我们时常也使用 f ( y) 这个记号 .这时 , 它表
示一个集 , 其中的点 , 而且在此集外再无其它点 , 被 f 映到 y .回 到连续性 问题 , 上述“ε—δ定义”
就是说 : Y 中的球ρY ( y , y0 ) < ε的原 像 必在 X 的 某个 球 ρX ( x , x0 ) < δ内 . 这 当然 不 是说 , 球
Bε ( y0 ) 中所有的点都是球 Bδ ( x0 ) 中某 点的像 .而是说 , 若球 Bε ( y0 ) 中一点 , 如果在映射 f 的值
域中的话 ( 当然 , 这就意味着 Bε ( y0 ) 中有些点可能根本不在 f 的值域中 .如果对这种点也要使用
- 1 - 1
f ( y ) 的记号的话 , 则 f ( y) = ) , 则这个点一定有原像在 Bδ ( x0 ) 中 ( 当然 , 这不 是说所有 的
原像点都只在 Bδ ( x0 ) 内而不能在其外 , 这里 只说在 Bδ ( x0 ) 内有 原像 之点 , 而且 Bδ ( x0 ) 必被 f
映入ρY ( y, y0 ) < ε内 ) .我们看看函数 y = f ( x ) 的两个例子就明白了 .常值函 数 y = y0 , 即 f ( x )
≡ y0 , 当然在任一点 x0 都连续 .但是 ρX ( x , x0 ) < δ即 | x - x0 | < δ之像却只是ρY ( y, y0 ) < ε即
2
| y - y0 | < ε中一个点 y0 , 而不是整个区间 .又如 y = x 在 x = 2 处连续 , 而 x = 2 的像是 y = 4 ,
但是 4 附近的 y 点之原像除了有一个在 2 附近以外 , 还有一个在 - 2 附近 .从上面讨 论的例子 中
可以看到 , 度量在其中并不起作用 , 我们可以这样来表述映射 f : X → Y , x0 → y0 点 处的连续 性
如下 : 任取 y0 在 Y 中的一个邻域 V , 必有 x0 在 X 中一个相应的邻域 U , 被 f 映入 V 内 : f ( U )
V .所以 , 一不是说 f ( U ) 可以把 V 填满 , 或说 f 把 U 映到 V 上 , 二不 是说 , U 以外没 有其 它
的点也被 f 映入 V 内 . 同样可以考虑 f : X → Y 在 X 上连续的定义 .当然会问如果只需讨论 f 在
X 的一个子集合上连续该怎么 办 ? 这 一点将 在下 一节回 答 .现 在我 们说 f : X → Y 在 X 上连 续
- 1
的充分必要条件是 : Y 中每个开集 V 在 f 下的原像 f ( V ) 都是 X 中的开集 .这一点我们就不来
§2 度量空间和赋范线性空间 3 77
证明了 .
读者很容易看到 , 关于映射连续性的讨论很容易推广到一般的拓扑空间中去 , 但是下面关于
序列收敛的讨论却本质地只能限于度量空间 .
定义 8 设 X 为一度量空间 , { xn } X .若有一点 x0 ∈ X , 使得 对任一 ε> 0 均有 N (ε) > 0
存在 , 而当 n > N 时 , ρ( x n , x0 ) < ε, 就说{ xn } 收敛于 x0 , 记作 lim x n = x0 .
n+ ∞
于是我们面临的问题当然是 , { xn }收 敛于 x0 的 条件 是什么 .当 然我 们就 想到 , 应该 把有 关
R 的概念和结论都搬过来 .于是有
定义 9 设 X 为一度量空间 , { xn } X , 若对任一 ε> 0 均有 N (ε) > 0 存在 , 使当 m , n > N
时 ,ρ( x m , xn ) < ε, 则称 { xn }为一柯西序列 .
当然一般说来 , X 中的柯西序列不一定都是 收敛 的 , 即不一 定以 X 中某 一点 x0 为极 限 .于
是我们要区别出一类特别重要的度量空间 , 这就是完备的度量空间 .
定义 10 若度量空间 X 中的任一柯西序列 都是 收敛的 , 即 以 X 中 某一 点 x0 为 极限 , 我 们
就说 X 是完备的度量空间 .
在本书中我们已看到一个度量空间是否完备是多么重要 .在上一节中我们指出 , 有理数系 Q
( 读者可以自行验证 , Q 也是度量空间 ) 是不完 备的 , 而 这导致 微积 分的许 多定 理得 不到证 明 .于
是我们把它完备化得到实数系 R , 这才把整个微积分学放在可靠的基础上 .我们又在积分学一 章
b
为范数‖ f ‖ .读者也不妨自行验 证一 下 ) 也是 不完 备的 , 导 致 对于 黎曼 积分 一般 地 不能 在积 分
号下求极限 .这正是黎曼积分 真正 的缺 点 .我 们引 入勒 贝格 积 分 , 有了 里斯 - 费希 尔定 理 , 知 道
p
L 是完备空间 , 这才克服了困难 .这是整个分 析数 学极重 要的 一大 步 .因 此我 们要 问 , 能 否仿 效
构造 R 的方法 , 对一个并不完备的度量空间 X0 , 构造出一个完备的度量空间 X 来 ? 这里我们要
求 X0 X , 而且 X0 的两点 x 和 y 在 X0 中的距离 ρX 0 ( x , y ) 与它们 在 X 中 的距 离 ρX ( x , y ) 相
价 : { x n }~{ x′
n } . 我们把柯西序列的等价类当作一个元素 .并记这 些等价类 的集合为 X .我们 要
完备化 .
证 上面我们已作出了 X0 中之柯西序列的等价类之集合 X , 现在在 X 中赋予距离如下 :
设有 X 中之两点 , 即 X0 中两个柯西序列之等价类 x 与 y, 在这两个等价类中各取一个代表
元{ xn } , { yn } , 我们定义
ρX ( x , y ) = nlim ρX 0 ( x n , yn ) . ( 7)
→∞
上式右 方 ρX 0 ( xn , yn ) 是 有 意 义 的 , 因 为 x n , yn 都 是 X0 之 元 , 这 个 极 限 是 否 存 在 ? 注 意
故
r n - r m = ρX 0 ( xn , yn ) - ρX 0 ( xm , ym )
≤ρX 0 ( xn , x m ) + ρX 0 ( yn , ym ) .
交换 n 与 m 又有
r m - rn ≤ρX 0 ( x n , xm ) + ρX 0 ( yn , ym ) .
总之有
| r n - r m | ≤ρX 0 ( xn , x m ) + ρX 0 ( yn , ym ) .
(7 ) 之极限存在 .
由 (7 ) 定义的 ρX ( x , y ) 之值与 x , y 之代表元的选法无关 .如果我们取 x , y 的另 外的代表 元
{ x′ m } , 则因
m }与 { y′
ρX 0 ( x′ n ) ≤ρ
n , y′ n ) + ρ
X ( x n , x′ X ( x n , yn ) + ρX ( yn , y′
0
n ) ,
0 0
ρX 0 ( xn , yn ) ≤ρX 0 ( xn , x′
n ) +ρX ( x′ n ) + ρ
n , y′ X ( yn , y′
n )
0 0
有
| ρX 0 ( xn , yn ) - ρX 0 ( x′ n ) | ≤ρ
n , y′ n ) + ρ
X ( xn , x′ n ) →0 .
X ( yn , y′
0 0
令 n→∞求极限即得 X 中的三角形不等式
ρX ( x , z) ≤ρX ( x , y) + ρX ( y , z ) .
X0 作为 X 之子集的含义已在上面说明 , 今证 x , y∈ X0 X 在 X0 中 的距离与 它们在 X 中的 距
离相同 . 把 x , y 看作 X 中之元来 计算 其距离 时 , 应该 取 x , y 之任 一代 表元 按 ( 7 ) 来 计算 .但 是
§2 度量空间和赋范线性空间 3 79
但是当 x , y ∈ X0 时 , 我 们 规 定 了 是 用 常 驻 序 列 作 为 其 代 表 元 的 , 所 以 可 取 { x n } = { x , … ,
x , …} , { yn } = { y, … , y , …} .因此 ρX 0 ( xn , yn ) = ρX 0 ( x , y ) , 而 有 ρX ( x , y ) = ρX 0 ( x , y ) , 而 X0
此可以选一个 kn 使
( n) ( n) 1
ρX 0 ( x m , x k n ) ≤ , m > kn . ( 9)
n
在 (8 ) 中按上述 kn 的选取方法构造一个序列 :
(1 ) (2 ) ( n)
x = { x k 1 , x k2 , … , x k n , … } , (10)
于是 , 由 ( 9) 式知当 k 充分大时
( n) ( n) ( n) 1
lim ρ( x m , x k n ) = ρX 0 ( xn , x k n ) ≤ . (11)
m→∞ n
所以 ,
( n) ( m) ( n) ( m)
ρX 0 ( x k n , x k m ) = ρX ( x k n , x k m )
( n) ( m)
≤ρX ( xn , x k n ) + ρX ( x n , xm ) + ρX ( x m , x k n )
1 1
≤ρX ( xn , xm ) + + .
n m
证明
lim x n = x . (12)
n→ ∞
事实上 ,
( n) ( n) 1 ( n)
ρX ( x , xn ) ≤ρX ( x , x k n ) + ρX ( x n , x k n ) ≤ + ρX ( x , x k n ) ,
n
( n) (1 ) ( p)
x k n 是常驻序列 , x = { x k 1 , … , x k p , … } , p→ + ∞ , 所以上式右方又可估计如下 :
1 ( p) ( n)
≤ + lim ρX 0 ( x k p , x k n ) < ε,
n p→ ∞
只要 n 充分大 , 因此 (12) 式成立 , 而知 X 是一个完备空间 .
再证明 X0 在 X 中处处稠密 .事实上 , 在 X 中取 一个 元 x , 我们 要在 X0 中找 一个元 素序 列
逼近它 . x 既是 X 之元 , 当然 就是 一 个 X0 柯 西序 列 之等 价类 .取此 等 价 类的 一 个代 表 元 { x1 ,
ρX0 ( ym , yn ) →0 , 即{ y1 , y2 , … , yn , …}是 X0 的 柯 西序 列 , 所 以 它定 义 X 中 的 一个 元 x ∈ X .这
X0 已嵌入在 X 中 , 而且是等距的 , 所以
ρX ( xn , x m ) = ρX 0 ( xn , xm ) →0 .
是 y 与 y′, 则
ρX ( x , x′) = nlim ρX 0 ( xn , x′
n ) = lim ρX ( xn , x′
n )
→∞ n→ ∞
= ρX ( y, y′) .
等距性得证 , 定理证毕 .
§2 度量空间和赋范线性空间 3 81
An Br n ( x n ) , r n → 0 , 则必有唯一一点 x∈ ∩ A n .
n= 1
∞
ρ( x , y ) ≤ρ( x , xn ) + ρ( xn , y ) ≤ 2 rN < r .
这与 ρ( x , y ) = r 矛盾 .
再证这样的点 x 存在 . 我们从 An 中任 取一点 yn , 则 当 m , n > N (ε) 时 , ym , yn ∈ A N , 从 而
ρ( ym , yn ) ≤ 2 rN < ε, 所以 { yn } 是 X 中的柯西序列 .由 X 之完备性 , 知道一定存在一点 x∈ X , 使
∞
。
A n 0 ∪ bd A n 0 . x | A n 0 , 必 为 An 0 之 外点 . 因此 必 有 一个 以 x 为 心 , 某 个正 数 r 为 半 径的 小 球
关于度量空间完备性的讨论就到此为止 .
度量空间完备性概念有一个在整个数学中都极为重要的应用 , 这就是压缩映像原理 .这里我
们讲的是一个完备度量空间 X 以 及一 个映 像 T : X→ X , 如 果 T 适 合以下 条件 , 则称 T 为一 个
压缩映像 : 对 X 中任意元 x , y :
ρ( T x , T y) ≤ cρ( x , y ) , 0≤ c < 1 . (13)
我们要证明
定理 8( 压缩映像原理 ) 设 X 为一完备 度量 空间 , T : X→ X 是一个 压缩 映像 , 则必 有唯 一
一点 x∈ X , 使 T x = x , x 称为 T 的不动点 .
证 证明就是我们熟知的逐步逼近法 . 任取一 点 x0 ∈ X , 称 为零次 近似 . 一 般说来 当然 不
会有 T x0 = x0 , 记 x1 = T x0 , x2 = T x1 , … , 以及一般地
xk = T xk - 1 , k = 1 , 2 , … . (14)
xk 就是 k 次近似 . 今证 { x k } 有极限 存在 , 而 此极限 即为 不动点 .实 际上 , { xk }是 一个 柯西 序列 ,
因为若取 m > n ,
3 82 第六章 再论微积分的基础
ρ( x m , xn ) ≤ρ( xm , x m - 1 ) + ρ( x m - 1 , xm - 2 ) + … + ρ( xn + 1 , xn ) .
但是右方第一项可以估计如下 :
ρ( xm , x m - 1 ) = ρ( T x m - 1 , T x m - 2 ) ≤ cρ( xm - 1 , x m - 2 )
2
≤ c ρ( x m - 2 , xm - 3 )
m - 1
≤…≤ c ρ( x1 , x0 ) .
对其余各项也作类似估计 , 即得
m - 1 m - 2 n
ρ( xm , x n ) ≤ ( c + c + … + c )ρ( x1 , x0 )
n m - n
c (1 - c )
= ρ( x1 , x0 )
1- c
n 1
≤ Mc ρ( x1 , x0 ) , M = .
1- c
因为 0≤ c < 1 , 由上式即知{ x n }是一个柯西序列 , 所以它有一个极限 x . 今证 x 即不动 点 : T x =
ε
x . 实际上 , 任给 ε> 0 , 必有 N (ε) 在 , 使 当 k > N (ε) 时 , ρ( xk , x ) < , 现取 n > N (ε) + 1 , 于
2c
是 , 因为 n - 1 > N (ε) , n > N (ε) , 而有
ρ( x , T x ) ≤ρ( xn , T x ) + ρ( x , xn ) = ρ( x , xn ) + ρ( T xn - 1 , T x )
≤ρ( x , x n ) + cρ( x , xn - 1 ) < ε,
由 ε之任意性即知ρ( x , T x ) = 0 , 亦即 T x = x .
最后证明不动点的唯一性 .设有两个不动点 x 和 y, 则
ρ( x , y ) = ρ( T x , T y ) ≤ cρ( x , y ) ,
故 ρ( x , y ) = 0 , 即 x = y .这就是不动点的唯一性 , 定理证毕 .
压缩映像原理在整个数学中应用极多 . 例如常微分方程的柯西问题的 唯一性用 逐步逼近 法
去证明 , 这在通常的教材中都会讲到 . 下面我们再证明隐函数的存在定理 , 可以看到 应用这个 原
理应注意些什么 .
2
设有 ( x , y ) ∈R 的函数 f ( x , y ) , 我们的目的是从方程 f ( x , y ) = 0 , 证明必有唯一的函数 y
= φ( x ) , 适合这个方程 , 以及 y0 = φ( x 0 ) .这里 f ( x0 , y0 ) = 0 . 首先的问题是选一个 完备的度 量
空间 X , 现在我们令 X = C( [ a , b] ) , 即在紧 集 [ a , b] 上 连续 的函 数 之空 间 .这个 空 间是 赋范 空
间 , 因为对 φ∈ C( [ a , b] ) , 即在 [ a , b] 上连续的函数 φ( x ) , 我们均可令
‖φ‖ = [sup | φ( x ) | . (15)
a, b ]
这里 M 待定 , 于是令
1
Tφ= φ - f ( x , φ) . (17)
M
为了使它成为压缩的 , 注意
1
Tφ1 - Tφ2 = (φ1 - φ2 ) - [ f ( x , φ1 ) - f ( x , φ2 ) ] .
M
因此如果 f ( x , y ) 对 y 为连续可微 , 则
1
| Tφ1 - Tφ2 | = ( φ1 - φ2 ) - φ( x,φ
f′ 1 + θ( φ1 - φ2 ) ) (φ1 - φ2 ) .
M
这里 0≤θ≤1 . 如果我们对 f 加上如下条件 :
φ≥ m > 0 ,
f′
并取 M = sup f′
φ , 立即有
m
| Tφ1 - Tφ2 | ≤ 1 - | φ1 - φ2 | .
M
先在右侧取 x∈ [ a , b] 时之上确界 , 再在左侧取 x∈ [ a , b] 时之上确界 , 立即有
‖ Tφ1 - Tφ2 ‖≤ c‖φ1 - φ2 ‖ ,
m
0 < c=1 - <1 .
M
而 T 是一个压缩映像 .
但这里有一 个 重 要 问 题 .压 缩 映 像 法 是 一 个 逐 步 逼 近 的 迭 代 过 程 : 先 任 意 取 零 次 近 似
φ0 ( x ) , 但我们要求 φ0 ( x0 ) = y0 , 然后以 φ0 代入 (17) 来计算 φ1 ( x ) 等等 .但是这就需要 考虑 φ0
是否可以“代得进去”(17) 中的 f ( x , φ) .因为 , 设若 f ( x , y ) 定义于 [ a , b] × [ - C , C] , 而 φ0 ( x )
可能在某些 x 点在 [ - C , C] 之外取值 , 这样 f ( x , φ0 ( x ) ) 就 没有 意义了 .所 以在 求 φ1 ( x ) 之 前
先要证明 φ0 ( x ) 适合以下的估计式 : | φ0 ( x ) | ≤ C . 对于 φ1 ( x ) , φ2 ( x ) , …也都需要作出类似估
计 .这种估计是在问题是否有解之前就要作出 的 , 因 此称 为先 验 ( a priori) 估计 .如 何作先 验估 计
时常是求解一大类问题最主要的困难 , 而且是一些数学分支最基本的技巧 .我们在这里当然无法
涉及 .所以我们规定 f ( x , y ) 在 [ a, b] × ( - ∞ , + ∞ ) 上有定义而且连续来绕过一这一困难 .
作了这些说明以后 , 我们就可以把最终的结果陈述如下 :
隐函数的存在定理 设 f ( x , y ) 在 [ a , b] × ( - ∞ , + ∞ ) 上连续 且对 y 连续可 微 , f′
y ( x , y)
适合以下的估 计 : 0 < m ≤ f′
y ( x , y ) ≤ M , 且 f ( x0 , y0 ) = 0 , 这 里 x0 ∈ [ a , b] , 则必 有 唯一 y =
φ( x ) 在 [ a , b] 上连续 , 适合关系式 y0 = φ( x0 ) 使得 f ( x , φ( x ) ) = 0 .
注 这里陈述的隐函数定理当然也适用于多个自变量、多个未知函数的情况 .但是它与第三
章中所陈述的稍有不同 .这是因为我们想回避先 验估计造 成的 .当 然 , 我们最 终得 到的结 果也 稍
强一些 , 我们得到的隐函数定义在整个闭区间 [ a , b] 上 , 而不只是在 x0 附近 .
*
这里我们还要求各次近似 φk ( x ) 都适合 φk ( x0 ) = y0 , 因此我 们所考虑 的空间 其实是 C =
{φ( x ) , φ( x ) 在 [ a , b] 上连续而且 φ( x0 ) = y0 } .它仍然 是一 个完 备的度 量空 间 , 这些地 方我 们
都未深究 .我们最后只想强调一下 , 这里的压缩映像原理 , 只是一大类不动点定理最简单的情况 .
在下一节我们还会回到这个问题 . 隐 函数定 理也 是一个 很重 大的 数学课 题 , 但本 书中我 们不 能
3 84 第六章 再论微积分的基础
再讲了 .
3. 希尔伯特 空间和巴 拿赫空 间 关 于度量空 间的完 备性问题 , 我 们已作了 详细的 讨论 , 现
在再回到本节开始时的一些具体空间 .它们除了 具有度量 之外 , 还 有线性 结构 , 而 且其度 量都 是
由范数或内积而来 .( 应该提到 , 有这样的度量空间 , 它也有线性结构 , 也有完备性 , 但是其度量并
非由范数来确定的 .在广义函数论中就常遇到这 类空间 , 所 以也 是很重 要的 , 但 我们不 会讲 到 .)
p
这些空间又都是完备的 , 如 C( I) , L 等等都是 .所以下面我们再转到这些具体的空间 .
完备化定理告诉我们 , 完 备化的 X 是 通过子 空间 X“
0 求 极限”而来 , 而 X0 则在 X 中 稠密 .
例如 R 是通过有理数系 Q
“求极限”得到的 , C( [ a , b] ) 之元可以通过多项式的 C( [ a , b] ) 极限即
一致收敛极限得出 ( 魏尔 斯特 拉 斯定 理 ) . X0 中 的元 即 [ a , b] 上 的 多项 式 .在 研 究函 数 空 间时 ,
p
X0 中的元时常比 X 中的元更容易处理 .例如 , 我们前面已多次说过 , L 函 数可以用 连续函数 或
∞ p
阶梯函数 , 甚至 C0 函数在 L 范 数下 去逼 近 . 而 且还 专门 讲 了如 何应 用磨 光算 子 去构 造这 些
∞
C0 函数 .但基本 的 结 论 一 直 没 有 证 明 .在 讲 勒 贝 格 积 分 时 , 我 们 介 绍 了 一 个 鲁 金 定 理 ; 设 有
[ a , b] 上的几乎处处有限的可 测函 数 f ( x ) , 则对 任意 δ> 0 必 可 找到 一个 闭 集 F [ a , b] , 使
m ( [ a , b] \ F) < δ, 而 f ( x ) 在 F 上连续 .但这个定理也未证明 . 而在证明上述 X0 在 X 中的稠
密性时 , 还必须用到它 .( 此外在 讲到广 义函 数时 , 例如 对 δ函 数 , 我们 作出 过许 多 δ序列 , 都 是
用很光滑的函数去逼近 δ( x ) , 但是这时的逼近已 不是在 某一个赋 范空间的 范数意 义下 , 而是 在
∞
广义函数意义下 .一般地说 , 一个广义函数总可以用 C0 函数 在广 义函数 意义 下逼 近 .这 时我 们
∞
也说 C0 函数在广义函数空间中稠密 .当然这与度量空间的完备化定理是不同的 ) .这样看来 , 我
们在定义或研究一个函数空间时 , 时常用该空间是 某一类很 规则 的函 数在某 种范 数下的 完备 化
来刻画它 .可见 , 度量空间的完备化不但是重要的概念 , 也是常用的方法与技巧 .
p
由于常见的空间 C( I) , L 都是完备空间 , 所以我们给出下面的
定义 11 完备的赋范线性空间称为巴拿赫空间 ( Banach space ) , 完备的内积空间称为希尔伯
特空间 ( Hilbert space ) .
p
当然我们也会区分实的和复的巴拿赫空 间和 希尔 伯特空 间 , 于是 我们看 到 , C ( I ) , L 都 是
2 k
巴拿赫空间 , 而 L 空间与索伯列夫空间 H 则是希尔伯特空间 .
n
在这些空间中 , 希尔伯特空间最为重要 .因为它是最接近欧氏空间 R 的线性空间 .
n
欧氏空间 R 有两个基本的几何量 .即 向量的 长 与两 个向 量的 夹角 .在任 何赋 范空 间 中 , 都
可以定义向量之长 , 但在内积 空间 中则 还可 以 定义 两个 向量 的交 角 , 因 为现 在有 施 瓦兹 不等 式
(6 ) . 对于实的内积空间 ,〈x , y〉是实数 , 所以由 (6 ) 可知 , 一定可以找到一个实数 α, | α| ≤1 , 使
〈x , y〉= α‖ x‖・‖ y‖
而我们又可以找到一个角 θ, 使 α= cosθ, 于是上式就成了实内积空间中的余弦定理
〈x , y〉= ‖ x ‖・‖ y‖cosθ.
π
θ可以解释为 x 与 y 的夹角 , 特别是〈x , y〉= 0 时 θ= , 而我 们说 x 与 y 正交 , 0 与 任何向量 都
2
正交 .
对于复内积空间 , 当然不一定有 实的 θ适 合上式 , 但是我们仍规定 : 若 ( x , y ) = 0 , 就说 x 与
y 正交 , 0 与任何向量都正交 .
§2 度量空间和赋范线性空间 3 85
x 与 y 正交就记作 x ⊥ y , 不论它们是实或复 .
在所有线 性空间中 都可以 定义向量 的线性相 关与线 性无关 , 并由 此可以定 义维数 . 但是 在
线性代数教本中 , 我们只讲有限维空间 , 因此只有有限多个线性无关向量 . 对于一般 线性空间 则
可能有无穷多个线性无关向量 . 所谓线性空间 E 有 无穷多 个线 性无 关向量 即指 任意给 出 N 个
线性无关的向量 x1 , … , x N ∈ E , 一定还可找到第 N + 1 个 向量 x N + 1 与它 们线 性无 关 .这 时我 们
说 E 是无限维的 .对于内积空间 H , 若它是有限维——— n 维的实内积空间 , 它必是赋有欧几里 得
n
范数的 R . 若是无限维的 , 则可能 或者找到一组无穷 多个线性无关的 向量{ e1 , e2 , … }使得任 一
向量 x∈ H 均可写为
∞
x= ∑
i= 1
xi ei , (18)
lim ‖ S N - x‖ = 0 . (19)
N→∞
因为 x2 与 e1 = x1 / ‖ x1 ‖线性无关 , 所以 y2 ≠0 . 令
e2 = y2 / ‖ y2 ‖ = [ x2 - ( x2 , e1 ) e1 ]/ ‖ x2 - ( x2 , e1 ) e1 ‖ ,
则‖ e2 ‖ = 1, 而且 ( e2 , e1 ) = [ ( x2 , e1 ) - ( x2 , e1 ) ( e1 , e1 ) ]/ ‖ y2 ‖ = [ ( x2 , e1 ) - ( x2 , e1 ) ]/ ‖ y2 ‖
= 0, 即 e1 ⊥ e2 . 这样 , { e1 , e2 }成为 H 中的一个 o .n .系 . 若{ x1 , x2 }尚未 穷竭 { x1 , … , x N , …} 则
仿此做下去 .假设已得出{ e1 , … , ek - 1 } 成为 H 中的一个 o .n .系 , 而 { x1 , … , x N , …} 中仍 有 xk 与
它们线性无关 , 也就是说 { x1 , … , xk - 1 } 尚未 穷竭 { x1 , … , x N , … } . 记 { e1 , … , ek - 1 } 所张 的子 空
k- 1
间为 Hk - 1 = ∑ αe , α 为复常数
i =1
i i i , 则对于{ x1 , … , x N , … } 中的 非 零的 xk , 我们 要 找 k - 1 个
复常数 ci , i = 1 , … , k - 1 , 使
k- 1 2 k-1 2
xk - ∑
i =1
ci ei = min
α
i
xk - ∑ αe
i= 1
i i .
仿照上面的作法 , 有
k-1 2 k-1 k-1
xk - ∑ αe
i= 1
i i = xk - ∑ αe , x ∑ αe
i= 1
i i k
-
i= 1
i i
k-1 k- 1 k-1
∑ α( x ∑α(x ∑ αα
2
= ‖ xk ‖ - i k , ei ) - i k , ei ) + i i
i= 1 i=1 i=1
k-1 k-1
2 2 2
= ‖ xk ‖ - ∑
i= 1
| ( x k , ei ) | + ∑ i= 1
| ( xk , ei ) - αi |
k-1
2 2
≥‖ xk ‖ - ∑
i= 1
| ( x k , ei ) | .
所以 , 这个最小值 是 可 以 达 到 的 , 而 只 要 取 αi = ( xk , ei ) 即 可 达 到 这 个 最 小 值 . 令 yk = xk -
k-1
∑( x
i= 1
k , ei ) ei , 显然 yk ≠0 , 再令 ek = yk / ‖ yk ‖ , 则{ e1 , … , ek }成为一个 o .n .系 .
或是复的 ) { ci } 使 x = ∑i= 1
ci xi , 亦 即 (19 ) , 或 Nlim
→∞
‖ S N - x ‖ = 0 . 这 里 SN 是 这个 级数 的部 分
和 , 不论如何 , 我们得到了
定理 9 任一可分希尔伯特空间 H 均有 o .n .基底 .
并不是 H 之任意可数无穷多个互相正交的 单位长向 量{ e1 , … , eN , …} , ( ei , ej ) = δi j 都是 基
底 , 要看 ( 18 ) 式是否成立 .
(18) 式何时会成立 ? 我们要看一下格拉姆 - 施密特手 续
k-1 2
的几何含意 .为什么 当 αi = ( x , ei ) 时 x - ∑ αe
i= 1
i i 会达
- ∑
i= 1
( x , ei ) ei , 所以 ( yk , ej ) = ( x , ej ) - ∑ ( x, e )( e , e )
i= 1
i i j
k-1
= ( x , ej ) - ∑i= 1
( x , ei ) δij = 0 , 这 里 j = 1 , 2 , … , k - 1 . OC 代 表 { e1 , … , ek - 1 } 所 张 的 子 空 间
∑ αe
2
| AC | = x - i 1 ,
i= 1
k- 1 2
∑
2 2 2 2
| A A′| = | OA | - | O A′| = ‖ x‖ - ( x , ei ) ei
i=1
k- 1 k-1
∑ ∑ ( x, e ) e
2
= ‖ x‖ - ( x , ei ) ei , i i
i=1 i= 1
2
= ‖ x‖ - ∑ i, j
( x , ei ) ( x , ej )δi j
k- 1
∑
2 2
= ‖ x‖ - | ( x , ei ) | ,
i=1
k- 1 k-1
2 2 2
| A′C | = ∑i=1
‖ (αi - ( x , ei ) ) ei ‖ = ∑
i= 1
| αi - ( x , ei ) | . (20)
k-1
( x , ei ) 时 , x - ∑ αei= 1
i i →min .
∑
2 2
| ( x , ei ) | ≤‖ x ‖ , (21)
i=1
∑i=1
| ( x , ei ) | = ‖ x ‖ . (22)
这时 , 我们说{ e1 , … , eN , …}是一个完全的 o .n .系
证 令 x i = ( x , ei ) , 则仿照上面的证明有
k- 1 2 k- 1
∑ ∑
2 2
x - xi ei = ‖ x‖ - | xi | .
i =1 i=1
因为上式左方非负 , 故有
k-1
∑
2 2
| xi | ≤‖ x‖ ,
i= 1
令 k→∞即得 ( 21 ) 式 .
再证帕塞瓦尔等式 的 必 要性 , 若 { e1 , … , eN , … } 是 H 之 基 底 , 则一 定 存 在 一 列复 数 ci , 使
N 2
x - ∑
i= 1
ci ei →0 , 令 xi = ( x i , ei ) , 仿上面的作法有
N 2 k-1 2 N
∑ ∑ ∑
2 2
x - ci ei = ‖ x‖ - xi ei + | xi - ci |
i=1 i= 1 i= 1
N
∑
2 2
≥‖ x‖ - | x i | ≥0 ( 贝塞尔不等式 ) .
i=1
lim
N→ ∞
x - ∑
i=1
xi ei →0 ,
N 2
这就是说 , 一定 能 找 到 复 数 ci , 使 x - ∑
i= 1
ci ei → 0 ( 取 ci = ( x , ei ) 即 可 ) , 所 以 { e1 , … ,
eN , …}是基底 .证毕 .
§2 度量空间和赋范线性空间 3 89
∑
2 2
‖ e‖ = | ( e, ei ) | = 0 ,
i= 1
∑
2 2
| ( x , ei ) | < ‖ x ‖ .
i=1
但若令
∞
y= ∑ ( x, e ) e ,
i= 1
i i
容易证明 ,
N
2
2 2
‖ SN 2 - S N 1 ‖ = ∑
i = N +1
| ( x , ei ) | .
1
一个 y∈ H 使 y = ∑ ( x, e ) e
i =1
i i . 显然
∞
∑
2 2
‖ y‖ = Nlim ( SN , SN ) = | ( x , ei ) | .
→∞
i=1
2
于是 y≠ x , 因为由 { e1 , … , eN , …}不完全的假设 我们已 知上式右 方 < ‖ x‖ . 但 是我们 可以 证
N N
= ( x , ei ) , 所以 ( y, ei ) = ( y - S N , ei ) + ( S N , ei ) = ( y - S N , ei ) + ( x , ei ) .但是 | ( y - SN , ei ) | ≤
‖ y - S N ‖‖ ei ‖ = ‖ y - SN ‖→0 .所以 ( y , ei ) = ( x , ei ) 对一切 i 成立 . 即是说 ( x - y ) ⊥ ei , 对
一切 i 成立 .令 e = x - y .我们找到了 H 中的一个非 0 的 , 正交于一切 ei 的元 e .
2 2
现在再回到 L 空间 . 第四章中 . 我们着重指出 , 对于两个 L ( [0 , 2π] ) 函数 f ( x ) 与 g( x ) ,
定义
2π
( f , g) = ∫ 0
f ( x ) g( x ) d x (23)
2 2
成为一个内积 .在这样的内积 下 , L ( [0 , 2π] ) 是一个 复内 积空间 .而 且因 为 L ( 0 , 2π) 是 一个 完
备空间 ( 里斯 - 费希尔定理 ) , 所以这是一个希尔 伯特空间 .它 是一 个可分 希尔 伯特 空间 , 因为 它
1 i nx
具有一个完全的 o .n .系 e , n = 0 , ±1 , ±2 , … . 对于其中的任一元 f ,
2π
2π
1
∫
- i nx
( f , en ) = f ( x) e dx
2π 0
3 90 第六章 再论微积分的基础
2
除了相差一个常数因子外就是 f ( x ) 的傅里叶系数 , 而对 L ( [0 , 2π] ) 函数 , 公式
2π
∫ ∑
2 2
| f ( x) | d x = | ( f , en ) |
0 n = 0 , ±1 , …
是已经证明了的 .
2
重要的事实是 , L ( [ 0 , 2π] ) 是一个“典型的”可分希尔伯特空间 .事 实上 , 任给一 个可分希 尔
伯特空间 H , 定理 9 告诉我们 , 它一定具有 一个完 全的 o .n .系{ ei } , i = 0 , ± 1 , … , ± n , … .这 里
2
我们对其指标 i 重新作了编号 , 使它可取一切 正、负 整数值 . 我们 现在在 H 与 L ( [ 0 , 2π] ) 中 建
立如下的一一对应 : 对 珘
f ∈ H , 我们可以作函数
1 i jx
f ( x) = ∑ j
f j・
2π
e
与珘
f 相对应 .这里 f j = (珘
f , ej ) .这个函数确实是存在的 , 因为
珘
f= ∑ j
fj ej , (24)
∑
2 2
而由于 H 是一个希尔伯特空间 , 由 (21) 式 , | f j | < + ∞ .因 此这个 级数在 L ( [0 , 2π] ) 中 收
j
2
敛 .所以可以记其和为 f ( x ) . f ∈ L ( [ 0 , 2π] ) 而且
2π
1 - i jx
fj = ∫ 0
f ( x)
2π
e dx .
2
反之 , 若有一个 f ( x ) ∈ L ( [0 , 2π] ) , 则可用上式作其傅里叶系数 f j , 而 用 ( 24 ) 式作一个 珘
f ,很容
2
易证明 珘
f∈ H .总之 , L ( [ 0 , 2π] ) 与 H 有一个 保持 线性关 系的 同构 .在这 个同 构关 系下 , 内积 和
2
范数都不变 : 设有另一个 珘
g∈ H , 对应于另一个 g ( x ) ∈ L ( [ 0 , 2π] ) , 它们的 傅里 叶系数 是 gj =
2π
1 - i jx
(珘
g , ej ) = ∫0
g( x )
2π
e d x , 则由帕塞瓦尔等式有
∑
2 2 2
‖ f‖ = | f j | = ‖珘
f‖ N ,
j
( f , g) L2 = ∑ f 珘g = (珘f ,珘g )
j
j j H .
§3 拓 扑 空 间
1. 拓扑空间的基本概念 度量 空间 是最 直 观的 拓 扑空 间 , 它 通 过两 点 间 的距 离 来定 义 开
集、闭集、邻域、收敛性等等 , 与微积分中的讲法很接近 . 而且在这个基础上 我们特别 建立了巴 拿
§3 拓 扑 空 间 3 91
这样的拓扑后称为一个拓扑空间 .
上一节中我们看到在度量空 间 X 中 , 以球 为 基础 , 定义 了 开集 .我们 还 特 别约 定 空集 是 开
3 92 第六章 再论微积分的基础
中所有的点 x , 并取 Ux 之并 , 于是 { x } ∪U
x
x A , 亦即 A ∪U
x
x A , 所以 A = ∪ Ux . 由开
x
c c
。 c
in t ( A ) 称为 A 之闭包 , 记作 A ; 边界点之集合记为 bd A = X - A ∪ ( in t A ) , 称为 A 的边
界 .
。
定理 4 A 是一切含于 A 中的开集之并 , 所以是含于 A 内的最大开集 ; A 是一切包含 A 的
闭集之交 , 所以是包含 A 的最小闭集 ; bd A 也是闭集 , 而且
。
A = A ∪bd A = A ∪bd A ,
。
A = A \ bd A = A \ bd A . ( 1)
。
从这个定理还可以看到 , A 为开 ( 闭 ) 集的充分必要条件是 A = A ( A = A) .
我们还要引入一个很有用的概念———导集 .为此先给出以下的定义 :
定义 6 设 ( X , τ) 为一拓扑空间 , A X , x∈ X 称为 A 之极限点 , 如果 x 之任一 邻域 Ω( x )
中均含有 A 中除 x 以外的其它点 , 极限点之集合称为 A 之导集 , 记作 A′.
极限点的概念很明显是通常微积分教材中讲到的点的序列之极限点的概 念的推广 . 我们 不
妨看一下 , x| A′是什么意思 .由定义 6 , x| A′显然是指 x 有某 一邻域 Ω( x ) 或者与 A 不相交 ,
即其中不含 A 之点 , 这时 x 是 A 的外点 ; 或者 Ω( x ) 中只有一点 x∈ A , 这时 x 是 A 的 孤立点 ,
3 94 第六章 再论微积分的基础
证 ( i) 必要性 设 f 为 连 续 , 任取 一点 x0 , 并记 f ( x0 ) = y0 , 任 取 y0 在 ( Y , σ) 中的 邻 域
- 1
V , 自然有 f ( V) = U X , 今证 U 必为 x0 的邻域 .首先 , x0 ∈ U 是明显的 , 其次 V 既是 y0 之
- 1
邻域 , 必有含 y0 的开集 V1 V .显然 x0 ∈ f ( V1 ) U , 但由 假设 , f 是连续 的 , 开集 V 1 之 原
- 1
像 f ( V 1 ) = U1 是 ( X , τ) 中的开集 , 而 x0 ∈ U1 U .所以由邻域之定义 , U 是 x0 之邻域 , 而且
f ( U ) = V , 故 f 在每一点 x0 均为连续 .
- 1
( ii ) 充分性 设 f 在 X 之每一点处均为连续 , 任取 ( Y ,σ) 中的开集 V , 今证 f ( V)是 X 之
- 1 - 1 - 1
开集 .如果 f ( V) = , 当然是 ( X , τ) 中的开集 .如果 f ( V )≠ , 则令 x0 为 U = f ( V)
中任一点 , f ( x0 ) = y0 即成为 V 中之任意点 .由邻域之性质 , 开集 V 是其任意 点之邻域 , 故由 假
§3 拓 扑 空 间 3 95
U= ∪{x
x ∈ U
0 } ∪U
x ∈ U
x
0
U .
0 0
∪U
- 1
所以 U = x
0
, 右方是开集 Ux 0 之并 , 所以也是开集 .即是说 f ( V ) = U 作为 V 之原像是开
x ∈ U
0
集 .因此 f 连续 .证毕 .
读者应该注意 , 连续性的定义为“ 开集的原像仍是开集”, 而不是“开集的像是开集”.即是说 ,
若 U 是 ( X ,τ) 之开集 , f ( U ) 不一定是 ( Y , σ) 之开集 .如果一个映 射 f : ( X , τ) → ( Y ,σ) 映 X 中
之一切开 ( 闭 ) 集为开 ( 闭 ) 集 , 即上述 f ( U ) 为开 ( 闭 ) 集 , 这种 映射 称为 开 ( 闭 ) 映 射 , 开 ( 闭 ) 映 射
的概念在许多数学问题中很重要 , 但无论如何 , 它不必是连续映射 .我们不来举例了 , 只是再提醒
一下 , 必须把开映射和连续映射区别开 .
在许多数学分支中还会遇到 以下 的问 题 : 已 知 f : X→ Y , 如果 在 X 或 Y 中已 赋 有了 拓扑 ,
问在 Y 或 X 应该给怎样的拓 扑才 能使 f 为连 续 ? 例 如已 给 了拓 扑 空间 ( X , τ) , 则对 于 U ∈τ
- 1
( 即对 τ中的开集 U ) , 记 f ( U ) = V , 我们有 U = f ( V ) .如果 我们定义 这样的 V 就是 Y 中 一
个开集 , 如果这能够构成一个拓扑 σ, 则 f : ( X , τ) → ( Y ,σ) 显 然是连 续的 .因 为 σ中 的开 集 , 就
是按照 τ中开集 U 的像来定义的 , 亦即按照其原像 为 τ中的 开集 这一要 求来 定义 的 .问 题是 这
样的 σ是否为一拓扑 .显然 , 与 Y 都属于σ, 因为其原像为 与 X 都是τ中的开集 . 若 Vλ ∈σ
( Vλ ) , 则 Uλ 为 τ之 开集 , 而 ∪ Uλ 也是 τ之 开集 , 但 f ( ∪ Uλ ) =
- 1
对一切λ成立 , 而且 Uλ = f
λ λ
∪f( U
λ
λ ) = ∪ Vλ , 所以 ∪ Vλ ∈σ. 此外 , 对有限多个 V k ∈σ, k = 1 , 2 , … , N , 令其 原像为 Uk =
λ λ
N N N N N
( V k ) , 则 Uk ∈τ, 而 ∩ Uk ∈τ.但是 f ( ∩ Uk ) = ∩ f ( Uk ) = ∩V , 所以 ∩ Vk , 既 然其 原
- 1
f k
k= 1 k= 1 k=1 k=1 k= 1
N
- 1
是连续的 ; ( iii ) f 也是连续 的 , 则称 ( X , τ) 与 ( Y , σ) 同 胚 ( homeomorph ) , f 为 一同 胚 映射 ( ho-
meomorphism) .
注 我们用了一一映射 ( bijection) 一词 , 常 用的 还有 单射 ( injection) 与 满射 ( surjection) 两 个
词 . 前者指 Y 中任一元 y 如 果有 原 像 , 则 原像 为 唯 一的 ; 后者 指 Y 中一 切 点 都是 X 中某 点 的
像 , 就是 f 把 X 映到 Y 上 , 而不只是 Y 内 .前者是说方程 f ( x ) = y 如果有解 , 则解必是 唯一的 ;
后者则说 , 方程 f ( x ) = y 对 Y 中的一切 y 都有解 ( 但 不一定 是唯一 的 ) .一 个映射如 果既是单 射
又是满射就称为是一一映射 .这时 f ( x ) = y 对任意 y∈ Y 都有唯一解存在 .
同胚的拓扑空间可以看成相同的空间 , 因 为拓扑 空间 的基 本定义 就是 开集 , X 与 Y 同胚 表
明 , 不但 X 与 Y 作为点的集合 , 是通过 f 实现一一对应的 , 而且 τ与σ作为子 集族 , 也通过同 一
个 f 实现一一对应 .如果粗略地说 , X 与 Y 的一切拓扑性质都是以开集为基础来定义的 , 则在 经
过同胚映射后 , 开集是一一对应的 , 因而 X 中开集的性质也都移到 Y 中的开集上而没有改变 .把
这一点说明白一点 : 所谓拓扑性质就是经同胚映 射不变的 性质 .因 此 , 同胚的 拓扑 空间可 以看 成
是相同的拓扑空间 .这一点经过下面的例子就看得很清楚 , 下面的几个例子在整个数学中起重要
的作用 , 虽然限于 2 维情况 , 其重要性并不稍减 .
2. 拓扑空间的几个例子
n
考虑 n 维单位球面 S :
2 2
x1 + … + x n + 1 = 1 .
2
我们只考虑 2 维球面 S , 并记上半球面 ( 不带边的 ) 为
2 3 2 2 2
S + = { x ∈R , x1 + x2 + x3 = 1 , x3 > 0}
2 2 2 1
( 图 6 - 3 - 1 ) 它的闭包 S + , 则是 S ∩{ x3 ≥0} . S + 的 边界 是平面 x3 = 0 上的 单位 圆周 , 即 S .
2 2 2
我们又记 D 为平 面 x3 = 0 上 的单 位 圆盘 : x1 + x2 < 1 ,
1 2 2 2
其边界即 S , 而闭包 D
是闭圆盘 x1 + x2 ≤1 . 同样可以
2 2 2
考虑下半球面 S - . 在球 面 S 和平 面 R : x3 = 0 上 都按
我们直觉习惯的方式规定哪一些集合为开集 , 于是我们得
2 2
到两个拓扑空间 S 与 R .我们要看一下怎样稍作修改即
可建立一种同胚关系 .
建立这样的同胚有多种方法 , 有一个最常见的称为球
2
极射影 ( stereographic projection ) , 其方 法 是由 球 面 S 的
2 2
北极 N ( 0 , 0 , 1) 与 球 面 S 上 一点 A 联直 线 , 它 交 R 于
2
A′点 . 这里我们取 R 为赤道平面 x3 = 0 . 于是 我们让 A
~ A′点 . 直觉告诉我 们 , 这个对 应是 一 对一 的 , 而且 是双
方 ( 即指映射 A→ A′与逆 映射 A′→ A ) 都是 连续 的 , 现在 图6 - 3- 1
3 2
我们来计算一下 .以下凡是上加一撇“′
”的都代表 R 中的平 面 R : x′
3 = 0 上之对 象 , 否则代表 球
2 2 2 2
面 S : x1 + x2 + x3 = 1 上之对象 , 相 同的字母 代表相 对应的对 象 . 我们把 N S 与 N A 所 决定 的
曲面与平面画在图 6 - 3 - 1 中 , 并设 O 即原 点 , ON 为 x3 轴 , O A′为 xj 轴 .这 里 j = 1 , 2 , 而我 们
得到的结果也对 j = 1 , 2 均 成 立 .于 是 我 们 有 ON = 1 , OA′= x′
j , BN = 1 - x3 , B A = xj , 由 于
△ NO A′∽△ NB A , 所以
§3 拓 扑 空 间 3 97
x′
j = xj/ (1 - x3 ) , j = 1 , 2 . ( 2)
现求它的逆映射 , 将 ( 2) 平方后对 j 求和有 :
2 2
∑ ∑
2 2 2 2
‖ x′‖ = x′
j = x j / ( 1 - x3 )
j= 1 j=1
2 2 1 + x3
= ( 1 - x3 )/ ( 1 - x3 ) = .
1 - x3
2
∑
2 2 2
这里我们利用了 A ∈ S , 所以 x j + x3 = 1 .由上式得
j=1
2
1 - x3 = 2/ (1 + ‖ x′‖ ) . ( 3)
2 2
由此即知 A~ A′把 R 与除去 N 点 ( 即 x3 = 1 处 ) 的 球面 S 双方 一对 一且 双方 连 续地 对应 起
来 .
2
注意 x3 → 1 的情况 .这时‖ x′‖→ + ∞ .如果我们认为 R 上当‖ x′‖ → + ∞时 的点都是 一
2 2
个点 , 而且认为是无穷远点 , 或者说把这个“极限”看成一个点添 加到 R 上 , 就 得到“扩 充的”R :
2 2 2 2
R ∪{∞ } .而且我们就说扩充 的 R 上 只有 一个 无 穷远 点 . 于是“ 扩 充的”R 与 S 是互 相同 胚
2 2
的 , 球极射影 ( 2 ) 与 ( 3 ) 就是一个 同胚映 射 .于 是按上 面所讲的 , R ∪ {∞ }与 S 应看成 相同的 拓
2 2
扑空间 .例如 S 上北极 N 的邻域就变成扩充的 R 上无穷远点的邻域 .例如 , ‖ x′‖ > R > 0( R
是任意正数 ) 就是无穷远点的一个邻域 .
这个观点 在研究复 变量的 函数时特 别有用 . 我们 在第三、四章 中讲过 解析函数 的微分与 积
分仍是解 析函数 , 并 且认 为解 析函数 都定 义在复 平面 C 上 的某 个区域 ( 甚至 就是 C 本身 ) 中 , C
2 2
就是 R .所以我们是在未扩充的 R 上讨论解析函数的 .如果有某个函数 f ( z ) , 令 z = 1/ t , 而 得
1
到函数 f ( z ) = f ( 1/ t ) = φ( t ) , 它在 0 < | t | < 中解析 , 如果 φ( t ) 一直到 t = 0 都是解 析的 , 我
R
2
们就说 f ( z ) 在 z = ∞处也是解析的 .这种观点可以说是在未扩充的 R 上把解析函数 f ( z ) 解 析
2 n
延拓到 R ∪{∞} 上 . 直到现在我们都是在未扩充的 R 讲微积分的 .现在许可 采用另一 种观点 ,
2 2
即在扩充了的 R , 即 R ∪{∞ }上 补充 这个函 数 , 而把 无穷远 真 正看 作一 个点 .但 这 个观 点与 第
2 2 2
一章绪论中讲的“实无限”还有区别 .如果看到 , R ∪{ ∞} 其实就是 S , 而 北极 N ∈ S 是 其上 一
2
个“普通的”点 , 这是任何人都能接受的 . 所以把{∞} 看成扩充的 R 上一个“普通的”点也是十 分
自然的事 .我们说这与“ 实无限”还有区别是因为讨论“ 实无限”时 , 我们甚至不需要找一个北极之
类的对象来与之相应 .但是这里究竟会遇到 t→ 0 时 z→∞ , 这个∞究竟不是通常的数 .解决这 个
2 2
问题的办法是 : 不要 奢求一 下子就在 整个 S 上讨论函 数而把 S 分成几 个部分 : 一部 分不包 括
2
北极 N , 例如就是 R 中 的 | z | < R , 在这 一部分里 讨论函 数时 , 我们取 z 为 自变量 , 或者 说以 z
2
为“局部坐标”.另一部分则包括北 极 N , 也 就 是包 括“扩 充的”R 的“无 穷远”点 , 例 如 | z | > R1
1
( R1 与 R 不一定相同而可取 R1 < R) , 这时我们就换一个新的局部 坐标 t , 而在 | t | < ( 注意 ,
R1
包括 t = 0 , 即 z = ∞ ) 中讨 论函数 f (1/ t ) = φ( t ) .这 两个 部分可 能相 重 , 例如 在 R1 < | z | < R
中 , 我们则允许采用任一个局部坐标 , 而两 种局部 坐标 t 与 z 之间 有一 个“转 换关系”( t ransition
relation ) z = 1/ t .这个十分自然的观点在 现代 数学中 起了 极大 的作 用 , 而 拓扑 的观 点 是其 关键 .
下一章我们将要详细地展开它 . 至于在复变量函数的研究中 , 也就是在复分析 中 , 在 扩充的复 平
3 98 第六章 再论微积分的基础
同一条直线的方 向 数 , 所 以 我 们 不 能说 每 一 条 这 样的 直 线 l 必 与 唯 一 一组 ( α1 , α2 , α3 ) ( 其 中
3
∑ α ≠ 0) 一一对应 , 而应该在这些三元组之间建立一个等价关系 :
2
i
i= 1
(α1 ,α2 ,α3 ) ~ (β1 ,β2 , β3 ) v λ≠0 使 (α1 ,α2 ,α3 ) = λ(β1 ,β2 ,β3 ) ,
3
这里 α= (α1 ,α2 ,α3 ) ,β= (β1 ,β2 ,β3 ) 都属于 R \ {0} , 这些 α,β称为 这条直 线的 齐次坐 标 ( ho-
mogeneous coordinates) ———其实 并不是 严格 意义下 的坐 标 , 因为 直线 l 与 方向数 α并非 一一 对
3 3
应 , 它只与 α在关系~下的等价类一一对应 .这些等价类之集合我们记作 R / ~ , 称为 R 对于~
的商空间 (quotien t space) . 商 空间 的概 念 是数 学的 基本 概 念之 一 . 其 实 我们 过 去已 见 过 很多 .
例如周期运动 , 一个质点沿单位圆周作旋转 , 其所走 的路 程当 然构成 整个 实数域 R, 但是 每转 一
圈 ( 正向或反向 ) , 这个质点都回到原来的位置 , 所以如 果不问 它已 转了多 少圈 , 而 只问它 现在 在
圆周上的位置 , 则运动路程 S 和 S + 2 kπ, k∈ Z 其实代表同一位置———或称相位 ( phase) .所以 我
们用 S~ S + 2 kπ 表 示 这 个 情 况 . 这 个 质 点 走 过 的 路 程 S ∈ R , 但 其 相 位 之 集 合 则 为 R/ ~ =
R/ 2πZ .相位空间是路程空间关于旋转 整数 周的 商空 间 .现 在回 到原 来的 问 题 .在 X 的每 个元 ,
3 2 2
即一条过 O 的直线 l 的等价类中 选一 个代 表 元 .为此 , 在 R 中以 O 为心 作单 位球 面 S : x1 +
2 3 3
x2 + x2 = 1 , 于是每一个 l 均与它交于两点 , 设其一 是 x ( 用 交点在 R 中的直角 坐标 来表示 ) ,
则另一交点是 - x , 这两点位于一条直径的两端 , 称为对 径点 ( an tipodal points) .我们 可以有两 个
2
说法 , 一是在这两个对径点中任取一点为其代表元 , 例如取位于下半球面 S - 上的一点代表 l , 但
这时位于赤道平面上的一对对径点 , 例如图 6 - 3 - 2 中的 a 与 a′又如何 ? 我们也可 以规定取 前
2
面的一点 .或者我们把 S 当成地球表面 , 认为 N A 为始初子午线 , 并由 它开始 计算经度 , 并且 取
2
经度在 [0 ,π) 中的 点为代 表元 , 这 样 X 中 的每一 条直 线均 与 S - ∪ { 前半条 赤道 } 上的点 一一 对
2 2 2
应 , 我们记 S - ∪ {前半条赤 道} 为 S - , 则 X 与 S - 作 为 集合 是 一一 对 应 的 .这 样的 说 法固 然 直
观 , 但是太多人为而不自然的痕迹 .尤其是 , 在应用它作具体计算时很不方便 , 因此我们又想到利
2
用商空间的技巧 , 即认为 x 与 - x 互相等价 : x ~ ( - x ) , 而 X 与 S / { x~ ( - x ) }一一对应 .对此
有一个重要的说明 : 第一种说法的好处仍然在于 其直观性 , 回 到上 面讲的 绕圆 旋转 的例子 , 起 点
位于 S = 0 与 S = 2π, 其 实是 一 个点 , 就 是说 , 如果 把线 段 [ 0 , 2π] 的 两端“粘 合”起来 , 它就 是 圆
周 . S = 0 与 S = 2π是等价的 : 具有相同相位 , 我 们就把 它们“粘 合”在一 起 . 把这 个想法 用于 我
2 2
们的例子 : 首先把 S + 去掉 , 只看下半球面 S - , 然后再把下半球面的边 缘———赤道———上所有 的
§3 拓 扑 空 间 3 99
2 2
对径点 , 例如图 6 - 3 - 2 中的 a 与 a′, 粘在一起 , 这样就可以得到 S - , 而仍 有 X 与 S - 作为集 合
一一对应 .到这里读者会问 , 具体怎样粘法 ? 举一个日 常生活 中的 例子 , 如果 你擀 出了一 张圆 形
2
的饺子皮 , 为了准备包馅 , 先把它拢成碗形 , 我们说这就 是 S - , 可是 最后怎 样按上述 要点捏成 一
个饺子呢 ? ———要求饺子皮边上的 每一 对 对径 点要 捏在 一起 .我们 直觉 的经 验 是 : 这 是捏 不 成
2
的 .您可以做一个黎曼球那样的“ 饺子”, 但做不成 S - 饺子 . 为什么做不成 ? 数学上可以证明 , 只
有在 4 维空间才可以做成 . 这里我 们回避 了许 多重要 的数 学问 题 : 什么是 商空 间 ? 它有 什么 性
质 ? 什么叫在 4 维空 间才能 做成 ? 这些 属于拓扑 学的范 围 . 但 是为了 看出它的 困难所 在 , 我 们
2
不妨再退一步 , 如果只是部分地把对径点捏到一起了 , 例如已 把 S - 边缘上 用虚线画 的两段粘 在
2
一起了 : a 点粘住了 a′, b 点粘在 b′上 , 这成 为一 个什么 ? 把“饺 子皮”S - 拉成 一条长 方形 , 把 它
的右端 a′b′转 180°后 粘到 左 边 的 ab 上 就 得 到 下面 那 个 著 名 的曲 面———默 比 乌 斯 带 ( M bius
strip) ( 图 6 - 3 - 3 ) .如果上面我们不把 a′b′转 180°, 而允 许 a′粘 到 b 点 , b′粘到 a 点 , 就 会得 到
一个柱面 , 它有上、下两个边 , 是两条曲线 , 可是默比乌斯带的边只是一条曲线 .请问 , 怎样把余下
的部分 ab′与 a′b 按我们的要求粘在一起呢 ?
图6- 3 -2 图6- 3 -3
3
回忆一下 , 我们 在第二章 中介绍 了黎曼曲 面 , 那也是一 种无法 在我们朝 夕生活于 其中的 R
中实现的 . 数学中出现了这样一些研究对象 , 并不只是由于想把微积分的基本 概念弄得 更明白 ,
例如黎曼提出黎曼曲面是与他研究 所谓 阿贝 尔积分 密切 相关的 . 更进一 步 , 他终 生思考 的问 题
是 , 我们生活于其中的空间的物理本性究竟是什 么 ? 对于空 间的 研究 与物理 学的 许多重 大问 题
相联系 .拓扑学的创始者之一庞加 莱研 究拓扑 学开 始是 出于天 体力 学的所 谓 n 体 问 题 , 于是 非
常自然地出现了种种奇特的空间结构 .正是为了研究这些空间结构 , 才进一步感到必须把一些最
基本的概念弄清楚 .这已经是 20 世纪初年的事了 .
2 2
现在再回到上述关于 X 与 S - 的研究 .我们可以 再提 出一 个与它 们同 胚的空 间 .在 S 的 南
2 2
极 N 处作一个切平面 x3 = - 1 , 在这个平面与 S - 间先 建立 一个作 为集 合的一 一对 应 : 若在 S -
上有一点 P , 联结 OP 交 x 3 = - 1 于 P1 ( 见图 6 - 3 - 4 ) , 反之 , 若在 x3 = - 1 上有 一点 P1 , 联 结
2 2
OP1 交 S - 于 P .这样我们令 P 与 P1 对应即 得 S - 与 x3 = - 1 的对 应 .注 意 , 这个 对应还 没有 拓
2
展到 S - 上 , 因为联结 O 与赤道上一点例如 a 点 , 将得到一条与 x 3 = - 1 平行的直线 , 它与 x3 =
4 00 第六章 再论微积分的基础
2
- 1 不会在任意有限远处相交 .所以 , 若想把这个一一对应拓展到整个 S - 上 , 就需要在此平面 上
添加一些理想元素 , 就如同把复平面变成扩充复平面要增加一个无穷远点 z = ∞ , 使 它成为黎 曼
球一样 .但是我们不能简单地在 x3 = - 1 上再添加 一个点 .因为在 扩充复 平面时 , 我们的 目的 是
要把复变量的解析函数推广到 z = ∞附近 , 为此我们要利用 z = 1/ t 以保持 f ( z ) 的解析 性质 , 而
在变换 z = 1/ t 之下 , 扩充的复平面上只许可有一个无穷远点 z = ∞与 t = 0 相应 .现在我们拓展
x3 = - 1 的目的是什么呢 ? 我们希望拓展后 的平 面尽可 能多 地保 持欧氏 平面 的性质 .在 欧氏 平
面上有两个互相对偶的性 质 : ( i) 经 过两 个不 同点 可以 作 一条 且仅 有一 条直 线 联 线 .( ii) 两 条 直
线 , 如果不平行 , 则必有一个且仅有一个有限远处的交点 .请注意 , 第二个提法就是著名的平行线
公设 . 这个公设在欧几里得《几何原本》中表述如下 “
: 若一直线落在两直线 上所构成 的同旁内 角
和小 于两 直 角 , 那 么把 两 直 线 无 限延 长 , 它 们将 在 同 旁 内 角和 小 于 两 直 角的 一 侧 相 交 .”直 到
1795 年 , 普赖菲尔 ( John Playfair) 才把这个公设改述为我们 熟悉的形 式 : 过直线外 一点可 以作 一
条 , 且仅可作一条与此直线平行的直线 .所谓平行直线 ,《几何原本》卷Ⅰ之定义 23 是说 , 即“ 向两
方无限延伸 , 而在两个方向上彼此不相交的直线 .”可见 , 欧几 里得是 非常 谨慎地 避免 说到“在 无
穷远处相交”一类的话 , 因为什么是“无穷远处”在数学上是没有定义的 .现在我 们扩充平 面 x3 =
- 1 想达到的目的就是把上述 ( i ) 、( ii) 两条加 以推 广 , 使 ( i) 成为 : ( i′) 经过 两个不 同点 ( 不 论是 有
限远点还是无穷远点 ) 都可以作一条且仅有一条直线 .( ii) 则推广成 : ( ii′) 两条不同直 线必有一 个
且仅有一个交点 ( 如果它们不平行 , 这个交点就是有限远点 , 如果平行 , 这个交点就是无穷远点 ) .
这样一来“
, 平行线必在无穷远处相交”这个原本含义模糊的命题就变得完全确切清晰了 .一个平
2
面 , 这样添加上无穷远点以后 , 称为射影平面 , 记 作 R P .射 影平面上 的几何学 称为 射影几 何学 .
我们立刻就会看到 , 射影平面与黎曼球面是截然 不同的数 学对 象 .由此可 见 , 为了 达到我 们的 目
的 , 首先要说明什 么是 x3 = - 1 上的直 线 .如果在 x3 = - 1 上已 经有了一 条我们 熟知的 有限 远
3 2
处的直线 ( 或线段 ) l ( 或 P1 Q1 ) , 则 OP1 , OQ1 决 定 R 中 的一个 平面 , 它 与 半球 面 S - 沿 一大 圆
弧 aPQb 相交 .大圆弧 ( 劣弧 ) PQ 对应于 P1 Q1 .在 x3 = - 1 上我 们遇 到了什 么是 无穷远 点的 困
2 2
难 , 可是在球面 S 以及 S - 上却没有这 个困难 .因 此 , 我们 把直 观而朴 素的 直线“ 定义”推 广为 :
x3 = - 1 上 , 大圆劣弧的像就是直线 , 大圆由 通过 球心的 平面 决定 , 大 圆就是 这个 平面与 球面 之
交 .图 6 - 3 - 4 上我们画了一 条通过 有限 远点 P1 的 直线 l , 它决 定 了相 应大 圆的 平面 , 即 OPQ
2
平面 , 它与赤道平面交于直径 ab .如上所 说 , a~ b , 而且 我们以 b 为 代表 元 ( b∈ S - ) , b 既然 在
大圆上 , b 之像就应该在 l 上 .在相应于 l 的大圆 劣弧 ( a , b] ( a 不算弧 上的 点 , 但是 b 算 ) 上 , 只
有这一点在赤道平面上 , 它的像不在有限远处 .因此 , 我们定义 b 的像即 l 上的无穷远点 .这与 我
们的直观是很符合 的 : 直 线 Ob 与 平面 x3 = - 1 平行 , 所 以它与此 平面交 于无穷远 点 .但是从 图
6 - 3 - 4上看 , 由 P1 沿 l 向 Q1 移动时 , 球面 上的相应 点向 b 移动 , 因此趋 向无穷 远 . 但由 Q1 向
P1 移动时 , 球面上相应点也趋向赤道平面 , 所以在 l 上也 趋向无穷 远点 , 那么 是否在 l 上有两 个
无穷远点呢 ? 没有 .因为后一情况 下球面 上的 点趋向 a , 而上面 已经 说过 , a 与 b 是 粘合 在一 起
的 : a~ b , 所以 不论是向 Q1 移动还 是向 P1 移动 , 都 会趋向 l 上的 同一个无 穷远点 .总之 我们 看
2
到 , 在 x3 = - 1 , 即在 R P 上 , 每条 通过 至少 一 个有 限 远点 P 的 直线 l 上 均 有 恰好 一 个无 穷 远
点 , 即大圆与赤道交点 b 的像 .上面我们加上了一点限制 “
: 通过至少一个有限远点 P 的直线 l”.
§3 拓 扑 空 间 4 01
图6 - 3 - 4
∑ i=1
ai xi = a1 x1 + a2 x2 + a3 x3 = 0 . ( 4)
线了 ) .我们规定 , 凡齐次坐 标为 ( x1 , x2 , 0 ) 之 点 称为 无 穷远 点 , 当 然 它们 的 集 合是 无 穷远 直 线
(5 ) .从这一段讨论可以看到 , 无穷远点、无穷远直线与有限点、有限直线比较 , 没有任何本质上的
特殊之处 .这正是射影几何学的精义之一 .
有了这些讨论 , 就可以看到欧氏平面上那两个对偶的性质现在成为
( i′) 过任意两个不同点必有唯一直线 .
2
当这两点都是有限远点 ( 如图 6 - 3 - 4 上的 P1 Q1 ) , 这直线就是 S - 上的大圆弧 PQ ; 若一点
是有限远点 P, 一是无穷远点 b, 就是过 P 与 b 的大圆弧 , 它的像即过 P1 而与直径 a , b 平行的直
线 ; 若两点都是无穷远点 , 这直线就是无穷远直线 .
( ii′) 任意两条不同直线必有唯一交点 .
2 2
这是因为两个大圆必有交点 , 也是因为两个 不同的方 程 ( 4) ai x1 + bi x2 + ci x3 = 0 , a i + b i +
2
c i ≠0 , i = 1 , 2 , 且 ( a1 , b1 , c1 ) 与 ( a2 , b2 , c2 ) 不等 价 , 必 有非 0 的公 共解 .如果 这个 交点不 在赤 道
平面上而是有限远点 , 这就是初等几何中讲的两直线相交于某有限远点 .如果这个交点是赤道平
面上某点例如 b 点 , 则从初等几何看来 , 这两条直线必平行于直径 ab, 而有相同的无穷远点 b 为
其公共点 .这一点读者很容易用立体几何的简单知识证明 .
那么普赖菲尔的平行公设怎么说呢 ? 如果平行线理解为不相交的直线 , 那么这个公设错了 ,
因为它与 ( ii′) 矛盾 .如果把该公设理解为从 l 外一点必有一直线与 l 相交于 l 上的无穷远点 b, 那
么它就是 ( i′) .总之 , 在射影几何中 没有 给“平行 性”留下 特殊 的地 位 , 或 者干 脆就 说 平行 性不 是
射影几何的概念 .
倒是有一点应该强调 , ( i) 与 ( ii ) 是对 偶的 : 把“点”与“直 线”互换 一下 , ( i) 就 变成 ( ii) , ( ii ) 就
变成 ( i) . 射影几何中许多最基本 的定 理都是 对偶 的 , 只 要证 明了 其 一 , 把其 中的 点 与直 线互 换
就得到另一个对偶的定理 .初等几 何中 的许多 定理 都有 这样的 性质 .而 在现 代数 学中 点 x 与 方
向数所代表的向量ξ的对偶关系 , 起 了十 分重要 的作 用 . 我们在 第五 章中还 联系 着 量子 力学 讨
论了这种对偶关系 .这种对偶关系和射影几何中的对偶关系本质上是相通的 .
我们似乎离题太远 , 这是 有原 因的 . 射影 几 何起 源 于透 视 , 这 在 建筑 学 与 绘画 中 都是 基 本
的 .在 19 世纪中 , 射影几何成了数学发展的主流的一个突出的部分 .当然 , 时过境迁 , 现在可以说
是风光不再了 .然而 , 它的许多基本概念都成了数学中 不可少 的财 富 .由于它 与默 比乌斯 带等 等
有密切关系 , 而默比乌斯带在许多问题上又是典型 , 如它的单侧性、不可定向性 ( 在下一章我们将
看到这些概念在微积分中是多么重 要 ) , 所以 , 对 射影 几何的 一些 基本概 念还 是知 道一些 为好 .
因为现在大学的数学课程一般都不再讲有关内容了 , 我们借 此机 会在 这里多 占用 一些篇 幅讲 了
以上的内容 .下面还是回到拓扑学的问题 .
3 2 2
我们上面实际上是讲了三个集合即 X (R 中过原点之直线 的集合 ) , S - 以及 RP 之间有 一
一对应关系 .但是重要的是如何在其上建立拓扑 , 从而使得这些集合之间的一一对应变为拓扑空
2 2
间的同胚 .这里最容易的从 S 开始 , S 上如何定 义开集似 乎直观 上没有 什么 困难 .我们 也可 以
2 3 2 3
一言以蔽之 : 让 S 赋有 R 的子空间拓扑 , 即 U S 为一 开集 , 当且仅 当有一 个 R 的 开集 V ,
2 2 2 2
使 U = V ∩ S .进一步我们来定义 S - 上的拓扑 , 由于 S - 是 S 在一种 等价关 系~下的 商空间 ,
2 2 2
我们说 U S - 是一个开集的意义如下 : 任找一个 x∈ U , 它在 S 中所定义的等 价类是 S 的 一
§3 拓 扑 空 间 4 03
有限子集{ U1 , … , U N }使 A ∪U
k= 1
k , 从而 f ( A ) ∪ f( U
k=1
k )= ∪V
k= 1
k , 即是 说{ V 1 , … , V N } 是
f ( A ) 的有限子覆盖 , 从而 f ( A) 为紧 .证毕 .
注 如果 A = X , 这个定理仍成立 .
紧集在连续映射下之像仍为紧 , 但 ( Y , σ) 中 的紧 集 K 在 ( X , τ) 中的 原像 则不一 定为 紧 .如
- 1
果对 Y 之任一紧子集 K , f ( K) X 仍为紧 , 则 f 称为适当的 ( proper) .
紧集在同胚映射下之像当然仍是紧的 .这个简单的事实却告诉我们一个重要事实 : 若 X = Y
= R, A = [ a , b] X , B = ( a , b) ∈ Y , 则 [ a , b] 与 ( a , b) 决 不可能 同胚 , 否 则 ( a , b) 将成 为 R 的
紧子集 .但在§1 中我们已经看到 实数 系的 紧子 集 必为 有界 闭集 , 而 ( a , b) 不 是有 界闭 集 , 所 以
n
它与 [ a , b] 不可能同胚 .由此看来 , 开区间与闭区间 的拓 扑性质 有很 大的 区别 .到高 维 R 时 , 情
况也一样 .所以在整个微积分理论中 , 我们时时都要注意是在开集还是在闭集 上讨论问 题 . 最 简
单如函数 f ( x ) 的连续性 , 在闭区间上讨论时我们 习惯把连 续性了解 为单侧 连续性 , 只是 最简 单
的例证 .
紧性与闭性有密切的关系 , 我们有
定理 7 紧空间 X 的闭子集 A 必为紧集 .
c 0
证 设 A 有一个开覆盖{ Uλ } , 因为 A 为闭 , 所以 A = X \ A 是 X 的一个开子集 , 记作 U ,
0 0
于是{ Uλ , U }构成 X 的开覆盖 , 而存在一个有限子覆盖 .不失一般性 , 我们可把 U 也列入这 个
N
∪U
0 0
子覆盖中 , 而得有限子覆盖为{ U1 , … , U N , U } , 所以 X = U ∪ k .所以 上式右方 亦必 覆
k=1
N
∪U
0
盖 A .但 U ∩A= , 所以 A k , 即 是 说 从 { Uλ } 中 可 以 找 到 A 的 有 限 覆 盖 { U1 , … ,
k= 1
U N } , 所以 A 是紧集 .
这个定理的逆则不太一样了 .
§3 拓 扑 空 间 4 05
定理 8 豪斯多夫空间的紧子集 A 必为闭 .
c
证 为证 A 是闭集 , 只需证明任一点 x∈ A = X \ A 必有一个与 A 不相交的邻域 V 即可 .
为此任取一点 z∈ A , 由 于 X 是 豪 斯 多 夫 空 间 , 故 必 有 x 与 z 的开 邻 域 V x 与 U z 互 不 相 交 :
V x ∩ Uz = .但{ U z } z ∈ A 是 A 的 一 个 开 覆 盖 , 故 必 有 一 个 有 限 子 覆 盖 { U1 , … , U N } 使 A
N N
∪U
k= 1
k = U .相应地则有 x 的有限多个开邻域 { V 1 , … , V N } 使 V i 与 Ui 不 相交 .记 V = ∩V
k=1
k ,
A 2 的邻域 Ux ( 即上面的 ∪ Uk = U ) , 使得 V x ∩ Ux = , 而 A2 Ux , 但是 { V x } x ∈ A 1 构成 A1 的
k=1
M
开覆盖 , 所以可以由其中选出有限个 V x 来 : { V1 , … , V M } , 使得 A1 ∪V
k= 1
k = W1 , 在 { Ux } x ∈ A 2
M
中取出相应 的 { U1 , … , UM } , 则 A2 ∩U
k= 1
k = W2 , W2 是 A2 的开 邻域 , 而且 仿照 上面 的 证法 ,
W1 ∩ W2 = .定理证毕 .
这个定理告诉我们 , 一个空间若为豪斯多夫空 间 , 则不但 其不 同点是 互相 分离 的 , 而 且其 不
相交的紧子集也是互相分离的 .
n
至此 , 我们试图来刻画一 个拓 扑空 间的 全部 紧 子集 .最 简单 的情 况 当 然是 R , 我 们可 以 证
n
明 , R 中的全部紧子集 , 即全部有界闭集 .所 以早 期一 点的微 积分 教材时 常不 讲紧 性这个 概念 ,
n
而只讲其有界闭集如何如何 .不言而喻 , R 必是豪斯多夫空间 .
n n
定理 10 R 的紧子集 , 即 R 的有界闭集 .
1
证 我们只对 n = 1 来证明 , 先 证 R 中 的有 界闭 集 A 为紧 集 .这在 本质 上就 是 §1 定 理 6
( 海涅 - 博雷尔定理 ) , 不过那里讲的只是闭区间 [ a , b] 而不是一般的有界闭集 A , 所 以要稍作 修
c
改 .因为 A 是有界的 , 所以必有一个有界闭区间[ m, M] , 使 A [ m , M] .令 A = [ m , M ] \ A, 则
c c
A 是子空间拓扑中的开集 . 设有 A 的开覆盖{ Uλ } , 则 { Uλ , A }构成 [ m , M ] 的开覆盖 , 而由§1
c c
定理 6 , 必有一个有限子覆盖 { U1 , … , U N , A } , 我 们一 定可以 把 A 取走 , 这 不会 有 影响 . 于 是
{ U1 , … , U N }成为 A 的覆盖 , 从而 A 为紧 .
n n n
再证另一方面 .设 A 为 R ( n = 1) 的紧子集 , 今证 A 是 R ( n = 1 ) 的有界闭子集 .因为 R 是
豪斯多夫 空 间 , 由 定 理 8 知 A 为 闭 集 , 余 下 的 只 要 证 明 A 为 有 界 的 即 可 .作 开 区 间 In =
( - n , n ) , 则 { I n }是 A 的一个开覆盖 ( 注意 A 中的元都是数 , 而±∞不是 数 , 所 以 A 中任一 个 x
4 06 第六章 再论微积分的基础
< ±∞ , 则 A [ - M , M ] 中从而 A 有界 , 证毕 .
n
至此 , 我们已成功地刻画了 R 中 的全 部紧子 集 .那 么读 者会 问 , 能 否类 似地 刻 画度 量空 间
中的全部紧子集即全部有界闭集 , 至少是刻画巴拿 赫空间或 希尔 伯特 空间的 全部 紧子集 即为 有
界闭集呢 ? 不行 , 而且这是有深刻的理由的 .所以我们 暂时把 它放 在一边 而来 进一 步讨论 紧性 .
不过从现在起我们要特别注意一般的拓扑空间与度量空间的区别了 .至少 , 所有度量空间都是豪
斯多夫空间 ( 请读者自己证明 ) , 而一般拓扑空间则不一定是 .
先看定义在一紧集 A 上的连续函数的性质, 这个连续函数 f ( x ) , x∈ A , 可以看成是由 A X
( X 是一个拓扑空间 ) 到 R 的连续映射 .
定理 11 设 ( X , τ) 是一个拓扑空间 , A X 是 X 的 紧子集 . f ( x ) : A → R 是 A 上的 连续 函
数 , 这时 f ( x ) 必定是有界函数 , 而且可以达到其上、下确界 .
证 这个定理就是§1 定理 7 的 ( i ) , 我们换一个更简单的证法 , 可以更清楚地看到它与度量
性质没有关系 .可以说它是一个纯粹紧性的证明 .
由定理 6 , f ( A ) 必为 R 之紧子集 .由定理 10 又知 f ( A) 是有界闭集 . 既然 f ( A ) 作为 f 之值
域是有界集 , 故 f ( x ) 在 A 上有上、下确界 M = sup f ( x ) , m = inf f ( x ) , 又因 f ( A) 是闭集 , 其上、
A A
我们用反证法证明它 .设定 理结 论不 真 , 则必 存 在 X 之 子集 序列 An , 使 所 有 An 均不 含 于
{ Uλ }之任一元 Uλ 内 , 但 diam A n → 0 .在 An 中选一点 x n , 于 是得 一无 穷子集 { x n } , 由魏 尔斯 特
拉斯 波 尔 查诺 性 质 , 这 个子 集 有 极 限 点 P , 因 为 { Uλ } 是 X 的 一 个 开 覆盖 , 故 必 有 一 个 U ∈
{ Uλ }使 P ∈ U .今 取 ε> 0 , 使 Bε ( P ) U , 再 取 N 足 够 大 使 得 ( i ) diam AN < ε/ 2 ; ( ii ) x N ∈
ε
Bε2 ( P) , 于是 ρ( x N , P) < , 而对 An 之任何一点 x , ρ( x , P) ≤ρ( x , x N ) + ρ( x N , P) < ε.这 表
2
明 AN U∈{ Uλ } , 这与 A N 不含于{ Uλ }之任一元之内相矛盾 .
注 以上说{ xn } 是一无穷子集需要 解释 , 因 为一 个集 合中 每 个元 只能 计一 次 ( 而序 列则 不
然 , 若说{ x n }是一序列 , 即定义在自然数集上 的函 数 , 则 同一 个 x n 可以 出现多 次 , 例如 §2 讲 到
度量空间完备化时讲到的常驻序列 ) , 而这里的 xn 取 自 A n 却是 可以 重复的 .若 x n 0 重复 了无 穷
无穷多个不同的 x n 而上面的讨论可以顺利进行 .
现在我们就来讨论度量空间的紧性 , 注意 , 它与一般拓扑空间是有区别的 .
首先来看一致连续性 , 设 X , Y 是两个度量空间 , 其度量分别是 ρ与σ, 我们说映射 f : X→ Y
是一致连续的 ( 或者准确一点说是关于 (ρ,σ) 一致连续的 ) 是指对任意 ε> 0 , 必可找到常数 δ(ε)
> 0 , 使当 ρ( x1 , x2 ) < δ时 ,σ( f ( x1 ) , f ( x2 ) ) < ε,δ(ε) 与 X 中取 x1 , x2 之取法无关 .
定理 14 若 X , Y 为度量空间 , 其度量为 ρ和σ, 若 X 为紧 , 则一切连续映射 f : X→ Y 必在
X 上一致连续 .
我们有以下的基本定理 .
定理 15 若 X 为一度量空间 , 则以下三个命题等价 ,
( i) X 为紧 ;
( ii) X 具有魏尔斯特拉斯 波尔查诺性质 ;
( iii) X 为列紧 .
证 ( i) ( ii) : 即定理 12 应用于度量空间 .
( ii) ( iii) : 设{ xn } X 为 一无 穷 序列 .定理 13 的 注 中 我们 强 调了 , 一个 序 列 { x n } 与 子 集
{ xn } 之区别在于前者允许有相等的 xn , 后 者则不 允许 .今设 { x n } 中 有无 穷多 个彼 此 相等 的元 ,
即有 x n 1 = xn 2 = … = x0 , 于是子序列 { x n k } 是一个常驻 序列 , 它自然 收敛于 x0 ∈ X .若 { xn }中 没
ε1 1 ε1
= ε2 > 0 , 且 ε2 < , 仿此可得一个序列{ xn k } , 使 ρ( xn k , x0 ) = εk < εk - 1 < … < k - 1 , 而且 εk >
2 2 2
0 , 很明显 klim xn k = x0 而 ( iii) 得证 .
→∞
Bε ( Pk ) , k = 1 , 2 , … , N 使 ∪ Bε ( Pk ) = X .{ P1 , … , PN } 就称 为一 个 ε网 , 所 以若 一 度量 空间 为
k= 1
1
但是 φ( x ) 是一致连续的 , 上式中 | x - ai | , | x - ai + 1 | ≤ , 故当 n 充 分大 时 , ( 71 ) , (7 2 ) 左右 两
n
方之项绝对值均小于 ε, 因此对 x∈ I , 有
( n)
sup | φ( x ) - φ ( x ) | < ε, ( 8)
I
而得到 M 的一个由折线组成的ε网 , 记为 N1 .
( n)
这些折线还是有界的 , 因为对每条折线 φ ( x ) 而言
( n) ( n)
|φ ( x ) | ≤ | φ( x ) - φ ( x ) | + | φ( x ) | ≤ε+ C≤ C + 1 .
这里 φ( x ) 是 M 中适合 ( 8) 式的曲线 , 而 C 是 M 中元素绝对值的公共上界 .
当然 , 这个 ε网不是有限的 , 但每一条折线均由固定的分点 x = ai 处折线的纵坐标 bi 决定 .
n+ 1
所以每一条折线对应于 R 中的一点 ( b0 , b1 , … , bn ) .因为每个 | bi | 都 有界 , 故对应 于上面得 到
n+ 1
的 ε网的 ( b0 , b1 , … , bn ) 之集合是 R 的一个紧集 , 因而有一个有限 ε网 , 记为 N 2 .这个新的有
( n) ( m)
限 ε网 N2 之每一点对应于一条折线 ψ ( x ) .取 N 2 中的 ψ ( x ) , 即有
( m) ( n) ( n) ( m)
| φ( x ) - ψ ( x ) | ≤ | φ( x ) - φ ( x)| + |φ ( x) - ψ ( x ) | < 2ε.
所以 N2 是 M 的 2ε网 .因为 2ε是任意数 , 我们不妨仍记为 ε网 N2 .
这个 N2 中之函数绝对值仍有公共上界 .
在必要性部分中我们已证明了 , 度量空间 X 中任一列紧集均有 有限ε网 .现在要证 明其逆 :
若这个度量空间 X 还是完备的 , 而闭子集 M 又对任意ε有有限的ε网 , 则此闭子集 M 必为列紧
的 .这两个结论合起来是豪斯多夫 证明的 一个 定理 .我 们 要特 别注 意其 充分 性 部分 中假 设了 X
是完备空间 .
现在证明其充分性部分 , 取一串 εn W 0 再取 M 中一个序列 S0 = {φ1 , … , φN , …} , 先作 M 之
( 1) ( 1) ( 1)
ε1 网 , {ψ1 , … ,ψN , …} , 以它们为心 ε为半径 作球 Bε1 ( ψk ) , 必 可覆盖 M , 因此 至少有 一个 这
样的球包含了{φ1 , … , φN , …} 之无穷多个元 , 记为
(1) (1 )
S1 = {φ1 , … , φN , … } .
下面只看序列 S1 , 再作 M 的有限ε2 网以及相应的 以 ε2 为 半径的球 , 于是 又可找 到 S1 的 一个 子
序列全含于此球中 :
(2) (2 )
S2 = {φ1 , … , φN , … } .
仿此可以作出 S 2 之子序列 S3 , S3 的子序列 S4 , … , 而每一个 子序 列都 含于半 径为 εk ( W 0 ) 的 球
中 .取这些子序列的对角线序列
(1 ) (2) ( N)
{φ1 , … , φ2 , … , φN , … } ,
请读者自己证明它 是一个柯 西序列 , 而因 X 为完备 的 , 所 以它有 一个极限 φ∈ X .又 因 M 是 一
闭集 , 所以 φ∈ M .这样得知 , 在 M 中任一序 列 S0 都有一 个收 敛子 序列收 敛于 M 之某个 元 φ .
这样 M 是列紧的也就是紧的 .定理证毕 .
p
与数学中许多重大的定理一样 , A - A 定理在 L ( I) 中也有 由里斯 证明了的 相应的 结果 : 设
p
M L ( I) , 使得
( i) 存在一个常数 K , 使得一切 φ( x ) ∈ M 均有
∫
p p
| φ( x ) | d x ≤ K ,
I
4 12 第六章 再论微积分的基础
∫
p p
| φ( x + h) - φ( x ) | d x ≤ε , ( 9)
I
p
这时 , M 必为 L ( I) 中的紧集 .
p
很容易看出 , ( 9) 就是 L 意义下的等度连续性 .它在上面的 讨论中 起了关键 作用 .因此我 们
自然要问 , 它在什么条件下可以成立 ? 我们仍以 C( I) 为例说明它 .若 φ( x ) 不 仅连续 , 而且有 一
阶连续导数 , 于是
φ( x1 ) - φ( x2 ) = φ′(ξ) ( x1 - x2 ) , x1 ≤ξ≤ x2 .
ε
如果 sup | φ′(ξ) | = K < + ∞ , 则 对 任 给 的 ε, 令 δ( ε) = , 即 知 当 | x1 - x2 | < δ( ε) 时
K
| φ( x1 ) - φ( x2 ) | < ε, 而如果这个 K 不只适合某一个 φ( x ) , 而且 适用于 M , 则 M 是等 度连 续
的 .因此 , 我们不必假设 M 等度连续 , 而是换一个空间 :
1
C ( I ) = {φ( x ) , φ与 φ′在 [ a , b] 上连续} .
1
在 C ( I) 中我们可以定义范数为
‖φ‖ C 1 = sup ( | φ( x ) | + | φ′( x ) | ) .
I
1
很容易看出 C ( I) 成了一个巴拿赫空间 ( 即完备的赋范线性空间 ) , 这个空间中的有界集
1
M = {φ( x ) ∈ C ( I ) , sup( | φ( x ) | + | φ′( x ) | ) ≤ K}
中的元 , 不但其本身有 公 共的 界 K , 而且 一 阶导 数 也 有公 共 的 界 K , 所以 是 C ( I) ( 注意 , 不 是
1
C ( I) 而是 C( I) ) 中的有公共的界 ( 不妨称为一致有界 ) 的等度连续函数集 .因此在 C( I ) 中为预
1 1
紧 . C ( I ) 作为一个集合是 C( I) 的子集合 , 我们就说 C ( I ) 可以嵌入在 C( I) 中 .同 样上面 的 M
1 1
也嵌入在 C( I) 中 , 但是 M 在 C ( I) 只是 C ( I) 范数下的 有界 集 , 而在 C ( I) 中则 它———或者 说
是它的嵌入像———是一个预紧集 .我们就说 M 是紧嵌入在 C( I) 中 .所以 , 为了应用 A - A 定理 ,
1 1
我们先不妨把 M 放在 C ( I) 中 , 并证明它是 C ( I) 中的有界集 .就是说先不妨去证明 φ( x ) ∈ M
都有一阶连续导数 , 然后去估计 φ( x ) 及其导数 φ′( x ) 并 证明 sup( | φ( x ) | + | φ′( x ) | ) ≤ K , K
适用于整个 M 而不只是 M 中某一具体函数 .下一步就是证明 M 可以紧嵌入于 C( I ) 中 , 这样 从
M 中的一个序列{φk ( x )} 找出一个收敛子序列 .因此 A - A 定理就是一个紧嵌入定理 .我们只讲
了一个最简单的例子 , 但是读者们应注意到 , 这是数学 和数学 物理 中极重 要的 方法 .例如 在第 三
章变分学一节中我们讲到某个泛函 ( 例如能量泛 函 ) 的极小化 序列 , 它 可能是 某个 索波列 夫空 间
k l
H ( Ω) 中某个集合 M 的序列 .我 们不 知道 它是 否 会收 敛 , 但不 妨证 明 它在 另一 个空 间 H ( Ω)
k l
( l < k, 可能还要附加一些别的条件 ) 中是紧的 , 即 H ( Ω) 的某个 集合 M 紧 嵌入于 H ( Ω) 中 , 因
l 1
此这个极小化序列至少在 H ( Ω) 中有收敛的子序列 .当然与上面的 C( I) 和 C ( I) 不同 , 这里 的
2
讨论要以 L 理论 为 基础 , 但 其 基本 思 想 是 一 致的 .它 们也 有 共 同 的 问 题 : 上 面 我 们 虽 然 涉 及
1 1
C ( I) , 我们得到的子序列都只是在 C( I) 中收敛 , 其极 限函数 只能在 C ( I) 中而 不在 C ( I ) 中 .
l k
同样 , 在变分问题中我们得到的 极小 化序列 也只 在 H ( Ω) 中 , 而不 在 H ( Ω) 中 .这 里产 生的 新
问题当然又需要其它方法来解决 .但不论如何 , 我们看到了紧性问题是整个数学中的一个重大问
题 , 而决不只是怎样把微积分的基本概念弄得更清楚的问题 .
关于紧性的讨论至此为止 .
4. 连通拓扑空间 另一个需要认真研究的问题是空间的连通性问题 .这是一个 与空间的 度
§3 拓 扑 空 间 4 13
1
q( x ) ≥ .
2
特别是因为 x→∞时 q( x ) → 1 , 故知当 | x | ≥ R 时 q( x ) > 0 .于是由
n n n
p( b) = b q( b) , p( - b) = ( - 1) b q( - b)
知道 p( b) 与 p( - b) 异号 , 而此定理得证 .
由代数学的基本定理 , 知 p ( x ) = 0 共 有 n 个 根 , 但可 能是复 根 .只不 过当 n 为奇数 时一 定
至少有一个实根 .所以 n 为偶数 以及 其它复 根的 情况还 要用 代数 学的基 本定 理来 处 理 .我们 想
要提到的是 , 代数学的基本定理也可以用拓扑学方法去证明 .
中间值定理与不动点定理有密切 的关系 , 在 §2 中 我们 已经从 度量 空间 的完 备 化引 申出 压
缩映像有唯一不动点存在 .在那里 , 我们把待解的方程 g( x ) = 0 化为
x - f ( x ) = 0 , 即 f ( x ) = x - g( x ) .
然后 g( x ) = 0 之解 x0 即映射 f 下的不动点 : f ( x0 ) = x0 .现在要讲的不动点原理却与度量空 间
的完备性无关 , 我们假设 f 是拓扑空间 X 的子集 Ω 上 的一个 连续 映射 .我们 不要 求这个 映射 是
压缩的 , 但要求 f 把 Ω 映入 Ω: f ( Ω) Ω .这种映 射可 称为自 映射 .我 们指 出 , 若 Ω 具有 某些 性
质 , 则其一切连续的自映射都有不动点存在 .例如我们有
定理 21( 一维的布劳威尔 ( Brou wer ) 不动点定理 ) 设 I 为 R 的有界闭区间 , f : I→ I 是连 续
映射 , 则必有至少一点 x0 ∈ I , 为 f 之不动点 :
f ( x0 ) = x0 .
证 考虑 g( x ) = x - f ( x ) , 若 I = [ a, b] , 先看 g( a) 与 g( b) , 因为 f 映 连通空间 I R到
f ( I) , 所以 f ( I) 也是一个区间 ( α,β) [ a , b] ( 也可能 是 [ α, β) , (α, β] 或 [α,β] ) , 从而 α≥ a ,β
≤ b .若 α= a 或β= b, 则 x = a 或 x = b 即为所求不动点 .若 α= a , β= b 均不成 立 , 则 必有 α>
a ,β< b, 因此 g( a ) = a - f ( a ) = a - α< 0 , g ( b) = b - f ( b) = b - β> 0 .由 中间值定 理即知 一
点存在 x0 ∈ [ a , b] , 使 g( x0 ) = 0 , 亦即
f ( x0 ) = x0 .
定理证毕 .
布劳威尔定理在一个方面不如压缩映像原理 .因 为它没 有给 出例 如逐步 逼近 法那样 的实 际
找出不动点的程序 .它是一 个非 构造 性的 存 在定 理 .同时 , 它也 不给 出 唯一 性 .但是 它 对映 射 f
的要求很少 : 只要是连续的自映射即可 .与此相对比 , 它对空 间 X 的子集 Ω( 现 在是区间 I ) 的 要
n
求很高 .这里的 I 是 R 的紧集 , 但是如果 X = R 是有限维的 , 紧集并不 起重要 作用 , 下面就是 一
1 2 2 1
个例子 .设 Ω 是平面上的圆周 , 不妨就说是 S : x1 + x2 = 1 .如果把 此平 面看作 是复 平面 , 则 S
iφ 1 1 iφ i ( φ+ α)
可以写为 z = e , 令 f 为一旋转 : f : S → S , e →e ,α是常数 , 很 明显 , f 是一个 连续的自 映
射 , 但是它明显没有不动点 .可见是否存在 不动点 , 与 Ω 的拓 扑性 质密切 相关 .我 们将在 附录 中
给出一个一般的布劳威尔定理一个证明 :
n n 2 2 n n
定理 22( 布劳威尔定理 ) 设 D R 是 n 维 闭球体 x1 + … + x n ≤1 , f : D → D 是 一个 连
n
续映射 , 这时 f 在 D 中至少有一个不动点 .
n n
还要指出 , 若将 D 换成 D 中的凸体 , 这个定理仍成立 .
布劳威尔定理本质上属于另一个领域 .这个领域中的问题例如有 : 某个区域上连续向量场有
附录 布劳威尔不动点定理的初等证明 4 17
附录 布劳威尔不动点定理的初等证明
下述的布劳威尔定理是一个重要的拓扑定理 :
n n
布劳威尔定理 设 f : D → D 是一个映 n 维闭单位球体
n 2 2 2
D : x1 + … + x n = ‖ x ‖ ≤1 ( 1)
n
到其自身的连续映射 , 则 f 必有至少一个不动点 x∈ D :
f(珔
x) =珔
x .
这个定理涉及拓扑学中许多重要的概念 .下面我们将要给出它的一个解析的证明 .比之它的
拓扑本性 , 这个证明可以说是初等的 .这个证明是米尔诺 ( J .Milnor) 于 1978 年给出的 , 原文是 :
J . Milnor, Analytic Proofs of the Hairy Ball Theorem and the Brou wer Fixed Point Theorem ,
Amer . Mat h . Mont hly , vol . 85 (1979) , 521 ~524 .
该文首先证明了另一个更强 的定 理 : 偶 数维 球面 上不 可能 把 头发 梳顺 , 即 所 谓“ 头 发定 理”
( hairy ball t heorem) :
2n 2n+1
定理 1 令 S 是 R 中的单位球面
2n 2 2
S : x1 + … + x2 n + 1 = 1 , ( 2)
2n
则 S 上任一个连续切向量场必有零点 .
1 1
证明的准备 我们只需 就 C 切向量场证明 本定理即可 , 因为任意连 续切向量场均可 用 C
2n 2n+ 1
切向量场 去逼 近 .事实 上 , 若 ξ: S → R 是 一个 连续切 向量 场 :ξ= ξ1 , … ,ξ2 n + 1 .由 魏尔 斯
1 ε ε 2n 2
特拉斯定理 , 一定可以找到 C 向量 ξε ( x ) = ξ ( x ) , … ,ξ 1 2n+ 1 ( x) .使 得在 S 上‖ξ - ξε ‖ =
2 n+ 1
ε 2 2 2n
sup2 n ∑ ξi ( x ) - ξi ( x ) < ε .但是 ξε ( n ) 不一定是切向量 , 所以我们把它投影到 S 在 x 点的
x∈ S i= 1
1
切平面上 , 得到一个切向量 ηε ( x ) .很明显 ηε ( x ) 仍为 C 切向 量场 , 而且仍 有‖ξ - ηε ‖ < ε.如
2n 2n
果对 ηε 可以证明定理 1 , 则必有 xε ∈δ 适合ηε ( xε ) = 0 .因 为 S 是紧 的 , 故当 ε→ 0 时 , 可以 找
2n
到一串 ε→0 ( 仍用记号 ε) 使 xε 有极限 x ∈ S , 而且
ξ( x ) = εlim ηε x = 0 .
→0
1
所以下面我们设定理 1 中的切向量场 ξ( x ) 是 C 切向量场 .
2n 1
我们用反证法证明定理 1 .设 ξ( x ) ≠ 0 , 于是 可 以作 出 S 上 一 个 C 单 位 切 向量 ν( x ) =
2 n+ 1
- 1 2 2
ξ( x )| ξ( x ) | .这 里 S( x) = ∑ξi ( x ) 是 依 赖 于 x 的 而 与 上 面 的 记 号 ‖ S ‖ =
i= 1
2n
是绝对值 .有了 ν( x ) 以后我们构造一个单位球面 S 的映射
2n
φt ( x ) = x + ν
t ( x ) , t∈ S . ( 3)
因为 x 是单位径向量 ,ν( x ) 是单位切向量 , 而与 x 正交 , 故
φt ( x ) = 2
1+ t .
2 n 2
从而 (3 ) 中的 φt 映单位球面 S 到半径为 1 + t 的球面 记作 1+ t S
2 2 n
上 , 再令
f t = | x | φt x/ | x | ( 4)
2n+ 1
/ 0 中是一个 C1 映射 , 它将半径为 r 的球面 S 2r n 映到 2 2n
则 f t 在 Rt × R x 1 + t St 内 .
现在我们考虑 φt 与 f t 的性质 .
2n 2n
引理 2 当 | t | 充分小时 φt 是 S 到 S 上的微分同胚 .
2n 1 2n
证 φt 显然是 ( t , x ) 在 R t ×S 上的 C 映射 .但因 S 并非欧氏 空间 , 我 们只能采取与坐 标
2n
无关的处理方法 .注意到 如果限 制在 S 上考虑 , 则当 t = 0 时 , 它 就是恒 等映射 , 因此 其切映 射
dφ0 = id = I .而当 | t | 充分小时 , dφt 也与 I 充 分接 近而为 非退 化的 , 因 此可以 应用 反函数 定理 知
2n
道 φt 当 | t | < ε(ε是一适当选定的正数 ) 时是局 部微 分同胚 .但 是我 们的目 的是 要证 明 φt = S
2 2 n
→ 1 + t S 是整体微分同胚 .关于可微性不必证明 , 现在证明它是一个双射 .
先证明它是满射 .
2 2n
设 P∈ 1 + t S 在φt 之像内 , 则因 φt 在 P 之某邻域中是微 分同胚 , 所以 P 之 某个邻域 必
2n 2n 2 n
全在φt 之像中 , 即是说 φt S 是一个开集 .φt S 又 是一 个闭 集 .因为若 Pk φt S , k
2 2n 2 n 2n
= 1 , 2 , … , 而且 Pk → P∈ 1 + t S , 则 必有 Qk S 使 Pk = φt Qk .因为 S 是紧集 , 由 波
尔查诺 - 魏尔 斯特拉斯 定理知 Qk 必有收 敛的子 序列———不妨设 就是 Qk 本身 , 故 Qk → Q ,
2 n 2n 2 2n
而由 φt 在 S 上的连续性知φt Q = P , 因此 P 也在 φt 之像内 , 因此 φt S 又是 1+ t S 之
2 n 2 2 n
闭集 , 总之 φt S 是 连通 集 1+ t S 之 非空 ( 非空 几 乎是 自 明的 ) 又 闭又 开 集, 故 即 为
2 2 n
1+ t S .满射证毕 .
再证明 φt 当 | t | 充分小时是单射 , 这时要用 反证 法 .设结果 不成 立 , 则一定 有一 串 tn → 0 , 而
2n 1 1
Q k 使 Qk ≠ Q1k , φt n 2 n
φt n 不是单射 , 即在 S 上存在 Qk , Qk = φt n Qk .再利用 S 之紧性 ,
1 1 1 1
可以认为 Qk → Q , Q k → Q , 而 φ0 ( Q ) = φ0 Q .但是 φ0 = id 是恒等 映射 , 故 Q = Q .这样 当
1 1
k 充分大时 , Qk 与 Q k 均在 Q 的一个邻域中 , 而 φt k 在此邻域中是微分同胚 , 故不 可能当 Qk ≠ Q k
1
时φt k Qk = φt k Qk .故得单射性质 .
引理 2 证毕
2n+1 2 n
在引理 2 的证明中我们避免了使用 R 中的 坐标 .因为在 S 上 , 这 2 n + 1 个坐标 不是 互
2n+1
相独立的 , 但在完成定理 1 的证明时 , 却要利用 R 中的坐标了 .
2n 2n+1 2 n+1 2n+1
定理 1 证明的完成 S 是 D 的表面 , 现在在 R 中考虑映射 (4 ) , 而且就采用 R 中
的坐标 : x = x1 , … , x2 n + 1 ,ν( x ) = ν1 , … ,ν2 n + 1 , f t = ft , 1 , … , ft , 2 n + 1 利用 (3 ) 有
f t ( x ) = x + t | x |ν x/ | x | .
附录 布劳威尔不动点定理的初等证明 4 19
所以
f ti ( x )
det = det δij + t | x | νj ( x | x | ) , ( 5)
xj xj
而且 t = 0 时 , 这个行列式为 1 , 所以当 | t | 充分小时 , 这个行列式应该为正 .
2n+ 1
现在计算 D 在 ft 下之像的体积 .一方面如果把球体看成一层一层的球壳 ( 其 厚度为无 穷
2n 2 n
小 ) 组成 , 而每一个球壳又看成 S r , 它在 ft 映射下成为 S 1 + t
2
r
, 所以
2n+ 1 2n+ 1 2 n+1
2
vol f t D = 1+ t vol D . ( 6)
另一方面
ft ft
∫ ∫
2 n+1
vol ft D = det dx = det dx .
2 n+ 1
x 2 n+ 1
x
D D
ft 2n+1
这里利用了 det > 0 .右方由 ( 5) 式应该是 t 的 2 n + 1 次 多项 式 , 但是 1+ t
2
不是 多
x
2n
项式 , 这就是矛盾 .这个矛盾来自假设 S 有一个切向量场ξ( x ) ≠0 .所以定理 1 得证 .
下面还需要一个定理 , 它讨论的不是切向量场 , 而 是一般 的连 续向量 场 : 和定 理 1 的 情况 不
一样 , 这个定理的结论与空间的维数奇偶性无关 , 所以我们设空间维数为 n .
n n n - 1 n
定理 3 设 ξ( x ) 是 D 上的连续向量场 .设在 D 的边界 S 上 ,ξ( x ) 指向球体 D 之外 , 即
在| x| = 1 处
〈x ,ξ( x )〉≥0 .
n
这时 ξ必在 D 中有零点 x , 即 | x | ≤ 1 且 ξ( x ) = 0 .
证 分成两种情况
n
首先设 n 为偶数 .把 ξ拓展为 2 D ( 即半径为 2 的闭球体 ) 上的连续向量场 ξ如下 :
ξ( x ) | x | ≤1 ,
ξ( x ) = ( 7)
| x | - 1 x + 2 - | x | ξ x/ | x | , 1≤ | x | ≤2 .
n
很明显 ξ( x ) 在 2 D 上是连续的 , 且在 1≤ | x | ≤2 处
2 x x 2
〈ξ( x ) , x〉= | x | - 1 | x | + 2 - | x | 〈| x | ξ , 〉≥ | x | - 1 | x | > 0 ,
| x| | x|
这里我们利用了
x x
〈ξ , 〉≥0 .
| x| | x|
x n n n n - 1
注意 是单位向量 .所以 ξ在 2 D \ D 上不为 0 .在 2 D 之边缘即球面 2 S 上, 因 | x | = 2,
| x|
有 ξ( x ) = x 即是径向向量 .
n+ 1 n n n
增加一个维数而考虑 2 D , 其边缘是 2 S .现在作一个映射 φ把 2 D 映到 2 S 的下半球 面
n n
上且得其上的切向量场ξ, 并使在 2 D 的表面 ( 映为 2 S 的赤道 ) 上 , 如 A、B、C、D 四 个向量仍 映
为与赤道平面正交的向量 ( 如图附 - 1 ) .图附 - 1 只是用几何图形说明它 , 如果要写出 φ来 , 则 可
以利用球极投影 .为了避免复杂的运算 , 我们没有把式子写出来 .
n =
现将 ξ 拓 展 到 2 S 的 北 半 球 面 成 ξ .如 果 南 半 球 面 上 有 一 点 P = x′, xn + 1 , x′=
=
x1 , … , xn , 则北半球面必有一个对称点 Q = x′, - xn + 1 .我 们定 义 ξ( Q ) 之前 n 个 分量 与
4 20 第六章 再论微积分的基础
图附 - 1
n+1 n+ 1
其次看 n 为奇数的情况 .仍与前面相似 , 我们 把维 数增加 1 而考虑 D , 并设 法在 D 上
作一个 n + 1 维向量 ξ如下 :
ξ x1 , … , x n + 1 = ξ x1 , … , xn , axn + 1 , ( 9)
n+ 1 n n+ 1 2
a > 0 待定 .关键在于我们希 望拓展后的 ξ在 D 的 边缘 S 上仍 指向 D 之外 , 即希望 在 x1 +
2
… + xn+ 1 = 1 处,
n+ 1 n
∑ xξ
i= 1
i i x1 , … , xn + 1 = ∑ xξ
i= 1
i i x1 , … , x n + ax2n + 1
n
2
= ( x ,ξ) + a 1 - i∑
= 1
x i ≥0 . (10)
n
a 的选法如下 , 和定理 1 证明的准 备中 说的 一 样 , 我们 可以 假 设 ξ( x ) 一直 到 D 的 边界 外稍 远
n
但是 F( 1 ,θ) = ∑ xξ
i= 1
i i x1 , … , x n
S
n -1 ≥ 0 , 故由上式双方乘以非负的 1 - r ( 注意 , 我们是从球
n n-1
体 D 内接近边界 S 的) , 有
F( r ,θ) - F( 1 ,θ) ≥ - M ( 1 - r) .
从而
M 2 2
F( r ,θ) ≥ - M ( 1 - r) = - 1- r ≥ - k 1- r .
1+ r
所以只要取 a≥ k , 即可证得 (10) 式 .总之我们有 ∑ xξi i x1 , … , xn + 1 ≥ 0 , 现 在 n - 1 是偶数 ,
n+ 1
所以可以对向量场 ξ应用定理前一部分 , 而知必有 x = x1 , … , x n + 1 ∈ D 使 ξ( x ) = 0 , 但
ξ( x ) = ξ x1 , … , xn , a珔
xn + 1 ,
n
所 以 ξ ( x ) = 0 就 意 味 着 , xn + 1 = 0 , 而 x = x1 , … , xn , 0 D x1 , … , x n ∈ D .且
ξ x1 , … , xn = 0 , 定理证毕 .
n n n
布劳威尔定理的证明 对定理中讲的映射 f , 我们作 ξ= x - f ( x ) , D →R , 于是 ξ是 D 上
n n - 1
的一个向量场 , 但在 D 的边界 S 上,
2
〈x ,ξ〉= | x | - 〈x , f ( x )〉≥0 .
n n n
这是因为 f ( x ) , D → D , 故 f ( x ) ≤1 , 而 〈x , f ( x )〉 ≤ | x |・| f ( x ) | .在 D 的 边界上 | x | =
1, f ( x ) ≤ 1 , 所 以〈 x , ξ〉≥ 1 - f ( x ) ≥ 0 .由 定 理 3 即 知 ξ有 一 个 零 点 x : ξ( x ) = x -
f ( x ) = 0 .从而 f ( x ) = x 而 x 是映射 f 的不动点 , 证毕 .
n n
以上我们是对单位球体证明布劳威尔定理 的 .但是 实际 上 , 把 D 改成 R 中的闭 凸体 , 而 对
f 仍要求它是把此凸体映到其自身中的连续映射 , 定理仍然成立 .
第七章 微分流形上的微积分
我们生活于其中的宇宙———时间与空间———是什么样 ? 这是从远古以来的哲学家就十分关
注的问题 .而自从古希腊时代有了作为一门演绎科学的几何学以后 , 空间就成了几何学研究的对
象 .哥白尼的日心说固然在解放人类思想上起了 无可估量 的作 用 , 为后来 的伽 利略、开普 勒开 辟
了道路 , 这以后才有了牛顿力学 .但是从对空间的了解 而言 , 只不 过是 把作为 线性 空间的 欧氏 空
间换成了一个仿射空间 ( affine space) .什么是仿射空间 , 我们不来叙 述其数 学定义而 只概略地 说
明一下 .任意定一个起点 P( 我 们不 说是 原点 , 仿射 空间 没有 原点 ) .如果 再给 出一 点 Q 作为 终
n
点 , 则联结 PQ 两点可以得一向量 a = PQ .现在再以 Q 为 R 的原点 , 则空间的任一点 T 都可以
n
写成 a + R 的某点 的形状 , 即首先在 以 Q 为原 点的 空间中 用 一个 向量 Q T = v 来 表示 T , 则
n
T 相对于 P 点可以表示成为P T = PQ + Q T = a + v , 这样的 集合 a + R 就是 一个仿 射空 间 .仿
射空间的向量是 a + v , 它不能作加法 : 若有两个点 T1 和 T2 分别对应于 a + v1 , a + v2 , 它们 不
能相加 , 因为形式地相加成 ( a + v1 ) + ( a + v2 ) = 2 a + ( v1 + v2 ) , 2 a 是 什么无 法解释 .但是可 以
作减法 ( a + v1 ) - ( a + v2 ) = v1 - v2 , 其实就是 T1 对 T2 的相对位 置 .从数学来 看 , 托勒密和 哥
白尼的区别就在于托勒密 认 为原 点应 该放 在 P ( 地球 ) 处 , 而哥 白 尼则 认 为 应该 放 在 Q ( 太 阳 )
处 .其实空间的性质没有发生变化 : 它是三维的、均 匀的 ( 在宇 宙的 任何地 方 , 不论 是在比 萨斜 塔
上或在猎户座大星云里 , 物理规律是相同的 ) , 各向同性的 ( 不论是头朝天顶面向东方还是头下脚
3
上做实验 , 结果都是一样的 ) .我们说 空间是 R , 除 了指定 一个 原点位 置以 外 , 就是 这样的 意思 .
1
至于时间更是与空间无关的一维的、均匀的 .如果我们确定了一个时间原点 , 则时 间是 R .总之 ,
3 1
时空就是 Rx ×R t .这里我们完 全没 有涉 及时 间的 不 可逆 性 , 那是 整 个物 理学 的另 一大 篇 章 .总
之 , 时空是一个空空洞洞的框架 .它是被动的 , 没有 物理内 容的 .这 就是牛 顿的 时空 观 .几 何学 就
是研究这个框架的学问 .我们在中学学的初等几何和后来学的解析几何学就是这门学问的大概 .
到了 18 世纪末叶 , 情况开始有变化 .首先应该提到的是高斯 , 随着人们枉费心机地想去证明平行
线公设 ( 或者证明与此等价的三角 形三内 角之 和为 π) , 高斯 开始 怀疑 我们生 于斯 长于斯 的空 间
究竟是不是欧氏空间 .他真的选了三个小山头 , 想用实际测量看一下三角形三内角和是否确实为
π .虽然可惜在他的实验条件下得不出任何结论 , 却标志着对牛顿的时空观的一次冲击 .高斯的一
3
个极重要的贡献就在于提出 , 不要只把一个曲面 看成 R 中弯 曲的一部 分 , 应该把 曲面就 看成 是
2 2 2
一个空 间 .在 这 个 空 间 里 , 没 有 毕 达 哥 拉 斯 定 理 , 而 有 d s = Ed u + 2 Fd ud v + Gd v , 这 里
( u , v ) 是曲面上的点的“坐标”, E , F , G 是 ( u , v ) 的 函数 .这 些函 数 决定 了这 个曲 面的 性 质 , 特
别是曲面的曲率 .而且曲面上的三角形 ( 其三边为测地线 ) 之三角之和与 π之差恰好由曲率决定 .
黎曼进一步发展了高斯的 思 想 .他 指 出空 间 不一 定 是三 维 的 , 而 可 以是 n 维 的 , 在 这 样的 空 间
2 i j
里 , 毕达哥拉斯定理自然是不对的 , 而有 d s = ∑ g ij d x d x .( gi j ( x ) ) 完全决定 了空 间的性 质 .其
实黎曼研究空间的性质是为了说明物理学的问题 .可是这个工作不是由黎曼完成的 .尽管当时就
§1 向量和张量 4 23
§1 向量和张量
fi = ∑λ e ,
j=1
ij j i = 1, 2, …, n, ( 3)
= ∑λ
i= 1
i1 yi e1 + … + ∑λ y
i= 1
in i en .
因为 e1 , … , en 是线性无关的 , 所以有
n
xj = ∑λ y ,
i= 1
ij i j = 1, …, n . ( 6)
t t
如果引入坐标的向量记法 ( 这一次是真向 量了 ) : x = ( x1 , … , x n ) , y = ( y1 , … , y2 ) , 则 ( 6 ) 可 写
成
t t -1
x = Λy 或 y = Λ x . ( 7)
t - 1
( 新坐标 ) = Λ ( 老坐标 ) .
以上 , 左上角的 t 都表示转置 .
n n
(5 ) 与 ( 7) 形成重要的对比 .两个由 R 到 R 的线性变换 , 若其矩阵互为转 置逆 , 则说这两 个
线性变换互为逆步的 ( cont ragredient ) .所以标架的 变换 ( 5 ) 与 坐标 的变 换 ( 7 ) 互为 逆步 .因 此 , 向
量 x 的上述坐标 ( x1 , … , xn ) 或 ( y1 , … , y2 ) 称 为逆 变坐 标 ( con travarian t coordinates ) .所 谓逆 变
是相对于标架而言的 , 因为标架的变换式是 ( 5) 而坐标的变换为
t - 1
y = A x, A = Λ . ( 8)
它是与 (5 ) 逆步的变换 , 所以 x 和 y 称为逆变坐标 .
在数学中有一个重要的规定 , 若一个向量 ( 还有以后要讲的张量 ) 等等 , 只要含有若干个指标
例如 i , j ,α,λ, …其变化范围为例如 ( 1 , 2 , … , n ) , 或 ( 0 , 1 , … , n - 1 ) ( 视空 间的维 数而 定 ) , 而 当
此空间的坐标作变化 (7 ) 时 , 某个指标是逆变的 ( 即与 (7 ) 相同而与 ( 5) 逆步 ) , 这种 指标都 写在 上
角 , 称为逆变指标 .若此指标与 (7 ) 逆步 , 与 (5 ) 相同 , 这个指标一定写在下角 , 称为协变指标 .若在
一个式子中同一个字母作为指标出现两次 , 一次是逆变的 , 一次是协变的 , 即一下一上 , 则规定要
对此指标求和 , 而略去求和号 ∑ , 其变化范围视空间 中坐标 记号 的规定 而定 .这 叫做爱 因斯 坦
求和约定 .所以 ( 1) , ( 3) , ( 6) , …应写作
i
x = x ei ,
j
fi = λi ej ,
j j i
x = λi y ,
等等 , 为什么 λ的两个指标要一上一下 , 后面要讲 .
§1 向量和张量 4 25
我们在整个第七章中都使用这样的记号 .
既然讲到逆变坐标 , 当然会问有没有协变坐标 ( covariant coordinates) .它的几何意义是什么 ?
逆变坐标的几何意义前面已经讲得很清楚了 , 就是把一个向 量按平行 四边形法 则分解 在 n 个 线
性无关的向量 ( 即基底 ) 上 .在构成基底的每个向量上应该取一个单位 , 但这决不等于说在空间中
已经引入了长度 , 因为在度量空间中我们 已说过 什么 是长 度 .至少任 意两 点 x , y 间都要 定义 其
距离ρ( x , y) ≥0 , 而现在我们至多也只能在该向量的方向即该坐标轴上定义“长度”.其所以还要
加上引号是因为坐标轴上给了两个点 x 和 y ,ρ( x , y ) = x - y 可正可负 , 表明在 x 和 y 之间要区
分出起点与终点 .这个概念在度量空间中是没有的 .在坐标轴上按
给定的单位测“长度”, 实质 上是比 例线 段问 题 .欧 几里 得的《几何
原本》就把这一点说得 很明 白 .我们就 此停 下不再 追究 , 只 是 说明
一点 : 给定逆变坐标只需要在空间中能作向量运算 ( 加法和正负倍
n
数的放大即前面说的倍乘 ) 就够 了 .现 在我 们在 R 中引 入欧 几里
n n
得度量 ( 许多书上这时把 R 改写 为 E , E 是欧 几里 得 ( Euclid) 第
n
一个字母 , 本书则不这样做 ) .在 R 中取 一个 标架 , 这时 又会 有一
个误解 , 以为这 个标 架 一 定是 正 交的 , 这 是由 于 我 们 太 习惯 了 在
2 3
R 与 R 的坐标系 Ox y 与 Ox yz , 而 忘记 了 标架 只 需线 性 无关 即 图7- 1 -1
可 , 所以人们忘记 了在 用 到 O xy , O xyz 时 应 该加 上 一句 : 正交 坐
n
标系 Ox y 等等 ( 这当然有点多余 ) .反而在不必加什么说明的地方偏要说在 R 上取一个“ 斜交坐
标系”.坐标系本来就无所谓斜正 , 引入欧氏度量后才得到作为特例的正交标架 .不过倒要提醒一
下 , 每个坐 标 轴 上 的 单 位 长 倒 都 要 选 用 同 样 的 1 , 否 则 连 等 边 三 角 形 的 概 念 都 会 出 毛 病 .
2 1 2
图 7 - 1 - 1上我们只画了 R , 我们考虑一个向量 OP以 及它在 两个坐标 轴 O x , O x 上的 投影 长
ξ1 与 ξ2 , 于是 OP完全决定了 (ξ1 ,ξ2 ) , 反之 (ξ1 ,ξ2 ) 也完 全定义 了 OP , 所 以 (ξ1 , ξ2 ) 也是 P 的 一
种坐标 , 下面我们证明这就是 P 的一个协变坐标 .
为了证明这一点 , 考 虑 一 个 运 算 : 记 向 量 A 在 逆 变 向 量 B 上 的 投 影 为〈A , B〉, 于 是 ξi =
1 2
〈OP , ei〉, 这个运算对 A 与 B 分别均为线性的 , 于是任取一个逆变向量 OQ = ( x , x ) ; 我们有
1 2 i
〈OP , OQ〉 = ξ1 x + ξ2 x = ξi x . ( 9)
此式对 n 维向量也是成立的 .但 是 (9 ) 式左 方的量 显然 与坐标 的选 取无 关 , 所 以右 方 亦然 .于 是
1 2
我们换一个标架 , 使 OP的投影为 (η1 ,η2 ) , OQ的逆变坐标为 ( y , y ) , 应有
i i
ξi x = ηi y . (10)
i
但是新坐标 y 与旧 坐标 x 之 间有关系 式 ( 8 ) , 令其 中 A 的元 素为 ( aj ) . i 是 第一个 指标 , 表示 横
行 , j 是第二个指标表示竖列 .为什 么一个 写在 逆变位 置 , 一个 写在协 变位 置 , 是因 为 这样 一来 ,
则 (8 ) 可以写为
i i j
y = aj x . (11)
i
至少可以看到这样写法与 y 为逆变坐标相符合 .以此代入 (10) 立即有
i i j
ξi x = ηi aj x ,
由把上式右的 j 改写成 i, i 改写成 k, 有
k i
ξi - ηk ai x = 0 .
4 26 第七章 微分流形上的微积分
i
此式应该对任意 x 成立 , 故其系数为 0 , 即有
k
ξi = aiηk . (12)
t
注意现在是对横行的指标求和而 (11) 中是对竖列的指标求和 , 所以 ( 12 ) 右方为 Aη, 而有
t -1
η = A ξ. (13)
所以 ξi 是协变坐标 .
n
定义逆变坐标时我们只需要 R 的线性结构 , 也就 是只需要 平行四 边形法则 .与 逆变坐标 不
n
同 , 在定义协变坐 标时 , 我 们则增加了 R 中的欧氏 结构———度量 , 这样才有了投影 等等 .但 是我
们想要问 , 是不是非此不可 ? 不然 , 我们 在上 面把投 影写 成〈A , B〉, 读者 立刻 会想 到 这是 内积 ,
而且就此就联想到欧氏空间的度量 .其 实我 们并没 有用 到度 量的任 何特 殊性质 , 如果用〈ξ, x〉,
〈η, y〉来表示上面的“内积”, 我们所用到的只有以下几件事 :
1. 〈ξ, x〉=〈η, y〉;
2. y = A x ;
t
3. 〈ξ, x〉=〈η, A x〉=〈 Aη, x〉;
t
4. 由〈ξ- Aη, x〉= 0 对一切 x 成立得出
t t - 1
ξ = Aη或η = A ξ.
n
第一点是说应该有一个量 , 此量是内蕴的 即与坐 标无 关的 , 我们 这里 则是 x ∈R 的 一个 线
性泛函 .无限维线性空间的线性泛函之定义中应该加上连续性 ( 即有界性 ) 的要求 .我们在讲希尔
伯特空间与广义函数时都强调了这一点 .但有限维线性空间上的线性泛函则一定是连续的 .第四
n n
点是要求〈・,・〉是非退化的 , 即若对一切 x∈R 均有〈ξ, x〉= 0 , 则必致 ξ= 0 .在 R 上这总是 成
n
立的 .至于另外两点就简单地是矩阵的初步知识 .在线性代数 中我们记 R 上的线性 泛函之集 合
n * n n n *
为 (R ) , 并且证明了它也是一个 n 维线性空间 ( 当 R 换成 C 时 , (C ) 也是一个 n 维复线 性
n n * n
空间 ) 称为 R 之对偶空间 , 若 ξ∈ (R ) , x∈R , 则 ξ作用在 x 上之值ξ( x ) 也常用内积记号 , 记
作 ξ( x ) =〈ξ, x〉, 甚至也称为“内积”.于是我们可以把以上所说的归结为一个定理 .
n n * n
定理 1 R 的向量与其对偶空间 ( R ) 中 之向 量是互 为逆 步的 .因此 , R 中 的向量 称为 逆
n *
变向量 , ( R ) 中之向量称为协变向量 .
n
前面所讲的就是此定理的证明 .我 们只想 提出 一 点 : 当我 们给 出 R 及其 对偶 空间 时 , 本 来
n * n
都没有给定基底———标架———坐标 , 所以当我们说 ξ∈ (R ) 在 x∈R 上的值ξ( x ) 或〈ξ, x〉时
本来就意味着此值与坐标的选择无关 .
n
现在在 R 中取一个基底 ei , i = 1 , 2 , … , n , 注意我们是把指标写在 下面的 , 因为 现在我们 有
了一个标架 , 而不是向量的坐标———坐 标是 把向量 用 ei 作 线性 表达 时的系 数 .当基 底作 线性 变
换 (3 ) 或 ( 5) 时 , 坐标的变化与之逆步 , 而这些坐 标是用 上指 标———逆变坐 标来 表示 的 , 所 以标 架
n *
应该用下指标来表示 .前 面就 是这 样做 的 .与 此相 同 , 在 (R ) 中的 标 架 则应 用 上指 标 表示 : 在
n * * j
(R ) 中找一组向量 ( e ) , j = 1 , 2 , … , n , 使
* j
〈( e ) , ei〉 = δi j . (14)
* j n * 1 * n
这样的 ( e ) 是存在的 , 它就 是用 上式 定 义的 R 上之 线性 泛 函 , 很容 易 看到 ( e ) , … , ( e )
n *
是线性无关的 , 因此构成 ( R ) 的一个基底 , 称为{ e1 , … , en }的对偶基底 .
为什么一般的微积分教科书没有区分逆变与协变向量 ? 因为一般书上都只在正交的笛卡儿
§1 向量和张量 4 27
t - 1
坐标系中讨论向量 , 而两个正交笛卡儿坐 标系之 间的 线性变 换又 都是 正交变 换 : A = A, 所以
(8 ) 和 ( 13 ) 都是一样的 , 而逆变坐 标与 协变 坐标就 没有 区别了 .我 们知 道 , 所有的 n 维实 线性 空
n * n
间都是同构的 .( R ) 自然也就同构于 R .在丧失了协变与逆变之别后 , 就 更没有理 由视它们 为
n * n * i i
不同的空间 .如果把 (R ) 就写成 R , 把 ( e ) 就写 成 e , 则对 偶 基底 就成 了 o .n .系 .向 量 ξ∈
n * n n
(R ) ( = R ) 作用在向量 x∈R 上之值 , 如果用这个 o .n .系表示就成了
* i j j i
〈ξ, x〉 = 〈ξi e , x ej〉 = ξi x δj
n
∑ξ x
i
= ξi x = i i .
i =1
n
也就是内积 , 即是说 , R 的线性泛函 , 如果选定了一个 o .n .基底 , 都可表示成为内积 .
n
R 的一切正交变换均用正交矩阵表示 , 它构成一个群 , 记作 O ( n) .特 别重要的 是行列式 为
n
1 的正交矩阵群 , 是它的 一个 特别 重 要的 子 群 S O ( n ) ———特 殊 正交 群 .在 复 空 间 C 则有 酉 群
U ( n) ( 物理学家喜欢称为幺正群 ) 和特殊酉 群 S U ( n ) .这些都 是特别 重要 的李 群 “
( 李”是 人名 ,
即 Sophus Lie, 1842— 1899 , 挪威大数学家 ) , 可以说 是现 代的 理论 物 理学 的最 主要 的框 架 .在 正
交群下 , 逆变与协变的区别就不起作用了 .
n n *
但是并不是一切情况 下 都可 以 把 R 与 ( R ) 视 为 相同 的 .下 面 我 们 讲 一个 极 重 要 的“ 例
n n n *
子”———R 中的牛顿第二定律 .如果我们在 R 与 ( R ) 中采 用了 互相对 偶的 基底 , 而将 其中 的
1 n i * j
向量分别写成 x = ( x , … , x ) = x ei 与ξ= (ξ1 , … ,ξn ) = ξj ( e ) , 设 它们都是 时间 t 的光滑 函
・ ・1 ・n ・i ・ ・ ・ ・ * j
数 ,于是 x = ( x , … , x ) = x ei , ξ = ( ξ1 , … , ξn ) = ξj ( e ) .按 我 们 的 习 惯 , 动 能 是 T =
n
m i ・ i・i
∑
i
x x . 但是动能是一个物理 量 , 它应 该是 与 坐标 的选 取无 关的 .如果 换一 个 坐标 系 y =
i =1 2
i i i j ・i i ・j
y ( t ) , 则因 y = λj x , 有 y = λj x , 而第 i 个质点之质量 mi 更是与坐标无关的 , 所以在 y 坐标中
计算的动能是
n n
m i ・i・i mi i i ・k ・l
∑i =1 2
y y = ∑
i= 1 2
λlλk x x . (15)
n
m i ・ i・i
右方一般说来当然不会是 T = ∑i=1 2
x x .但是有一个情况是 可以的 , 即 是我们所 描述的乃 是
3
N 个质点所成的质点组在 R 中的无约束的运动 .这个质点组有 3 N 个自 由度 , 例如 第一个质 点
的位置就由 x1 = X1 , x2 = Y 1 , x3 = Z1 描述 , 而且 m1 = m2 = m3 = M1 即第一个质点的质
量 .这时 n = 3 N 而且
N
Mi ・2 ・2 ・2
T = ∑i=1 2
X i + Y i + Zi .
3 n
如果作 R ( 注意 , 不是 R ) 中的正交变换 , 把 ( Xi , Y i , Zi ) 变成 ( Ui , V i , Wi ) , 这时 确实容 易计 算
Mi ・2 ・2 ・2 M i ・ 2 ・2 ・2
出 ( X i + Y i + Zi ) = ( U i + V i + W i ) , 而 T 确实 与坐 标的 选 取无 关 , 大多 数 力学 书中 都
2 2
只讨论这个情 况 .严 重的问 题在于 , 作用 在这个质 点组上 的力是保 守力 , 即是有 位势为 F( x ) 的
力 , 位势就是负位能 F( x ) = - V ( x ) , 而作用在质点上的力是 grad F = - grad V .于是牛顿运动
方程成为
4 28 第七章 微分流形上的微积分
mi ¨
i
x = i F( x ) , i = 1 , … , n (16)
x
i
( 不对 i 求和 ) .如果要考虑坐标变换 , 立即看出了问 题 : 式 左是 逆变 向量 x 对 时间 的二阶 导数 ,
在经典力学中时间是一个均匀流动的参数 , 它与空间完全无关 , 所以本章一开始就说了牛顿时空
3 1 4 i
是 Rx ×R t 而不说是 R( x , t ) , 这样 , x 对 t 求导后仍是逆变向量 .但式右则不然 , 如果引入新坐标 .
i i j i
y = λj x 或 y = Λx , Λ = λj ,
i i j -1 -1 i
x = μj y 或 x = Λ y , Λ = ( μj ) ,
则
j
F F x j F
i = j i = μi j ,
y x y x
j
F F y j F
i = j i = λi j
x y x y
( 注意 , 分母中的上指标算是下指标 ) .于是 (16) 的左 右双方分 别是 一逆变 与协 变向 量的分 量 , 而
此式只有在不区分逆变与协变向量的坐标系 中 , 才有 意义 .例 如上面 说的 N 个质 点而每 个质 点
3 3
均在一个 R 中运动 , 且每一个 R 中各取 o .n .标架 , 就属于这个情况 .
怎样克服这里的矛盾 ? 关键在使动能 T 成为与坐标无关的标量 .方法是在各个 坐标系中 分
2
别引入一个矩阵———即 n 个量 ( gij ) 并把 T 修改为
1 ・i・j
T = g x x , g ij = gji . (17)
2 ij
这里 的 ( gi j ) 的 选 法 应 该 是 使 在 我 们 原 来 用 以 表 述 牛 顿 第 二 定 律 所 用 的 x 坐 标 中 T =
n
m i ・ i・i ~ ~ ~
∑
i
x x , 而在用另一个坐标 y = A x , A = ( a j ) 时应把 gij 改成 g ij , g i j = g j i 使得
i =1 2
~ i j ~ k l
g kl = gi j ak al , gij = g klαiαj . (18)
k i
这里 (αi ) 是 ( aj ) 的逆矩阵 .注意 , 我们已经把质量放在 gij 中去了 .由 (17) 和 (18) 立即有
1 ・i ・j 1 ~ ・i・j
T = gij x x = g y y .
2 2 ij
但是 T 既然在 x 坐标系中代表动能 , 当然在 y 坐标系 中也 代表动 能———动能 是一 个标量 , 它 的
值不受坐标变换的影响 .
解决了这个问题 , 立即就知道 , 牛顿第二定律的正确表述应该是
d ・j F
( gi j x ) = i , i = 1, 2,…, n . (19)
dt x
j i
・j ・l x j・l F F x i F i
因为 x = y l =αl y , k = k = αk i 故将上式双方乘以αk , 再对 i 求和即得
y y xi y x
d i j・l F
( gijαkαl y ) = k ,
dt y
亦即
d ~ ・l F
(g y ) = k . (20)
d t kl y
§1 向量和张量 4 29
i
y
Fi ( y ) = ∑fj
j ( x)
x
j , (22)
则称它为一逆变向量 , 这时规定将指标写在上面而有
i
i j y
F ( y) = f ( x) j .
x
若 f 与 F 间的关系式为
j
x
Fi ( y ) = f j ( x ) i ,
y
这时规定指标写在下面 , 则称之为协变向量 .
i i
例如 , Ω 中某一函数φ( x ) 之梯度 grad φ就是协变向量 .Ω 中某 一曲线 x = x ( t ) 之“ 导数”
1 n
dx dx 1 n
或“速度” , …, 以及沿此曲线的微分 ( d x , … , d x ) 都是逆变向 量 .可 以说 , 它们是最 重
dt dt
要的协变和逆变向量 .
2. 旋转和反射 上一节中除了最后一段是讨论的非线性坐标变换以外 , 我们都 是讨论的 线
性变换 .在物理学中具有特殊重要性 的是 一些特 殊的 线性 变换例 如 S O ( n ) , U ( n ) 还有 作为 相
对论基础的洛 伦兹变 换 ( Lorentz t ransformation ) 等 等 .这就涉及 了群论 的问题 , 是一 个浩瀚的 数
学海洋 .即使是从微积分的角度来看 , 也确有一些变 换特别 重要 , 例 如有平 移、旋转 和反射 .我 们
在这里不去讨论平移 , 因为它虽然简单 , 却不属于线 性变换 , 而 是仿 射变换 .下 面我 们讨论 旋转 .
至于反射 , 则其性质又与旋转很不相同 .不过 , 这里有两个相联系的问题 .前面我们是固定了一个
向量 , 即一个点 , 然后让基底———即坐标轴———改变并且 看此 点的 坐标如 何变 化 .另一个 情况 是
固定基底 , 并让此向量 , 即一个点 , 变成另一个向量 , 而 且这个 变换 对于被 变换 的向 量是线 性的 .
这两种问题虽然不同 , 却互有联系 , 甚至可以看成一种“相 对运动”: 把 一个平 面向 量绕原 点旋 转
角度 φ与将坐标轴旋转一个角 - φ, 所得的公式是一样的 .所以下面我们只看向量的变化 .
先看平面上的旋转 , 先看由 ( x , y ) 点 ( 现 在没 有必要 区分 协变 与逆变 向量 , 因 为我们 用的 是
正交笛卡儿坐标 ) 到 ( x′, y′) 的旋转 , 其旋转中心为原点 , 旋转角为 φ .最好的方法是用复数记号 ,
于是令 z = x + i y, z′= x′+ i y′, 则
iφ
z′= e z , (23)
( x′+ i y′) = ( xcos φ - ysin φ) + i( xsin φ + ycos φ) ,
分开实虚部 , 并用矩阵表示 , 即得
x′= xcos φ - y sin φ, y′= xsin φ + ycos φ,
x′ cos φ - sin φ x
= . (24)
y′ sin φ cos φ y
这是点的变换 .如果坐标轴旋转一个角度 φ则得
x′ cos φ sin φ x
= . (24′)
y′ - sin φ cos φ y
不论是哪个问题 , 变换矩阵都是正交矩阵 .
上面我们还看到 , 平面旋转可以用两个观点来 看 : 一是看 成实 的正交 变换 , 一 是看成 复变 换
iφ iφ iφ
z′= e z , e 可 以看 成一 个一 阶 矩阵 , 它 仍 是酉 矩阵 , 因此 记为 ( e ) .这个 情 况在 三维 时照 样 成
立 .
§1 向量和张量 4 31
z1 0 0 1 z
2. 现在 O x1 即 OL , 它既在 O x1 y1 平面上 , 又在 O x′
y′平面上 , 所以一方面它与 Oz 1 正交 ,
一方面又与 Oz′正交 .以 O x1 为轴在 Oz z′面上旋转一个角度θ, 于是得到新坐标系 O x2 y2 z2 , 这
里 O x2 即 Ox1 , Oz2 即 Oz′而由 (25) 式有
x2 1 0 0 x1
y2 = 0 cos θ sin θ y1 . (27)
z2 0 - sin θ cos θ z1
3. 现在绕 Oz 2 作最后一次旋转 .因为 Oz2 即 Oz′所以旋转是在 Ox2 y2 平面上实现的 .旋转
的角度为 ψ .于是 O x2 即 OL 变成 O x′. Oz2 是旋转轴所以不变 . Oy2 即 Oy′( 条件是 O x′y′z′与
O xyz 同为右手或左手坐标系 ) , 于是最后有
x′ cos ψ sin ψ 0 x2
y′ = - sin ψ cos ψ 0 y2 . (28)
z′ 0 0 1 z2
合并 (26) , ( 27 ) , (28) 即得最后的结果
x′ x
y′ = A y . (29)
z′ z
cos φcos ψ - cos θsin φsin ψ sin φcos ψ + cos θcos φsin ψ sin θsin ψ
A = - cos φsin ψ - cos θsin φcos ψ - sin φsin ψ + cos θcos φcos ψ sin θcos ψ .
sin φsin θ - cos φsin θ cos θ
很容易证明 , A 是一 个正 交矩 阵 , 而且 det A = 1 .但 是要 注意 , 这 是由于 我们 假设 了 O x′y′z′与
4 32 第七章 微分流形上的微积分
图7- 1- 3 图7- 1- 4
§1 向量和张量 4 33
3
对于 R 也是一样 , 图 7 - 1 - 4 给出了左、右手坐标系 , 其关系也是
x′ - 1 0 0 x
y′ = 0 1 0 y . (31)
z′ 0 0 1 z
(30) 和 (31) 这样的线性变换称为 x 方向的反射 ( reflection) .如果对所有坐标轴均作反射 , 则称 为
2
反演 ( inversion ) ( 物理学家 常 称为 宇称 ( parity) 变 换 ) .反 射与 旋 转不 同 , 它 不 形成 群 .例如 在 R
上作对 x 与 y 轴两次反射如图 7 - 1 - 3的 O′x″y″, 等于绕 O 点旋转π, 而不再是反射 .
3
坐标系的手征是一个重要问 题 .在 R 中 选取 一个 o .n .标架时 , 即 使原 点位置 相 同 , 三个 轴
都与对应的轴平行 , 却可以有手征的不同 .这会影响到 对物理 量的 表述和 刻画 .因 为物理 量和 几
何量与参考系———坐标系的手征的关系是非常重要的 问题 .即 以“ 向量”而 言 , 我们 前面指 出 , 所
谓的向量原来只是指线性空间之元素 , 因此适用 平行四边 形法 则 , 从而也 有坐 标 , 而且坐 标的 变
换与标架的变换是逆步的 , 因而是逆变坐标 .有了对偶 空间以 后又 有了协 变坐 标 .不过这 一段 讨
论又限制坐标变换只是正交变换 , 因此协变逆变 之区别又 消失 了 .但在这 时又 出现 了新问 题 , 即
正交变换是否保 持手征 不变 ; 从算术 上看即此 变换的 行列式是 + 1 还是 - 1 ; 从 几何上看 则是 此
变换中是否除了旋转以外还包含了反射 .于是 , 从作为线性空间的元素的向量中又可分为两个子
类 : 一类是在一般的正交变换 , 即在 O (3 ) 之下 , 亦 即容许 手 征改 变时 , 适 合坐 标变 换 的规 则 , 我
们甚至说它们在手征变换 下 不 变 ( 或者 比 较准 确 一些 说 它协 变 ) , 这类 向 量称 为 真 向 量 ( proper
vector) 惑极向量 ( polar vector) , 另一类在 S O (3 ) 下 按坐标 变换的 规则 处理 , 而若 手征 改变 ( 例 如
1 = - x 之类 ) 时 , 则整个向量变号 , 亦即在 det A = - 1 , A∈ O (3 ) 时 , 坐标变换 A 将 写成 A =
x′
PA 1 , P 为手征变换 , Pu = - u , A1 ∈ S O (3 ) 按通常的向量变换规则作用于 一向量 u , 于是 Au =
PA 1 u = Pv = - v = - A1 u .这 一类 向 量 称 为 赝 向量、伪 向 量 ( pseudo - vector ) 或 轴 向 量 ( axial
vector) .上面讲的话可能令读者感到太抽象 , 但看 一下 实例就 知道 这个区 别实 际上 是很本 质的 .
3
在 R 中最重 要的真 向量当然 是位置 向量 ( x , y, z ) 以及它 对时间 的导数 , 即速 度 v 与 加速度 a .
由牛顿第二定律得出的力 F = ma, 还有动量 m v ( 注意 , 现在我们不区别协变与逆变向量 ) , 当然
3
也都是真向量 .R 中最常见 的赝向量 是两个 真向量 A = ( a1 , a2 , a3 ) 与 B = ( b1 , b2 , b3 ) 的向 量
积 A× B .请读者回忆一下向量积的定义 .在 通常 的教本 中的 说法 , 例 如 : A× B 是一 个向 量 , 其
大小是 | A | | B | sin φ( φ是 A 与 B 之间的劣角 , 所以 0≤φ≤π) , 其方向与 A、B 所定 义的平面 垂
直 x而且 A , B, A× B 成一个右 手系 , 这 里有一 个隐 含的 假 设即 O xyz 是 一个 右手 系 .如 果想 丢
掉这个假设 , 则上面加了着重号的一句话应改为“ 而且 A , B, A× B 成一个 与原来坐 标系手征 相
同的坐标系”.向量积在物理学中极为重要 .例如设一质点之位置向量与速 度向量是 r 和 v , 则 其
角速度 ω= r× v 就是向量积 .因此 , ω 是赝 向量或 轴向 量 .同样还 有角 动量 r× m v 和 力矩 r×
mF 都是 .可是更有趣的是转到电磁理论 .我们都知道有电场 E 和磁场 B .上面我们已经看见了 ,
E 是真向量 , 可是由安培定律 , 如果有电流经过导线 d l( 电流即运动的电荷 ) , 设电流值为 i, 则它
在 D 点产生的磁场是
3
d B = id l × r r .
( 图 7 - 1 - 5 ) 由此立刻看到 B 其实是一个赝向量 .
不仅如此 , 我们来看以速 度 v 运动着 的电荷 q 在电磁场 E 和 B 中所 受的力———称为洛伦 兹
力 ( Lorentz force ) ( 注意 , 库伦定律只适用于静电荷 ) :
4 34 第七章 微分流形上的微积分
1
F = q E+ v × B , c = 光速 .
c
它是真向量还是赝向量 ? 第 一项 当然 是真向 量 .第二 项当 手 征改
变时 , 一方面作为 向量 积会 变一 次 符号 , 另 一方 面 B 作 为 赝向 量
又会变一次符号 , 最终是不变 .所以洛伦兹力和牛顿力一样都是真
向量 .
但是看来 电磁场中 却存两 个性质完 全不同的 成分 : 真向量 E
与赝向量 B, 两个不 同性 质 的东 西怎 能共 处在 一 起 ? 其实 还 有一
图7- 1 -5
件“怪事”值得在此提一下 : 细心的读者一定会注意到 , 我们只讨论
三维空间中的向量积 , 这是为什么 ? 试看上面 给的 A = ( a1 , a2 , a3 ) , B = ( b1 , b2 , b3 ) , 则 A× B
的三个分量恰好是 2×3 矩阵
a1 a2 a3
(32)
b1 b2 b3
的三个二阶子行列式 ( 附以适 当的 正负号 ) , 于 是要问 , 对 于 n 维 向量 A = ( a1 , a2 , … , an ) , B =
( b1 , b2 , … , bn ) 可否取 2× n 矩阵
a1 a2 … an
(33)
b1 b2 … bn
n
的二阶子行列式附以 适 当符 号来 构成 一个 新 向量 呢 ? 但 是现 在二 阶子 行列 式 的个 数 是 =
2
1 1
n ( n - 1 ) .如果想构成一个 n 维 向量 , 其充分 必要条 件是 n ( n - 1) = n , 即 n = 3 .所 以三 维
2 2
向量的“向量积”A× B 是一个三维向量 , 其实是一件“偶然”的事 , 它一定还另有实 质 .同 样 , 磁 场
B 由安培定律也是一个“向量积”, 所 以它 的“实 质”是什 么需 要深 入 讨论 .到 了那 时 才能 对麦 克
斯韦的电磁理论有一个确切的理解 .
向量有真赝之分 , 标量当然也有 .真赝标量之别在 于手征 变化 后变号 或不 变符 号 .许 多物 理
量例如质点的质量、光速等等都是真标量 .但是例 如磁 场 B 与 位置 向量 r 的标量 积 r・B 却是 一
个赝标量 .
那么 B 的本质是什么呢 ? B 和 E 在一起构成一个二阶张量 .
3. 张量 数学中要研究的量 , 除了标量 , 向量 ( 以及标量值 , 向量值函数 ) 以外 , 还有 许多 .把
张量也纳入数学研究的对象是一大进步 , 因为这就大大扩大了数学的视野 .人们发现许多在物理
学和几何学中极重要的量都是张量 .这里我们只从几个例子出发 , 用有坐标的便于计算的方式引
入张量的概念和它们的基本运 算规 则 , 其比较 系统 的不 依赖于 坐标 的讨论 则放 在§ 3 中 与外 形
式运算一起来讲 .
我们已看到 , n 维空间中若赋予了坐标 , 其向量就是一组 n 个 数 ( 本节 之中我们 限于讨论 实
的线性空间 ) ( a1 , … , an ) 并要求它 们在 坐标 变换下 按一 定规 则变 化 , 并 视其 所遵 循 的规 则称 为
k
逆变与协变向量 .k 阶张量 , 有了坐标以后 , 则 是一 组 n 个数 , 而 在坐 标变换 下也 要求它 们按 一
定规则变化 .一个例子是黎曼引进的度量 .黎曼的思想是 , 对一般的非平直的空间 , 其无限接近的
两点之间的距离 ( 这里又涉及无穷小的问题 .但读者们 不会再 有困难 ) 不再是 由毕 达哥拉 斯定 理
§1 向量和张量 4 35
2 2 2
得出的 d s = d x + d y ( 这 与我们 在欧氏空 间中引入 曲线坐 标如极坐 标、球坐标还 不一样 .因 为
n
现在的空间中根本不一定有 R 中的直角坐标系存在 ) 而是
2 i j
d s = gi j ( x ) d x d x , gi j ( x ) = gj i ( x ) , (34)
这里矩阵 ( gij ( x ) ) 规定为正定的 .
如果我们作一个坐标变换
y = y( x ) , (35)
( y1 , … , yn )
这里 x ( y ) 是光滑的 , 而且上式是局部 微分 同胚 , 所 以雅可 比行 列式 ≠ 0 .本 节开 始
( x1 , … , xn )
时我们讲的都是线性变换
y = Ax,
n
现在则因所讨论的空间不是 R , 其中的坐标变换 当然不 一定 是线 性变换 了 .不过 在下一 节介 绍
了微分流形及其切空间概念后将会知道 , 这里没有什么本质区别 .我们现在只说 (35) 式在某定点
( y1 , … , yn )
( 不妨设为 x = 0 , y( 0) = 0) 附近的线性部分就是 y = A x , 这 里 A = .知道了 这
( x1 , … , x n ) x= 0
一点以后 , 下面我们就只讨论变换 ( 35 ) 了 .
2
d s 的定义怎样能做到与坐标无关 ? 为了从几何 上研究 空间的性 质而不 把坐标系 的特点 掺
进去 , 这是完全必要的 .为此就要求 ( gij ( x ) ) 服 从一 定的要 求 .这要 求就是 , 若 在坐 标系 y 之下 ,
~
gi j ( x ) 变成了 g kl ( y) , 我们应该有
2 ~ k l i j
d s = g kl ( y) d y d y = gij ( x ) d x d x ,
以 (35) 式代入中间一项即得 :
k l k l
2 ~ y i y j ~ y y i j i j
d s = g kl ( y ) i d x j d x = g kl ( y ) i j d x d x = gi j ( x ) d x d x .
x x x x
i
由 d x 的任意性即得
k l
~ y y
g kl ( y ) i j = gi j ( x ) . (36)
x x
i k
x y k
注意到 l i = δl , 也可得出
y x
i j
~ x x
g kl ( y ) = gij ( x ) k l . (37)
y y
k
y
注意 , ( 36 ) , (37) 和前面的 (12) , ( 13 ) 是很相似的 , 例如 (36) 中的 i = A( 注意 (36) 中是对 k , l
x
i
x t - 1
求和的 , 而 ( 37 ) 中的 k 是 A , (37) 中是对 i , j 求和的 ) .
y
3
我们再来看一个例子即 A × B .如果用 R 中的 o .n .标架 ( e1 , e2 , e3 ) , 注意到从 ej 到 ek 所得
的平行四边形面积为 + 1( 只要 i , j , k 可由 1 , 2 , 3 用轮换排列而得 ) , 于是
2 3 3 1 1 2
A × B = a b e2 × e3 + a b e3 × e1 + a b e1 × e2
3 2 1 3 2 1
+ a b e3 × e2 + a b e1 × e3 + a b e2 × e1
2 3 3 2 3 1 1 3 1 2 2 1
= ( a b - a b ) e2 × e3 + ( a b - a b ) e3 × e1 + ( a b - a b ) e1 × e2 . (38)
4 36 第七章 微分流形上的微积分
k ,… , k
p+ q ~ 1 p
取值 .若作一个局部微分同胚 ( 35 ) , 使得在新坐标系下有 n 个函数 Tl , …, l
( y ) , 而 与原来的 函
1 q
i ,… , i
1 p
数组 T j ,… , j
( x ) 之间有以下关系式
1 q
k , …, k k k j j
~ 1 p y1 yp x1 x p i1 , … , ip
Tl ,…, l
( y) = i … i l … l T ( x) , (41)
1 q x1 xp y1 y p j1 , … , jq
i ,… , i
1 p
就说{ T j ,… , j
( x )} 是 一 个 k 阶 ( p , q) 型 张 量 , 更 确 切 地 说 是 一 个 p 阶 逆 变 , q 阶 协 变 张 量 ,
1 q
i1 , … , ip 和 j1 , … , jq 分别称为逆变和协变指标 .
很清楚 , 向量就是一阶张量 .逆变与协变向量分别是 ( 1 , 0 ) 型 与 ( 0 , 1 ) 型张 量 .标量则 是 0 阶
张量 , 或者说是 ( 0 , 0) 型张量 .
i
有一个特别重要的 (1 , 1 ) 型张 量 δj , 称为 克 罗内 克 ( K ronecker ) 张 量 , 它 的 特点 在 于其 不 变
~ k
性 : 若它在 y 坐标下的分量是δl , 则
~ k k
δl = δl .
§1 向量和张量 4 37
事实上
k j k i
~ k y x i y x k
δ =
l i lδj = i l = δl .
x y x y
我们说它是一个不变张量 .另一个重要的张量是 n 维空 间中的 ( 0 , n ) 型张量———列 维 - 齐维 塔
n
( Levi - Civita ) 张量 , 它在 R 的一个正交坐标系下的分量是
1,…, n
1, 若 是偶置换 ,
i1 , … , in
εi1 , … , i n = 1,…, n (42)
- 1, 若 是奇置换 ,
i1 , … , in
0 , 若 i1 , … , in 中有相等者 .
n
它只在正交变换下有不变性 : 考虑 R 上的一个旋转变换 y = A x , 这里 A ∈ S O ( n) .令
a11 a12 … a1 n
A = … … … .
an1 an2 … an n
i
y ~
则 j = aij , 而且 det A = 1 , 另一方面若记 εi1 , … , i n 在 y 坐标系下的分量为εj1 , … , j n , 则
x
j j
~ y1 yn
εj1 , … , j n = ∑ε i
i ,… , i
1 n
i …
x1
i
xn
.
这里我们没有区分协变与逆变坐标 , 因为在正交变换下二者没有区别 .
由行列式的定义
aj , 1 … aj , n
… …
∑ε i
i ,… , i
1 n
aj1 , i1 … aj n , in = .
aj n , 1 … aj n , n
1, …, n 1, …, n
所以若 是 偶 置 换 , 此 行 列 式 等 于 det A = 1 ; 若 为 奇 置换, 此 行列 式 等
j1 , … , jn j1 , … , jn
于 - det A = - 1 ; 若 j1 , … , jn 中有二者相等 , 此行列式有两行相同 , 因而为 0 .
在一般坐标变换下 , 列维 - 齐维塔张量没有不变性 .
下面讨论张量的代数运算 .为了书写方便 , 我们不写出关于一般 ( p , q) 型张量的 公式而只 写
出对某特定类型张量的 相 应 公式 .一般 公 式自 然 容易 得 出 .首 先 是 加 法 , 设 有 两 个同 型 的 张 量
i i i i
1 2 1 2
Aj 与 Bj , 则二者可以求和 , 其和也是同型张量 , 而其分量是
1 1
i i i i i i
1 2 1 2 1 2
Cj = Aj + Bj . (43)
1 1 1
i i i
1 2 3
其次是张量积 , 仍设有两个张量 , A j 与 Bj j
, 分别是 (2 , 1) 型与 (1 , 2 ) 型的 , 则定义其张量
1 2 3
积 C= A B 为一个 (2 + 1 , 1 + 2 ) 型张量
i i i i i i
1 2 3 1 2 3
Cj j j
= Aj ・ Bj j
. (44)
1 2 3 1 2 3
4 38 第七章 微分流形上的微积分
i i i
1 2 3
有时我们又会把它写成 A j Bj j
.应该注意 , 一般说来 A B≠ B A .即以 (44) 为例 , 如果把
1 2 3
A B = ∑ a be
i, j = 1
i j i ej .
∑( A B )
i
A・ B = j | j= i .
j
2
利用缩并还可以得到一个决定某一组量是否张量的方法 .设有 n 个 量 , 它 们在 x 坐标下 的
k k
表示为 A ik , 若对此坐标系下的任意逆变向量 X , 均可 证明 A ik X 是 一个 ( 0 , 1 ) 型张量 , 则 A ik 必
k ~ ~ k
为一个 (0 , 2 ) 型张量 , 实际上若换到 y 坐标系而 A ik 与 X 分别成了 A ik 与 X , 则
l
~ ~ k x m
A ik X = i Al m X .
y
但是
k
~ k y m
X = m X ,
x
4 40 第七章 微分流形上的微积分
代入上式有
k l
~ y x m
A ik m - i Al m X = 0 .
x y
m
因为此式对任意逆变向量 X 均成立 , 故有
k l
~ y x
A ik m = Al m i .
x y
i l i
y x y l
双方乘以 p 并对 i 求和 , 利用 i p = δp , 有
x y x
k i
~ y y l
A ik m p = Al mδp ,
x x
亦即
k i
~ y y
A ik m p = A pm .
x x
所以 A lk 是一个 (0 , 2 ) 型张量 .
j j i
作为本节之结束 , 我们来回答为什么坐标变换不写成 ( 6) 而要写成 x = λi y ? 这 不但为了 应
用爱因斯坦求和规定 , 而且要保证在变换前后有相同的协变与逆变性质 .
§2 微 分 流 形
- 1
从这个图看到 , 在 ( x1 , x2 ) 与 ( y1 , y2 ) 之间有一个映射 φ( 其逆映射为 φ ) , 而用坐标表示成为
y1 = φ1 ( x1 , x2 ) , y2 = φ2 ( x1 , x2 ) . ( 1)
这一对函数就称为“迁移函数”( transition functions , 这又是数学名词而不是制图学的 名词 ) .如 果
我们想在地球上做微积分 , 当然应该要求它们是光滑函数 ( 但远不止于此 ) .从这里我们汲取了以
下的研究弯曲空间的基本思想 :
n
1. 把研究对象分成许多小的部分 , 而每一部分都可以投影到欧氏空间 R 内 , 因而可以进行
局部的讨论 .
2. 在两个部分相交的地方 , 通过研究迁移函数来实现从一个部分到另一个部分的转换 .
现在就可以介绍微分流形的概念了 .但是立刻就遇到一个问题 , 在讨论地球表面的各种投影
3
以及在讨论更一般的曲面时 , 我们 的对 象是 很清 楚 的 : 它是 R 的 曲 面 , 它的 弯曲 是 相对 于包 含
它的空间———所谓包含空间 ( ambient space ) ———而言的 .但是本章 一开始 就指出 , 黎曼的 基本 思
想是 : 空间本身就是弯曲的 , 用不着有包含空间作衬托 .而其弯曲就表现在 , 其各点附近就距离而
2 i j
言并非均匀的 , 因而度量 d s = gi j ( x ) d x d x 随 x 而 异 .现 在 我们 也 不能 设 想 还有 什 么包 含 空
间 , 也不知道有没有度量 .因而我们一开始只有把研究对象 M 规定是一个拓扑空间 .
然后 , 我们把 M 划分成许多小片 , 具体说 , 设有若 干个 开集———注意 , 拓 扑空 间中是 可以 定
义开集{ Uα }的 , 使 M = ∪
n
Uα .对于每一个 Uα , 我们都假设有一个“投影”φα : Uα →R , 从数学 上
α
n
说 , φα 是一个同胚 , 因此 φα ( Uα ) R 是一个开集 , 甚至是一个区域 . Uα 称为一个区图 ( char t, 这
是一个古老的英文字 , 下面的解释现 在已不用了 : 一片水域 或陆地的地图 ) , 而其集{ Uα }称 为 M
n n
的一个图册 ( atlas) , 这都是借用了制图学中的名称 .φα ( Uα ) R , R 中是有坐 标的 , 我们就借 用
这个坐标作为 Uα M 中点的坐 标 .这种 坐标 称 为局 部坐 标 , φα 称为 坐标 映射 ( 有 时也 就称 φα
为局部坐标 ) .我们不妨设 Uα 是连通的 , 因若不 然 , 我 们可以把 Uα 的 各个连通 分支各当 作一 个
n
Uα .因为 φα 是同胚 , 所以 φα ( Uα ) R 也是 连通 开集———所 谓区域 就是 连通 开集 .这样 我们 看
n
到 , 通过同胚 φα 可以把 R 的拓扑性质———连通性、局部紧性———都移植到 M 上 .结果 , 所有 我
们将要定义的微分流形 M 都是局部连通与局部 紧的 .可见 , 微分流 形将不会 是一 个过于 空泛 的
概念 .
如果 U1 ∩ U2 ≠ , 则不论是否 φ1 ( U1 ) ∩φ2 ( U2 ) ≠ , 在 φ1 ( U1 ) 和 φ2 ( U2 ) 的局部坐 标
( x1 , … , xn ) 与 ( y1 , … , yn ) 之间都会得到迁移函数作为一个映射 :
- 1
φ2 φ1 : φ1 ( U1 ) → φ2 ( U2 ) .
用局部坐标来表示就是
4 42 第七章 微分流形上的微积分
-1
yi = ( φ2 φ1 ) ( x1 , … , xn )
= ψi ( x1 , … , xn ) . ( 2)
为了使得在 M 上有微分学 , 就需要一 个至 关重 要的 相 容性 条件 : ( 2 ) 是 微 分同 胚 .重要 的 是 , 我
∞ - 1
们不妨取 φ1 ( U1 ) , φ2 ( U2 ) 充分 小 , 使得 这 个微 分同 胚条 件可 以 用坐 标来 表示 为 : ψ∈ C , ψ
∞
∈C ,且
( y1 , … , yn )
det ≠0 . ( 3)
( x1 , … , xn ) φ ( U )
1 1
“充分小”这 样 的 限 制 词 是 必 要 的 , 如 若 不 然 , 仅 由 雅 可 比 行 列 式 ( 3 ) 不 为 0 尚 不 足 以 保 证
- 1
φ2 φ1 = ψ为一微分同胚 .
最后我们还要加上两个条件 : 首先 M 是豪斯多夫 空间 , 这不仅使 我们避 免了 与许多“ 病态”
的对象打交道 , 而且有了它 , 再加上第 二个 条件 即 M 适合“ 第 二可 数性 公理”, 即 存 在可 数多 个
开集{ Ui } i = 1 , 2 , … , 使 M 中任一开集必是若干个 ( 可能是可数多个 ) Ui 之并 , 就可 以构造出 许
多极为有用的重要的对象 .首先是单 位分 解 ( 见第 三章 ) , 有 了 它 , 才能 把有 关 M 的 问题 例如 积
分问题归结为在各个区图 Uα 上的相应问题 .至今我们没有说 , M 上是否可以按照黎曼的要求 构
2 i j
造出一个度量 d s = gi j ( x ) d x d x , 而在有了单位分解以后 , 就可以证明 M 上确可定义黎曼的度
量 .证明见§5 .这以后 M 之每个连通分支均各将成为一个度量空间 , 这一点我们则不加证明了 .
有了这些讨论 , 我们就可以正式地给出微分流形的定义 .
定义 1 设 M 为一适合第二可 数性 公理的 豪斯 多夫 拓 扑空 间 , 而且 有 由连 通开 集 { Uα } 所
n - 1
成的覆盖 , 使得对每个 Uα 存在同胚映射 φα : Uα →R , 而且当 Uα ∩ Uβ ≠ 时迁移函 数 φβ φα :
∞ ∞
φα ( Uα ) →φβ ( Uβ ) 为 一 ( C ) 微分 同胚 .这 时称 M 为一 n 维 ( C ) 微 分流 形 , Uα 称 为一 个区 图
n n
( 或坐标邻域 ) , { Uα }称为图册 , φα ( Uα ) R 在 R 中的坐标 称为 M 中 Uα 之局 部坐标 , φα 称 为
坐标映射 , n 称为 M 之维数 .
n
注 1 定义中只要 求{ Uα } 能覆盖 M , 而有时需 要把一切 适合 φ( V ) R 的同胚 φ 与连 通
- 1
开集 V 也都列入 {φα} 和{ Uα }之中 , 但要 φ φα 为微 分同 胚 , 以得到 一个 极大 图册 ( maximal at-
las) .极大图册的存在性是需要而且可以证明的 .这种极大图册称为一个微分构造 .于是产生一个
7
问题 : 同一个 M 上是否有唯一的微分构造 .20 世纪 60 年代 , 米尔诺 ( J .Milnor) 证明了 S 上就有
- 1
互不相容的微分构造存在 , 即一个构造中的 φα 与另 一构造中 的 φβ 能 使 φα φβ 不 是微分 同胚 .
也有人证明了确有没有微分构造的流形存在 .2 0 世纪 80 年 代 , 英国数学 家唐纳逊 ( S .K .Donald-
4
son ) 证明了 R 中即有互不相容的微分构造 , 这件事与理论物理有密切的关系 .
∞ ∞
注 2 上面我们讲的是 C 微分流形 , 即指迁移函数 是 C 函 数 .这 是最常 见的情况 , 一般 数
∞ ∞
学文献中凡讲到光滑 , 总是指的 C , 所以也时常略去 C ( 甚至光滑 ) 字样 .但实际上还有迁移 函
k k 0
数只是 C 函数的情况 .这时流形就称为 C 流形 , 特别是 C 流形 , 其实并没有可微性 .它的性质
k
与其它 C 流形可以很不相同 .例如 可以 问 , 每个 微分 构造 是 否只 有一 个维 数 ? 确 实如 此 , 但 对
k
于 C 流形 , 当 k > 0 时证明并不 难 , k = 0 时也是 可以 证明的 , 但要 证明 维数 不变 需 证明 著名 的
区域不变性定理 :
n m
定理 1 若 n ≠ m , 则 R 之一开集不能同胚于 R 的开集 .
§2 微 分 流 形 4 43
这个著名定 理是 布 劳威 尔证 明的 , 要用 到很 细致 的 同调 理论 工具 , 但在 k > 0 时 却不 难 证
明 .由此 , 我们至少看到 , 维数是刻画一个流形的整体不变量 ; 对一个微分流形找出尽可能多的整
体不变量是很重要的事 .这类问题我们就说到这里为止 .
有时 , 迁移函数是实解析函数 ( 一个函数在某点附 近是实 解析 的 , 即在此 点附 近可以 展开 为
ω ω
收敛的幂级数 ) , 实解析函数类时常记为 C , 实解析流形也 就记为 C 流形 .读者 会问 , 如果把 上
n
面讲的 n 维实空间 R 换成 n 维复空间 , 而迁移函数从可微函数换成全纯函数 , 是否可以得到 相
应的复流形理论 ? 是 , 而且复流形与实流形很不相同 , 我们完全不能涉及 .
M 上有了微分结构以后 , 就可以在其上建立种种有关微分学的概念 .这里 一定要注 意 , 所 有
这些概念都必须是与局部坐标之选取无关的 .我们先确定一下什么是 M 上的可微函数 f .如果 f
- 1
定义在 M 上某点 P 之邻域中 , 不失一般性 , 可以 设此 邻域即 为一 坐标邻 域 U .于 是 f φ 即 成
n - 1 ∞ ∞
为 φ( U ) R 上的函数 .如果 f φ 是 C 可 微的 , 就说 f 在 P 附 近是 C 可 微的 .这个 定义 显
然与 U 和φ的选择无关 , 因为若选 P 的另一个邻域 V 与相 应的 局部坐 标 ψ, 但在 U∩ V 上 ψ
- 1 ∞ - 1 ∞
φ : φ( U∩ V ) →ψ( U∩ V ) ψ( U ) 是一个微分同胚 , 因而是 C 的 , f φ 也 是 C 函 数 , 所 以
- 1 - 1 - 1 ∞
f ψ = ( f φ ) ( φ ψ ) 至少在 P 的一个较小的邻域 U∩ V 上是 ( C ) 可微的 .
∞
下面我们来举一些 C 微分流形的例子 .
n n
例 1 M = R .这是平凡的 , 因为现在的图册 { Uα }只 含一 个元 U = R 即 可 , 而坐标 映射 就
是恒等映射 : φα = id .我 们这里没 有去讨 论什么是 极大图册———微 分构造 .讨 论那个问 题对我 们
目前并无好处 .
n n
其次令 M 为 R 中任一开集 U .这时仍有{ Uα } = { U} , φα = id | U , 我们说 U 是 R 的开子流
形 .这个概念与下面要讲到的闭子流形是不一样的 , 开子流形的维数仍为 n .
n n
读者会问 , 半空间 H = { x∈R , xn ≥0} 是 不是 微 分流 形 ? 一 方面 我们 很需 要 把它 纳入 我
们的视野 , 因为例如在积分理论中考虑斯托克斯 ( Stokes) 定 理 ( 格林公 式是它 的特例 ) 时 , 必须 要
n
讨论 H 上的积分 .另一方面它又不是流形 , 因为它有一个“ 边缘”xn = 0 , 其上的点没有任何可 以
n n
同胚于 R 的邻域 .因此 , 我们要以 H 为模型来扩大微分流形的定义 .
+ +
定义 2 设 M 是一适合第二可数性公理的豪斯多夫拓扑空间 .{ Uα} 是覆盖 M 的开集族 ,
+ n n - 1
∪ Uα = M , 而对每个 Uα 均有同胚 φα : Uα →R 或 H , 使得当 Uα ∩ Uβ ≠ 时 , φβ φα : φα ( Uα )
α
+ n +
→φβ ( Uβ ) 为一微分同胚 .这时称 M 为带边的微分 流形 .{ x ∈ H , x n = 0} 在 M 中的原 像称 为
+ +
M 的边缘 , 记作 M .
+ 2
注 一个带边流形 M 之边缘与 一 个拓 扑空 间的 子空 间 的边 界点 是不 同的 概 念 .例如 , R
中的去了圆心的闭圆盘 0 < r≤ 1 的边 缘只 是单 位圆 周 r = 1 , 但其 边界 点之 集合 还 多了 一个 点
r = 0———圆心 .
+ +
注意 , 这个定义中 M 就 是拓 扑空 间 的全 空间 , 因 此不 存 在 M 以外 的 点的 问 题 .也 因此 ,
+ + n n
Uα 作为 M 中的开集允许含有 M 上之点 .但是 H 又是 R 的子空间 , 并赋有子空 间拓扑 , 因
n n n
此{ xn = 0} 上之点 虽然就 H 是 R 之 子集而 言是 H 之 边界点 , 按子 空间拓 扑而言则 可以含 于
n - 1
H 之开子集 φα ( Uα ) 中 .由同样的理由 , φβ φα 可 以一 直光 滑到 xn = 0 处 , 我们 通常 就说 , φβ
- 1 n n n
φα “光滑到边”.现在我们问 , 把 H 作为 R 之子集来看 , 可否找到“ 更大”的子集 K , 包含 H 而
4 44 第七章 微分流形上的微积分
- 1
且跨越到 xn < 0 处 , 使 φβ φα 可以光滑地拓展到 K 上 ? 一般说来 , 设 f ( x ) 是闭集 H 上的光滑
函数 , K H 是一开集 , 能否找到一个定义在 K 上的光 滑函 数 F ( x ) , 使在 H 上 F( x ) = f ( x ) ?
F( x ) 称为 f ( x ) 由 H 到 K 上的光滑延拓 .是 否可 能延拓 与 H 的 构造有 密切 的关 系 .作 为带 边
n
流形的模型 H 之边缘构造特别简 单 , 就只 是一个 超平 面 x n = 0 , 比 较一 般的 情况 , 则可 以考 虑
+ ∞ +
M 局部也 可 以 用 f ( x ) ≥ 0 来 刻 画 , 这 里 f ( x ) ∈ C , 而 且 grad f ≠ 0 .且 M 局 部 地 位 于
+
M = { x ; f ( x ) = 0}之一侧 .在这个情况下有著名的 Seeley 延拓定理 :
n n n
Seeley 延拓定理 设 f ( x ) ∈ D ( H ) , 则必有一个连续映射 ρ: D( H ) → D( R ) , 使
n
(ρf ) ( x ) = f ( x ) , x ∈ H .
- 1
由于有这 个定 理 , 上述 迁移函 数 , φβ φα 可 以在 x n < 0 的 某一 区域中 也光 滑 , 且是 微分 同
胚 , 这对我们讨论带边流形有很大的方便 .
+ +
这个定理的证明我们就略去了 , 只是要提醒一下 , 如果 M 不是 如此简单 , 哪怕 M 例如 是
一个象限 , 角点的出现也会使函数的延拓困难不少 .
n
例 2 无奇点的光滑超曲面 设有 R 中一个光滑的超曲面 , 它由一个方程
f ( x1 , … , x n ) = 0 ( 4)
n ∞
定义 , 这里 f 是其自变量在 R 之某区域 Ω 内的 C 函数 , 我们设它是无奇点的 , 即在 Ω 上
grad f ( x ) ≠ 0 ,
f
因此在每一点至少有一个偏导数不为 0 .设在某个开集 U 中 , ≠ 0 而可 以应用隐 函数定理 得
xn
出
x n = φ( x1 , … , xn - 1 ) , ( x1 , … , x n - 1 ) ∈ ω .
这里 , 适合以上方程的 ( x1 , … , xn - 1 , x n ) ∈ U , 从而所 有这 种 U 构 成超 曲 面 (4 ) 的 开覆 盖 , 而 且
有坐标映射
n-1
Φ: {( x1 , … , xn - 1 , φ( x1 , … , xn - 1 ) ) ∈ U , ( x1 , … , x n - 1 ) ∈ ω} → ω R .
f
于是我们需要证明的只是 , 例如有两个这样的 U 和 V , 在 V 中 ≠ 0 , 且有相应的坐 标映射 :
xn - 1
n - 1 - 1
Ψ: { ( x1 , … , x n - 2 , ψ( x 1 , … , xn - 2 , x n ) , xn ) , ( x1 , … , xn - 2 , x n ) ∈ Ω}→ Ω R ,则 Ψ Φ :ω
→Ω 是迁移函数 , 其自变量是 ( x1 , … , xn - 1 ) 而函数值是 ( x1 , … , x n - 2 , x n ) .但是很清楚 , 因为
-1
Ψ Φ : ( x1 , … , xn - 1 ) → ( x1 , … , x n - 2 , x n )
可以写为
xj = x j , j = 1 , 2 , … , n - 2 ,
x n = φ( x1 , … , xn - 1 ) ,
xn f f
且 = - ≠0 , 所以它当 ω, Ω 充分小时是微分同胚 , 总之上述超曲面是一个 n - 1
xn - 1 xn - 1 xn
维微分流形 .
n
将它推广 , 在 R 中由 m ( m < n ) 个方程
f j ( x1 , … , xn ) = 0 , j = 1 , … , m ( 5)
∞
定义的几何轨迹是一个 n - m 维微分流形 , 这里 f j 是 C 函数 , 而且 m× n 矩阵
§2 微 分 流 形 4 45
f1 f1
…
x1 xn
… …
fm fm
…
x1 xn
之秩为 m .
n
这个例子告诉我们 , R 中的曲面 (5 ) 是微分流 形 .反 过来 , 也有定 理说明 任一 个 k 维 微分 流
2k+1
形都可以嵌入在充分高维的欧氏空间 R 中 .这就是说 , 为了研究微分流形 , 只需讨论本例就够
n
了 .这时 , R 成了此流形的包含空间 .但是我们并 不采取 这种 观点 , 因 为它使 得许 多很深 刻的 思
想得不到充分表现 .而且 , 维数很高的空间带来的几何复杂性不见得比不用包含空间来抽象地讨
论微分流形更少 .
2
例 3 黎曼球面和射影空间 上一章中我们在 z 平面 C( 即 ( x , y ) 平面 R ) 上引进了一个 无
2
穷远点 , 并通过球极射影把它变成一个球面 S , 称为黎曼球面 .从球极射影的公式可 以看出这 个
射影其实是可微的 .现在我们要证明黎曼球面是一个 2 维微分流形 , 而球极射影其实就是坐标映
射 .
2 2
由图 7 - 2 - 1 可 以 看 出 , S = U1 ∪ U2 , U1 = S \
2
{ N} , N 是北极 ( 0 , 0 , 1 ) ; U2 = S \ { S} , S 是 南极 ( 0 , 0 ,
2 2
- 1) .在 U1 中作球极射影 φ1 : U1 →R , R 是过球心的赤
2
道平面 , 并把一点 P(ξ,η,ζ) ,ζ≠ 1 映 到 R 上 的 ( x , y ) ,
很容易看到
ξ η
x = , y = , ζ≠ 1 .
1 - ζ 1 - ζ
2
这就是 U1 →R 的坐标映射 .同样 , 若 从南 极 S 开 始作球
极射影 , 则点 (ξ, η, ζ) 对应的点 ( x1 , y1 ) 应为 图7 - 2- 1
ξ η
x1 = , y1 = , ζ≠ - 1 .
1+ζ 1 +ζ
2
这就是 U2 →R 的坐标映射 .由此就可以得到 , 除在 ( x , y) = (0 , 0 ) 处以外 .
x y
x1 = 2 2 , y1 = 2 2 .
x + y x + y
而在 U1 ∩ U2 中恰好没有南北极 , 因此不会有 ( x , y ) = (0 , 0 ) 和 ( x 1 , y1 ) = ( 0 , 0) .所 以上式就 是
U1 ∩ U2 中的迁移函数 .由此我们看到 , 黎曼球面是一个微分流形 .其实 , 黎曼球面只不过是普 通
2 2 2
的复平面即 ( x , y ) 平面 R 添加一个无穷远点 而已 , 但 是它 却成了 一个 与 S 同 胚的 球面 , 与 R
的性质大相径庭 : 前者是紧的 , 而后者只是局部紧 , 尽管局部地看来都是通常的平面 .如果我们进
2
一步再看射影平面 R P , 还会感受到更多的区别 .
射影平面其实也只是普通平面再添加一些理想的 元素 .这一 次是 添加了 一条 无穷远 直线 却
2
又使它们的性质与黎曼球面大不相同了 .然而 RP 仍然只是一个 2 维微分流形 .
2 3
从上一章看到 , 定义 RP 有多种方法 , 其一 是在 R 中把 过原 点的直 线当 成一个 元素 , 每 一
条这样的直线可以用其上非原点的一个点 ( x1 , x2 , x3 ) 来定义 , 这里 x1 , x2 , x3 不能同时为 0 .不
4 46 第七章 微分流形上的微积分
过 , 若 ( x1 , x2 , x3 ) 与 ( x′
1 , x′ 3 ) 只相差一个常数因子 , 即
2 , x′
x i = λx′
i ,λ≠ 0 或 x′
i = μx i , μ≠ 0
3
这两点要算成等价的 : ( x1 , x2 , x3 ) ~ ( λx1 , λx2 ,λx3 ) .而 这些直线的集合 即 R 中这些点的 等价
3 2 3 2
类的集合 .我们就称 R ~为 2 维的实射影平面 : R P = R ~ .上一 章里我们 在 R P 上这样来 定
2 2 2
义一个拓扑 , 使 RP 与球面 S ( 经过一些改造 ) 同胚 .现进 一步问 , 能否用 类似的 方法在 R P 上
引入微分结构 , 使得在其上可以建立起微分学 ?
2 2
上一章里 , 我们是令通过原点的直线与 S 相交 , 而将直线之集 合映到 S 上 .但 每一条这 样
2 2
的直线与 S 有 两个交点 互为对 径点 , 因此要 把 S 上的 对径点视 为一点 , 这 样得到射 影平面 的
2 2
几何形象 , 也就是上文说的 S“ 经过一点改造”的意思 .这样作会发现 , RP 与一些很奇特的几何
2
图形例如默比乌斯带有关 .也可以这样 去讨论 R P 的微 分构 造 , 但这 需要把 商拓 扑的概 念和 方
法讲得更明确 , 因此我们采用另一个方法 .
2 3 2
讲解射影平面最简单的方法是引入 R 上的 所谓“齐 次坐 标”.我 们先 引入 R , 即 在 R 上 方
2
多加一个 z 轴 , 于是 R 就成了 z = 0 .我们先把这个平面向上抬起成为 z = 1 , 于是原 来的 ( x , y )
2 3
点变成 ( x , y , 1) .把它与原 点 (0 , 0 , 0) 连 成 直线 , 这 样 一来 , R 与 R 中过 原 点 的直 线 族对 应 起
来 .上面已说过这个直 线 可以 用 ( x , y, z ) ( x , y , z 不 同时 为 0 ) 之 等 价 类 ( x , y , z ) ~ ( λx , λy,
λz) , λ≠ 0 对应起来 .于是 ( x , y ) 点也 就与 ( x , y , 1 ) 之 等价类 对应 起来 了 .我 们选 此 等价 类之 任
一元 ( x1 , x2 , x3 ) 作为代表元 , 但要求 x1 , x2 , x3 不同时为 0 , 例如 ( x , y ) 对应于 ( x , y , 1 ) 的等 价
类 , 而 x1 = x , x2 = y, x3 = 1 , 于是 x = x1 x3 , y = x2 x3 .正 如 复平 面变 成黎 曼球 面 是通 过附 加
2
无穷远点 ( 即北极 ) 而得 , 我们现在也对 R 添加“许多”点成一个新的集合 , 即加 上{ ( x1 , x2 , 0) } .
2
并把这个新集合称为射影平面 RP .它的 点是 坐标 ( x1 , x2 , x3 ) ( 坐标不 同时 为 0 ) , 称为 射影 平
面中一点的齐次坐标 .当 x3 ≠ 0 时 , 由它 们 可 以得 出 普通 的 笛卡 儿 坐标 x = x1 x3 , y = x2 x3 .
2
R P 中每个点并不是恰有一个齐次 坐标 , 而 是 有齐 次坐 标的 恰好 一 个等 价类 .齐 次 坐标 方法 很
早在数学中就通行了 .例如当我 们研究 一个 多项式 P( x , y ) = 0 时 , 就可 以引 入齐 次 坐标 , 并 考
虑一个三个变元的齐次多项式 .
m x1 x2
x3 P , = F( x1 , x2 , x3 ) = 0 .
x3 x3
m 是 P 的次数 .齐次多项式的好处不仅在于形状整齐 , 而且它允许添加一些理 想的元素 .例如 直
线 ax + by + c = 0 , 现在变成 ax1 + bx2 + cx3 = 0 .这 样一来 就增 加了一 个研 究对 象 x3 = 0 , 它 相
应于 a = b = 0 , c≠0 .本来我们是不应该考虑 x3 = 0 的 , 因为 a = b = 0 而 c≠0 与 ax + by + c = 0
m x1 x2
是矛盾的 .上面用 x3 去乘 P , 也是不合法的 .但是若我们允许这样做了就相 当于把集 合
x3 x3
2 2
{( x1 , x2 , 0) }即 x3 = 0 也纳入我们的讨论之中 , 就 相当于 把 R 变成 R P .这 种做 法的合 理性 在
于 : x3 = 0 和 ax1 + bx2 + cx3 = 0 一样是一个一次方程 , 而一次方程代表一条直线 , 所以我们其实
2
是在 R 中添上了一条直线———无 穷远 直线 .这条 直线 经过 一 个适 当的 射影 变换 即 齐次 坐标 的
非奇异线性变换 , 可以化为任一指定 的普通 的直 线 .所以 从 射影 几何 的角 度来 看 x3 = 0 与其 它
的直线并无本质的不同 .
2
现在我们可以来证明 R P 确实是一个微分流形 .事实上
§2 微 分 流 形 4 47
3 3
∪U = ∪ { ( x1 , x2 , x3 ) , xi ≠ 0}
2
RP = i ( 6)
i= 1 i=1
2 2
Ui = { ( x1 , x2 , x3 ) , xi ≠ 0}显 然 是一 个开 集 .从 Ui 到 R 之同 胚定 义为 φi : U i → R , ( x1 , x2 ,
x1 x i - 1 xi + 1 x3
x3 ) ,…, , , …, , 当 i = 1 或 3 时 , xi - 1 或 x i + 1 无意义 , 这时要稍作些修改 , 总之
xi xi xi xi
- 1
使分子上不再出现 xi .余下的只要证明 φi φj 在 φj ( U i ∩ Uj ) 上是 微分同 胚即 可 .不妨 看 φ1
- 1 x2 x3
φ2 .在 U1 ∩ U2 ( ≠ ) 上 , φ1 ( U1 ∩ U2 ) = , : x1 x2 ≠0 = {( z 1 , z2 ) } , φ2 ( U1 ∩ U2 )
x1 x1
x1 x3 - 1
= , ; x1 x2 ≠0 = { ( w1 , w 2 )} , 于是 φ1 φ2 可以写为
x2 x2
1 z2
w1 = , w2 = .
z1 z1
x2 2
但因在 U1 ∩ U2 中 z1 = ≠ 0 , 所以上式很明显是微分同胚 .于是 R P 是一个微分流形 .
x1
2 2
比较一下黎曼球面与 R P , 就知道 , 局部地看 , 它们是非常相似的 , 都是 R .其实凡微分流 形
2
必为局部欧氏空间 .但是整体来看 却极 不相 同 : RP 虽然 与黎 曼球 面同 样 为紧 的、连通 空 间 , 却
n
与后者不同 , 它是不可定向的 .一般地说来 , R P 当 n 为偶 数时必 为不 可定 向的 , 而当 n 为奇 数
2
时却是可以定向的 .那么 RP 整体看来像什么样子 ? 这就很不好说 , 因为它只能 嵌入 ( 这两个 字
5 5
也要解释 , 见后文 ) 在 R 中 .R 是一个什么样 的空间 就不 是人们 的直 觉能 够想到 的了 .因 此 , 整
体地研究微分流形就得一整套其它方法 .这就是 拓扑学的 主题 了 .它将应 用同 调、同伦等 等一 整
套方法 , 而我们这一章只能介绍一点微分流形上的微积分学罢了 .
例 4 黎曼曲面 本书中我们讲了许多不同的微分流形 , 不止于弯 曲的曲 面 .下 面我们再 讲
两种在本书中涉及的微分流形 .其一是黎曼曲面 .在第 二章中 我们就 复变 量的多 值函 数 w = z
介绍了黎曼曲面的概念 .它是以我们的直觉为基 础的 , 因而很 难解 释它如 何穿 过其 自身 .现在 我
2
们从微分流形的角度来看 w = z的黎曼曲面是如何构造出来的 .首先 , 我们把 z 平面看成是 R
即 ( x , y ) 平面 .在其上取一点 z0 ≠0 , 并作以 z0 为心圆周过原点 的圆盘 U0 , 它 是一个开 集 .在 这
1 2
个开集中考查 w = z . z0 有两个可能的值 , 相差一个符号 , 任取其中之一 , 记作 ( z0 ) , 则有 以
下的二项级数展开式 ( 见第三章 ) :
1
1 z - z0 2
w= z = ( z0 ) 2
1+
z0
( 7)
∞
1
∑ Aζ,
n
= ( z0 ) 2
n 0 ζ0 = ( z - z0 ) z0 .
n= 0
∑ Aζ
2 n
代数方程 w - z = 0 的一个解 .另一解则是 w = - ( z0 ) 2
n 0 .我们在 U0 中任取一点 z1 ,
n=0
并用 (7 ) 式算出
∞
1
z1 - z0 n
w = z1 = ( z0 ) 2
∑
n= 0
An (
z0
) ,
4 48 第七章 微分流形上的微积分
并记作 ( z 1 ) 2 , 于是又有
∞
1
z - z1 1
n z - z1
w = ( z1 ) 2
1 +
z1
= ( z1 ) 2
∑ n=0
Anζ1 ,ζ1 =
z1
, ( 8)
1
这个表达式适合于圆盘 U1 ( 以 z 1 为心 , 边界过原 点 ) 中 ( 图 7 - 2 - 2) , 而 且由于 ( z 1 ) 2 的 选取 方
法知 , 在 U0 ∩ U1 中 , ( 7) 与 ( 8) 定义 相同 的函 数 .第 三章 中 指
出 , ( 8) 称为 ( 7 ) 在 U1 中 的解 析 延拓 , 于 是由 ( 7 ) 与 ( 8 ) 共同 定
义的 函 数 之 定 义 域 是 U0 ∪ U1 , 仿 此 进 行 下 去 , 可 能 在 作 出
U N - 1 时就发现 z 0 ∈ U N - 1 .于是我们可以 选 zN 和 U N 即为 z0 ,
1 1
U0 .但这时会得到 ( z N ) 2 = - ( z0 ) 2 , 这一 点 在第 三 章中 就 已
讲过 .所以 , 如果我们真的令 U N = U0 , 则在其上会 定义两 个函
N
个单 值 的 解 析函 数 w = z .为 此 , 我 们只 好 取 另 一 个 区 域 为
2 图7- 2- 2
U N .尽管 它作 为 R 的 区域 仍与 U0 相同 , 而 且 z N = z 0 , 却 是
另一个区域 , 并且从 U N 开始再用级数
∞
1
z - zN
∑
n
w = ( zN ) 2
AnζN ,ζN = ( 9)
n= 0 zN
∑a
k= 1
ik ajk = δij , i , j = 1 , 2 , 3 . (12)
∑a
k= 1
ki akj = δi j , i , j = 1 , 2 , 3
( det A ) = 0 A ij = 0 , " i, j .
ai j
但若在一点处一切 A ij = 0 , 则在该点由拉普拉斯展式
n
det A = ∑a
j=1
ij A ij , i 为固定的
1 n
( y , …, y ) y
所以等价类 [ c ] 并不因采用不同的局部坐 有而有所 不同 .而且 因为 1 n = 是迁
( x , …, x ) P
x P
n
把上面的证明综合成一句话 , 就是我们可以通过坐标 映射把 R 中的 线性关 系移到 T P M 中
n
来 , 而且因为有 ( 13 ) 式可知这种 线性关 系的 转移 不受局 部坐 标选择 的影 响 .特 别是 0 ∈R 所 对
应的曲线之等价类我们就应该规定为 T P M 中的 零元素 .由于 这个 等价类 之重 要性 , 我们 要特 别
- 1
看一下 , 其中包括了什么 .当 然 , 其 中 包含 了 φ ( 0・ t ) .这 里 的 0 是 零 向 量而 不 是 数 0 , 即 0 =
- 1
(0 , … , 0) , 所以我们写 0・t 而不写 0 t .φ ( 0・t ) 是这 样的 曲线 : 即对 一切 t 值它 始 终是 一个 点
n ・
P , 我们不妨称之为驻定曲线 .但除此以外 , 它还 包含了 R 中 的适合 x ( 0) = 0的 曲线 在 φ 下的 原
- 1 ・
像 ,而且也只包含这种曲线 .所以 [ c ] = { φ ( x ( t ) ) , x ( 0 ) = 0} .但是 若 一曲 线 x = x ( t ) 适 合
・
x (0 ) = 0 就说它 以 t = 0 为奇点 .因 此 TP M 中的零 元素即 是以 P 为奇 点的曲 线之等 价类 .这 一
等价类我们记为 [0 ] .有了这些规定后即得
k k
∑ λξ
i= 0
i ( i) = 0 ∑λ [ c ]
i=1
i i = [ 0] . (14)
由此 , { [ ci ]} , i = 1 , 2 , … , k, 在 T P M 中线 性相 关或线 性无 关的 充 分必 要条 件是 {ξ( i ) } , i = 1 , 2 ,
n n
… , k , 在 R 中线性相关或线性无关 .但是 R 中恰好有而且最多也只有 n 个线性无关的向量 , 所
以在 T P M 中也是这样 .由此可知 T P M 是 n 维空间 , 证毕 .
于是要问 , 如何找出 TP M 的一个基底 ? 为了找出一个最有 用的基 底 , 我们要再 回顾一下 切
n
空间的定义 .切向量和切空间在 R 中 都是很 直观 的东 西 , 但 是当 微分 流形 M 并 未 放置 在某 包
含空间中时 , 就无法应用这些直观的东西 .于是我们利用微分流形局部地与欧氏空间同胚这一事
实 , 并只在一个坐 标 邻 域 U 中 考 虑 切 向 量 与 切 空 间 , 而 且 用 坐 标 映 射 φ 把 我 们 的 考 察 引 入
n n n
φ( U ) R .在 R 中则可以充分应用直观上已经很明确 的概念 , 然 后用 R 的 线性 同构 , 作出 抽
n
象的 T P M .这样做 法还给了 我们更 大的活动 余地 : 简单地 说 , 只要与 φ( U ) R 上 的直观的 切
空间同构的就算是 M 在 P 点的切空间 T P M .上面我们用速度向量来构 成线性 空间 .现在我们 使
n n
用 R 上的方向导数来建立切空间理论 .先讨论 M = R 的情况 .
n n
首先 , R 中的方向导数是一个求导运算 , 这是 因为 , 若 F ( x ) 是定义 在某 点 P∈ R ( 不妨 设
n
P 就是 x = 0 ) 附近的光滑函数 , 则在某一个方向 ξ(ξ∈ R 是 一个向 量 ) 上 在 P 点对 F( x ) 求导 ,
就是把此函数放在过 P 的直线 x = ξt ( t = 0 对应于 P 点 ) 上 , 得到一个 t 的函 数 F( x ) = F(ξt ) ,
然后对 t 求导 , 得到
n
d F(ξt )
∑ξ
i
X( F) = F(ξt ) = i = 〈grad F(ξt ) ,ξ
〉. (15)
dt i= 1 x
i
( 注意 , 我们这里写的是 ξ 而不是ξ( i ) , 上面 (14 ) 式讲 ξ与 [ c ] 的 对应 关系 时则用 的是 记号 ξ( i ) .
那里是表示的第 i 个向量 , 现在则表示向量 ξ的第 i 个分量 , 分量记号用上标是否指 ξ为逆变 向
量 ? 是的 , 这一点下面再说 .) 最后令 t = 0 得到在 P 点的方向导数值 .这里 有一个非 常关键的 事
实 , 如果我们不把 F 放在直线 x = ξt 上 , 而且 放在 该直 线所属 的等 价类 [ c] 中 任一曲 线上 , 所 得
结果全是一样的 .所以我们所建 立的不 只是 X 与 x = ξt 的 对应 关系 , 而且 是 X 与 [ c] 的 对应 关
系 .( 15 ) 式中的算子 X 有以下的性质 :
(1 ) 关于 F 的线性性质 , 即对光滑函数 F , G 和实数λ, μ有
X (λF + μG ) = λX ( F) + μX( G ) . (16)
§2 微 分 流 形 4 53
(2 ) 若 F = const , 则
X ( F) = 0 .
(3 ) 莱布尼茨性质 , 即
X ( FG) = F X( G) + GX ( F) . (17)
特别值得注意的是 (17) .事实上 , 性质 (2 ) 可 由 ( 16 ) , ( 17 ) 导 出 .凡 一线 性算子 具有 以上三 个性 质
的都称为一个导子 ( derivation) , 我们以后还会看到并不是只有方向导数才是导子 , 而例如微分也
是导子 .方向导数在导子中的特点在于 , 它以某种方式与一个向量相联系 .为了看清这种联系 , 注
n n
意到上面讨论中的 P 本来可以在 R 中 某一区 域上 变动 , 现 在我们 把 P 固 定只看ξ∈ R 变动 ,
n
则 (15) 式表示当 P 固定 ( 即是令 t = 0 时 ) 有一个由 ξ∈R 到某一个 X 的映射 .这些 X 都可以写
为
n
F(0 )
∑ξ
i
XP ( F) = i . (18)
i=1 x
它与 (15) 之区别在于 F 之导数是在 P 即 t = 0 处取 值的 , 所以我 们用 X P 表示 , 以 示与 (15 ) 的 区
别 .这个区别似乎是微妙的 , 但是它是下面将要讨论的切丛概念的基础 .
n
定理 3 由 ( 18 ) 式定义的映射赋予{ X P }以线性构造 , 而且使 R 与{ X P } 同构 .
证 { X P }的线性构造是明显的 , 因为
n
F( 0)
∑ ( λξ + μη )
i i
λ
ξ+ μη i .
i =1 x
n 1 n 1 n
这里 ξ,η∈R 是向量 ,ξ= (ξ , … ,ξ ) ,η= (η , … , η ) , 而 λ, μ是实数 .从这一个简单的推导 就
看出为什么要把 P 固定 , 因为若在计算中令 P = ξt 而让 P 变动 , 计算的结果只会得出
n n
F(ξt ) F( ηt )
∑λξ ∑ μη
i i
i + i , (19)
i= 1 x i= 1 x
而无法结合成 F(ξt + ηt ) ( 即 令合成 了也 会丧失 了 (18 ) 式 对 ξ, η的 线 性依 赖性 , ( 15 ) 式对 ξ, η
本来就不是线性的 ) .
在给出了{ X P }的线性构造以后 , (18) 式为一同构 就容易证 明了 .首先它 是单射 , 因为 若 ξ∈
n
R 对应的 X P 是零算子 , 则应当有 : 对任一光滑函数 F( x ) ,
n
F(0 )
∑ξ
i
i = 0,
i= 1 x
1 2 n 1 2 n
依次令 F = x , x , … , x 就得出ξ = 0 ,ξ = 0 , … ,ξ = 0 , 即 ξ= 0 .
最后证明 (18) 是满射 .为此 , 先要注意一件事 .若 F( x ) 在 x = 0 附近是光滑的 , 把它在 x = 0
处用泰勒公式展开到二次项 :
n
i i j
F( x ) = F( 0) + ∑ Fi ( 0) x + ∑
i, j = 1
Fi j ( x ) x x ,
F(0 )
用 X P 作用到两边 , 这里 Fi ( 0 ) = i , 而 Fij ( x ) 仍 是 x = 0 附 近的光滑 函数 .利用 X 之性 质
x
(1 ) ~ ( 3) , 再在 P 点取值即有
n
i
XP ( F) = ∑
i= 1
Fi ( 0) X P ( x ) .
n 1 n 1 n
现在在 R 中取向量ξ= (ξ , … ,ξ ) , 我们只要这样定义算子 X , 使 ξ= ( X P ( x ) , … , XP ( x ) ) 即
4 54 第七章 微分流形上的微积分
∑ξ
i
X= i , 代入上式即知对任意 F( x ) 有 (18) 式
i= 1 x
n
F(0 )
∑ξ
i
XP ( F) = i .
i=1 x
n
所以任一个 X P 都是某一个ξ∈R 之像 , 因此满射得证 .
n
这个定理告诉我们 T P M ( 现在 M 就是 R ) 与 { X P } 同构 .因 此我 们可以 说 { XP } 就是 T P M ,
∑ξ
i - 1
XP ( F) = i (F φ ) (0 ) . (20)
i =1 x
这里右方的 0 即是 φ( P) , X P 称为 M 在 P 点的切向量 .
§2 微 分 流 形 4 55
这样定义的 X P 自然适合导子的三个要求 .
这个定义显然与坐标的选取无关 .若改用另一个坐标邻域 ( V , ψ) , 而以 y 为新的局 部坐标 ,
1 n
并设在新坐标 y 下 , 逆变向量 ξ的分量变成η= ( η , … ,η ) , 且
i
i x j
ξ = j (0 )η ,
y
代入 (18) 式有
n i -1
j x (F φ )
X P ( F) = ∑ η j ( 0) i (0 )
i= 1 y x
n - 1 - 1
[F φ (φ ψ ) ]
= ∑η
j
j (0 )
j= 1 y
n -1
j (F ψ )
= ∑η j (0 ) .
j= 1 y
它的形状仍与 (20) 相同 .由此可见这样定义的对象 XP ( F) 确实仅仅决定于 M 的性质 ( 当然只 是
局部性质 ) , 而与坐标之选取无关 .也由此 , 我们可以把定理 3 改写为
定理 3′ 设 M 为一 n 维微分流形 , P∈ M .则由 定义 5 给 出的 X P 之集 合具 有自 然的 n 维
n
线性空间结构 , 且{ X P } ǖ R .{ X P }称为 M 在 P 点的切空间 .记作 T P M .
至此 , 一个微分流形 M 在 P 点附近的“ 线性化”过程完 成了 .我们在 M 上 P 点 处给 M 添 加
了一个 n 维线性空间 T P M .我们可以在某种 意义下 用 T P M 来 代替 M 以 研究 其性质 .这 样自 然
产生许多深刻的问题 , 例如 : 可否局部地由 T P M 恢复 M ( 指数映射 ) ? 如果 M 还是一个 李群 , 则
群结构在 T P M 上诱导出什么 ( 李代数 ) ? 所有这 一切 自然都 远远 超 出本 书范 围 .但 是有 一个 问
题却是不能回避的 .
现在有了 T P M , 它是一个线性空间 , 线性空间上有 许多结构 , § 1 讲的 向量和张 量就是其 中
十分重要的 .有许多结构需要考虑 P 在 M 上的 变化 ( 而 不是 如上面 那样 把 P 固定 , 而我 们上 面
一再指出 , 把 P 固定是很重要的一步 ) , 这就导致了向量丛的概念 , 我们 等一会 再去讨论 它 .目 前
要讨论的是 T P M 的对偶空间 , 但在此以前需要讨论什么是切映射 .
首先 我 们 要 重新 看 一 下 什 么是 一 个 函 数 的微 分 , 看 一 下一 元 函 数 这 个最 简 单 的 例 子 ( 图
7 - 2 - 3) .如果一个光滑函数 f ( x ) 定义在区间 ( a , b) 上 , 而 过 P 点有 一条 切线 .设 P 点 的坐 标
是 x ( 在上文中是取 x 为 0) .我们不妨把函数的图形看成一个微分流形 M , 而视此函数关系为由
一维微分流形 R 到 M 的映射 f , 映 Q∈ R 到 P∈ M , 而且此 映
射是可微的 . M 在 P 点的切空间就是过 P 的切线 , 而 R 在 Q 点
的切 空 间 仍 是 一 个 1 维 线 性 空 间 R , 不 过 原 点 要 放 在 Q 点 :
T Q R = R .当 我 们 有 一 个 可 微 映 射 f : ( a , b) R→ M , x
f ( x ) 时 , 在切空间 T Q R 与 T P M 之间也有一个 映射 A , 映 T Q R
中的 h 为 Ah = f′( x ) h .不过我 们并没有 把它画 在 TP M 上 , 而
是画在与 y 轴平 行 的方 向 上 , 因 为这 是 我们 习 惯的 .通 常的 微
积分教本把 Ah 这个量称为微分 , 而把 A 看成一个数即曲线 M
图7- 2 -3
在 P 点 的斜率 , 而正 如我们在 第三章 中讲的 , 我们 则把 A 看 成
4 56 第七章 微分流形上的微积分
图7- 2- 4
k
为了直观起见 , 我们仍设 M 和 N 各有一个维数充分高的 R 作为包含 空间 , 并作出 图 7 - 2 - 4 :
图上画出了 M 和 N 上两点的坐标邻域 U 和 V 以 及坐标 映射 φ和 ψ, 并设 φ( U ) 和 ψ( V ) 中 的
局部坐标是 x 与 y, 而且 P, Q 两 点都 映射到 原点 O .这 与图 7 - 2 - 3 不 同 , 那里 P 点是 映到 x
m n
处 , 不过我们认为 x 是 固定的 .图上 在 M 与 N 的下方 还画了 R 和 R .不 过 , 它们中的 每一 个
m n
都起双重作用 : 一是作为微分流形与之同胚的 那个空间 : φ( U ) R , ψ( V ) R , 它 们是 与 U ,
m n
V 同胚 的 .二是 上面 我们已 经说 过 , 微分流 形在 每点 上都有 切空 间而同 构于 R 或 R , 这里 的
m n m n
R 和 R 就是 T P M 和 T Q N 的同构像 , 它们与 T P M , T Q N 不仅是 同胚 而且线 性同 构 .R 和 R
的这种双重作用的区别极为重要 .作为 φ( U ) 与 ψ( V ) 来看 , 对应于由 M 到 N 的 映射 f , 有一 个
- 1 - 1
映射 , ψ f φ , 即 f 的局部坐标表示 .ψ f φ 是光滑的 , 其实这 就是 f 为光 滑映射的 定义 .作
为 T P M 与 T Q N 来看 , 其元是 M 在 P 点和 N 在 Q 点 的切 向量ξ与 η, 而 当由 M 到 N 有 映射 f
- 1
( 其坐标表示为 ψ f φ ) 时 , 在 ξ与η之间也应 该有一 个线 性映射 .这 就是 图 7 - 2 - 3 中 的 A
的推广称为切映射 .正如 图 7 - 1 - 3 中 的 A 称 为 f ( x ) 的 微分 , 并 在 通常 的 微 积分 教 本中 记 作
d f : A = d f ( 但实际上通常的微积分教本中的微分是 Ah) 一样 , 这个 我们认 为应该存 在的线性 映
射称为 f 在 P 点的切映射 , 也应该称为 f 在 P 点的微分 , 并记作 d f ( 就是图 7 - 2 - 4 上的 f * , 这
个记号将在下文中解释 ) , 同时也应该有与 (21) 的对应公式在 .
现在我们就来寻找这个 d f 的相应的公式 .为此 我们再 回到切向 量的定义 , 上 文中我 们用 两
个方法来定义切向量 , 其一是用光滑曲线 c 的等价类 [ c] , 这里 的 c 要求 当 t = 0 时经过 P 点 , 等
价关系则由同一等价类的两条曲线 c1 与 c2 必在 P 点 相切来定 义 .但是我 们所熟悉 的相切性 是
m
欧氏空间 R ( 我们先看 T P M , T Q N 的情 况与 此相仿 ) 中的 概念 , 所以 c1 与 c2 的 相 切需 要先 用
m m
坐标映射 φ将它们映到 φ( U ) R 中去 , 得到 R 中两条曲线
1 m
φ ci : t → ( x ( i ) ( t ) , … , x ( i ) ( t ) ) , i = 1 , 2 ,
再按通常微积分教本的方法对 t 在 t = 0 处求导得出
§2 微 分 流 形 4 57
1 m ・1 ・m
ξ( i ) = (ξ( i ) , … ,ξ( i ) ) = ( x ( i ) (0 ) , … , x ( i ) ( 0) ) , i = 1 , 2 ,
是为切向量 .如果 ξ( 1 ) = ξ( 2 ) ( 这一点下文还有说明 ) , 就说 c1 与 c2 在 P 点 相切 , 这时 ξ( i ) 的公 共
n
值 ξ∈R 就称为 P 处的一个切向量 , 它是 [ c ] 的坐标表示 .有了这一切再看什么是切 映射就容 易
- 1
了 , f c1 与 f c2 是 N 上的两条光滑曲线 , 在坐标邻域 中它们 相应 于 ψ f ci = ( ψ f φ ) φ
1 n 1 n ・1
ci : t ( y ( i ) ( t ) , … , y( i ) ( t ) ) , 而 其 对 t 在 t = 0 处 的 导 数 是 ( η( i ) , … , η( i ) ) = ( y ( i ) ( 0 ) , … ,
・n - 1
y( i ) (0 ) ) , 这里 ψ f φ 是 φ( U ) 到 ψ( V ) 的映射
k k 1 m
y = y ( x ,…, x ) , k = 1, 2, …, n,
而
k
・k y ・j
y( i ) ( 0) = j (0 ) x ( i ) ( 0) .
x
( 请读者注意 : 一个重复出现的指标代表对该指标在适 当范 围中求 和 , 所以 这里出 现的 两个 j 因
m n
为是 x 的指标 , 而 x∈R , 所以应从 1 到 m 求和 ; 如果是对 y∈R 的指标求和 , 则要从 1 到 n 求
和 .) 如果用向量来表示则得
η( i ) = Aξ( i ) , i = 1 , 2 .
1 n
( y , …, y )
这里 A 是雅可比矩阵 1 m (0 ) .它确实是 n × m 矩阵而不是方阵 .所以没有相应的行列
( x , …, x )
式:
1 1
y y
1 ( 0) … m (0 )
x x
A = … … . (22)
n n
y y
1 ( 0) … m (0 )
x x
因为 ξ1 = ξ2 = ξ, 所以 η1 = η2 , 从而 f c1 D f c2 , 其等价类为 [ f c] , 其坐标表示则是 η1 与 η2 的
m
公共值 η, 而上式成为 η= Aξ.在讲切空间的定义时我们已经说了 , 我们要把 ξ∈R 的线性构 造
m m
移到 [ c] 上去 , 使得 [ c ] 之集合也成一个线性空间 , 所以由于 A 是ξ∈R ( 注意现在的 R 是 TP M
n
而不是 φ( U ) 的包含空间 ) 到 η∈R 的线性映射 , 所以由 [ c ] 到 [ f c] 之间有一线性映射 , 称为 映
射 f 在 P 点的切映射 , 或称为 f 在 P 之微 分 d f P .d f P 的 坐标 表示则 是雅 可比 矩阵 A ( ( 22 ) 式 ) .
这是我们用切空间的第一种解释得到的切映射之定义的说明 .
上文说 , 关于 ξ( 1 ) = ξ( 2 ) 还有 说明 , 这指的 是 , 在通常 微积分教 本中 , 讲到两 曲线相切 时只 需
要其切线有相同斜率即可 , 所以只要 ξ( 1 ) = Cξ( 2 ) , C 是 一个非 零实 数 , 就应该 说它 们定义 相同 的
・
切向量 ; 或者说 , 不需要 ξ( 1 ) = ξ( 2 ) , 只需要 ξ( 1 ) ∥ξ( 2 ) .而我 们这里 ξ= x ( 0 ) , 其实 是 由速 度的 概
念而来 , 所以 , 我们现在讲的切向量 , 其实是力学的速度向量 , 而不是几何向量 .
我们现在来寻找公式 (21) 的类 似物 .在第 三章 中我们 就说 过 , 微分公 式 ( 21 ) 中 的 x 与 h 性
质不同 : 前者是底空间之元 , 后者则是切空间之元 .二者本来无法相加 .(21) 中写出 x + h 只是 因
n n
为现在 底 空 间 是 R 的 一 个 区 域 , 切 空 间 则 是 整 个 R , 它 们 很 偶 然 地 可 以 相 加 . 同 样 ,
f ( x + h) - f ( x ) 也只对这种特殊情况有意义 .在 f 表示微 分流形 M 到另 一微分 流形 N 的可 微
4 58 第七章 微分流形上的微积分
- 1
映射时 , 应怎样寻找 ( 21 ) 的类似物呢 ? 为此 , 我们要用 f 的局部坐标表示 , 即 ψ f φ 并将它 和
前面一样写成
i i 1 m
y = y( x ) 或 y = y ( x , … , x ) , i = 1, 2, … , n . (23)
我们还设 P 和 Q 分别即是 x = 0 与 y = 0 , 于是在 x = 0 处把 ( 23 ) 用泰勒公式写成
i
i y ( 0) j
y = j x + 高阶项 .
x
并取它的线性部分 ( 注意 , 我们不再说“略去高阶项”的话了 , 第三章第二节作了详细说明 ) :
1 n
( y , …, y )
η = Aξ, A = 1 m ( 0) .
( x ,…, x )
这里我们用 η和ξ取代了 x 和 y .事实上 , x 与 y 是底空间中之元的局部坐标 , f 本来就是底空间
之间的映射 ;η和ξ则是切向量———切空间之元的局部坐标 , 而切映 射正是 切空间之 间的线性 映
射 .至此我们更看到切映射概念确是函数的微分的概念之推广 .而且用局部坐标表示后更表明它
们的确是一回事 .我们不说略去了 o( h) , 而说成是取泰勒公式的 1 节 (1 -jet ) 来 代替 f , 而 1 节
的形状是与局部坐标的选取无关的 ( 此即一阶 微分的形 式不变性 ) “
. 略去 高阶无 穷小”现 在代 之
以“只考察 1 节”.这样绕过了无法定义 f ( x + h ) - f ( x ) 的 困难 .总之 , 切映射 就是微分 概念 的
推广 , 所以我们采用了同样的记号 d f .
但是 , 切向量还可以用一阶微分算子作定义 .按这种定义切映射又应如何理解呢 ? 它能告诉
我们什么新的联系、新的概念吗 ? 为此 , 我们暂时把有待我们去探讨的切映射记作 珘
d f , 并且打 算
i 1 m ・1 ・m
说明它就是 d f .于是设有 X P = ξ i ∈ TP M .这里 (ξ , … , ξ ) = ( x ( 0 ) , … , x ( 0 ) ) 是 它的 局
x
~
部坐标表示 .于是 , d f・X P 应是 N 在 Q 点的切向量 , 也不妨设它在 N 上的局部坐标表示是 Y Q =
k 1 n
η k , k = 1 , 2 , … , n .于是我们问 , 应 该怎 样决 定 η= (η , … , η ) ? 一 个微 分算 子 是通 过它 在
y
函数上的作用来表现的 , 所以对任意的定义在 f ( M ) N 上的函 数 F ( 不 妨用局部 坐标 F ( y ) 表
k F
示 ) , YQ F = η k 是有定义的 .但是 F 也可以认为是 定义在 M 上的 , 即先 把 M 上 之点 ( x 是 它
y
的局部坐标 ) 通过映射 f 映到 N 上 , 而 原来 在 N 上的 函数 F( y ) 现 在变 成 F( y ( x ) ) , 被 拉回 到
~
M 上 .一个十分自然的想法是这样来定义 d f・ XP = Y Q : 使 X P 作 用到 F( y ( x ) ) 上恰好 就是 Y Q
作用到 F( y ) 上 .亦即在 x = 0 及其像 y = 0 处
k F( y ) i
η k = ξ i F( y ( x ) )
y y= 0 x x= 0
k
i F y
= ξ j i .
y x y = y( x) , x = 0
1 n
因为此式应该对任意函数 F( y) 成立 , 依次令 F = y , … , y , 即有
k
k i y (0 )
η = ξ i .
x
但是这正是用第一种方法得出的 d f 的局部坐标 表示η= Aξ .所 以 , 切 映射的 这两种 定义 是
~
完全一致的 .我们也就没有必要再用 另一个 记号 d f , 而都 用 d f .第 二种 讲法 实际 上 引入 了一 种
对偶性 .因为 d f P 把 M 上的切向量 XP 推前到 N 上 , 成为 N 上的切向量 .F( y( x ) ) 或记为 F( f )
§2 微 分 流 形 4 59
d f P ・ XP = XP ( f ) . (26)
尽管从表面上看上式左方是一个算子 , 右方则是一个实数 , 二者怎能相等 ? 有了这样的说明
后 , 即有
推论 7 假设同上 , 有
f ( 0) i
d fP = i d xP . (27)
x
j
证 在 (26) 中令 f 为第 j 个坐标函数 x , X = i , 即有
x
j i
dx i = δj . (28)
x
i
对任意的 X P = ξ i , 设 P 即 x = 0,
x
i f ( 0) i j f (0 ) f ( 0) i j f ( 0) i
d f P ・ XP = XP ( f ) = ξ i = δjξ i = i d x Pξ j = i = d xP ・ X P .
x x x x x
此即 (27) 式 .
这样一方面我们得到了与古典的微分公式形状完 全相同 的结 果 ; 另一方 面又 大大发 展了 第
三章所讲的微分学的基本思想 , 即“ 略去高阶无穷小”.但是我 们所 得又远 不止 于此 .我们 把切 向
量变成了一个一阶微分算子 , 而切映射 , 作为函数微分的推广并不只是把 X P 映为另 一个微分 算
子例如 Y Q , 而且如定理 6 指出的那样 , 在经过了一定的解释以后 , 对任意的 X P ∈ T P M 给出一 个
(1 ) (2)
实数值 X P ( f ) .这 就 是 ( 26 ) 式 的 含 意 . X P ( f ) 对 X P 当 然 是 线 性 的 : [ c1 X P + c2 X P ] ( f ) =
( 1) (2 ) (1 ) ( 2)
( d f P ) ( c1 X P + c2 X P ) = c1 X P ( f ) + c2 X P ( f ) , 所 以 d f 是 T P M 上 的 线 性 泛 函 , 而 且 因 为
dim T P M = dim M = m 是有限的 , 所以还是 T P M 上的连续线 性泛函 .这样 , d f P 就成了 T P M 的
*
对偶空间 T P M 中的元 .上面我们说切映射的研究导致了一种深刻的对偶性的出现就是指此 .
* *
T P M 之元称为余切向量 , 其空间 T P M 称为 余切 空间 .余切 空间 作为 T P M 之 对偶 空间 其
维数与 T P M 相同 , 即同为 dim M = m , 现在要 问 , d f P 是 否已概 括了 全部余 切向 量 ? 或者 说 , 余
切向量是否全由某个光滑函数 f 之微 分生 成 ? 当 然 不是 如此 , 这 是 一个 很深 刻的 问题 , 我们 将
在§4 中讨论它 .在目前我们只需指出一点 , 我们现在 讨论余 切向量 是限 制固 定一个 P 点 的 , 而
当 P 在 M 上变时 , 这个余切向量也会变动 , 这时是否所有 这些余切 向量都 是由同一 个函数之 微
分生成是很不确定的 .在古典的微积分教本中我们已见到这种问题 .例如 , 设有 xd y - yd x , 这 里
( x , y ) ≠ (0 , 0 ) , 当 ( x , y ) 变动 时能 不能找 到一 个函 数 φ( x , y ) 使 xd y - yd x = dφ? 当然 不行 ,
2 2
φ φ φ φ
因为如果有这样的光 滑函 数 φ存 在 , 当有 x = , - y= 而 = - 1, = 1 二 者不 相
y x y x x y
1 xd y - yd x y
等 .但是若用 2 2 去乘此式 , 得到 2 2 = d ( arctan ) .前面要 求 ( x , y ) 不 是原点 原因 在
x + y x + y x
此 .我们不去讨论当 P 变动时怎样求出各点的 余切空间 中的全部 元素 , 而 要问 , 当 P 固定 时 , 怎
* * *
样求 T P M 的基底 .由于 T P M 维数为 m , 所以我们想去求出 T P M 的 m 个线性无 关的元 .( 27)
i i
告诉我们 d fP 是 {d x P } , i = 1 , 2 , … , m , 的线性组合 , 所以只要得证 {d x P }是 线性无关 的则它们 必
*
是 T P M 的一个基底 .
§2 微 分 流 形 4 61
因此 , 设有实数 λ1 , … ,λm 使
j
λj d x P = 0 ,
把双方作用到 i 上 , 由 ( 28 ) 即得
x
λi = 0 , i = 1 , 2 , … , m .
i *
因此{d x P } , i = 1 , 2 , … , m , 是 T P M 之基底 , 概括以上所述 , 我们有
*
定义与定理 8 TP M 之对偶空间 T P M 称为 M 在 P 点的 余切空 间 , 若在 M 上某个 坐标 邻
i i * *
域中取局部坐标{ x } , i = 1 , 2 , … , m , 则 {d x P }是 T P M 的一个基底 , 从而 T P M 之一 切元 , 即 M
在 P 点的一切余切向量必可写为
i
ωP = λi ( P) d x P . (29)
注 1 当 P 变 动时 ωP 不 一定是某 个函数 之微分 , 即若 不附加其 它条件 , λi ( P) 不会 是某 个
光滑函数 φ之全部偏导数 .所以 (29) 称为微分形式而不是微分 .
i *
注 2 在局部坐标 x 中 , i 与{d x } 是 T P M 与 T P M 之一对对偶基底 .
x
注 3 至此我们应该提一下切 ( 余 切 ) 向量 究竟 是协 变的 还 是逆 变的 ? T P M 的 一个 基底 是
f
1 , …, m ,按我们 前 面 的 讲 法 是 说 i 是 协 变 的 .但 是 前 面 讲 的 是 i , 它 是梯 度向 量
x x x x
grad f的 分 量 , 即 以 { e1 , … , em } 为 基 底 时 的 坐 标 .现 在 的 i 本 身就 是一 个向 量, 它 是标 架
x
1 , …, m 的第 i 个元 .它不 是 某一 个 向量 的 坐标 , 它自 己 却 有 坐 标 .例 如 1 ǖ ( 1, 0, …,
x x x
i i
0) . T P M 的任一元 XP = ξ i ,ξ 才是其相对于标架 1 ,…, m 的坐标 , i 是协变 的 , 其 坐
x x x x
*
标则 一定 是 逆变 的 .这样 , X P 才 是 与坐 标无 关的 , 无所 谓协 变与 逆变 .同样 , T P M 中的 任一 元
i 1 m i
ω= λi d x , {d x , … , d x } 是 标架 , 每一 个 d x 都是 一个 向量 , 而 且是逆 变的 .这 样 , 为了 使 ω 成
为与坐标无关的 , ω对于上述基底的坐标{λ1 , … ,λm }又一定是协变的 .
*
最后引入一个记号 , 我 们记 d f P 为 f * , 记 F f = f F, f * 是一 个“ 推前”( push for ward) , 因
*
为 f 把 M 映成 N , f * 则把 T P M 映成 T Q N“
, 方向”是一致的 . f 则是一个“ 拉回”( pull back ) , 因
*
为若 F 定义在 N 上 , 则 F f 定义在 M 上 , 所以 f F 把原来 定义于 N 上的“对 象”( 现在是一 个
函数 ) 拉回到 M 上来了 .这样一来 (25) 式就可以写成
*
〈f * XP , F〉 = 〈X P , f F〉 .
它是说 , 或者把 M 上的切向量 X 推前到 N 上成为 f * X ∈ T Q N , 然后 把它作用 到定义 在 N 上 的
*
函数 F 上去 ; 或者向量 X P 不动而把定义在 N 上的 F 用 f 拉回 到 M 上 , 再 与 XP 作 用 .( 25 ) 表
明 , 这两种方法结果是一致的 .
*
用现在的记号就发现 f * 与 f 的关系恰好是互 相对偶 的 .我 们又时常 把 f * 写成 T P f , 于 是
切映射就有了几种记法 : d f ( P) , f * ( P) 或 TP f 或 ( T f ) ( P) .
3. 切丛与余切丛 我们多次讲过 , 在函数的微 分的定义 中出现的 f ( x + h ) , x 与 h 必须 从
4 62 第七章 微分流形上的微积分
空间 M 看成是 E 的零切口 .
4. 浸入、嵌 入、浸没和子 流形 微分流 形的子流 形当然 是一个重 要概念 .其实 , 所 有的微 分
N
流形都可以 看成是 某一个高 维欧氏空 间 R 的子流形 , 只 不过因为 这样做 等于对每 个微分流 形
都规定要放在一个包含空间中去研究 , 而包含空间的概念是不必要的 .而且 , 一旦把 微分流 形 M
N N
放在 R 中去 , R 自己就有一个标准的微分结构 , 这个微分结构又与 M 的微分结构 有什么关 系
呢 ? 但不论如何 , 子流形的概念总是极其重要的 , 而且其关键问题就在于如上所述的两种微分结
构的关系 .所以我们应该从一个明确无误的定义开始 .
定义 6 设 M 是一 n 维微分流形 , N M 称为 M 的一个 k ( k≤ n ) 维子流形 , 是指对每一点
P∈ N 都有一个在 M 中的坐标邻域 ( U , φ) 使得
k
(1 ) φ( N∩ U ) = R ∩φ( U ) ;
(2 ) ( N∩ U , φ| N ∩ U ) 是 P 在 N 中的坐标邻域和坐标映射 .
注 1 很容易证明 , { N∩ U , φ| N∩ U }是 N 的 一个 图册 , 所 以 N 本身 也成 为一 个微分 流形 ,
而其微分结构是由 M 的微分结构诱导来的 .
注 2 我们又时常定义一个映射———包含映射 ( inclusion) i : N→ M , P( ∈ N ) P( ∈ M ) , 于
是子流形 N 又可看 成是包含 映射的像 : N = i ( N ) .于 是子流形 的定义又 可以这 样来看 : 首先 我
们已有了一个 k 维微 分流形 N , 作为一个 集合 , 它是 M 的子集 .因此 可以认为 i ( N ) = N .如 果
i( N ) 是如定义 中说 的 M 的 子流形 , 则 M 在 i ( N ) 上诱 导出 一个微 分结 构 , 所以 , 一 方面 N 与
i ( N ) 是一一对应的 , 但是二者的关系又不止于此 , N 和 i ( N ) 还有 相同的微 分结 构 : N 本 身自 己
已有一个微分结构 , i ( N ) 则从 M 中 继 承了 一 个 诱 导 的微 分 结 构 , 二 者 应 该 相 同 .所 以 , N 与
i ( N ) 是微分同胚的 ( 当然也是同胚的 ) .这样把 N 与 i ( N ) 分开的好 处在于 下面我们 将不必限 制
于 i 而对某一可微映射 f 把 N 与 f ( N ) 比照起来研究 .
上述关于子流形的定义虽然在几何上是十分清楚自然的 , 用起来并不方便 , 因为它要求去寻
找适当的坐标邻域和坐标映射 ( U , φ) .解决这个困难的基本工具是反函数定理 .
第三章§5 中我们讲了局部的反函数定理 , 即其中的定理 1 , 我们把它重新叙述于下 :
n n
设 U R 是一开集 , f : U →R 是 一个光滑 映射 , 且 0 ∈ U , f (0 ) = 0 , 若 ( T f ) (0 ) 是非退 化
n
的 , 则 f 必是 x = 0 在 U 中的某个邻域到 f (0 ) 在 R 中的某个邻域的微分同胚 .
我们先把它用于微分流形的情况 , 于是 把 U 改 成某 个 n 维 微分 流形 M , 可 微 映射 f : M →
N , P∈ M , f ( P ) = Q∈ N , N 是另 一个 同维 数的微 分流 形 , 而 TP f 是 非退化 的 .这 时很 容易 证
明 , f 在 P 附近是局部的微分同胚 .这个证明是 很容易的 : 只需取 M 与 N 在 P 与 Q 附近的坐 标
- 1 n
邻域 ( U , φ) 与 ( V , ψ) , 并用 f 之坐标表示ψ f φ 作为反函数定理 中的 f , 用 φ( U ) R 作为
n
其中的 U , 并以 ψ( Q ) = 0 的邻域 R 作为其中的 f (0 ) 之邻 域即 可 .( T f ) ( 0 ) 之非 退化性 现在 就
- 1
是 ψ f φ 在 0 处的雅可比行列式不为 0 .
这个定理对于 M 与 N 之维数不相同 : dim M = m , dim N = n ( m ≠ n ) 的 情况 也有推 广 .这
就是第三章§5 的定理 2 与定理 3 .我们很容易地把它 们用于 微分 流形的 情况 , 并 分别称 之为 浸
入 ( immersion ) 定理与浸没 ( submersion ) 定理 .下面我们直接对微分流形 M 与 N 的可微映射 f 写
出它们而不加证明 .先给出两个定义 , 其中用到 M , N , P , Q 等等都已如上述 .
定义 7 当 m≤ n 时 , 若 T P f : T P M→ T Q N 是一个单射 , 就说 f 在 P 点附近 是一个 浸入 .若
4 66 第七章 微分流形上的微积分
f 在 M 之每一点附近均为浸入 , 就说 f : M→ N 是一个浸入 .
在通常的书上 , 常用条件 m < n , 其实当 m = n 时 , 由于 T P f 是一个 方阵 , 而 一个方 阵是 单
射与它是一个一一映射是一样的 .但有 一点 要说明 : 按 第三 章§5 的定 理 2 的 说法 , 定义 7 应 改
为“ TP f 当 P 在某点附近时为单射”, 为什么这里只说在 P 点为单射 ? 用局部坐标表 示最容易 说
明这一点 .现在 TP f 是一个 n × m 矩阵 , 而单射条件 , 即此矩阵之秩为 m , 于是有一个 m 阶子行
列式不为 0 .但是这个矩阵之元为光滑函数 , 所以其子行列式为连续 函数 , 只要在 P 点不为 0 , 则
在 P 点附近也不为 0 .又由于现在 m 是最大秩 , 此矩阵之秩 不会大于 m , 所以 一旦有 一个 m 阶
子行列式在 P 点不为 0 , 则它在 P 附近之秩均为 m .这 就是在 定义 中只说 T P f 在 P 点为 单射 的
理由 .下面讲满射时也有相类似的情况 .在那里我们就不再提醒这一点了 .
定理 10( 局部浸入 定理 ) 设 f : M→ N 在 P∈ M 处是 一单 射 , 这里 m = dim M < n = dim
N , 则必存在 P 与 f ( P) = Q 的邻域中的局部坐标 x 与 y, 使 f 可以表为
1 m 1 m
f ( x , … , x ) = ( x , … , x ; 0 , … , 0) . (32)
m n
(32) 右方有时称为一个典 则浸 入 ( canonical immersion ) : 它 把 R 浸入 在 R ( n > m ) 时 , 而
m 1 m n 1 m 1 2
把 R 中的一点 ( x , … , x ) 变成 R 中 ( x , … , x ; 0 , … , 0) , 正如把 R 看成 ( x , y ) 平面 R 中
的 x 轴那样 .
浸入必然是 M 与 f ( M ) 的局部的微分同胚 .这使我们 设想 , M 在 N 中的 浸入像 f ( M ) N
应该局部地是 N 的子流形 .一个特别明显的例子是曲线 .若 y = f ( x ) 是一条光滑曲线 , 它必可 看
1 2
作是由 R 到 R 的浸入像 , 这个浸入可以写为
x = t, y = f ( t ) , t ∈ ( a , b) .
2
M 是 R 上的开区间 ( a , b) , N 则是 R .这个映射的切映射是
t → ( x′( t ) , f′( t ) ) .
它自然是单射 , 因为 x′( t ) ≡1 .稍 加推广 可以 类似 地讨论 更高 维的几 何图 形如 曲面等 等 .但是 ,
浸入像并不一定整体是子流形 .首先 , f ( M ) 可能是自 交的 .例如图
7 - 2 - 6 所示确实是 一个 浸入 .因为 局部 地看 来 , ( A1 , B1 ) 被 映入
则 f 称为一个嵌入 .
嵌入像当然是一个子流形 .这类子流形称为嵌入子流形 ( embedded submanifold) .
k+1
本节中一再提到一个抽象的 k 维微 分流 形不 一 定能 在 R 中 实 现 , 例 如 黎曼 曲 面就 是 这
样 .实际上 , 惠特尼 ( H .Whit ney) 证明了下面的定理 .
2k + 1
惠特尼嵌入和浸入定理 k 维微分流形必可嵌入在 R 中而成为其嵌入子流形 ; 或者浸 入
2k
在 R 中而成为其浸入子流形 .
读者会问 , 一个浸入在什么条件下成为嵌入 ? 对这一类问题我们不说了 .
上面我们讲了一种定义子流形的方法 , 即用一个低维流形向高维流形作映射 , 并且看映射的
像是否子流形 .但是还有另一个方法 , 即考虑一个高维 流形向 低维 流形的 映射 , 并 且考虑 低维 流
形的某一点在此映射下的原像 , 看它是否高维流 形的子流 形 .前一 个方法 以浸 入概 念为基 础 , 后
一个方法则以浸没 ( submersion ) 概念为基础 .所以我们首先给出浸没概念的定义 .
定义 9 设 f : M→ N 是两个微 分 流形 之间 的可 微映 射 , dim M = m > dim N = n , P ∈ M ,
f ( P) = Q∈ N , 若 T P M 为一满射就说 f 在 P 点为一个浸没 ( submersion ) , 若 f 在 M 之每一点均
为浸没就说 f 在 M 上为一浸没 .
这里我们有
定理 11( 局部浸没定理 ) 设上述 f : M→ N 为一浸没 , f ( ) = Q , 则必存在 P 的邻域 U 中 的
1 m 1 n
局部坐标 ( x , … , x ) 以及 Q 在 N 中的邻 域 V 中的 局部坐 标 ( y , … , y ) , 使 在此坐 标系 下 , 映
射 f 可写为
1 m 1 n
y = f ( x ) = π( x , … , x ) = ( x , … , x ) , (33)
m n m - n n m 1 n n
这里 π: R ǖ R ×R → R 是映 R 为坐标的前 n 个分量 ( x , … , x ) ∈ R 的投影映 射 .这 个
投影映射也称为一个典则浸没 ( canonical submersion ) .
这个定理就是第三章§5 的定理 3 投影定理 .利用它可以 得到子流 形的一 个判据 , 但在这 以
前我们先引进一个概念 .
定义 10 设 f : M→ N 是微 分流形 M 到 N 的可微映 射 .dim M = m , dim N = n . P∈ M , Q
∈N
(1 ) 如果 TP f 之秩小于 n , 则称 P 为 f 之临界点 ( 或称奇点 ) , 反之称 P 为 f 之正则点 .
- 1
( 2) 若 P 为 f 之临界点 , 则称 f ( P) 为 f 的临界值 , 若 f ( Q ) 中一切点均为正则点 , 则称 Q
为 f 之正则值 .
- 1
这样 , 若对一切 P∈ f ( Q ) , T P f 是浸没 , 则 Q 是正 则值 .有 了这样 一个 概念 , 我们 要把 隐
函数定理 ( 第三章§5 定理 4 ) 稍微改动一下 :
对 f , M , N 仍作如上的解释 .
- 1
隐函数存在定理 令 m > n , 若 Q∈ f ( M ) 是 f 的正则值 , 则 f ( Q ) 是一个微分流形 , 其微
- 1 - 1
分结构是由 M 的微分结构诱导而来 , 而且 dim f ( Q ) = m - n , 或者说 n 是 f ( Q ) 的余维数 .
其实证 明 是 很简 单 的 , 我 们 不 妨 设 P , Q 在 某 局 部 坐 标 中 均 为 原 点 .第 三 章 的 定 理 是 说
- 1
f ( Q ) 中有某一点 P( 也设它为原点 ) , 使 TP f 之秩为 n ( 但设源空间的维数为 m + n , 所以自然
有 m + n > n) , 这时 T P f 自然是满射 , 而在 P 附近 , 按局部浸没定理 , f 可以写为
1 m m+ 1 m+ n j
fj ( x , … , x ; x ,…, x ) = x , j = 1, 2,…, m .
4 68 第七章 微分流形上的微积分
如果我们再取一个新的局部坐标
j j
z = fj ( x ) - x , j = 1 , 2 , … , m ,
m+ j m+ j
z = x , j = 1 ,2 ,…, n,
- 1 n
则 f ( 0) 在 P 附近就成为 R :
n j
R :z = 0 , j = 1, 2, …, m .
n+ m - 1 n n+ m
现在 M 中的微分结构是 R ,而 f (0 ) 在 P 附近的微分 结构是 R , 它自 然是由 R 诱导 而
- 1
来 .所以是子流形结构 .所以 , 第三 章 中的 隐 函数 定 理适 用 于 f ( Q ) 之 一点 附 近 .用 现在 的 提
- 1 - 1
法 , 使用正则值的概念 , 这个证明适用于 f ( Q ) 中的一 切点 .又因 f ( Q) M , 令 i 为 包含 映
- 1 - 1 - 1
射 , i[ f ( Q) ] = f ( Q ) , 所以子流形的一切要求 f ( Q ) 均可适合 .这样 就有关于 子流形的 一
个最常用的判据 :
- 1
定理 12( 原像定理 ) 若 Q 为 f : M→ N 之 正则值 , 则 f ( Q ) 为 一个维 数为 m - n 的子 流
形 .
这个定理与我们所熟悉的称子流形为以下方程组之解
j 1 m
f ( x ,…, x ) = 0, j = 1, 2,…, n < m
1 n
( f , …, f )
相一致 .这里要求这些方程是“ 独立的”, 即雅可比矩阵 1 m 在这个方程组的轨迹上有 最
( x , …, x )
大秩 n .
现在把这个定理用于上面一个没 有解 决的 问题 : O ( n ) 是不 是一个 微分 流形 ? 设 A 为一 n
t t
阶方阵 , 所谓 A ∈ O ( n ) 即 A 应适 合 A・ A = I , A 是 A 的转 置矩 阵 .但不 论 A 是 否 正交 矩阵 ,
t
A・A总是 对称 方阵 , 记 一切 n 阶 对称 方阵之 集为 S ( n ) , 我 们已说 过 , 一个 n 阶方 阵可 以看 成
2 1
n n( n + 1)
R 中的一个点 , 其各元素即为此点之 坐标 . S ( n ) 于 是也 可看 成 R 2 .于 是 O ( n ) 就 是以 下
2
n
方程在 R 中的解集合 :
t
f ( A ) ≡ A・ A = I . (34)
2 1
n n( n + 1 )
我们视 f 为 R 到 S( n ) ǖ R2 的映射 , 或者
-1
O ( n) = f ( I) .
2 2
n n
现在以 R 为 M , S ( n) 为 N , 我们需要证明的就只是 I 为 f 的正 则值 .注意到 R 与 S ( n ) 都 是
2 2
k n n - 1
R 形的微分流形 , 所以 TP R ǖ R , T Q S ( n) = S ( n) .所以只要证明 f 之切映射在 f ( I )为满
射即可 .但由切映射之局部坐标形式 , 并且注意到一个 矩阵的 元素 即是其 各个 坐标 分量 , 我们 通
过计算 f ( x + h) - f ( x ) 来求出 d f , 这里 x = A , 不过 h 应与 x 同维数 , 所以 我们令 x = A , h =
B 都是 n 阶方阵 , 计算 d f 时应略去阶数为 1 以上的 量 , 现在则 略去 含 B 之元 素平 方的量 , 这 样
得到
t t t
f ( A + B) - f ( A ) = ( A + B) ( A + B) - A・ A
t t t
= A・ B + B A + BB ,
略去最后一项即得
t t
d A f・ B = A・ B + B・ A . (35)
2 2
n n
所以为了证明 d A f : R ( ǖ T A R ) → S( n ) ( D T f ( A) S ( n ) ) 为满 射 , 只需证 明对 任意 D∈ S ( n ) ,
§3 多重线性代数介绍 4 69
2
n
一定可以找到 B∈R 使
t t
A・ B + B・ A = D . (36)
t
t D D
因为 D∈ S ( n) , D = D, 所以上式右方可写为 + 而我们来解
2 2
t 1
A・ B = D.
2
t t
因为 A 适合 A・A = I 所以 A 非奇异 , 故由上式
1 t -1
B = ( A) D . (37)
2
但这个 B 必适合
t
t 1 - 1
B = D・ A .
2
故
t
t 1 D
B・ A = D = .
2 2
- 1
而 (37) 给出的 B 即 适 合 ( 36 ) , 所以 d f A 在 f ( I ) 上是 满 射 .应用 原 像定 理即 知 O ( n ) 是 一 个
2 1 1
n - n ( n + 1) = n ( n - 1 ) 维微分流形 .
2 2
这个微分流形由两个连通分支组成 .其中一个是 S O( n ) , 另一个之元行列式为 - 1 .
§3 多重线性代数介绍
n * n
背景 , 而且因为线性代数理论告诉我们 , ( TR ) 与 TR 同构 , 那 么二者 之间的区 别何在呢 ? 为
了弄清这个问题就发现当把向量用分量来表示时就很 明白了 .从 笛卡 儿建立 解析 几何起 我们 就
n
明白了 , 坐标系是研究几何对象的好方法 .所以在研 究向量 时 , 我 们首 先在 TR 中 取一个 基底 ,
n
也叫做取一个标架 .所谓基底就是 n 个线性 无关的 向量 ei ∈ TR , 我们 记为 { e1 , … , en } , 于是 有
n i i
了任一向量 u∈ TR , 一定有 n 个实数 u ∈ TR 使 u = u ei , 这 n 个实数就叫做 u 对上述基底 的
1 n
坐标或分量 , 我们用 ( u , … , u ) 表 示 .现在我 们作 一个 规定 , 凡是 基底 一定用 花括 号 {… } 表示 ,
所以{…} 内的对象都是向量 , 凡是坐标一定用圆括号 ( … ) 表示 , 其中的对象一定是数 .我们在§1
中讲向量时是用的与坐标无关的处理方法 .所以 要讨论在 标架 变换 下 , 坐 标如 何变 换 .如 果旧 标
架是{ e1 , … , en } , 新标架是 { f1 , … , fn } , 而有
j
f i = ai ej . ( 1)
或者写成
{ f } = A{ e} .
j 1 n
A = ( ai ) , 而 ( 1) 是对上 标求 和 .同 一个 向量 u 如在 不 同的 标架 下有 不 同 的坐 标 ( u , … , u ) 与
1 n
( v , … , v ) , 则应有
i i
u = v f i = u ei
将 (1 ) 代入上式即得
j j i
u = ai v ( 2)
或
t -1
( v) = ( A ) ( u) .
在§1 中我们说 ( 1) 与 (2 ) 是互相逆步的 , 所以标架的变换与坐 标的变换 是互相 逆步的 .这是一 个
基本的事实 .
*
现在转到对偶空间 , 如果原空间 V 的标架为 { e} , 后来变 成了 { f } , 其对偶 空间 V 之 元 , 如
果后来是{σ}而原来是{ω} , 则应有
〈ω, e〉 = 〈σ, f〉
这里 e, f ; ω,σ都是向量而不是实数 .以 (1 ) 代入上式 , 并用转置矩阵处理有
-1 t -1
〈ω, A f〉 = 〈 A ω, f〉 = 〈σ, f〉
因此
t - 1
σ = A ω. ( 3)
* 1 n 1 n
它与 (1 ) 互相逆步 , 而与 (2 ) 相一致 , V 中的元应 该用 {ω} = { ω , … , ω } 或 {σ} = {σ , … , σ } 来
* *
表示 , 如果同一个 u ∈ V 表示为
* i i
u = λiω = μiσ ,
又容易得到
j
μi = aiλj 即 (μ) = A (λ) . ( 4)
它与 (1 ) 一致而与 ( 2) 逆步 .§1 中我们给出了逆变向量与协变 向量的概 念 .其实是逆 变还是协 变
要看对谁而言 .如果以 V 中标架变换公式 (1 ) 为准 , 凡 与它一 致的 就称为 协变 , 与 它逆步 的就 称
为逆变 , 则以上所述可以列成一个表
§3 多重线性代数介绍 4 71
原空间 V 对偶空间 V *
标架 ( 1) 基准 (3 ) 与( 1) 逆步
坐标 ( 2) 逆变坐标 (4 ) 与( 1) 一致 , 协变坐标
这样我们就给出
定义 1 一个由 V × V 到 R 的双线性 ( bilinear) 映射 :
T: V × V → R ( 8)
0
称为二阶协变张量 ( 或 ( 0 , 2) 型张量 ) .所有二阶协变张量形成一个线性空间 , 记作 T ( V ) . 2
0
定义中指出 T 2 ( V ) 是一个线性空间 , 其实这是有待证明的 , 只不过 因为它 是如此明 显 , 所 以
0 0
我们未加证明而在定义中直接指出这一点 .于是 要问 , dimT 2 ( V ) = ? 我们 可以 证明 dimT 2 ( V )
2 2
= n , 而且具体地找出 n 个线性 无关的 二阶 协变 张量 .为此 目的 , 我们 还要 再引 入 两个 向量 的
*
张量积 .设 ω,σ∈ V , 我们可以定义其张量积为一个二阶协变张量 如下 : 任取 u , v∈ V , 我们 定
义
( ωí σ) ( u , v ) = ω( u) ・σ( v ) . ( 9)
很明显它是 V× V 到 R 的双线性映射 :
定义 2 双线性映射 ( 9) 称为 ω与σ之张量积 , 记作 ωí σ .
0 1 n *
现在我们就很容易找 出 T 2 ( V ) 的一个 基底了 .令 {ω , … , ω } 为 V 的一个基 底 , 我们要 证
i j i j
明{ω í ω } , i, j = 1 , … , n , 就 符 合 要 求 , 为 此 证 明 它 们 是 线 性 无 关 的 .设 Ci j ω í ω = 0 , 令
1 n i j
{ e1 , … , en }为{ω , … , ω }之对偶基底 , 取 u = ei 0 , v = ej0 , 以 Cij ω í ω 作用 于 ( u , v ) ∈ V × V ,
有
i j
0 = ( Ci jω í ω ) ( ei0 , ej 0 ) = Ci0 j0 .
i j 0
所以一切 Cij = 0 , 而知{ ω í ω }在 T 2 ( V ) 中线无关 .其次易见所有二张协变张量 T 均可写成
i j
T = T i jω í ω . (10)
i j 0
实际上 , 只 要 取 T ij = T ( ei , ej ) 即 可 .由 此 可 知 { ω ω} 确 为 T 2 ( V ) 的 一 个 基 底, 而 且
0 2
dimT 2 ( V ) = n .
现在我们要问, 如果在 V 中作一个坐标变换, 即由老基底{ e1 , … , en }变为新基 底{ f 1 , … , f n } ,
变换为
j
f i = ai ej
问 T 应如何改变 ? 一方面看来 T 应该不变 , 因 为按 定义 , T : V × V →R 是一 个双线 性变 换 , 这
i i *
是与坐标是无关的 .但是{ ω } 会改变 , ( T ij ) 也会改变 , 实际上 , { ω }作 为 V 之基 底 ( 即标架 ) , 若
j
在新坐标系下成为{ Ω } , 则应有
i i j
ω = aj Ω .
~
它与{ e1 , … , en }的变换是互相逆步的 .若 T 在新坐标下为 ( T kl ) , 则由 (10) 式
k l k l i j ~ i j
T = T kl ω í ω = T kl ai ajΩ í Ω = T i j Ω í Ω .
所以
~ k l
T ij = T k l ai aj . (11)
所以 Ti j 的变化规律和协变向量的变化规则相符 .在§ 1 中 , 我们对张量 是用分 量来定义 的 : 在 某
2 2
一个坐标系下 , 一个二阶协变张量即一组 n 个实数 ( T ij ) , 如果在另一个坐标系下 , 这 n 个实数
~ 0
成为 ( T k l ) , 则二者之间应有关系式 (11) .这样 , 我们就 看到 , 现在给出 的 T 2 ( V ) 张 量都 是§1 中
讲的协变张量 .反过来 , 如果给出一个§1 中讲的二阶协变张量 ( T ij ) , 令
§3 多重线性代数介绍 4 73
i j
T = T ij ω í ω
0
则得到我们现在讲的 T 2 ( V ) 张量 , 而且§1 中给出的分量变化规则 ( 6 ) , 保证了 ( 10 ) 式给出 的 T
0
确实是一个与坐标无关的由 V × V 到 R 的 双线性 映射 , 因 此也是 现在 讲的 T 2 ( V ) 张 量 .总之 ,
§1 的用分量讲的张量与现在作为 双线性 映射 的张量 是完 全一 样的 .现在 的讲 法能 帮助 我们 更
好地了解张量的本质 , 而§1 的讲法计算起来更加便利 .
*
以上我们考虑了最常见的二阶协变张量 , 它的定义显然是 V 之元即协变 向量之推 广 .所 以
协变向量就是一阶协变张量 .其余类型的张量自可仿此处 理 : 我 们仍考虑 一个 n 维线性 空间 V ,
* *
但同时 也 考 虑 其 对 偶 空 间 V , 其 维 数 仍 为 n , 如 果 有 r 个 V , s 个 V , 我 们 要 研 究 由
* *
V ×…× V × V ×…× V 到 R 的多重线性映射 , 于是有
r个 s个
定义 3 上述多重线性映射
* *
V ×…× V × V×…× V → R (12)
r个 s个
r
称为一个 ( r , s) 型张量 ( r 阶逆变 , s 阶协变 ) , 这种张量构成一个线性空间 , 记作 T s ( V ) .
* i
和前面一样 , 若 V 和 V 有对偶基底{ω } , {σj } , i , j = 1 , 2 , … , n , 则对
* * 1 s
V ×…× V × V ×…× V 中的元{μ1 , … , μr ;ν , … ,ν }我们可以定义张量积
r个 s个
i i 1 s
ω1 í … í ωr í σj1 í … í σj s {μ1 , … , μr ;ν , … ,ν}
i i 1 s
(13)
= ω1 ( μ1 ) …ωr ( μr )σj1 (ν ) …σj s (ν ) ,
r
而知一切 T s ( V ) 张量 t 均可写为
j … j
1 s i i
t = ti … i
ω1 í … í ωr í σj 1 í … í σj s . (14)
1 r
r s
于是{∏ ωl ∏
i r
σj l } 是 T s ( 珡
V ) 的基底 , 从而
l= 1 l=1
r r+ s
dimT s ( V ) = n . (15)
i …i
1 r
tj …j
是 t 的分量 .我们时常除了 (14) 式以外 , 也用下面的记号 :
1 s
i …i
1 r
t = tj …j
. (16)
1 s
n n
d x } .我们现在以 T P M 为 Vǖ R , 则可以定义其上的 ( r , s) 型张量
i …i
1 r j j
tP = tj …j
( P) i í …í i í dx1 í … í dxs . (17)
1 s x1 xr P
r
{ tP }构成一个线性空间 T s ( P) .于是令 P 变动时 , 将可得到一个丛 , 即 M 上的张量丛 .它有一个
全空间 E = ∪T
P∈ M
s
r
( P) .有 一个 底 空间 即 M , 有 由 E 到 M 的 投影 π: E → M , T s ( P) , 也有 纤 维
r
- 1 r
π ( P) = T s ( P) .这样一个张量丛不但有一般的微分流形结构 , 而且有向量丛的结构 , 特别是 局
部平凡性 , 即存在一个同构 :
r- s
∪ tp D
r n
U ×T s D U×R .
P∈ M
这一点和切丛、余切丛是一样的 , 即是 说 , 所 谓局 部平 凡 性即 在 M 的一 个适 当的 坐 标邻 域中 各
- 1
点 P 处纤维 π ( P) 具有相同的基底 .但是纤维作为线性空间的“系数”是 x 的 函数 .所以在研 究
∞
这类问题时 M 上 U 中的 C 函数环———以后记作 F———将有特别作用 .对 这个张量 丛我们也 可
∞ ∞ - 1
以定义其 C “切口”( C section) , 简 单说 即 在每 一 个 π ( P ) 中取 一 固 定的 元 , 其 局 部表 示 是
i …i
1 r ∞
(17) , 不过 tj …j
( P) 是 C 函数 , 即为 F 中的元 .上面我 们只是说 明了建 立张量丛 的程序 与建 立
1 s
T P M × T P M → R, X , Y ∈ TP M ( X, Y) ∈ R .
* 1 n
在 T P M 中有了相应的对偶基{d x , … , d x } , 则此张量为
i j
T = gi j d x í d x , ( X , X ) = ( T ; X , X ) (18)
1 n * i i 1
现在的{d x , … , d x }是 T P M 的 基底 , 所 以 d x 是 向量 , 而 与 ( 5 ) 式 中的 d x 作 为切 向量 ( d x ,
n
… , d x ) 的分量 , 是一些数 , 二者不同 .以 (18) 作用到 k , l ∈ T P M× TP M 上去即得
x x
T: k , l = k , l = gkl .
x x x x
∞ 1
说这个内积光滑地依赖于 P 即指 gi j 是 x 的 C 函数 .如果我们 取一个“ 无穷小”切 向量 ( d x , … ,
n i i
d x ) = d x・ i ( d x 是分量是数 , i 是基底向量是切向量 ) , 立即得到 ( 5) 式 .于是我们得到了两
x x
i * 1
个式子 ( 18 ) 与 ( 5) .( 18 ) 是张量的表达式 , 其中 d x 是一个余切向量 , 是 T P M 中的基底{d x , … ,
n i i
d x } 中的第 i 个元素 .( 5) 则是这个张量作用到切向量 X = d x ・ i 的结果 , 这里 d x 是 X 的第 i
x
i
个分量 , 它是一个数 , 而不是向量 .如果把它与作 为余切 向量 的 d x 混起来 , 会 发生 很大的 混淆 .
总之 , 黎曼原来使用的记号 ( 5) 与现在我们使用的 (18 ) , 尽管很 相似 , 却是 不相 同的 .现在 的数 学
i
家们心里都很明白这个区别 , 但是 d x 这些记号用熟了 , 也就不太在乎 , 所以有的文献干脆把 ( 1)
写成
2 i j
d s = gij ( x ) d x í d x .
但是 , 事关“无穷小量”就更应 该说 明 .其实 , 一 个合适 的讲 法
1
是, 在 切 向 量 之 长 度 定 义 为 ( X , X )2 以 后, 如 果 要 求 图
i i
7 - 3 - 1中曲线弧 A B之 长为 s , 这 里 A B 的方 程 是 x = x ( t )
即 x = x( t ) , A 点对应于参 数 t = 0 , B 点对 应于参 数 t, 则 把
A B分成 若干段 , 而例如 Ai - 1 Ai 则 代以 弦 A i - 1 A i , 然后 再代 以
・
A i - 1 处 ( 即 t = ti - 1 处 ) 的切线 , 因此弦 将被 切向 量 x ( ti - 1 ) ( ti
・ ・ ・
- ti - 1 ) = x( ti - 1 )Δi t 取 代 , 其长 为 〈x( ti - 1 ) , x ( ti - 1 )〉・( ti 图7 - 3 - 1
- ti - 1 ) ( ti ≥ ti - 1 ) .把分点{ A i }取密以求极限可得
t
・ ・
s = ∫ 0
〈x ( t ) , x ( t )〉d t .
所以
2 ・ ・ 2 i j
d s = 〈x ( t ) , x ( t)〉d t = gi j ( x ) d x d x .
这就是通过在 M 上给出切向量长度 ( X , X ) 以及 作典型 的积 分运 算得到 黎曼 度量公 式 ( 1 ) 的 方
法 .这里没有因为无穷小量的介入而导致的任何困难 .
在一本著名的微分 几 何数 本 ( M .Spivak , Comprehensive In troduction to Differen tial Geome-
try, Vol .1 , Publish or Perish , 1979 ) , 153 页上说到这类记号问题时讲了一段很有趣的话 “
: 古典
i i
的微分几何学家 ( 还有古典分析学家 ) 在讲到坐标 x 的 无穷 小改 变 d x 时 , 毫 不犹 豫 .莱 布尼 茨
就是这样 .他们谁也不肯承认这种说法是毫无意义的 , 因为把这些无穷小量相除 ( 只要做得对 ) 总
4 76 第七章 微分流形上的微积分
1 x1 y1 1
如果不管因子 , 并且只看其矩阵 , 则其二阶子矩阵 的三个二阶子行列式
2 x2 y2 1
X = x1 - x2 , Y = y1 - y2 , Z = x1 y2 - x2 y1
之面积适合
~1 ~1 1 2
1 a a 1 a a
~2 ~2
= det A・
2 b b 2 1
b
2
b
可见面积这个几何量与向量本质不同 .
3
其实 , 说面积是一个向量 , 即向量积 O A× OB还 有一 个限制 , 即这个 说法 最多只 能用 于 R .
1 n 1 n
因为若 OA , OB是 n 维向量 : O A = ( a , … , a ) , OB = ( b , … , b ) , 则当 n = 3 时 , OA × OB的 分
量恰好是下述 2×3 矩阵
1 2 n
a a … a
1 2 n
b b … b
1
的三个二阶子行列式 ( 加上适当的±号 ) .但是对于一般的 n , 上述矩阵共有 n( n - 1) 个二阶 子
2
1 n
行列式 , 为使它们能够组成一个 n 维向量 , 必须 n( n - 1) = n , 即 n = 3 .可见非 3 维的 R 中是
2
3
不可能定义两个向量的向量积的 .通常的微积分 教材在讲 向量分析 与场论 时总限 于在 R 上 ( 有
的书上未强调这一点 ) 原因在此 .但这些二阶子行列式有几何意义正是格拉斯曼的基本思想的一
部分 .
那么 , 用什么样的数学工具来表示面积、体 积呢 ? 用格拉 斯曼 建立的 外代 数 .下面我 们就 来
介绍这个理论 .我们要提醒读者经 常把 下面的 结果 与 n 维平 行体 的体积 和行 列式 作 比较 .其 实
如上所述行列式从几何上看正是“表 示”了 n 维平 行体 的体积 .它 是一 个十分 重要 的 概念 , 而 且
又是外代数最好的模型 .
n
我们再回到张量空间 .为了简单 起见 , 我 们恒 取 V = R 以后 主 要是 讨论 协变 张量 , 但照 顾
r 0 r
到外代数习惯用上标记号∧ , 我们也就把 T r 型张 量暂时记 作 T .下面我们 讲张 量恒指 它研 究
过的张量有两类特别重要的 , 一是 对称张 量 , 一 是反 对称 ( skew symmet ric) 张 量 .设 有张 量 T ∈
r r
T (R ) , 于是对 r 个 n 维向量 v1 , … , v r 有
T ( v1 , … , v r ) ∈ R .
如果将 vi 与 vj 对换 , 时而会有
T ( v1 , … , vj , … , vi , … , v r ) = T ( v1 , … , vi , … , vj , … , vk ) , (19a)
时而又会有
T ( v1 , … , vj , … , v i , … , vk ) = - T ( v1 , … , vi , … , vj , … , vk ) . ( 19b)
相应地就说 T 对于指标 i 和 j 是对称或反对称的 .如果 T 对一切 ( i, j) 均是对 称或反对 称的 , 就
说它是对称张量与反对称张量 .例如黎曼度量张量就是一个二阶对称协变张量 , 而反对称张量正
是我们要讨论的主题 .
如果把一个 n 阶行列式 det A 的各行均看成一个 n 维向量 , 则行列式显然是一个 n 阶张 量
T 作用于这 n 个 n 维 向量 v i = ( ai1 , … , ain ) , i = 1 , 2 , … , n ( 其 实按 我 们的 规 定 应该 写 成 vi =
1 n
( a i , … , ai ) , 现在我们是照顾熟知的行列式记号 ) 之值
det A = T ( vi , … , vn ) ,
它就是一个反对称张量作用于这 n 个向量之值 ( 互换行列式之两行 将使之 变号 ) .用 初等方式 定
4 78 第七章 微分流形上的微积分
而有
r r
定理 1 Alt :T ( V ) →∧ ( V ) 是一个投影算子 .
2
证 我们要证明的是 : Alt 是一个满射 , 而且 Alt = Alt .先要注意 , 如果 T 已经 是反对称 算
子了 , 则 Alt ( T ) = T .事实上这时由 ( 20 ) 式知 ( 21 ) 之每一项均等于 T ( v1 , … , v r ) , 因此
1
r !∑
Alt ( T ) ( v1 , … , v r ) = T ( v1 , … , v r ) = T ( v1 , … , v r ) . (22)
σ
r n 2 1
这就是说 , 在∧ (R ) 上 , Alt 其实 是恒 等算 子 : A lt = A lt .( 21 ) 式 中要 有一 个因 子 的 作用 就
r!
在于此 .
r n r n
再证 Alt 是满射 , 为此先证对任意 T∈T (R ) , Alt ( T ) ∈∧ (R ) .为此取任意置换 τ以及
r 个向量 v1 , … , v r .从简单的代数考虑知道 sgn(στ) = sgn σ・sgn τ, 所以
1
r !∑
Alt ( T ) ( vτ( 1 ) , … , vτ( r ) ) = sgn σT ( vστ( 1 ) , … , vστ( r ) )
σ
sgn τ
r ! σ∑
= sgn σ′T ( vσ′( 1 ) , … , vσ′( r) ) = sgn τ・ A ltT ( v1 , … , vr ) .
′= στ
r n r n r n r n
所以 A lt ( T ) ∈∧ (R ) , 或 写作 A lt (T ( R ) ) ∧ ( R ) .但 是 ( 22 ) 告诉 我 们 , 在 ∧ ( R ) 上 ,
A lt 实际上是恒等算子 , 所以
r n r n r n r n
∧ ( R ) = A lt ∧ (R ) Alt (T ( R ) ) ∧ (R ) .
而此式中所有的“ ”, 均可写为“ = ”.特别是
r n r
AltT (R ) ) = ∧ (R) .
这样就得到 A lt 是满射而定理证毕 .
r n r n
∧ (R ) 作为线性空间是 T (R ) 的子空间 , 这是几乎自明的事 .下面略去其证明 .但是张量
r n s n
还有一种乘法运算 : 张量积 , 若 T ∈∧ (R ) , S ∈∧ ( R ) , T S 显然不一定仍是反对称的 .
§3 多重线性代数介绍 4 79
r n r n
这就是说 , ∧ (R ) 不是 T (R ) 的子代数 .我们还需要另一种乘法 : 外积 .其定义如下 :
r r
r n s n r+ s n
定义 5 若 T ∈∧ (R ) , S ∈∧ (R ) , 定义其外积 T ∧ S ∈∧ ( R ) 如下 :
( r + s) !
T∧ S = Alt ( T S) . (23)
r !s !
定理 2 外积是双线性的、结合的 .
证 外积的双线性很容易证 , 在此略去 .我们来证明其结合性 .除了定义 5 中的 T , S 外 , 再
t n
加上 R ∈∧ ( R ) , 我们来证明
T ∧ ( S ∧ R) = ( T ∧ S) ∧ R .
为此我们把记号简化一下 : 用 σ表示 ( 1 , 2 , … , r + s + t ) 的置换 , 用 τ表示 (1 , 2 , … , r + s + t ) 中
最后 t 个数不动的置换 , 即只在 (1 , 2 , … , r + s) 中作置换 , 指标为 r + s + j, j = 1 , 2 , … , t, 的都
不变 .这样 τ与 ( 1 , 2 , … , r + s) 之置换 σ′具有相同的符号函数 : sgnτ = sgnσ′.于是
A lt[ A lt ( T S) R] ( v1 , … , v r+ s+ t )
1
( r + s + t ) !∑
= sgn σ Alt ( T S) ( vσ( 1 ) , … , vσ( s+ t ) )
σ
・ R( vσ( r + s+ 1 ) , … , vσ( r + s+ t ) )
1 1
( r + s + t ) ! ( r + s) !∑
= sgn σsgn τ・ T ( vστ( 1 ) , … , vστ( r) )
σ, τ
= A lt ( T S R) ( v1 , … , vr + s+ t ) .
所以
Alt ( T S R ) = A lt [ Alt ( T S) R]
r !s !
= A lt [ ( T ∧ S) R]
( r + s) !
( r + s) ! t ! r !s !
= ・ ( T ∧ S) ∧ R]
( r + s + t ) ! ( r + s) !
r !s ! t !
= ( T ∧ S) ∧ R .
( r + s + t) !
4 80 第七章 微分流形上的微积分
r !s !t !
同样的推理得知 , 它也应该等于 T ∧ ( S ∧ R) , 所以
( r + s + t) !
( T ∧ S) ∧ R = T ∧ ( S ∧ R) .
我们可以把这个公共值定义为 T ∧ S ∧ R , 由此还可以进一步得到
r n r +… + r n
推论 3 设 T i ∈∧ i (R ) , i = 1 , 2 , … , k 则可以定义 T1 ∧ … ∧ T k ∈∧ 1 k
(R ) , 而且
( r1 + r2 + … + rk ) !
T1 ∧ T2 ∧ … ∧ T k = Alt [ T1 … Tk ] . (24)
r1 ! r2 !… rk !
定理 2 证明了外积是结合的 , 那么它是不是可交换的 ?实际上它既不如 A× B 那样是反交换
的 : B × A = - A × B, 更不是交换的 , 而有
r n s n
定理 4 若 T ∈∧ (R ) , S ∈∧ (R ) , 则
rs
T ∧ S = ( - 1) S ∧ T . (25)
证 我们只需证明
rs
A lt( T S ) = ( - 1 ) A lt ( S T)
即可 .为此取 r + s 个向量 v1 , … , vr , vr + 1 , … , vr + s , 有
1
( r + s) !∑
A lt ( T S ) ( v1 , … , v r + s ) = sgn σT ( vσ( 1 ) , … , vσ( r ) )
σ
・ S ( vσ( r+ 1 ) , … , Vσ( r+ s) ) .
考虑一个特殊的置换 τ: ( 1 , … , r , r + 1 , … , r + s) → ( r + 1 , … , r + s , 1 , … , r) , 即将后 s 个元换
成前 r 个元 .例如把 r + 1 变成 1 , 为此 r + 1 需要跨过 1 , … , r 等 r 个元 , 因而需要 r 个对换 , r +
rs
2 变成 2 , 这又要 r 个对换 , 直到 r + s 变成 s, 共需 rs 个对换 , 故 sgn τ = ( - 1 ) , 而上式成为
1 2
( r + s) !∑
A lt( T S ) ( v1 , … , v r+ s ) = sgn σ( sgn τ) S ( vσ( r+ 1 ) , … , vσ( r + s) ) ・ T ( vσ( 1 ) , … , vσ( r) )
σ
sgn τ
( r + s) !∑
= τ) S ( vστ( 1 ) , … , vστ( s) ) ・ T ( vστ( s+ 1 ) , … , vστ( r + s) )
sgn(σ
σ
τ
1
( r + s) !∑
rs
= ( - 1) sgn σ′S ( vσ′( 1 ) , … , vσ′( s) ) T ( vσ′( s+ 1 ) , … , vσ′( r+ s) )
σ
′
rs
= ( - 1 ) A lt ( S T ) ( v1 , … , v r+ s ) .
定理证毕 .
外积之分配律是自明的 :
T ∧ ( S1 + S2 ) = T ∧ S1 + T ∧ S2 , ( T1 + T2 ) ∧ S = T1 ∧ S + T2 ∧ S . (26)
r n r n
至此我们看到 , ∧ ( R ) 是一个线性空间 , 而 ∪ ∧ (R ) 对于外积成为一个代数 .它服从结合律 ,
r
r n
但不服从交换律 ( 但又不是反交换的 ) , 现在余下的是求出 ∧ (R ) 的维数和基底 .这里也附带提
0 n 0 n r n
到 , ∧ ( R ) = T (R ) ǖ R .关于 ∧ (R ) 的维数和基底我们有
r n r n n
定理 5 当 r > n 时 , ∧ ( R ) = {0} , 即为零维空间 , 若 0 ≤ r ≤ n , 则 dim ∧ (R ) = ,
r
1 n 1 n 1 n r n
而若{ω , … , ω } 为 ∧ (R ) = T ( R ) 之基底 , 则 Λ (R ) 的基底是
i i
{ω1 ∧ … ∧ ωr , 1 ≤ i1 < i2 < … < ir ≤ n} . (27)
§3 多重线性代数介绍 4 81
n
证 令{ e1 , … , en } 为 R 的一个基底 .若 r > n , 任取 ei1 , … , ee i , 其中必有重复者 .例如 ei1
r
n r n i i
是由 n 个事物中取 r 个的组合数 (T ( R ) 之一个基底是{ω1 … ωr } , 这里 i1 , … , ir 次
r
序不受限制 .所以其中所含元素的个数是 n 中取 r 的排列数 ( n) r = n( n - 1 ) … ( n - r + 1 ) =
n r n n
r ! ) .至此 dim ∧ (R ) = .其实 , 证明的前一部分 , 也可归入这里 , 因为当 r > n 时 , 由定
r r
n
义 = 0 .
r
n n
r n n r n n
再回来看代数 ∪
r
∧ (R ) .现在知道它应写为 ∧ (R ) = ī
r=0
∧ (R ) , 而其维 数为 ∑
r=0 r
=
n n n r n
2 .这个代数称为 R 上的外代数或格拉斯曼代数 ( Grassmann algebra ) , ∧ ( R ) 中的 ∧ ( R ) 之
元称为 r 向量 .
n
这里附带还可以解决一个问题 .在 R 中 任取 r 个向 量 , 问 它 们在 什么 时候 线性 相 关 ?因 为
n n * 1 r n *
R ǖ (R ) , 不妨认为这个 r 个向量ω , … , ω ∈ (R ) 即是某个 n 维空间的对偶空间之元 .于
r-1
∑ Cω , 则
1 r r k
是可以作出 ω ∧ … ∧ ω .如果它们是线性相关的 , 则例如 ω = k
k=1
r- 1
∑ Cω
1 r 1 r- 1 k
ω ∧…∧ω = k ∧…∧ω ∧ω .
k= 1
k k k 1
右方每一项中 ω 至少出现两次 , 但由上面已证明 ω ∧ω = 0 , 知上式右方每一项均为 0 , 所以 ω
r
∧… ∧ω = 0 .反 之 , 设它 们是 线 性无 关的 , 则 由 线性 代数 中的 定理 , 一定 可以 把它 们 扩充 成 为
n * 1 r r n
(R ) 的一个基底 .于是 ω ∧…∧ω 是∧ ( R ) 基底的一个元 , 它当然不会为 0 , 由此得到
1 r
推论 6 n 维向量 ω , … , ω 为线性相关的充分必要条件是
1 r
ω ∧…∧ω = 0 . (28)
其实这里的证明与行列式为 0 的充要条件是其各行线性相关的证 明是一 致的 ; 也与 n 个向量 线
性相关的充分必要条件是其构成的 n 维平行体的体积为 0 是一致的 .
至此要问 , 我们在格拉斯曼所指出的道路上走了 多远 ?按 拉格斯 曼的 思想 , 我 们已将 各种 几
4 82 第七章 微分流形上的微积分
ī
n r n 0 n
何量构成了格拉斯曼代数 ∧ ( R ) = ∧ (R ) .它是一个 分级代 数 : ∧ ( R ) 就 是实数 域 R,
r=0
1 n n
∧ (R ) 就是向量空间 R ( 我们暂时不区 分协 变与逆 变向 量 , 因为 二者 之区 别无 非 其一 在对 偶
n * n 1 n
空间中 , 而 ( R ) ǖ R , ∧ (R ) 中的元可以用 1 × n 矩阵表示 :
1 1 2 n
Gn = ( x , x , … , x )
2 n
它的每一个分量即 1 ×1 子式恰好是这个向量在各个坐标轴上的投影 .再看 ∧ (R ) , 它的元是以
1 2 i 1 n
下形式的 2 向量之线性组合 : u ∧ u , 如果 u 的分量是 ( u i , … , ui ) , 则这个 2 向量可以用 2 × n
矩阵
1 2 n
2
u1 u1 … u1
G n = 1 2 n
u2 u2 … u2
i j
u1 u1 i j i j 1 2 1 2
来表示 , 它的所有的 2 阶子式 i j
= u1 u2 - u2 u1 恰好是 u , u 这两个向量是在 x x 坐
u 2 u 2
2
标平面上的投影形成的平行四边形的面积 , 而我们可以把 G n 与下式对应
2 i j i j
Gn ǖ ∑( ui< j
1 u2 - u2 u1 ) ei ∧ ej .
2 1 2
所以我们就说 G 是 u , u 这两个向量所成的平行四边形之面积 .读者不要以为这只是一个方便
n
1 2 1 2
的说法 . u , u 尽管是 n 维向量 , 但是以它们为基底 ( 当然我们假设 u , u 不平行 , 否则上面的讨
论就会落了空 ) , 确实成为一个 2 维空间 .它确实是平面而不只是像平面 .我们中学里学过的平面
几何定理 ( 例如三角形的重心定理 ) 在此全都成立 , 只不过有一些定 理需要 引入欧氏 结构才能 证
2 n
明 , 如勾股定理 . ∧ n (R ) 的表示法与通常 微积 分教本 中讲 的向 量 O A = ( a1 , a2 , a3 ) 与 O B =
( b1 , b2 , b3 ) 之向量积 O A × OB 的表示法完全一致 :
i j k
O A × OB = a1 a2 a3
b1 b2 b3
= ( a2 b3 - a3 b2 ) i + ( a3 b1 - a1 b3 ) j + ( a1 b2 - a2 b1 ) k .
3 n
只需把 i , j , k 分别换成 j ∧ k, k ∧ i, i ∧ j 即可 .同样 , ∧ n (R ) 对应于 3 × n 矩阵 , 它构成通
常的 3 维空间 , 而过去学过的初等的立体几何在此都有效 .
n n n n 0 n 0 n
最值 得 注 意 的 是 ∧n (R ) .dim ∧n (R ) = 1 = dim ∧ n (R ) . ∧ n (R ) 中 之 元 是 实 数 .
n n n n n
∧n ( R ) 之元是什么 ?上面已经说了 ∧n (R ) 是 n 阶反对称协变张量之空间 .取 R 之任一基底
1 n n * 1 n n n
{ e1 , … , en } , 则其对偶基 { e , … , e } 是 ( R ) 之一个基底 , 而 e ∧ … ∧ e 是 ∧ ( R ) 的基底 .
n
张量成 分 则 是 ω1 , 2 , … , n , 只 要 看 一 下 它 们 在 R 的 基 底 即 标 架 的 变 换 下 如 何 变 换 就 可 以 知 道
n n n
Λ (R ) 中的元究竟是什么了 .于是设在 R 中作基底的变换 ( 1) :
j
f i = ai ej , { fi } = A{ ej } .
于是{ ei } 之对偶基将按逆步变换变成{ f i } 之对偶基
i i j i t j
{ e } = a j { f } , { e } = A{ f } .
t -1 j
以下我们记逆步矩阵 A = B = ( bi ) .于是有
§3 多重线性代数介绍 4 83
定理 7 在上述变换下
~ j
ω1 , 2 , … , n = det ( ai ) ω1 , 2 , … , n , (29)
1 n j 1 n
f ∧…∧ f = det ( bi ) e ∧ … ∧ e . (30)
~
这里ω1 , 2 , … , n 是张量成分在基底{ fi } 下的表示 .
~
证 因为ω1 , 2 , … , n 是协变张量成分 , 故
~ j j
ω1 , 2 , … , n = a11 … ann ωj1 , … , j n
σ( 1 ) σ( n )
= ∑ sgn σ a1
σ
… a n ω1 , 2 , … , n
j
= det ( ai ) ω1 , 2 , … , n .
这里 σ是变 (1 , 2 , … , n) 为 ( j1 , j2 , … , jn ) 之排列 .
i i j
其次 , 由 f = bj e 有
1 n 1 n j j
f ∧ … ∧ f = b j1 … bj n e 1 ∧ … ∧ e n
∑ sgn σb
1 n 1 n
= σ( 1 ) … bσ( n ) ・ e ∧ … ∧ e
σ
j 1 n
= det ( bi ) e ∧ … ∧ e .
n n
前面我们 已多 次讲 到 空间 R 的定 向 .其实 空 间 R 的 定向 即给 定 一个 基 底的 次 序 , 例 如
1 n n *
{ e1 , … , en } . 对偶基{ω , … , ω } 的相应次序 , 既可以认为是给出了 (R ) 之定向也 可认为是 给
n i 2 1 3 n n
出了 R 的定向 .所以若改变 {ω } 之次序为例如{ω , ω , ω , … , ω } , 也可认为 R 得到了相反的
定向 .但若对基底作一个变换 , 新基底的哪一种次序与给 定次 序的原 基底 所定义 的定 向一 致 ?因
n
此定义定向更好的办法是利用定理 7 : 设有 R 的两个基底 { ei } 与{ f i } , 自然存在一个非奇异的线
i ~
性 变换 A = ( aj ) 使 (1 ) 成立 , 因此可认为{ f i } 是{ ei } 的变换 .若相应的 ω变为ω, 当有 ( 29 ) 成立 .
j j
这里 det ( ai ) ≠ 0 .我们规定 , 若 det ( ai ) > 0( < 0 ) , 就说 { ei } 与{ f i } 规定相同 ( 相反 ) 的定向 .于
n j
是 R 有两个定向 , 分别对应于 (29) 中行列式 det ( ai ) 之符号正负 .
n
至今我们还没有在 R 中引入度量 .度量引入外代数以后会得到什么 ?我们所需的度量 ( 包括
欧氏度量以及十分重要的洛伦兹度量 ) , 基础 在于定 义两 个向量 的内 积〈u , v〉 .对 内积有 两个 要
求 : 1 .双线性 : 即对 u , v 分别均为线性 的 ; 2 .对 称性 :〈u , v〉 = 〈v , u〉; 3 .本应加上正定性 , 但 是
n i j
我们刻意地要推广这一点 .设有 R 的基底{ ei } 使 u = u ei , v = v ej , 则记
i j
〈u , v〉 = g ij u v , gi j = 〈ei , ej〉 . (31)
通常讲到内积时都规定 ( gi j ) 是正定矩阵 , 我们 要放 弃这 一点 , 其 原因 在于物 理学 发展到 麦克 斯
0 1
韦的电磁场理论以后就很清楚 : 必须把时间与空间统一 起来看成 一个 4 维 时空连 续统{ ( x , x ,
2 3 0
x , x ) } , x = ct, c 是光速 .它称为闵可夫斯基时空 ( Minkowski space-time) 记作 M4 , 它是一个
线性空间 , 当然也就是一个微分流形 .但是在 M4 上 不能 使用 欧几里 得度 量 , 因为 这不能 说明 物
理问题 .我们需要的是如下的洛伦兹度量 ( Lorentz metric)
2 0 2 1 2 2 2 3 2
ds = (d x ) - (d x ) - (d x ) - (d x ) . (32)
1
- 1
现在 ( gij ) = 不是正定的 , 所 以洛 伦兹 度 量不 是某 种黎 曼度 量 而时 常说 是
- 1
- 1
4 84 第七章 微分流形上的微积分
i i n n p n i
{ e 1 ∧ … ∧ e p } 是线性无关的 , 而因为 {・} 中含有 个元 , = dim ∧ (R ) , 所以{ e 1 ∧ …
p p
i p n i i
∧ e p } 就成了 ∧ (R ) 之基底 .于是非蜕化性就容易证明了 .{ e 1 ∧ … ∧ e p } 是 o .n .系, 证如下 :
i i j j i j
〈e 1 ∧ … ∧ e p , e 1 ∧ … ∧ e p〉 = det (〈e s , e r〉) .
设 i1 < i2 < … < ip ; j1 < j2 < … < jp .如 果 j1 < i1 , 则 j1 < 一 切 is , 1 ≤ s ≤ p , 从 而
i j
〈e s , e 1〉 = 0 , 即是说上式右方行列式有一列元素全为 0 , 从而式右与式左均为 0 , 而只有在 i1 =
j1 时 , 上式双方可以不为 0 .于是令 i1 = j1 , 再看 j2 , 这时已有 j2 > j1 = i1 , 如果 j2 < i2 < …
i j
< ip , 则〈e s , e 2〉 = 0 .因此又只有当 i2 也与 j2 相等式上式双方可以不为 0 .仿此进行下去
i i j j
0 ( i1 , …, ip ) ≠ ( j1 ,…, jp ) ,
〈e ∧ … ∧ e , e ∧ … ∧ e 〉 =
1 p 1 p
i i s
det(〈e s , e r〉) = det (δr ) , ( i1 ,… , ip ) = ( j1 , …, jp ) .
i i
但因〈e s , e s〉 = ± 1 , 故当 ( i1 , … , ip ) = ( j1 , … , jp ) 时式右为一对角 形行 列式 , 其 主对角 线上 之
s i i
元为 ± 1 , 从而其值亦为 ± 1 .准确些说 , 其值为 ( - 1) , s 是基底中适合〈e , e〉 = - 1 的元素之个
数 , 定理证毕 .
n n * p n
上面我们已经看到 , 有了内积之后 , 就可以定义 R 与 ( R ) 之同构 .现在 ∧ (R ) 也有了内
p n n- p n n- p n
积 .我 们 可 以 利 用 它 来 定 义 ∧ (R ) 与 ∧ ( R ) 的 一 个 同 构 .事 实 上 , 若 ω ∈∧ (R ) ,
p n n n n n 1
σ∈∧ ( R ) 则 ω∧ σ∈∧ ( R ) , 但 dim ∧ (R ) = 1 , 其基底只含一 个元 , 即体积元 e ∧ …
n 1 n
∧ e . 这里我们假设了{ e , … , e } 是此内积 ( 度量 ) 下的 o .n .系基底 , 故
1 n
ω∧ σ = A( ω,σ) e ∧ … ∧ e .
1 n
这里 A ( ω, σ) 是一个实数 , 而且因为 e ∧ … ∧ e 与 ω,σ无关 , 易见 A( ω,σ) 对 ω与σ是双线
p n p n
性的 .如果固定 ω, 则 A( ω,σ) 是 σ∈∧ (R ) 之线性泛函 .但因 ∧ (R ) 上已有了内积 , 故必存
p n
在 ∧ (R ) 之一个元 * ω( 这个元显然 线性 地依 赖于 ω, 故 有一 个 线 性算 子 * , 使 此 元可 记 为
* ω) , 使 A ( ω,σ) = 〈 * ω,σ〉, 于是我们有
n- p n p n
定理 9 上面定义的算子 * 称为霍奇 ( Hodge) * 算子 , 它是 ∧ (R ) 到 ∧ (R ) 上的同
构:
1 n
ω∧ σ = 〈 * ω,σ〉e ∧ … ∧ e . (36)
n- p n p n
证 *: ∧ (R ) →∧ (R ) 是 线 性 映 射 是 明 显 的 .现 证 它 是 单 射 .为 此 设 有 某 个 ω
p n n- p n
使 * ω = 0 . 于是对任意 σ∈∧ ( R ) 有 ω∧ σ = 0 .因此 ω = 0 而 * 是单射 .但 ∧ (R ) 与
p n n
∧ ( R ) 是维数同为 的线性空间 , 所以只要 * 是一个单射线性映射 , 则必为同构 , 定理证毕 .
p
注 我们在构造 * 算子时使用了一个特定的 o .n .系{ e1 , … , en } .实际上 * 之 定义与 { ei }
n 1 n i
之选取无关 .这 里我 们 略去 证 明 , 而 始终 应 用 R 关于 度 量 ( gi j ) 下 的 o .n .系 { e , … , e } : e =
ij
g ej .
p n i
现在我们在这个基底下计算 * 算子的具体表达式 .为此 , 只 需对 ∧ (R ) 的基 底{ e 1 ∧ …
i i i
∧ e p } 中的任意元 ω = e 1 ∧ … ∧ e p 来计算 * ω .由定义
i i 1 n n- p n
( e 1 ∧ … ∧ e p ) ∧ σ = 〈* ω,σ〉e ∧ … ∧ e , " σ∈∧ (R ) . (37)
这里不妨设 i1 < i2 < … < ip .令 { j1 , … , jn - p } 是 { i1 , … , ip } 在 {1 , 2 , … , n} 中的余集 , 而且 令
j j
j1 < … < jn - p . 于是除非 σ = he 1 ∧ … ∧ e n - p ( h ≠ 0 为一实数 ) , ( 37 ) 之左方必为 0 .这样就
§3 多重线性代数介绍 4 87
n- p n j j
知道 * ω可用 ∧ ( R ) 之基底 { e 1 ∧ … ∧ e n - p } 来表示 , 即存在非零实数 c, 使
j j
* ω = ce 1 ∧ … ∧ e n - p , ( c ≠ 0 , c ∈ R) , (38)
而 (37) 成为
i i j j h j1 j 1 j j 1 n
he 1 ∧ … ∧ e p ∧ e 1 ∧ … ∧ e n - p = 〈e , e 〉…〈e n - p , e n - p〉e ∧ … ∧ e .
c
令 π为变{ i1 , … , ip ; j1 , … , jn - p } 为 {1 , 2 , … , n} 之排列 , 由上式消去 h 即有
1 j j j j
= sgn π〈e 1 , e 1〉…〈e n - p , e n - p〉 .
c
j j j j ij - 1 j j
因为〈e 1 , e 1〉 = g 1 1 而 ( g ) = ( gi j ) 为对角矩阵 , g 1 1 = 1 gj1 j1 = ± 1 , 所以
c =±1 .
i i
代入 (38) 即可得到 * ( e 1 ∧ … ∧ e p ) 的表达式 .
* 算子有下面的重要性质 .
定理 10 霍奇 * 算子具有以下性质 :
p n
(1 ) 对于 ω∈∧ ( R )
p ( n - p) + s
* * ω = ( - 1) ω, (39)
j j
s 是 o .n .基底 { e1 , … , en } 中适合条件〈e , e〉 = - 1 的元素之个数 .
p n
(2 ) 若 ω,σ∈∧ (R ) , 则
s 1 n
( a ) ω∧ * σ = σ∧ * ω = ( - 1 ) 〈ω,σ
〉e ∧ … ∧ e .
s
( b) 〈 * ω, * σ〉 = ( - 1 ) 〈ω, σ
〉.
i i
证 (1 ) 我们只需对 λ = e 1 ∧ … ∧ e p ( i1 < … < ip ) 证明 (39) 即可 .令{ j1 , … , jn - p } 是
{ i1 , … , ip } 在{1 , 2 , … , n} 中的余集 , 而且 j1 < … < jn - p , 由 * 算子的定义 (38) 有
i i i i j j
* * ω = sgn ρ・sgn π〈e 1 , e 1〉…〈e p , e p〉〈e 1 , e 1〉…
j j s
〈e n - p , e n - p〉ω = ( - 1) sgn ρ・sgn πω (40)
ρ与π分别是把{1 , 2 , … , n} 变为{ i1 , … , ip , j1 , … , jn - p } 与 { j1 , … , jn - p , i1 , … , ip } 之置换 .但是 ,
为将例如{ i1 , … , ip , j1 , … , jn - p } 对换成为{ i1 , … , ip - 1 , j1 , … , jn - p , ip } 共需 n - p 个对换 ; 再把
ip - 1 与 j1 , … , jn - p 对 换 , 仿 此 进 行 下 去 , 总 之 要 有 p( n - p ) 个 对 换 . 所 以 sgn ρ =
p( n - p)
( - 1) sgn π . 代入 ( 40 ) 即得 ( 39 ) 式 .
(2 ) ( a) 由外积之反交换性 ( 定理 4 ) 以及 * 算子的定义有
p( n- p) p( n- p) 1 n
ω∧ * σ= ( - 1) * σ∧ ω = ( - 1) 〈* * σ, ω〉e ∧ … ∧ e
s 1 n s 1 n
= ( - 1) 〈σ, ω〉e ∧ … ∧ e = ( - 1 ) 〈ω,σ
〉e ∧ … ∧ e
= σ∧ * ω .
( b) 我们有
1 n
ω∧ * σ = 〈 * ω, * σ〉e ∧ … ∧ e .
与 ( a ) 比较 , 即有
s
〈* ω, * σ
〉 = ( - 1) 〈ω,σ〉 .
3
现在我们要用霍奇 * 算子来解释 R 中古典的向量分析公式 .我们仍 用箭头或 黑体字母 作
1 2 3 3
为古典的向量分析公式的向量记号 .于是 i = e , j = e , k = e .在 R 中 使用笛卡 儿直角坐 标
4 88 第七章 微分流形上的微积分
i
系 , 使得协变向量与逆变向量不分 , 这样 e = ei , 而我们不必担心上下指标的区 别 .这时 n = 3 ,
s = 0 . 设有三个向量 : A = a1 i + a2 j + a3 k = a1 e1 + a2 e2 + a3 e3 , B, C 的记法与此类似 .于是
考虑 p = 1 的情况 , 注意到这时 p( n - p) = 2 , 很容易看到会出现指标的轮换 :
* i = * e1 = e2 ∧ e3 , * j = * e2 = e3 ∧ e1 , * k = * e3 = e1 ∧ e2 .
p = 2 时 n - p = 1 , p ( n - p) = 2 , 所以情况会是一样的 , 利用定理 10 的 ( 1) 有
* ( e2 ∧ e3 ) = * * e1 = e1 , * ( e3 ∧ e1 ) = e2 , * ( e1 ∧ e2 ) = e3 .
p = 0 与 p = 3 的情况又是一样的 .于是
* 1 = e1 ∧ e2 ∧ e3 , * ( e1 ∧ e2 ∧ e3 ) = 1 .
利用这些公式我们可以很容易地解释古典的向量分析中的向量积与混合积 .对于前者 , 我们有
A × B = ( a2 b3 - a3 b2 ) i + ( a3 b1 - a1 b3 ) j + ( a1 b2 - a2 b1 ) k .
现在则求 A ∧ B 得
A ∧ B = ( a2 b3 - a3 b2 ) e2 ∧ e3 + ( a3 b1 - a1 b3 ) e3 ∧ e1 + ( a1 b2 - a2 b1 ) e1 ∧ e2 .
于是
A × B = * ( A ∧ B) . (41)
在讨论混合积之前还要讲一下内积 ( 即标量积 ) .前面已说过 * 算 子定义的 基础是 内积 , 反
过来内积也可以用 * 来表示 .实际上
* A ∧ B = ( a1 e2 ∧ e3 + a2 e3 ∧ e1 + a3 e1 ∧ e2 ) ∧ ( b1 e1 + b2 e2 + b3 e3 )
= ( a1 b1 + a2 b2 + a3 b3 ) e1 ∧ e2 ∧ e3 ,
因此
A・ B = * ( * A ∧ B) = a1 b1 + a2 b2 + a3 b3 . (42)
在古典的向量分析中 , 以 A, B, C 棱的平行六面体之体积用一个非常奇怪的公式来表示 :
V = A・ ( B× C) = B・ ( C × A) = C・ ( A × B) .
但用 * 算子则非常清楚 .只要用分量来表示 , 利用 ( 42 ) 与 ( 41 ) 即有
A・ ( B × C) = * [ A ∧ * ( B× C) ] = * ( A ∧ B ∧ C) .
a1 a2 a3
= b1 b2 b3 ・ 1 = V .
c1 c2 c3
这里 V 是上述平行六面体之体积 .总之把 1 写成 * ( e1 ∧ e2 ∧ e3 ) 即知
a1 a2 a3
V = * b1 b2 b3 e1 ∧ e2 ∧ e3 = * ( A ∧ B ∧ C) . (43)
c1 c2 c3
这里我们应用了定理 7 中的 (30) .
总之 , 利用了霍奇 * 算子 , 立即有
A × B = 以 A, B 为边的平面四边形的有符号的面积 = * ( A ∧ B)
A・ ( B× C ) = 以 A, B, C 为棱的平行六面体的有符号的体积 = * ( A ∧ B ∧ C) .
这就很明确地体现了格拉斯曼把几何量分成互相有联系的不同类型的量之系统这个思想 .
把格拉斯曼的这个思想用到微分流形上将得到更丰硕的结果 .
§4 外微分形式 4 89
§4 外微分形式
∞
1. 从一个张量空间到张量丛 设 M 是一个 n 维 C 微分流形 , 于是对其上每一点 P ∈ M ,
*
有切空间 T P ( M ) 与余切空间 T P ( M ) 是其对偶 .如果孤立地看一个点 , 即固定 P, 则切空间与余
n n *
切空间就是 R 与 (R ) , 其上的向量与张量结构我们已在 §1 与 §3 中作了详尽的讨论 .若令 P
∪T ∪T
*
在 M 中变动 , 我们就会得到一族线性空间 P ( M) 与 P ( M ) .因为 M 是光滑的 , 我们直
P P
∪T
P∈ U
P ( M ) 中可以引入如下的局 部坐 标系 ( x1 , … , x n ;ξ1 , … ,ξn ) .这 一点正 是向 量 丛定 义中 的
α
∑ξ ( x ) e
i =1
i i .所谓光滑切口则是指所有这些 ξi ( x ) ∈ C ( U ) .这样我们得到坐标邻域 U 中的切
s j …j
场集合记为 X( U ) .T r ( U ) 的切口称为张量场 , 其局部坐标表示为 ai 11 … i sr ( x ) j … j
x1 xs
i i r
d x1 … d x r . ∧ ( U ) 的切口成为
r i
ω( x ) = ai1 … i r ( x ) d x 1 ∧ … ∧ d x r , i1 < … < ir , ( 1)
∞ r
ai1 … i r ( x ) ∈ C ( U ) 称为一个 r 微分形式或 r 外微分形式 .我们记 r 微分形式的集合为 F ( U ) ,
( dφP ・ X) ( f ) φ( P) = X ( f φ) P .
*
我们把 f φ记作φ f , 而说是将定义在 N 上的 f 拉回到 M 上 , 并且仿照矩阵与内积的记号将上
式写成
*
〈φ* X , f〉φ( P) = 〈X , φ f〉P . ( 5)
*
于是看到 φ* 与 φ 的关系很像一个矩阵与转置矩阵的关系 , 而 ( 5) 式很像内积 .如果我们让 P 在
∞
M 上变动 ( 至少是在 M 的一个区域中变动 ) , 则应略去〈,〉下的下标 , 而得到两个 C 函数 , 左方
定义在 N 上 , 右方定义在 M 上 .
上面我们看到 , 推前与拉回的区别恰好和逆变 与协变 的区 别相 应 .这 不是 偶然 的 , 因 为二 者
n
均以 对 偶 性 为基 础 .为 了把 这 一 点 说 明白 , 我 们 不 妨从 最 简 单 的 情况 看 起 .现 在 用 R 来 代 替
TP M .在 §1 中 讨论 逆变 与协 变 两个 概念 时 , 我 们是 以其 在坐 标 变换———现 在就 假设 是线 性 变
n
换———下的的表现为依据的 .于是不妨设 R 中已 有了 一个 基底 { e1 , … , en } 并且 经 过变 换成 为
{ f1 , … , f n } :
j
ei = ai fj .
n * 1 n 1 n n n *
在 (R ) 中则有对偶基{ω , … , ω } 与 {σ , … , σ } .于 是 R 中 的 向量 α以及 ( R ) 中的 向量 β
分别用
i j
α = x ei ,β = ξjω
表示 .而 β作用在α上之值 , 即线性泛函 β在α上之值用“内积”表示 :
i
〈β,α〉 = ξi x .
j
如果换用新的基底{ fi }以及相应的对偶基底{σ } , 则因例如 α本身就是同一个向量 , 不应因坐 标
j
之选择而有异 .所以 α在新坐标系下的表示α= y f j 应该与原来的向量相同 :
i j
x ei = y fj .
i
但因 ei = aj f j , 代入上式有
§4 外微分形式 4 93
j i j
y f j = x ai fj ,
所以
j j i
y = ai x .
我们把它用矩阵写成
y = Ax .
n * i j
同样的理由用于 (R ) , 就得到同一个向 量 β在两个坐标系下 的表示β= ξi x 与β= ηjσ 中
应有关系式
ξ = Bη.
为什么写成 ξ= Bη而不写成η= Bξ, 下面的演算自会说明 .
问题在于 B 是什么 ? 要回答这个问题 , 就要注意到 , 不但 α,β不应因坐标 的改变而 异 , 它 们
的内积〈β, α
〉也是这样 .所以
i j
〈β,α〉 = ξi x = ηj y .
j j i
但是 y = ai x , 代入上式就有
j i i
ηj ai x = ξi x .
i
因为此式应该对一切 x 都成立 , 所以
j
ξi = aiηj .
j j j i
所以自然得到形如 ξ= Bη的关系式 .而且 注意到 , 现 在是 对 ai 之上 标求 和 .前面 y = ai x 是 对
j
ai 之下标求和 , 所以立即有
t
B = A .
如果用矩阵形式来写 , 就更清楚 : 由于
t
〈η, A x〉 = 〈 Aη, x 〉 = 〈ξ, x〉,
所以
t
ξ = Bη = Aη.
在§1 中我们讲的是如何从“老坐标”变为“新坐标”, 所以上式要改写为
t -1
η = A ξ.
逆步变换即由此而来 .
上面我们把§1 的内容重复了一次 .现在 我们 要换 一个观 点来 看待它 .上面我 们把 T P M 换
n n n
成了 R , 然后按§ 1 的讲法在 R 中作坐标变换 .但是 R 中换用了另一个坐标系以后 , 也可以看
n n
成是另一个 n 维线性空间 .所以 , 如果把 T P M 看成原来的 R , 则现在的 R 就可以认为是 T Q N .
Q = φ( P) , 而 A 就认 为 是切 映 射 d Pφ = φ* : TP M → T Q N .我 们 得 到 的则 是 其 对 偶 映射 : B =
* t - 1 n n * *
φ .逆步变换 A 中采用转置是因为我 们从 R 转到 ( R ) .其中 出 现“ 逆”, 则 表明 了 φ 的 映
射方向与 φ* 相反 : 一是拉回 , 一是推前 .
上面讲的当然不完满 , 这一点前面已经说过 了 : 至 少 dim M 与 dim N 不 一定 相同 .和前 面
一样 , 我们不去讨论这些问题 .至少我们看到 , 协变逆变也好 , 推前拉回也好 , 其基础就是对偶性 .
我们把它写成 (5 ) 式 , 借用了线性代数的记号 , 正是因为其基本思想是一致的 .
于是我们看到了 0 阶协变张量 ( 即一阶微分形式 ) 之拉回有了定义 , 一阶协变张量 ( 即一阶微
0 r *
分形式 ) 之拉回也有了定义 , 那么 T r ( M ) 乃至 Λ ( M ) 之切 口 T 之拉 回 φ T 又应 如何定 义呢 ?
4 94 第七章 微分流形上的微积分
由 A lt 之定义 , 再让 P 在 M 中变动 , 有
* *
Alt ( φ T ) ( X1 , … , Xr ) = φ ( Alt T ) ( X1 , … , Xr ) .
这就是我们需要的可换性 :
* *
Alt ( φ ・) = φ ( A lt・) . (11)
把这个结果用于 ω与σ, 并应用定理 1 , 有
* ( r + s) ! *
φ ( ω∧ σ) = φ [ A lt ( ω σ) ]
r !s !
( r + s) ! * ( r + s) ! * *
= Alt [ φ ( ω σ) ] = Alt ( φ ω φ σ)
r !s ! r !s !
* *
= φ ω∧ φ σ.
定理证毕 .
*
§2 中我们得出了推前算子 φ* 的局部坐标表达式 .现在要问 φ 的局部坐标表达式是什么 ?
1 m 1 n
为此 , 我们再把 § 2 中相关的记号在此重复一次 .令 x = ( x , … , x ) 和 y = ( y , … , y ) 分别是
M 与 N 中的局部坐标 , 而可微映射 φ: M → N 成为
i i 1 m
y = y ( x ,…, x ) , i = 1, 2, …, n .
在 § 2 中得到 , φ* 的表达式如下 :
k
y
φ* i = dφ i = i ・ k , (12)
x x x y
或
t
φ* = dφ = A . (13)
x x y
1 1
y y
1 … m
k
x x
y t
这里 A = i = … … , 而求和是对 y 的上标进行的 , 所以上式中用记号 A .从这
x n n
y y
1 … m
x x
里我们看到 dφ一方面应该看作是一个整体记号 , 而由切映射的 与坐标 无关的定 义得出 上式 .另
4 96 第七章 微分流形上的微积分
k k 1 n
一方面又可以看作是用通常微积分教本中讲的古典的微分运算作用于函数 y = y ( x , … , x )
*
的结果 .尽管其含义不同 , 计算结果都是一样的 .现在我们同样利用这两种方法来计算 φ .
*
首先利用 φ 的定义 (8 ) 式 , 并且只看 T 为 1 阶协变张量场的情况 , 因为高阶张量场可以由
*
定理 1 和 2 化为 1 阶张量场之张量积或外积 .又因 φ 是线性算子 , 所以只需设 T 为 1 阶张量场
k * k
之基底中的元 d y ( 注意 T 是 N 上的张量 ) 即可 .因此我们只要计算〈φ d y , X〉即可 , 而且不妨
其间的可微映射
φ ψ
M N L .
于是 ψ φ: M → L 是一个可微映射 .对于切映射 (ψ φ) * , § 2 的定理 5 指出
( ψ φ) * = ψ* φ* . (16)
然而对于拉回映射 , 则会得到一个次序与此相反的关系式 :
* * *
( ψ φ) = φ ・ψ . (17)
为证此式 , 回到定义 1 .令 T 是 L 上任一 r 阶协变张量场 , X1 , … , Xr 为 M 上任意 r 个向量场 , 于
是由于 ψ φ: M → L 是一个可微映射 , 故由 (6 ) 式
*
( ψ φ) T ( x ) ( X1 , … , Xr ) = T ( x ) [ ( ψ φ* ) X1 , … , ( ψ φ) * Xr ]
*
= T ( x ) [ ψ* ( φ* X1 ) , … , ψ* (φ* Xr ) ] = (ψ T ) ( x ) [ φ* X1 , … , φ* Xr ]
* *
= [ φ ( ψ T ) ] ( x ) ( X1 , … , Xr ) .
而 (17) 得证 .
不论是从局部坐标表示看还是从链式法则的形式看 , 推前与拉回的关系都是互相逆步的 , 有
如向量之协变与逆变的关系一般 .所以在选用记号 时 , 凡下加 * 者都 是指映 射方 向与基 本的 可
微映射 φ: M → N 一致的 , 而上加 * 者都是与它相反的 .
n 1 n n
3. 微分流形的定向 R 的 定向可以由其某 一坐标 ( x , … , x ) 的次序决定 .如果 R 还 有
i
1 n i i j i y i
另一个坐标 ( y , … , y ) , 则 y = a x , 而 a = j j j , 从而 上述 变换 式 之系 数矩 阵 A = ( aj ) =
x
1 n 1 n
( y , …, y ) ( y ,…, y )
1 n .如果 det 1 n > 0 , 就说这两个坐标决定相同定向 , 若此行列式为负 , 则
( x , …, x ) ( x ,…, x )
说它们定出相反 定 向 .这 个 概念 转 到微 分 流 形 M 上 时 会 遇 到 新问 题 .设 M 可 以用 坐 标 邻 域
n 1 n
{( U , φ)} 来覆盖 , 而 φ( U ) R 中有局部坐标例如 ( x , … , x ) , 则 我们可以 认为它 决定了 U
中的定向 .所以在 M 上局部给出定向是没有困难的 , 若换另一个坐标邻域 V 而 V ∩ U ≠ ,我
1 n 1 n
们要看 V 中的局部坐标 ( y , … , y ) 与 ( x , … , x ) 在 U ∩ V 中是否决定相同定向 .如果是 , 就
1 n
说 ( y , … , y ) 在 V 中 ( 而不只是在 U ∩ V ) 中也决定与 U 相同的定向 .这样 , 定向适用的区域
就从 U 向 U 以外拓展 .我们应该限制只看 M 为连通的情况 , 因为 M 若不是连通的 , 而由若干个
连通分支合成 : M = M1 ∪ M2 ∪ … , 则应逐一地讨论 Mi 中的定向 .对于连通的 M , M = ∪ Ui ,
i
1 n
每 个 U i 中均有局部坐标 ( x ( i ) , … , x ( i ) ) , 而且每个 Ui 均会与至少一个 Uj , j ≠ i 相交 ( 除非 M 就
是由一个坐标邻域构成的 : M = U1 ) , 而我们得到一系列局部坐标 .如果每当 Ui ∩ Uj ≠ 时恒
1 n
( x( i) , … , x( i) )
有 det 1 n > 0 , 则由它们在 Ui 与 U j 中分别决定的定向在 Ui ∩ Uj 中是相同的 .这
( x( j) , … , x( j) )
时我们说 Ui 与 U j 有相同定向 , 并以它为 Ui ∪ Uj 中的定向 .用这样的方法 , 如果每个 Ui 中均
有相同的定向 , 我们即以它作为 M 之定向而说微分流形 M 是可定向的 .如要在 M 上找不到具有
这样性质的{ U1 , … , U N , …} ( 不一定限于可数多个 ) .就说 M 不可定向 .如果一个流 形是可定 向
1 2 n 2 1 n
的 , 则由 ( U , φ) : ( x , x , … , x ) 开始得 到一个定 向 , 而由 ( U , φ) : ( x , x , … , x ) 开 始就可 以
得到另一个定向 .这个概念和前面讲的曲面的两侧是 相应的 .本书只 讨论 可定向 的流 形 .不可 定
2k
向流形最为人熟知的是默比乌斯带和偶数维的射影空间 R P , k ≥ 1 .
4 98 第七章 微分流形上的微积分
n n n
正如 R 的定向可以用 ∧ (R ) 中指定的一个元来表示一样 , 对于微分流形 M , 我们可以证
1
明 M 可定向的充分必要条件是在 M 上存在一个处处非零的 n 微分形式 Ω = f ( x ) d x ∧ … ∧
n 1 n
d x .事实上 , 若两个局部坐标邻域 U1 ∩ U2 ≠ , 而在 U1 , U2 中分别有局部坐标 ( x , … , x )
~ ~
1 n 1 n 1 n
与 ( y , … , y ) , Ω 和 Ω 则 分别 表 示为 f ( x ) d x ∧ … ∧ d x 和 f ( y ) d y ∧ … ∧ d y .于 是 在
U1 ∩ U2 中应有
1 n ~ 1 n
f ( x )d x ∧ … ∧ d x = f d y ∧ … ∧ d y
1 n
~ ( y ,…, y ) 1 n
= f ( y) det 1 n dx ∧… ∧ dx ,
( x ,…, x )
~ 1 2 1 2 ~
这里与 f ( x ) 与 f ( y ) 均不为 0 .必要时交换 x 与 x 或 y 与 y 可以设 f ( x ) > 0 , f ( y ) > 0 ,
而由上式即得
1 n
( y , …, y )
det 1 n > 0 .
( x , …, x )
这就符合原来 M 可定向的要求 .反过来 , 若在 M 上可以找到这样一个图册{ ( Ui , φi ) } , 使相应的
局部坐标适合上式 , 亦必可以找到一个在 M 上处处不为 0 的 n 微分形式 .
∞
4. 外微分 在 M 上的 C 微分形式代数中有一些很重要的微分运算 .其中最重要者当推外
微分运算 .它以许多在数学物理中最常见的运算如梯度、散度、旋度为其特例 .现在我们详细地讨
论外微分运算 ——— 即外微分算子 d .
0 ∞
设 f ∈ F ( M ) , 即 f 为 M 上的 C 函数 .在 §2 中定义了 f 的微分 d f 是向量场空间上的线
性泛函 :
d f( X ) = X ( f) .
1
因此 d f ∈ F ( M ) .如果用局部坐标表表示则有
f i
df = i d x ,
x
i i
d x 是 x 作为坐标函数 : M U → R 的微分 , 其实也就是古典的微分 , 这些都在 § 2 中详细讨论
p
过了 .现在我们要把它推广到 F ( M ) 上来 .
定理 3 设 M 为一 n 维微分流形 , 则必存在唯一的算子
p p+1
d: F ( M) → F ( M) ,
称为 M 上的外微分 , 具有以下性质 :
( i) d 是 R 线性的 , 而且具有所谓的“反导子”( an ti-derivation) 性质 :
p p
d( ω∧ θ) = dω∧ θ+ ( - 1 ) ω∧ dθ, ω∈ F ( M ) ; (18)
0
( ii) d 在 F ( M ) 上就是通常的微分算子 .
2
( iii) d = d d = 0 .
1
证 先证唯一性 .为 此 , 取 M 的一 个坐标 邻域即区 图 ( U , φ) , 并记 其局 部坐标 为 ( x , … ,
n p
x ) .于是任意 ω∈ F ( M ) 必可在 U 中表示为
i i
ω( x ) = ai1 … i p ( x ) d x 1 ∧ … ∧ d x p ,
于是利用 d 的 R 线性 ( 即对实数系数的线性 ) 以及 ( 18 ) 式 , 有
i i 0 x i
dω( x ) = d ai1 … i p ∧ d x 1 ∧ … ∧ d x p + ( - 1 ) ai 1 … ip d [d x 1 ∧ … ∧ d x p ] .
§4 外微分形式 4 99
0 i i
这 里利用了 ai1 … ip ( x ) ∈ F ( M ) , 又上式第二项为 0 .因为反复利用 (18) , 在 d[ d x 1 ∧ … ∧ d x p ]
2 i
的每一项中均出现 d x 形状之项 , 从而由 ( iii ) 必为 0 .总之 , 在 M 之任一个区图中 dω必只有唯
一的表达式
i i
ai1 … i p j i i
dω = d ai1 … ip ∧ d x 1 ∧ … ∧ d x p = j dx ∧ dx1 ∧ … ∧ dx p . (19)
x
所以 d 的唯一性得证 .
存在性证明如下 .在任一区图上用 (19) 来定义 dω, 我们现证这样的 d 具有所需的性质 ( i ) ~
( iii) .
j j
先看 ( i ) , d 是 R 线性的是自明的 .为证明它适合 ( 18 ) , 再取 θ = bj1 … jq d x 1 ∧ … ∧ d x q , 于是
有
i i j j
d ( ω∧ θ) = d[ a i1 … i p bj1 … jq d x 1 ∧ … ∧ d x p ∧ d x 1 ∧ … ∧ d x q ]
i j
= ( d ai 1 … i p ・ bj 1 … j q + a i1 … i p d bi1 … jq )d x 1 ∧ … ∧ d x q
i i j j
= [ d ai 1 … i p ∧ d x 1 ∧ … ∧ d x p ] ∧ [ bj 1 … j q d x 1 ∧ … ∧ d x q ]
p i i j j
+ ( - 1) [ ai1 … i p d x 1 ∧ … ∧ d x p ] ∧ [ d bj1 … jq ∧ d x 1 ∧ … ∧ d x q ]
p
= dω ∧ θ+ ( - 1) ω∧ dθ.
i i
这里我们反复利用了 ( 19 ) 以及 d bj1 … j q 是 1 微分形式 , 所以在将它移到 d x 1 ∧ … ∧ d x p 后面去
p
时需要添加因子 ( - 1 ) .
( ii) 可由 (19) 直接得出 .
( iii) 的证明可再用一次 (19) , 于是
2
2
ai1 … ip k j i i
d dω = d ω = k j dx ∧ dx ∧ dx1 ∧… ∧ dxp
x x
把前面两个因子按 k < j 的次序排列将有
2 2
2 ai1 … ip ai 1 … i p k j i i
d ω= k j - j k d x ∧ d x ∧ d x 1 ∧ … ∧ d x p = 0, k < j .
x x x x
i i
余下的问题是 : 在两个区图 U ∩ V ≠ 时 , 应用 U , V 中的局部坐标 ( x ) , ( y ) 分别按 ( 19 ) 式
计算 dω, 结果是否一致 ?在 U ∩ V 中 ω又可写为
i i
ω( x ( y ) ) = ai 1 … ip ( x ( y) ) d x 1 ( y ) ∧ … ∧ d x p ( y ) ,
i * i
这里 d x 1 ( y ) 就是前面讲的 φ d x 1 .如果用 d′表示对局部坐标 y 按 (19) 来作的外微分计算 , 则
i i
ω= d′[ ai1 … i p ( x ( y ) ) d x 1 ( y) ∧ … ∧ d x p ( y) ]
d′
i i
= d′ai1 … i p ( x ( y ) ) ∧ d x 1 ( y ) ∧ d x p ( y ) + … ,
i
“…”中的每一项都有 d′( d x ( y ) ) 这样 的因 子 .在这 里我 们已 对 ai1 … i p 应用 了一 次 反导 子性 质
0
(18) , 其中 ai 1 … ip ∈ F ( M ) .这个性质已经得到了证明 .
i i
但是 § 2 中就已指出 , d x 1 ( y ) 就是函数 x 1 ( y ) 的通常的微分 , 所以
i
i x 1 ( y) j
d x 1 ( y) = j dy .
y
5 00 第七章 微分流形上的微积分
i
仿照上面证明 (3 ) 成立之法即有 d′(d x 1 ( y) ) = 0 .又因为 ( 19 ) 指出 , 对于 0 微分形式外微分就是
普通的微分 , 因此可以利用一阶微分的形式不变性 :
d′ai1 … i p ( x ( y ) ) = d ai1 … i p ( x ) .
x
把 d′( d x 1 ) = 0 以及上式都代回 d′
ω之表达式 , 有
ω = dω .
d′
注 定理 3 的陈述中我们特别强调了 R 线性 .其实这里没有新概念 , 只是说若取系数为实
数 ——— 实常数 ——— 时它是线性的 .强调这一点是因为当我们从 M 上一个固定点 P 处的外代数
∞ ∞
过渡到 P 在 M 上变动从而得到一个丛时 , 系数将变成 C 函数 .一个 C 函数当然不能如同常数
一样在微分运算 d 中“走进走出”.
以上我们是用坐标表示来给出外微分 d 的定义 , 如果要给出一个与坐标无关的定义 , 则应看
r r +1
到 , 当 ω ∈ F ( M ) 时 , dω ∈ F ( M ) , 因 此应 该 在 给 定 r + 1 个 向 量 场 X1 , … , Xr + 1 时 求 出
dω( X1 , … , Xr + 1 ) 之值并以此作为 dω之定 义 .事 实上 , 在给出了 dω 之坐标表示 后 , 我们可以 证
明下面的重要定理 , 而且 可以用它 作为 dω之定 义 .这个 定理中用 到了一个 重要 概念 , 即 两个 一
阶微分算子 X 的交换子 [ X , Y ] = X Y - Y X 的概念 .交换子概念无论在数学或物理中都极
i i
为重要 , 由于本书篇幅限制 , 不能详细讨论 .我们只能在 X = a ( x ) i , Y = b ( x) i 的情况
x x
1 n
下给出它在坐标系 ( x , … , x ) 下的表达式 :
i j i j
[ X, Y ] = X Y - Y X = a ( x) i b ( x) j - b ( x) i a ( x) j
x x x x
j j
i b i a
= (a i - b i ) j . (20)
x x x
所以 [ X , Y ] 仍是一个一阶微分算子即向量场 .现在我们可以给出下面的与坐标无关的表达式
r +1
^
∑( -
i+ 1
dω( X1 , … , Xr + 1 ) = 1) Xi ( ω( X1 , … , Xi , … , Xr+ 1 ) )
i= 1
^ ^
∑
i+ j
+ ( - 1) ω( [ X i , Xj ] , X1 , … , Xi , … , Xj , … , Xr+ 1 ) , (21)
1 ≤ i≤ j≤ r+ 1
^
这里 Xi 表示 Xi 已删去不出现 .这个公式计算比较复杂 , 而且以后我们又常只在 p = 1 时应用它 .
所以下面只证明它的这个特例 .
定理 4 设 ω是 M 上的一个 1 微分形式 , 则对任意向量场 X , Y 我们有
dω( X , Y ) = X・ω( Y ) - Y ・ω( X ) - ω( [ X , Y ] ) . (22)
∞
这里 X・ω( Y ) 表示 X 作为一个算子作用在 C 函数 ω( Y ) 上 . Y ・ω( X) 也相似 .
i i i
证 如果用局部坐标表示 ω = ai d x , X = X i , Y = Y i , 我们有
x x
i ai aj i j
dω = d ai ∧ d x = ∑
i < j x
j -
xj
dx ∧ dx ,
ai aj
∑
i i i j
ω( X ) = ai X , ω( Y ) = ai Y , dω( X , Y ) = j - i X Y .
i, j x x
注意 , 最后一个∑中 i 不一定小于 j .另一方面
§4 外微分形式 5 01
i
i i ai i j Y j
X・ω( Y ) = X ( ai Y ) = d( ai Y ) X = j Y X + ai j X ,
x x
i
i i ai i j X j
Y ・ω( X) = Y ( ai X ) = d( ai X ) Y = j X Y + ai j Y .
x x
i i
这里我们应用了对偶基关系 d x i = δj 以及 d f ・ X = X( f ) .由交换子之定义 ( 20 ) , 有
x
i i
j Y j X
ω( [ X , Y ] ) = ai X j - Y j .
x x
综合这些式子即有
X・ω( Y ) - Y・ω( X) - ω( [ X , Y ] ) = dω( X , Y ) .
下面的定理告诉我们外微分 d 与拉回算子是可交换的 .
定理 5 对任意 r 微分形式 ω,
* *
d( φ ω) = φ ( dω) . (23)
证 r = 0 时 , 此式即 (15) 式已经证明 , 所以下面只对 r > 0 时求证 .为此我们用归纳法 , 设
r
对 ( r - 1 ) 微分形式 ω 已经证明了 (23) , 于是对 ω∈ F ( M ) ,
* * i i * i
d( φ ω) = d[ φ ( ai 1 … i r d x 1 ∧ … ∧ d x r - 1 ) ∧ φ d x r ]
* i i * i r- 1 * i
= d[ φ ( ai 1 … i r d x 1 ∧ … ∧ d x r - 1 ) ] ∧ φ d x r + ( - 1) d[ φ d x r ]
* i i * i
= φ ( d a ∧ d x 1 ∧ … ∧ d x r - 1 ) ∧ φ ( d x r ) ( 为简单起见略去了 a 之下标 )
* i i i *
= φ ( d a ∧ d x 1 ∧ … ∧ d x r - 1 ∧ d x r ) = φ (dω) .
* 1 i * i i
上面我 们 应 用 了 归 纳 假 设 d [φ ( ad x ∧ … ∧ d x r - 1 ) ] = φ d [ ad x 1 ∧ … ∧ d x r - 1 ] =
* i i
φ ( d a ∧ d x 1 ∧ … ∧ d x r - 1 ) 以及 ( 15 ) 式
* i * i 2 * i
d[ φ ( d x r ) ] = d[ d( φ x r ) ] = d ( φ x r ) = 0 .
外微分 形式之 所以重要 , 至少其 原因之一 在于 , 物 理学中有 重要应 用的许多 有关向 量和 张
量的概念与公式都可以或应该用外微分形式来解释 .下面讲一点历史 .物理学中的许多向量引起
数学家的重视大约是 19 世纪中叶的事 .为了研究这些量 , 人们曾提出了种种概念和名词 .前面我
们提到了格拉斯曼的贡献 .尽管他的写作十分晦涩 , 很难 为物 理学家 和工 程师接 受 , 但是 他确 曾
考虑了他的理论对力学、磁学和晶体学的应用 .在这个方向最重要的贡献应该归功于哈密顿 ( W .
R .Hamilton) .他的研究的出发点主要是物理学 .为了找出作为平面向量的复数的高维类似物 , 他
提出了四元数的概念 , 并且确信四元数对物理学的重要性将不亚于微积分 .他引进了现在常用的
微分算子 .
Δ= i+ j+ k.
x y z
不过这里 i , j , k 虽然不是现在我们所用的 x , y, z 轴上的单位向量 , 却有以下的性质
ij = k, jk = i, ki = j ( 这一点很像向量积 ) ;
2 2 2 2
i = j = k = - 1 ( 这是模仿虚数 i = - 1 而来的 ) ;
ij = - ji 等等 ( 这又是模仿向量积 ) .
于是
u v w w v
Δ ( ui + v j + wk) = - + + + - i
x y z y z
5 02 第七章 微分流形上的微积分
u w v u
+ - j+ - k.
z x x y
第一项是标量部分 , 除了相差一个符号 , 就是我们现在说 的散 度 ; 后三 项是向 量部 分就是 我们 现
在说的旋度 .其后伟大的贡献来自麦克斯韦 , 他在《电磁通论》中 系统地 使用了向 量理论 .上述 散
2
度、旋度的概念都应归之于他 ( 还有Δ = - Δ, 拉普拉斯算子这个名字也是他取的 ) .其后的发展中
起了关键作用有两个人 .一是美 国的统计物理学 家吉卜斯 ( J .W .Gibbs) , 他写了 第一本未公开 发
表的《向量分 析基础》一书 .另一位是 英国电 机工程师 赫维赛 德 ( O .Heaviside ) .他 的工作 完全 是
为了工程师的需要 .因为各方面的需要都很迫切 , 又缺少统一的名词与记号 , 多少有一些混乱 .在
20 世纪初数 学界的 几次国际 大会上 还专门成 立了机构 以求统 一 , 然而似 乎成果 不大 .但 是有 一
点很清楚 , 向量分析 , 也就是通常的微积分教本中称为“场论”的 那一部 分 , 远不只是 一种方便 的
记号 , 而是真正接触到事物的物理本质 .尤其是 , 它告诉我们 , 刻画大自然的数学理论决不如人们
想像那么“自然”; 我们必须讨论不可交换的乘法等 等 .这不是 由于 某些人 偏爱 异想 天开的 抽象 ,
而是不得不出此途 .没有这一切努力 , 现代的代数学是不 可想 像的 , 整 个现代 数学 也是不 可想 像
的 .有了这一切 , 不仅是成就了数学 , 尤其是成就了物理学 .
以上所说与外微分有何关系 ?例如有一个函数 f ( x ) , 则 d f 作为一个向量 ( 以 {d x , d y , d z} 为
基底 ) 正 是 grad f . 如 果 A = ( Ax , Ay , Az ) , 同 样 以 {d x , d y, d z} 为 基 底 , 则 d A =
Az Ay Ax Az Ay Ax
- dy∧ dz + - dz∧ dx + - d x ∧ d y, 恰好对应于 curl A .
y z z x x y
麦克斯韦指出 ,curl grad f = 0 .于是产生了一个重要问题 ; 若一向量 A 适合 curl A = 0 , 是否一
定存在一个函数 f 使 A = grad f ?如果 A 表示电场 , 则若 f 存在 , - f 称为这个电场的势 , 势存在
与否是电磁学中重要的问题 .麦克斯韦完全理解其重 要性 , 而 且知道 一般 而言势 是不 存在 的 .他
还指出了这是一个拓扑学问题 ( 麦克斯 韦用的 是“位 置几何 学”一 语 , 因为 当时 还没 有“ 拓扑 学”
这个术语 ) .由此可 见 我 们 已涉 及 到 科 学 中 很 深 刻 的 问 题 了 .建 议 读 者 自 己 去 找 一下《电 磁 通
论》( 武汉出版社有中译本 , 1992) 上册 .读一下绪论一章就知道今天 我们讲 的场论在 麦克斯韦 时
代已发展到什么程度了 .
2
5. 庞加莱引理和上同调理论 外微分运算 d 有一个根本之点 , 即 d ω = 0 对任意阶微分形
式 ω 成立 .现在要问 , 若 σ是微分流形 M 上的一个微分形式 , 而且 dσ = 0 , 是否一定有另一微分
形式 ω存在使σ = dω ?一般说来答案是否定的 .§2 中曾举了一个例子 xd y - yd x 就不是某个函
数 φ的微分 .这与常微分方程讲的 M d x + Nd y = 0 是否有积分因子的问题有关 .在那里我们知
道 , 只要 M 与 N 充分光滑 , 一定可以找到积分因子 h( x , y ) , 使 h Md x + h Nd y = dφ, 而 φ = c
xd y - yd x
就是这个方程的积分 .当然 xd y - yd x 并不适合 dσ = 0 .但 σ = 2 2 适合 dσ = 0 .这时
x + y
y
σ = dφ, 而 φ( x , y ) = arctan .但是 φ( x , y ) 是一个多值函数 , 而我们在第二章 中就已经 明
x
确了不应该讨论多值函数 .所以仍不能找到一个微分形式 ω 使σ = dω .产 生这些问 题的原因 在
于出现了一个奇点 (0 , 0 ) .为了系统地处理这些问题 , 我们先给出
p
定义 2 设 M 为一微分流形 , ω∈ F ( M ) , 0 ≤ p ≤ n , 若在 M 上 dω = 0 , 则称 ω为 M 上
p-1
的 ( 封 ) 闭 ( closed) 形式 .若存在 σ∈ F ( M ) 使 ω = dσ, 则称 ω为 M 上的恰当 ( exact ) 形式 .
2
于是 d = 0 即表示凡恰当形式均为闭形式 .问题在于其逆是否成立 .为了回答这个问题我们
§4 外微分形式 5 03
n
要引入一个几何概念 .设 D R , D 内有一定点 P( 不妨设 P 即为原点 O ) .若对任一点 x ∈ D,
联结 P 与 x 的线段 { tx , 0 ≤ t ≤ 1} 全在 D 内 , 则 D 称为关于 P 点是星形 ( starlike ) 的 .这个概念
的实质在于区域 D 可以沿着从 0 出发的射线收缩为 P 点 , 这类可收缩 ( cont ractible ) 区域有许多
重要的拓扑学性质 .在此情况下我们有
定理 6( 庞加莱引理 , Poincaré’s lemma ) 设 M 为一微分流形 , M 的一个子区域 S 位于 M 之
n p
一个坐标邻域 ( U , φ) 内 , 且 φ( S ) R 对某一点为星形的 , 则任一闭形式 ω∈ F ( S ) , p > 0 均
在 S 内为恰当的 .
n 1 n
证 不失一般性可以就设 S R 对 x = 0 为星形的 . x = ( x , … , x ) 就是适用于 S 的
p
局部坐标 .ω∈ F ( S ) , p > 0 .现在我们来找另一个 ( p - 1) 微分形式 σ, 使在 S 上 ω = dσ.
i i a
先看 ω为一单项式ω = a( x ) d x 1 ∧ … ∧ d x p 的情况 .dω = 0 就化为 j = 0 , j ≠ i1 , i2 ,
x
b i
… , ip .因此在 S 中 a = a ( x i1 , … , x ip ) , 令 b 为 = a 之任一解 , 容易看 到 σ = bd x 2 ∧ …
x i1
i
∧ d x p 就适合所求 .这样的解 σ当然不是唯一的 .事实上 , 若 τ是任意 ( p - 2) 微分形式 ,σ+ dτ
都是这个问题之解 .这一个证明可以推广 , 这样才能看到星形的假设起什么作用 .
p
证明这 个 定 理 的 关 键 在 于 作 一 个 线 性 算 子 Hp : F ( M ) →
p-1
F ( M ) , 使它具有以下性质 :
Hp + 1 ( dω) + d Hp ( ω) = ω . ( 24 )
因为若 dω = 0 , 则代入此式应得 ω = d Hp ( ω) .令 σ = Hp ( ω) 即
得所需解答 .Hp 作法如下 :
i i
令 ω = a i1 … i p ( x ) d x 1 ∧ … ∧ d x p , 取其任一项 , 并为简单起
i i
见 , 略去 a 之下标 , 而不妨设 ω = a( x ) d x 1 ∧ … ∧ d x p .我们定
义算子 图7- 4 -1
1
∫ ( a( t x ) t
p- 1
Hp ( ω) = d t )σ (25)
0
p
^
∑( -
j-1 i i i i
σ= 1) xjd x1 ∧ … ∧ d x j ∧ … ∧ dxp . (26)
i=1
i
d x j 上的“ ^ ”表示这个因子应该删去 .星形的假设就用在 , 当积分变量 t 由 0 变到 1 时 , 积分 域
{ t x} 就是图 7 - 4 - 1 上的线段 , 而 a 在其上有定义 .这样 , 积分 ( 25 ) 有意义 .这个积分对我们并
不陌生 , 因为在求 泰勒公式 的余项 时就遇见 过它 , 那时 我们还 说过 , 不必 讲到“星形”的概念 , 这
n
是因为对于 U R 内任一点 P( 不妨设为原点 ) , 恒可以它为心作一个充分小的球 S , S 对球心
恒为星形的 .引 入“ 星形”的名词 , 是使读 者开始与 拓扑学 中重要的 可收缩 性概念 打交道 .同样 ,
算子 Hp 也“ 大有来头”, 它是所谓同伦算子的一例 .
现在来证 (24) 式 , 因为
a( x ) k i i
dω = k d x ∧ d x1 ∧ … ∧ d x p
x
是一个 ( p + 1) 形式 .相应于 p 变成 p + 1 , (26) 应成为
5 04 第七章 微分流形上的微积分
p
k i i j - 1 i k i i
x d x 1 ∧…∧ d x p - ∑ j=1
( - 1) x j d x ∧…∧d x j ∧…∧ d x p .
k i i k
这是因为 x 起了 x 0 的作用 , 而原来 d x j 是第 j 个因子 , 现在因为多了一个 d x 而成为第 j + 1 个
j -1 ( j+ 1) - 1 j- 1
因子 , 所以原来的 ( - 1) 现在变成了 ( - 1) = - ( - 1) .这样
a k i i
Hp + 1 ( dω) = Hp + 1 k d x ∧ dx1 ∧… ∧ dxp
x
n 1
a( t x ) p
∑∫
k i i k
= k t d t ( x d x 1 ∧ … ∧ d x p - d x ∧ σ) .
h=1 0 ( tx )
上式的 σ仍是 (26) 式 .但是
1
∫
p- 1
d Hp ( ω) = d a( t x ) t dt σ
0
1 1
∫ ∫
p- 1 p- 1
= d a( t x ) t dt ∧ σ+ a( t x ) t d t dσ
0 0
n 1 1
a( t x ) p
∑∫ ∫ a( t x ) t
k p- 1
= k t d t d x ∧ σ+ d t dσ.
k= 1 0 ( tx ) 0
两式相加即有
n 1 1
a( t x ) p
∑∫ ∫ a( t x ) t
k i i p-1
Hp + 1 ( dω) + d Hp ( ω) = k t dt x d x1 ∧ … ∧ d xp + d t ∧ dσ.
k=1 0 ( tx ) 0
但是
n
k a( t x )
∑x
k= 1
k
( tx )
=
t
a( tx ) .
代入上式第一项并用分部积分法知
1 1
∫ a( tx ) t
p i i p- 1 i i
第一项 = a( t x ) t dx ∧ … ∧ dx 1 p
- p dt dx1 ∧ … ∧ d xp
0 0
∫ a( tx ) t
p-1 i i
= ω- p dt dx1 ∧… ∧ dxp .
0
第二项中
j - 1 i i i i
dσ = ∑ ( - 1 ) d x j ∧ d x 1 ∧…∧ d x j ∧…∧ d x p
i i i i
= ∑ d x 1 ∧…∧ d x p = pd x 1 ∧…∧d x p ,
所以
1
∫ a( t x ) t
p- 1 i i
第二项 = p dt dx1 ∧ … ∧ dx p .
0
两项合并即得定理之证 .
庞加莱引理表明 , 微分流形 M 上的闭形式是否均为 恰当形 式 ( 从 物理上 看也 就是是 否有 势
存在 ) , 取 决 于 M 的 拓 扑 性 质 .我 们 在 这 里 所 讲 的 拓 扑 性 质 表 现 为 所 谓 de Rham 上 同 调 群
*
H ( M ) .记
p
Z ( M ) = { M 上的闭的 p 形式} ,
并称为 p 维上循环 ( cocycle) 群 , 这里 的“群”是对于 p 形式的 加法而言的 , 因此是 阿贝尔 ( Abel)
群 ( 即可换群 ) .又记
§4 外微分形式 5 05
p
B ( M ) = { M 上的恰当 p 形式} ,
p p
并称为 p 维上边缘 ( coboundary) 群 .其实 Z ( M ) 和 B ( M ) 都不只是群 , 而且是线性空间 , 它们
的名称中都有一个“上”字 .这也不是偶然的 .
p p 2 p p
显然 B ( M) Z ( M ) , 其实这就是 d = 0 .我们也知道了一般说来 B ( M ) 只是 Z ( M ) 的
p p
真子空间 ——— 真子群 .那么至少要问 , Z ( M ) 中确非 B ( M ) 的元“实际”上有多少 ?准确些说 ,
p p
要考虑商空间或商群 Z ( M ) B ( M ) , 并且要问 , 它的维数是多少 ?有些什么生成元等等 .我们就
p p p p
称这个商空间或商群为 p 阶 de Rham 上同调群 , 并记作 H ( M ) : H ( M ) = Z ( m ) B ( M ) .这
p p p
里 p ≥ 0 .H ( M ) = 0 就表 明 Z ( M ) = B ( M ) , 亦 即 每 个 p 阶 闭 形式 都 是 恰 当 形式 .如 果
p p
H ( M ) ≠ 0 , 它既是线性空间 , 自当有基底 .如果 H ( M ) 是有限维的 , 而基底为 ω1 , … , ωr ( 当然
r
ωi 都是闭形式 ) , 这就 是 说 , 任 一闭 形 式 ω 必 可 写为 ω = dσ + ∑ c ω , 如果 用
i =1
i i ω 表示 ω在
r
∑c
p
H ( M ) 中所属的元 , 则 ω = i ωi .这样 , M 上有“ 多少”个非恰当的闭形式的问题就得到
i= 1
p p
了解决 . H ( M ) 的维数 是 一个 拓 扑 不 变 量 .实 际 上 , 若 有 微 分 同胚 φ: M → N , 则 H ( M ) ǖ
p
H ( N ) , 因此其维数自然不变 .这个不变量与 M 的其它不变量例如贝蒂数 (Bet ti numbers) , 欧拉
示性数 ( 粗略地说就是 M 有多少个“洞”的个数 ) 都 有密切 关系 .de Rham 上 同调 理论在 物理 学
( 例如量子场论 ) 中有重要的应用 , 这当然超出了本书的范围 , 下面来举几个例子 .
p n
例 1 庞加莱引理告诉我们 , 若 M 关于其一点是星形的 , 则 H ( M ) = 0 , p > 0 , 特别是 R
p n
自然是星形域 , 所以 H (R ) = 0 , p > 0 .
p = 0 又如何 ?于此 , 我们有
0
例 2 若 M 是一个连通 流形 , 可 以证明 H ( M ) ǖ R .事实 上 , 因为不 存在负阶 形式 , 所 以
0 0 0 0 0
B ( M ) = 0 而 H ( M ) = Z ( M ) , 我们现在来求 Z ( M ) .按定义 , Z ( M ) 就是闭的 0 阶形式的
∞ 0 ∞
空间 .但 M 上的 0 阶形式就是 C ( M ) 函数 .Z ( M ) = { f ∈ C ( M ) ; d f = 0} .因为 M 是连通
的 , 由 d f = 0 即得 f = C 于 M 上 , 这里 C ∈ R 是任意实数 , 这样
0 0
H ( M ) = Z ( M ) = { C} ǖ R .
如果 M 是不连通的 , 设它有 r 个连通分支 , 则由 d f = 0 可知 f 在每个连通分支上取常数值 .但在
0
不同分支上可以取不同值 .这样 Z ( M ) 之每个元都与一组 r 个实数 ( C1 , … , Cr ) 对应 , 故
0 0 r
H ( M ) = Z ( M ) = { ( C1 , … , Cr )} ǖ R .
例 3 庞加莱引理讲到 , 可以收缩为一点的流形上 , 闭形式 均为恰 当形式 , 下面 看一个明 显
1 xd y - yd x
不能收缩为一点的流形之例 : S .我们前面一再以 ω = 2 1 为例 .它是闭形式但不是恰当
x + y
1 - y x
的 : 找不到一个 0 形式 ( 即 S 上的函数 f ) 使 ω = d f .就是说 , 向量场 2 2 , 2 2 是没有
x + y x + y
1 1
势函数的 ——— 这里讲的是 S 上的整体的势函数 , 而不是 S 上任一点的某个邻域中局部的势函
数 .后者总是存在的 , 只要这个邻域充分小而且可收缩为 一点 即可 .现 在我们 用极 坐标来 考察 这
1 1 ∞
个问题 .于是 S 成为 r = 1 , ω = dθ, ( 其实 dθ这个记号有毛病 , 因为 θ并非 S 上的 C 函数 , 但
1 0 1
这不会影响以下的讨 论 , 因 为 可 以 把 S 分 成 几 块 坐标 邻 域 来 处 理 ) .H ( S ) ǖ R 已 如上 述 .
p 1 1 p 1
H ( S ) = 0 , 若 p > 1 , 因为 S 上没有 p 形式 ( p > 1 , 即 p = 2 , 3 , … ) , 所以 H ( S ) = 0 , p >
5 06 第七章 微分流形上的微积分
1 1 1
1 .余下只需讨论 H ( S ) , S 是 1 维流 形 , 所 以其切 空间 的 基底 是 , 而 余切 空 间的 基底 是
θ
1 ∞
{dθ} , 而 S 上所有的闭 1 形式就是 ω = ω(θ) dθ.这里 ω(θ) 是 θ的以 2π为周期的 C 函数 .ω
θ
2π为周期充分必要条件是
2π
∫ ω(θ) dθ =
0
0 .
∞
周期的 C 函数 σ(θ) 使
ω - cdθ = dσ.
1
这样我们得到了 S 上所有的 1 形式的表达式
ω = dσ+ cdθ.
1 1 1 1 1 1
( S 上所有的 1 形式都是闭的 , 因为 S 是一维的 .) 于是 Z ( S ) 对于 B ( S ) 之 等价类 ω =
cdθ;
1 1 1
Z (θ) B ( S ) = { cdθ} ǖ R .
1 1
于是得出 H ( S ) ǖ R .
这个例子与磁场可以产生感应电流的奥斯特 - 法拉第的实 验有密 切的关系 , 所 以我们称 ω
- yd x + xd y
= 2 2 为奥斯特 - 法拉第 ( Oersted -Faraday) 形式 .我们将在 §6 结束语 ——— 麦克斯韦
x + y
方程组简介中讨论外微分形式与麦克斯韦电磁理论的关系 .
6. 重访古典的向量分析 上节中 我们 在引 入了霍 奇 * 算子 后把 向量代 数中 的向量 积和 混
合积用外积表示出来 , 现在我们将继续利用它给向量分析中几个微分运算公式以更简单的证明 .
* 算子的引入与空间中对某一度量 下的 o .n .系 的选 用有 密 切关 系 .这 个 o .n .系我 们记 作
{ e1 , e2 , … , en } .因为我们使用了正交坐标系 , 所以协变与逆变的区别不 见了 , 而我们 现在都采 用
下标 . * 算子的公式中经常出现 p ( n - p) + s , n 是空间维数 , 在我们的情况下 n = 3 , p 是微分
形式的阶数 : 0 ≤ p ≤ n , 当 n = 3 时很容易验证 , p ( n - p) 恒为偶数 .如果我们是在欧氏空间中
p ( n - p) + s
讨 论向量 , 并选用 ( gij ) 为正定的度量 , 从而 s = 0 , 而有 ( - 1) = 1 .如果我们在闵可夫斯基
p( n - p) + s
四维时空中讨论问题, 则 n = 4 , s = 3 .这时 p( n - p) 不一定是偶数 , ( - 1) 也不一定是 1 .
仿照上一节的记号 , 凡古典的向量分析中的向量均用箭头或黑体字母表示 , 而现在则用o .n .
基{ ei } 表示 , 如
A = A1 i + A2 j + A3 k = A1 e1 + A2 e2 + A3 e3 ,
再回忆一下
* i = * e1 = e2 ∧ e3 , * j = * e2 = e3 ∧ e1 , * k = * e3 = e1 ∧ e2 ,
* ( e2 ∧ e3 ) = * * e1 = e1 , * ( e3 ∧ e1 ) = e2 , * ( e1 ∧ e2 ) = e3 , (27)
* ( e1 ∧ e2 ∧ e3 ) = 1 , * 1 = e1 ∧ e2 ∧ e3 .
§4 外微分形式 5 07
- 1
从这里我们还可看到 * * = id, 所以 * = * .
现在考虑一个 0 形式 f , 于是因为 ei = d xi
f f f
df = d x1 + d x2 + d x3 = grad f . (28)
x1 x2 x3
对于 1 形式 A = A1 e1 + A2 e2 + A3 e3 = A1 d x1 + A2 d x2 + A3 d x 3 ,
A3 A2 2 3 A1 A3 3 1 A2 A1 1 2
dA = - dx ∧dx + - dx ∧ dx + - dx ∧ dx ,
x2 x3 x3 x1 x1 x2
所以
A3 A2 1 A1 A3 2 A2 A1 3
* dA = - dx + - dx + - d x = curl A . (29)
x2 x3 x3 x1 x1 x2
又因
2 3 3 1 1 2
* A = A 1 d x ∧ d x + A2 d x ∧ d x + A3 d x ∧ d x ,
所以
A1 A2 A3 1 2 3 A1 A2 A3
*d* A = * + + dx ∧ dx ∧ dx = + + = div A .
x1 x2 x3 x1 x2 x3
(30)
于是 , 梯度 , 旋度与散度都可以用外微分来表示 .由此 , 外微分的性质将直接给出这些量的相关性
质 .例如从定理 3 的性质 ( i) , 即 (18) 式很容易地导出了以下诸多很容易混淆的公式
( i) div(curl A ) = 0 , 实即 (31)
2
* d * ( * d A ) = * d A = 0 ( * * ω = ω) .
( ii) curl(grad f ) = 0 , 即是 (32)
2
* d( d f ) = * d f = 0 .
( iii) curl( fA ) = fcurl A + grad f × A, 即是 (33)
* d( f A) = f * d A + * ( d f ∧ A ) .
= fcurl A + grad f × A .
( iv) div( f A) = f div A + grad f・ A, 因为 (34)
* d( * f A) = f ( * d * A ) + * ( d f ∧ * A )
= f div A + grad f × A .
( v) div( A × B ) = B・curl A - A・curl B, 因为 (35)
* d * ( A × B) = * d * ( * A ∧ B) = * d( A ∧ B)
= * ( d A ∧ B - A ∧ d B)
= * (curl A ∧ B - A ∧ curl B) = B・curl A - A・curl B .
我们特别注意的当然还是庞加莱引理的应用 .为此 , 假定都是在某一星形区域或一点的邻域
中考虑问题 .
∞
首先设 curl A = 0 , 亦即 * d A = 0 而有 d A = 0 .于是一定存在一个 0 形式即 C 函数 f 使
A = grad f .
在物理上 , 一个向量场 A 若适合 curl A = 0 的条件 , 就称为无旋场 .于是上面的结论就是无旋场
一定有势 .但是这只限于区域为星形或为某一点之邻 域时成 立 , 否则 势将 会是多 值函 数 .例 3 中
5 08 第七章 微分流形上的微积分
(36)
n
这里我们利用了上节 (39) 式 : 在 R 中对于欧几里得度量 p = 0 时 δ = 0 , 故 * * = id , 于是
Δω = - div grad ω .
可是现在的 Laplace-Beltrami 算子与古 典 的 拉普 拉 斯算 子 相差 一 个符 号 , 这 使 它应 用 起来 更 方
便 .因此在现代文献中我们常见到
2 2
Δ= - 1 + … + n .
x x
p 3 1 3
我们还要问 , 对 p > 0 的 F (R ) ,Δω是什么 ?一个常用的情况是 ω∈ F (R ) , 我们就记为 ω =
2 3
u .这时 , 因 dω ∈ F ( R ) , 故
δdω = * d * dω = curl curl u .
而
dδω = - d * d * ω = - grad div u .
i
另一方面我们可以直接计算 Δω 如 下 : 不 妨 设 ω = u i d x , 于 是经 过 不 太复 杂 的计 算 有 Δω =
2 2 2
- 1 + 2 + 3 u, 即对 u 之每个分量作古典的拉普拉斯算子并反号 .于是有
x x x
2
curl curl u = grad div u - Δ u . (39)
2
这里我们采用了古典的微积分教本中常用的记法 :Δ = Δ・Δ , 而Δ = 1 i+ 2 j+ 3 k, 这样
x x x
记就不会对 Δ 的符号产生误会了 .(39) 式如果按古典的讲法来证明 , 并不是一件容易事 .
n
上面我们利用外微分形式特别是霍奇 * 算子 , 非常清楚地讲了古典的“场论”在 R 中的 许
多公式 .但是如果换其它坐标系 , 更 容易 看 出它 的好 处来 .上一 节 已经 看得 很明 白 , 在任 一度 量
1 n
( gij ) 下 , 只要找到了 o .n .系{ e , … , e } 就可以定义 * 算子 , 因此也就可能定义 grad,curl 与 div
等等 .在 o .n .基底下 , 度量矩阵 ( gij ) 一定是对角矩阵 , 这是因为
gij = 〈ei , ej〉,
所以 i ≠ j 时 gij = 0 .这样
2 1 2 n 2
d s = H1 ( d x ) + … + Hn (d x ) . (40)
如果取度量为正定的 , 则有 Hi > 0 , 而且 H1 … Hn = g = det ( gij ) > 0 .所以只要令
i i 1
e = Hi d x , ei = i ,
Hi x
就可以得到所需的 o .n .系 , 而可对它们定义 * 算子 .下面我们限于 三维的 具有正定 度量的流 形
1 2 3 3
M , 即三维黎曼流形 , 并以 ( x , x , x ) 为其局部坐标 .所以有时我们也把 M 直接写成 R .
0
于是对于 ω∈ F ( M ) ( 我们习惯用 f 表示一个 0 微分形式 , 因为它确实就是一个函数 ) ,
f i 1 f i
df = i d x = i e ,
x Hi x
因此我们应定义
1 f 1 f
grad f = 1 ,…, n . (41)
H1 x Hn x
1 i
往下 , 如果 ω∈ F ( M ) , ω = A i e 或者写为 ω = A, 我们有
i
ω= Ai Hi d x .
5 10 第七章 微分流形上的微积分
在现在的情况有
A3 H3 A2 H2 2 3
dω= 2 - 3 dx ∧ dx
x x
A1 H1 A3 H3 3 1
+ 3 - 1 dx ∧dx
x x
A2 H2 A1 H1 1 2
+ 1 - 2 dx ∧dx .
x x
而
1 A3 H3 A2 H2 2 3
dω = 2 - 3 e ∧ e + … . (42)
H2 H3 x x
因此 , 我们应该有
1 A3 H3 A2 H2 1
curl A = 2 - 3 e +… . (43)
H2 H3 x x
下面没有写出的项均可由第一项用轮换对称得出 .最后看 div A = * d * A , 因为
2 3 3 1 1 2
* A = A1 e ∧ e + A2 e ∧ e + A 3 e ∧ e
2 3 3 1 1 2
= A1 H2 H3 d x ∧ d x + A2 H3 H1 d x ∧ d x + A 3 H1 H2 d x ∧ d x ,
1 2 3
d * A= A1 H2 H3 + 2 A2 H3 H1 + 3 A3 H1 H2 d x ∧ d x ∧ d x
x1 x x
1 1 2 3
= 1 A1 H2 H3 + … e ∧ e ∧ e .
H1 H2 H3 x
所以
1
div A = 1 A1 H2 H3 + … . (44)
H1 H2 H3 x
0
最后我们来看 Laplace-Beltrami 算子 , 对于 f ∈ F ( M ) , 有
Δf = ( dδ + δd ) f = δd f = - * d * d f
= - div grad f
(45)
1 H2 H3 f
1 + …
= - 1
.
H1 H2 H3 x H1 x
3
这些公式有一个常见的用处 , 即在 R 中引入球坐标
1 2 3
x = r sin θcos φ, x = r sin θsin φ, x = r cos θ
时 , 很容易算出
2 2 2 2 2 2 2
d s = d r + r dθ + r sin θdφ .
1 2 3
不妨以 ( r ,θ, φ) 为 ( x , x , x ) , 现在我们知道不应该令
f f f
grad f = , , ,
r θ φ
因为这个“记号”没有上面这些公式表示的几何性质 , 而应该注意现在应可得
2 2 2
H1 = 1 , H2 = r , H3 = r sin θ,
§5 微分形式在流形上的积分 5 11
而有
f 1 f 1 f
grad f = , , . (46)
r r θ r sin θ φ
对于一个向量 A , 在坐标系 ( r ,θ, φ) 中应该先把它写成
A = A1 d r + A 2 ( rdθ) + A 3 ( r sin θ)dφ,
然后用 (43) 和 (44) 可得
1 A3 ( r sin θ) A2 r
curl A = - dr +
θ φ
2
r sin θ
1 A1 A 3 ( r sin θ)
- dθ+ (47)
sin θ φ r
A2 r A1
sin θ - dφ .
r θ
1 2
div A = A1 r sin θ+ A 2 r sin θ+ A3 r . (48)
θ φ
2
r sin θ r
而拉普拉斯算子 ( 注意符号 ) 是
1 2 f f 1 f
Δf = - 2 r sin θ + sin θ +
r sin θ r r θ θ φ sin θ φ
2
1 2 f 1 1 f
= - 2 r + sin θ + . (49)
sin θ θ θ 2 2
r r r sin θ φ
§5 微分形式在流形上的积分
n
1. 微分形式在 R 上 的 积 分 本 节 中 我们 将 讨 论 一 个微 分 流 形 M 上的 微 分 形 式 ω ∈
n n
F ( M ) ( ω的阶数与 M 的维数相同 ) 在 M 上的积分问题 .因为 M 是光滑的 , F ( M ) 中的元素为
n ∞
∧ ( M ) 的 C 切口 , 因此也是光滑的 .在光滑的积分区域上对光滑的被积表达式作积分 , 黎曼积
分就已经够用了 .所以本章中的积分都限于黎曼积分而不去讨论第四章中的勒贝格积分 , 也就不
必讨论 M 上如何定义测度的问题 .当然这不等于说在研究有关流形的几何问题时用不着勒贝格
积分 .退一步说 , 至少要有黎曼度量才行 .一个微分流形 , 如我们所已假设的 , 是豪斯多夫空间 , 而
且满足第二可数性公理 , 在这个条件下 , 这个流形上一 定有黎曼 度量存 在 ( 证 明见 定理 6) , 也 可
以证明它由此就是一个度量空间 ( 证明略去 ) .但是我们现在还没有利用这些结果 .在这种情况下
n
如何定义 M 上的积分 ?办法就是利用 M 上的局部坐标 , 把积分区域映射到 R 上去 .这个映射尽
n
管“我们说它是可微的”, 却不涉及测度问题 .设 U M 是一个坐 标邻域 , φ: U → R 是坐标 映
*
射 , 记 φ( U ) = V , ω在 φ 下之像为 Ω, 则
l n
Ω = a( x ) d x ∧ … ∧ d x .
*
可是 ω是 Ω 在 φ下的拉回 : ω = φ Ω, 于是我们定义
∫ω =∫φ ∫ ∫ a( x ) d x …d x
* 1 n
Ω= Ω= , ( 1)
U U φ( U ) V
这就完全绕过了测度问题 .
5 12 第七章 微分流形上的微积分
1 n
但是若在 U 中有了另一个局部坐标ψ: ( y , … , y ) , 不失一般性 , 不妨设 y 与 x 坐标有相 同
定向 .如果在新坐标系中 ω成为
~
1 n
Ω = b( y ) d y ∧ … ∧ d y ,
∫
则按 (1 ) 式 , ω 应定义为
U
~ ~
∫ω =∫ψ ∫ Ω =∫b( y ) d y … d y
* 1 n
Ω= . ( 2)
U σ ψ( U ) V′
但由外微分形式的性质
1 n
1 n ( y ,…, y ) 1 n
b( y ) d y ∧ … ∧ d y = b( y( x ) ) 1 n dx ∧ … ∧ dx
( x ,…, x )
1 n
= a( x ) d x ∧ … ∧ d x .
1 n
( y , …, y )
即有 a( x ) = b( y ( x ) ) J, J = 1 n > 0 , 因为 y 与 x 有相同定向 , 所以 J = | J | , 而由黎
( x , …, x )
曼积分中重积分之变量变换公式
∫a( x ) d x … d x =∫b( y ( x ) ) |
1 n 1 n
J | d x …d x
V V
∫
1 n
= b( y )d y …d y .
V′
∫
1 n
方 .因为例如对于 ( 1) 式 , 要求 a( x ) d x … d x 有意义 , 应该要求 V 是勒贝格零 测度集 ( 第四 章
V
{ W1 , … , W k } , 并 令 xi = x0 + W i . 当 { W1 , … , W k } 线 性 无 关 时 , 由 ∑ λi W i = 0 , 亦 即 由
i= 1
k k k
∑λ ( x
i =1
i i - x0 ) = ∑λ x
i=0
i i = 0 时可得 λ1 = … = λk = 0 , 这里 λ0 = - (λ1 + … + λk ) , 从而 ∑ λi
i= 0
下性质 : 若 ∑ λi xi = 0 以及 ∑ λi = 0 可得 λ0 = … = λk = 0 .这个性质我们说成是{ x0 , x1 , … ,
i= 0 i= 0
( 它可以表示为 ∑ μi W i = ∑μ ( x i i - x0 ) ) , 使
i= 1 i= 1
k k
x = x0 + ∑μ ( x
i=1
i i - x0 ) = μ0 x0 + ∑μx i= 1
i i
k k
= ∑μx
i =0
i i , μ0 = 1 - ∑μ .
i= 1
i ( 3)
形如 (3 ) 的表达式称为{ x0 , x1 , … , xk } 的仿射组合 , 但
k
∑μ
i= 0
i = 1 ( x0 , x1 ∈ V ) . ( 4)
最简单的例子是 { x0 , x1 } 的仿射组合之集 , 即
L = {μx0 + ( 1 - μ) x1 ; μ∈ R} .
它就是过 x0 , x1 两点的直线 , 它与 V 的线性子空间不同 , 它不必经过原点 .如果在 L 中限制 0 ≤
μ≤ 1 , 则将得到 L 上由 x0 到 x1 的线段 ( 端点包括在内 ) .
有了仿射组合的概念以后 , 我们就可以定义单形了 .
定 义1 n 维线性空间 V 中的 k 维单形 ( 这里 0 ≤ k ≤ n) , 简称为 k 单形 ( k-simplex) , 即 k + 1
个仿射无关的点{ x0 , x1 , … , xk } 之如下的仿射组合的集合 .
k k
σk = 〈x0 , x1 , … , xk〉 = x; x = ∑λ x , 0 ≤ λ ≤ 1 , ∑λ
i=0
i i i
i=0
i = 1 . ( 5)
这些点称为 σk 的顶点 .
以上受了限制 0 ≤ λi ≤ 1 的仿射组合是一个凸集合 .因此 σk 就是由这些顶点所生成的闭凸
集 ——— 或称凸包 .λi 称为 x 点的第 i 个重心坐标 ( barycentric coordinates ) , 我们常记之为 bi ( x ) =
λi .注意 , σk V 乃是 k 维空间的一个子集 , 所以其中的点的独立的坐标应有 k 个分量 , 而现在有
k
( C, ) : … Ck Ck - 1 … C0 0 . ( 8)
最后一项为 0 是因为 C0 是由复形 K 中之一切单形的顶点所成的形式和 ( 7) 之集合 , 顶点 x i 没有
边缘 , 即边缘为空集 , 我们用 0 表示空集之形式和 .
2
定理 1 = 0 .
§5 微分形式在流形上的积分 5 15
知 ,τi 的顶点必 不 能 尽 取 τi + 1 的 顶 点 , 所 以 { x i j } 一 定 是 { x0 , x1 , … , xk } 的 一 个 重 新 排 列 , 而
k
1
k + 1∑
b(τk ) = xi 就是 b(σk ) .当然 , 我们 应该 来证 明〈b(τ0 ) , b(τ1 ) , … , b(τk )〉 确为 一个 单
i= 0
λ1 λk λk
+ + … + x1 + … + xk .
2 k +1 k+1
若它等于 0 , 由 { x0 , x1 , … , xk } 之仿射无关性 , 立即有 λk = 0 , 依次代入前面各项又依次有 λk - 1 =
λk - 2 = … = λ0 = 0 .
还要注意 , σk 之重心 重分 D(σk ) 一定成 一复 形 , 即 它的 各个小 的 k 维单 形〈b(τ0 ) , b(τ1 ) ,
… , b(τh )〉均规则地 相处 .这在 直观上 是很清楚 的 , 但是应 该要证明 .由于我 们在这里 并不是 想
要讨论代数拓扑学 , 所以不停留在这个问题上了 .但有一 点应 该提及 , 即在重 心重 分以后 所得 到
的小的单形的 定向 应 如何 确定 ?从 形式 上看 , 每 一个 小 单形〈b(τ0 ) , b(τ1 ) , … , b(τk )〉中 τi <
τi + 1 , 所以 这些 顶点 已 经有 了一 个自 然的 定 向 , 但是 这个 定向 与 原来 的单 形之 定向 却 不一 定 协
调 .例如 , b(τ0 ) 一定是某个顶点 xi0 , b(τ1 ) 应 是 线 段 ( x i0 , xi 1 ) 的 中 点 , 但是 在 原 单形 中 ( xi 0 ,
们已说 过 , { i0 , i1 , … , ik } 一 定 是 {0 , 1 , … , k} 的 一 个 排 列 π, 于 是 我 们 规 定 小 单 形〈b(τ0 ) ,
b(τ1 ) , … , b(τk )〉的定向应取为 sgn π〈b(τ0 ) , b(τ1 ) , … , b(τk )〉, 图 7 - 5 - 3 右就是调整以后的
定向 .
图7 - 5 - 3
m
我们当然要对 σ反复作重心重分 , 例如作出 D (σ) = D・ D・…・ D(σ) ( 共 m 重 ) , 而看 m
→ ∞ 时它是否会缩为一点 .这时就要问了 , 在 V 上我们并未赋以度量 , 怎样来考虑极限 呢 ?事 实
n n
上 , V ǖ R , 在 R 中当然可以作出极限 , 当然可以给出度量 ( 见第六章 ) 而不必要有欧氏度量 ( 这
n
一点与体积不同 , 要定义体积却是需要欧氏 度量的 ) .而 且第 六章 中还指 出了 , R 中各种 度量 均
是等价 的 . 例 如 两 个 点 x1 = ( x1 , … , x1 ) 与 x2 = ( x2 , … , x2 ) 之 间 , 用 ∑ | x1 - x2 | ,
1 n 1 n i i
i
§5 微分形式在流形上的积分 5 17
1
i i i i p
∑
p
sup | x - x |,
1 2 | x 1 - x | 2 ( p > 1 ) 作距离均无不可 .所以下面我们直接写 | x - y |
i
i
k
1 , ∑λi = 1 , 所以
k
| x - y |≤ ∑λ i=0
i | xi - x | ≤ sup
i
| xi - x | ≤ sup
i, j
| xi - xj | .
k
k
≤ (σ之直径 ) .
k+1
由此可知 , 当无限地作重心重分后 , 单形 σ将缩为一点 .
1
有了这些预备知识以后 , 我们可以开始讨论积分了 .我们首先考虑一个 k 形式ω = a( x ) d x
k
∧ … ∧ d x 在一个 k 单形σk = 〈x0 , x1 , … , xk〉上的积分 .这里遇到了关键问题 , 即如何处理体
n 1 k
积 .如果在 R 上已有欧氏结构 , 而且不妨即设 ( x , … , x ) 为笛卡尔坐标 , 则 切空间 有一个 o .n .
1 k
基底 { e1 , … , ek } = 1 , …, k .{d x , … , d x } 则 是余切空 间与它 对偶的 o .n .基 底 .如果 记
x x
σk 之棱为切向量{ v1 , … , vk } ( 实际上例如 v1 = x1 - x0 ) , 而且
j j
vi = A i j ( 注意 A i 为实常数 ) .
x
1 k
于是 d x ∧ … ∧ d x 作为 k 阶反对称协变张量 , 易知
〈d x ∧ … ∧ d x ; v1 , … , vk〉 = det ( A i 〈
x k〉
1 k j 1 k
) dx ∧… ∧ dx ; j ,…, j
x1
j
= det ( A i ) = k !vol (σk ) .
今取 ω之系数 a( x ) 在 σk 的重心 bk 处的值 a( bk ) , 并且作出第一个“黎曼和”.
1 1 k (1) ( 1)
S1 ( ω,σk ) = 〈a( bk ) d x ∧ … ∧ d x ; v1 , … , v k 〉 = a( bk )vol(σk ) , (10)
k!
(1) 1 j 1
这里 v i 就是 vi .( 10 ) 式前的因子 来自 : det ( A i ) 是 k 维平行体的有符号的体积 .乘上 后才
k! k!
得到单形 σk 的体积 vol(σk ) .
5 18 第七章 微分流形上的微积分
2
往下的作法就很清楚了 .作 σk 的二 次重分 D (σk ) .它 是一个链 , 由具有适 当符号 的 k 单 形
2
σk , i 构成 .对每个这样的单形 , 仿照 ( 10 ) 作出
(2 ) 1 (2) 1 k (2 ) (2)
S2 ( ω,σ ) = ∑
k! i
〈a( b k , i ) d x ∧ … ∧ d x ; v1 , … , v k 〉,
∑ a( b k, i )vol(σk, i ) .
(2 ) (2 )
=
i
然后再作出
( m) 1 ( m) 1 k
Sm ( ω,σ ) = ∑
k! i
〈a( b k , i ) d x ∧ … ∧ d x ;
∑ a( b
( m) ( m) ( m) ( m)
v1 , …, vk 〉 = k, i ) vol(σk , i ) . (11)
i
k
我们考虑的是 R 上的光滑微分形式 , 所以应该看到 a( x ) 在有界闭集 σk 上是连续的 , 因而是 黎
∫a( x ) d x … d x
( m) 1 k
曼可积的 , 因此当 m → ∞ 时 , mlim Sm ( ω,σ ) = 是存在的 .所以 , 我们有理由给
→∞
σ
k
出
1 k k
定义 3 若 ω = a( x ) d x ∧ … ∧ d x 在 R 中包含某个 k 维单形σk 的区域中是光滑的 k 形
式 , 则定义
∫ ∫
1 k
ω= a( x ) d x … d x . (12)
σ σ
k k
∫ ∫
1 k
曼积分 a( x ) d x …d x 作为 ω之定义 .
σ σ
1 k
我们的作法当然有些偷巧 .既然知道 d x ∧ … ∧ d x 作用到 ( v1 , … , vk ) 上以后可以得到一
个“很像”体积的东西 , 何不以它为基础建立一套测度和积分理论而 要将它 归结为通 常的黎曼 积
分呢 ?如果那样做就太麻烦了 .回想一下古典的黎曼积分定义是很麻烦的 : 一维情况好说 ( 现在几
乎一定要考虑高维问题 ) , 在高维时 , 我们需要把积分区域分解成若尔当可测的小区域 ( 而什么条
件下一个区域才是若尔当可测又是麻烦事 ) , 现在我们只 分划 为单形 , 而单形 又只 允许作 重心 重
分 , 这当然 容易多了 .特别是 把它化成 了黎曼积 分就不 必操心证 明这个“很 像”体积的东 西是 否
具有有限或可数可加性了 .可是以单形及其重心重 分为基础 来建 立积 分理论 真正 的目的 是为 了
§5 微分形式在流形上的积分 5 19
突出积分的组合学的侧面 , 表现在下面的斯托克斯定理上 .
根据同样的“偷巧”的办法 , 有许 多关 于积分 必须 要证明 的结 果将 都在其 较一 般 的情 况下 ,
即流形上的积分中 , 一并证明 .
i
最后还要提一下 , 我们的 vol(σk ) 是有符号的 : 若将 σk 的定向反转 , 成为 - σk 则 det ( Aj ) 将要
反号 , 于是
∫ω = -∫ω .
-σ σ
(13)
k k
( i)
这可能是微分形式的 积分与 通常函数 的积分最 重要的 区别 .也很 清楚 , 若 有一个 由 k 单形 σk ,
i = 1 , 2 , … , l , ( l 为有限整数 ) 所成的链
l
∑λσ
( i)
c = i k , λi ∈ Z (14)
i= 1
( 这里 Z 指整数集 ) , 则可以在链上求积分而有
l
∫ω = ∑λ∫ω .
c i=1
i
( i)
(15)
σ
k
∫dω =∫ω .
σ σ
(16)
j
方向导数 , 亦即 ( 9) 式中的 v i = Ai j .但是 vi 都是常系数微分算子 , 因此互相间都可 以交换 :
x
vi , vj = 0 , 因此“其它项”是不会出现的 .故
5 20 第七章 微分流形上的微积分
k
1
∑
j-1
S1 ( dω,σ) = ( - 1 ) Dv j〈ω( b(σ) ) ; v1 , … , v^ j , … vk〉 . (17)
k !j = 1
再看 (16) 的右方 , 相应于它的黎曼和是
k
1
∑
j
S1 ( ω, σ) = ( - 1) S 1 ( ω, σj ) .
( k - 1) ! j = 0
σj = 〈x0 , … , x^ j , … , x k〉, 当 j > 0 时它是由{ v1 , … , v^j , … , vk } 构成的 ( k - 1) 单形 .但是当 j =
0 时 σ0 = 〈x1 , … , xk〉的棱是{ wi = xi - x1 = vi - v1 } , i = 2 , … , k .因此在 S1 ( ω,σ0 ) 中 ω是
作用于 w 2 ∧ … ∧ w k = ( v2 - v1 ) ∧ … ∧ ( vk - v1 ) 的 .把 w 2 ∧ … ∧ w k 按 v1 展开 , 其第
一 项不含 v1 而是 v2 ∧ … ∧ vk .含 v1 的“一次幂”者是在 ( v2 , … , vj , … , vk ) 中以 - v1 代替 vj ,
其它项则至少含两个 v1 作为因子 , 外微分形式 ω既是反对称协变张量 , 则它作用于含两个 ( 或更
多 ) 相同因子 v1 的项上自然为 0 , 因此
k
1 1
( k - 1 ) !∑
0
S 1 ( ω, σ) = ( - 1) S 1 ( ω( b0 ) ,σ0 ) + 〈ω( bj ) ,σj〉
( k - 1) ! j=1
k
1
∑
j
= ( - 1 ) 〈ω( bj ) , v1 , … , v^j , … , vk〉 + (18)
( k - 1) !j= 1
k
1
∑
j-1
( - 1 ) 〈ω( b0 ) , v1 , … , v^ j , … , vh〉 .
( k - 1) !j= 1
这两项不同在于 , 第二项中是在 b0 处取 ω之值 , 而第一项则是在 σ之第 j 个面σj 之重心 bj 处取
ω之值 .所以
k
1
∑
j- 1
S1 ( ω, σ) = ( - 1) 〈 ω( b0 ) - ω( bj ) , v1 , … , v^j , … , vh〉 .
( k - 1) ! j = 1
下面是关键的一步 .应用中值定理于 ω( b0 ) - ω( bj ) .在 微分学 一章 中我们 就指 出过 , 对 于多 元
函数 , 中值定理一般 不成立 , 而只能用一个 不等式来代替 .现在注 意单形 σ对其任何 一点都是 星
形的 , 因此连接 b0 与 bj 的线段 { tb0 + (1 - t) bj , 0 ≤ t ≤ 1} 恒在 σ内 , 而 ω在这个线段上确实
是单变量 t 的函数 , 因此可以应 用中 值定 理 ( 更准 确地 说是 应 用专 用于 一元 函数 的 拉格 朗日 公
式 ) 而知在此线段上一定可以找到一点 cj 使
ω( b0 ) - ω( bj ) = D v j ( cj ) ( b0 - bj ) .
这里 D v j 是沿 ( b0 , bj ) 线段的方向导数 , 而因
1 1 1
b0 - bj =
k ∑x i≠ 0
i - ∑x
i≠ j
i =
k
( xj - x0 ) =
k
vj ,
所以就是 vj 方向的向量 , 从而
1
ω( b0 ) - ω( bj ) = D v ( cj ) v j .
k j
代入 (18) 即有
k
1
k !∑
j-1
S1 ( ω, σ) = ( - 1 ) D v j〈ω( cj ) , v1 , … , v^ j , … , vk〉 . (19)
j= 1
把( 17 ) 与 ( 19 ) 比 较 , 其 差 别一 是 在 cj 处 求 值 , 一 是 在 b( σ) 处 求 值 .但 在 经 过 多 次重 心 重 分 后
b(σ) 与 cj 会任意接近 , 而且若以重心重分后 k 维单形 之直径作 为无穷 小之阶的 标准 , 则每一 项
§5 微分形式在流形上的积分 5 21
∫
1
f′( x ) d x = f ( x1 ) - f ( x0 ) .
x
0
F( b) - F( a) = F( aN ) - F( a0 ) = ∑
i=1
F( ai ) - F( a i - 1 ) .
∑( a
k= 1
k - ak - 1 ) bk = ∑( b
k=0
k - bk+ 1 ) ak , a0 = bN + 1 = 0 .
∫ ∫ ∫Ω
*
ω= φ Ω=
U U φ( U )
n
得出 .如果 U 是 R 中的一个复形 , φ( U ) 在 M 上 . M 是弯曲的 , 其上本来没有平直的单形和 复
形 .是否可以设想 , φ把复形的结构映射到 M 上 , 即将 M 分成许多小块 , 每一个小块 U 是一个 n
维单形 σ之像 , 而 σ之面 , 分别映射到 U 的一个低维子流形上 ?如果可以 , 就称 U M 是一个 k
维奇异单形 .称它为奇异的是因为由 σ到 U 的映射 φ允许很“奇异”, 甚至不一定是一对 一的 .这
些奇异单形的形式和 ∑σi 称为奇异链 .如果存在这样一 个映 射 , 就说 M 可以三 角剖 分 .如果 这
i
∞ ∞ ∞
个 映射是 C 的则说 M 可以 C 地三角剖分 .那么 , M 是否可以 C 三角剖分呢 ?从 20 世纪 30 年
代起这就是一个重大问题 , 因为它关系到能否把组合的方法用于微分流形的研究 .这里有惠特尼
∞ ∞
( Hassler Whitney) 的三角剖分定理 , 指出每一个 C 微分流形一定有 C 三角剖分 .这个定理的
证明太复杂 , 不妨留待读者有志于更深入地讨论流形的拓扑学时再去研讨 .现在我们用另一种方
法来讨论 , 这就是应用单位分解 .
在微分流 形 M 的定义 中我 们加上 了 M 为豪 斯道 夫空间 并且 适合 第二可 数性 公理 的要 求
( §2 ) , 那时我们就指出这样做是为了使用单位分解 .其实前面我们已多次这样做了 , 现在再比较
明确地讲一下定义积分的过程 , 它是应用单位分解方 法的一 个典 型例子 .所谓单 位分 解就 是 : 在
上述关于 M 的限制下 , 若 M 有一个开覆盖 , 则它必有一个局部有限的子覆盖{ Uα} , 即每一点 P
必有一个邻域 W , 与最多有限多个 Uα ( 设为 U1 , … , Uk ) 相交 : Ui ∩ W ≠ , i = 1 , 2 , … , k .然
∞
后可以找到一族 C0 ( M ) 函数 φα , 称为从属于此覆盖的单位分解 , 使每一个 φα 的支集 supp φα 必
含 于某一个 Uβ 中 , β= β(α) ( 不说是含于 Uα 中 , 因为 { Uβ } 不一定与{φα } 用同样的参数标记 , 而
且同一个 supp φα 可以含于好几个不同的 Uβ 中 , 我们选定其中一个并记为 β(α) ) , 这些函数的支
集{supp φα } 一定是局部有限的 , 而且
0 ≤ φα ≤ 1 , ∑φα = 1 . (20)
α
ω= ∑ φω= ∑ω
α
α α . (21)
1 n n
( x , … , x ) 是 Uα 中的局部坐标 , 而 aα ( x ) 不 妨认 为 是 定义 在 整个 R 上 的 , 只不 过 在 Vα =
- 1 n ∞ n
φα ( Uα ) R ( φα 是 Uα 中的坐标映射 ) 之外 aα ( x ) ≡ 0 .这样 aα ( x ) ∈ C0 (R ) , 这个函数的黎
曼积分没有一点困难 .
n n
于是我们得到了 R 上的 n 微分形式 , 其积分是可以定义的 , 当然要对 R 赋以典则 的 , 即 标
准的欧氏度量 .对 ( 21 ) 式之每一项作类似处理后 , 即可看出 , 应有
定义 4 设 M 是一个可定向的 n 维微分流形 , ω是 M 上的一个具有紧支集的 n 微分形式 ,
则我们定义 ω在 M 上的积分为
∫ω = ∑∫ω = ∑∫a ( x ) d x … d x
1 n
α α . (23)
α α
M M n
R
∫ω = ∑∫ψω .
M β M
β
但是
= ∑ ∑∫( ψφ ) ω
β α
M
β α = ∑∫ψ ∑φω
β
M
β
α
α
= ∑∫ψω .
β M
β
所以采用不同的单位分解并不影响定义 .
~ - 1
其次 , 若在积 分 区 域 中 Uα 中 有 两 个 局 部 坐 标 系 ( V , ψ) 与 ( W , ψ) , V = ψ ( Uα ) , W =
~ -1 1 k 1 k
ψ ( Uα ) , 而且局部坐标分别为 ( x , … , x ) 与 ( y , … , y ) , 则有微分同胚 φ: V → W , x = φ( y)
而 ωα 有两个表达式
1 n 1 n
ωα = aα ( x ) d x ∧ … ∧ d x = Aα ( y ) d y ∧ … ∧ d y ,
1 n
( y , …, y )
aα ( x ) = Aα ( y ) 1 n .
( x , …, x )
因为 我 们 已 设 M 是 可 定 向 的 , 当 然 可 以 要 求 所 有 的 局 部 坐 标 的 定 向 是 相 协 调 的 , 因 此
1 n
( y , …, y )
1 n > 0 .于是
( x , …, x )
1 n
( y ,…, y )
∫ω =∫a ( x ) d x ∫A ( y)
1 n 1 n
α α …d x = α 1 n d x …d x
( x ,…, x )
∫A ( y) d y …d y =∫A ( y ) d y
1 n 1 n
= α α ∧ …∧ dy .
5 24 第七章 微分流形上的微积分
(1 ) ∫( λ ω
M
1 1
∫ M
∫
+ λ2 ω2 ) = λ1 ω1 + λ2 ω2 λ1 ,λ2 为实数 .
M
(2 ) 若将 M 上定向反转 , 记所得流形为 - M , 则
∫ω = -∫ω .
- M M
(24)
n
证明很简单 , 现在均略去 , 不过要说明 , 它们对 R 上的积分也都成立 .
这里我们要对 (24) 式多说几句 .通常 的微积 分教 本中讲 曲线 积分 与曲 面积 分 时 , 总 分成 第
一型与第二型两种 .其实所谓“ 第二型”就是在一维流形 ( 曲线 ) 或二维 流形 ( 曲面 ) 上积 分 .在 那
里我们是说函 数的 积 分 , 现 在 则 应 说 是 微 分 形 式 Pd x + Qd y + Rd z 或 Pd yd z + Q d zd x +
Rd xd y 的积分 ( 前者是曲线积分 , 后者是曲面积分 ) .不过曲面积分我们是写成 Pd y ∧ d z + Qd z
∧ d x + Rd x ∧ d y .第二型曲线积分适合 ( 24 ) 是人们都明白的 :
∫Pd x +
AB
Q d y + Rd z = - ∫Pd x +
BA
Qd y + Rd z .
∫ ∫ω .
*
φ ω= ε (25)
M φ( M )
这里 ε = ± 1 视 φ为保持定向或反转定向而定 .
证 在必要时引用上面所说的单位分解 , 我们可以设 C = supp ω U , U 是 N 上一个坐标
§5 微分形式在流形上的积分 5 25
n 1 n
邻域 , 而坐标映射 f : U → R , f ( C) f ( U ) 中的局部坐标为 ( y , … , y ) , 使得
1 n 1 n
ω = a( y , … , y ) d y ∧ … ∧ d y .
-1 1 n
不失一般性 , 可以设 φ ( U ) 在 M 的一个坐标邻域中 , 其局部坐标是 ( x , … , x ) .于是
* 1 n 1 n
φ ω = A( x , …, x )d x ∧ … ∧ d x ,
而且
1 n 1 n
1 n 1 n ( y ,…, y ) 1 n ( y ,…, y )
A ( x , … , x ) = a( y , … , y ) 1 n = εa( y , … , y ) 1 n .
( x ,…, x ) ( x ,…, x )
所以
1 n
( y ,…, y )
∫φ ∫A( x ∫
* 1 n 1 n 1 n 1 n
ω= , … , x ) d x … d x = ε a( y , … , y ) 1 n d x …d x
( x ,…, x )
∫ ∫
1 n 1 n
= ε a( y , … , y ) d y … d y = ε ω .
必要时应用单位分解就可得到 (25) .
在上面的证明中 , M 与 N 是可定向的是一个重要条件 .因为不然的 ,ε可能在不 同坐标邻 域
上不同 .但是退一步说 , 还得 M 与 N 都是连通的 , 否则在不同的连通分支上 ε可能各取 + 1 或 - 1
而不同 .这些都是很容易理解的 .重 要 的是 要 明白 φ为 微 分 同胚 是 一个 本 质的 要 求 , 否则 的 话
(25) 会不成立 , 而要改为
∫ ∫ω.
*
φ ω = εdeg φ
M φ( M )
∫dω =∫ω .
M M
(26)
n n
而 Uα 中有一点 P( 不能问 Uα 外的点如何 , 因为流形的定义是讲 Uα 内的点与 R 或 H 的一个开
~ ~
集同胚 ) 对应于 Hn 中 x n = 0 上的某一点 P , 则 P 在 Hn 中的一个邻域 ( 图 7 - 5 - 4 的右图中的
阴影区域 ) 必与 M 中含 P 的 Uα ( 图 7 - 5 - 4 左图中的阴影区域 ) 同胚 .而 M 中含 P 的子集 A B
~ ~ ~
n n n
应该同胚于 H 中 x = 0 上含 P 的子集 A B .于是 M 中的点是否可以分成两类 , 一类与 H 的
n n n n
某一子集中 x = 0 上的点对应 , 一类则与 H 中适合 x > 0 之点或与 R 中之点 ( 自然也可以设
n 1 n
此 点适合 x > 0) 相应 ?关键在于弄明白 , 决不可能有一个点 P ∈ M , 在某个坐标系 ( x , … , x )
~
n 1 n n
下与 x > 0 的点 Q 相应 , 而在另一个坐标系 ( y , … , y ) 下则与 y = 0 之点 C 相应 ( 图 7 - 5 -
n
5) .这是因为 , 如果这样的点存在 , 则必有图 7 - 5 - 5 上的两个开集 ( 右图是 H 中的开集 ) 即阴
-1
影区域通过迁移函数的 ψ φ 成为微分同胚 :
i i 1 n
y = Φ( x , …, x ) . (27)
图7- 5- 4 图7- 5 -5
1 n
( y , …, y )
而且其雅可比行列式 det 1 n ≠ 0 一直到边 “一直到边”
. 四个字很关键 .我们可以假设
( x , …, x )
它 > 0 .如果没有“一直到边”四个字 , 则只能假设它 ≥ 0 .这里不会有 = 0 倒不是极限问题 , 而是
- 1
因为由微分流形的定义 , ψ φ 既是一直到边的微分同胚 , 则其逆也是一直到边的微分同胚 , 所
1 n
( x ,…, x ) n n
以其逆行列式 det 1 n 必须一直到 y = 0 处都连续 , 这样就必须原行列式在 y = 0 处
( y ,…, y )
n
不为 0 .于是可以对 (27) 在 Q 点应用隐函数定理 ——— 这确实是一个 R 中的定理而丝毫不受上
~
n n
面关于 H 的拓扑的议论影响 ——— 知 Q 附近必有一些点被 (27) 映到 Q 附近 y < 0 处而与这些
- 1
迁移函数 ψ φ 是两个阴影区域间的微分同胚相矛盾 .这样一来就看到了 M 中的点有两类 : 第
n n
一类是图册中第一类区图 ( 即 R 中某个开集 ) 内点之像 , 或是第二类区图 ( 即 H 中某个开集 ) 适
n n n
合 x > 0 的点之像 .第二类则是 H 中某开集中适合 x = 0 之点的像 .这两类泾渭分明 , 绝不混
淆 .第二类点之集合称为 M 之边缘 , 记作 M .我们在第六章讲拓扑空间中简单地提 了一下边 缘
与边界点之区别 , 现在就看 得比较 清楚了 . M 并 不是一 般拓扑空 间理论讲 的边界 点之集合 .一
是因为现在没有了包含空间的概念 , 所以没有了 外点 .二是因 为我们 M 之定义 并不 是它“不 是
n n n
什么什么”而是非常明确的它是什么什么 : 它是 H 中 x = 0 之像 , 与一个超平面 x = 0 有密切
关系 , 所以我们有
§5 微分形式在流形上的积分 5 27
n
y
J 就是我们要求的迁移函数雅可比行列式 . 今证 n > 0 .注意前面关于光滑到边的讨论 ,
x M
n
y ST
n = lim ~ ~ ≥ 0
x Q S T
n
-1 y
( 见图 7 - 5 - 6) .但是它不可能是 0 , 否则 φβ φ 的雅可比行列式为 0 而没有逆 .因此 n
α >
x Q
1 n n
( y , …, y ) y
0 .因为我们已设 M 是可定向的 , 所以不妨设 1 n > 0 再加上 n > 0 , 即得 J > 0 .
( x , …, x ) x Q
( 1) (2)
∪ ∪ (2) n n
α
Uα ∪ β
Uβ 代 替 M .如 果 用 Vβ 记 Uβ 中 相 应 于 H 之 边缘 x = 0 的点 集 , 则 M
(1 ) ( 2) (1) (2)
=∪ Vβ .于是作从属于 M 之覆盖{ Uα , Uβ } 的单位分解{φα , φβ } , 有
β
∑φ ∑φ ∑ω ∑ω
(1 ) (2) (1) (2 )
ω= α ω+ β ω= α + β ,
α β α β
∫ ∑∫ ∑∫
( 1) (2)
dω = dωα + dωβ .
M α M β M
∫
(1 ) (1 ) n ( 1) n ( 1)
先 看 dωα .按定义它可以化为 U α 在 R 中的像 ( 仍记为 U α ) 上的 R 中之积分 .因为 dωα 之
M
(1 ) n Fj
支集不会超 出 ωα 之 支 集 , 所 以 不 妨 就 设 它 的 积 分 域是 R , 而 被 积 函 数 形 如 ∑ i , Fj ∈
i, j x
∞ n
C0 ( R ) , 但是由微积分的基本定理即有
Fj
∫ n
xi
d x = 0,
R
所以所有的
∫dω
(1)
α = 0 .
M
∫
( 2) n
再看 dωβ .和上面一样的理由 , 可以设它的积分域是 H 的一个很大的单形σβ , 而这个单形有一
M
n
个面在 x = 0 上 , 由于在单形上斯托克斯定理是成立的 , 所以
∫ ∫ ∫
(2) (2) (2 )
dωβ = dωβ = ωβ .
M σ σ
β β
(2 ) n
但是 ωβ 又是有紧支集的 ——— 在 R 的开集中 , 紧子集离开集的边界点是有一定距离的 .但现在
n n (2 )
σβ 是在 H 中 , 它的支集可以直到 x = 0 , 即上面讲的 Vβ 之像 .但我们仍用 Vβ 表示 supp ωβ 在
n
x = 0 上的部分 , 所以有
∫ ∫
( 2) (2)
ωβ = ωβ .
σ V
β β
对 β求和后有
∑∫ ∑∫ ∑∫
( 2) ( 2) (2)
dωβ = ωβ = ωβ .
β M β V β M
β
(1)
因为 ωα = 0 , 所以综合以上结果有
M
∫dω =∫ω . M M
定理证毕 .
以上我们是将定理归结到单形的情况 .上一段我 们已讲 了如 何在 单形边 缘上 规定定 向以 便
2
使 = 0 , 所以在以上的结果中 M 上自动有一个定向使斯托克斯定理成立 .这个使得斯托克斯
定理得以成立的 M 之定向称为由 M 的定向在 M 上诱导的定向 ( induced orientation on M) .
我们现在来具体算出这个诱导定向 .
n
我们仍用上面的记号 , 并设在 M 中的定向 ( 其实就是在坐标邻域 φα ( U ) R 中的定向 ) 即
§5 微分形式在流形上的积分 5 29
1 n
为 ( x , … , x ) .我们仍然在单形 σ上考虑ω .σα 是不必考虑的 , 因为在 σα 上ωα = 0 , 因此我们只
n
来看 Uβ 和ωβ .supp ωβ 中有一部分 Vβ 位于 σβ 的 { x = 0} 上 , 除此以外 , 在 σβ 上 ωβ = 0 , 凡此
1 n-1
种种均不必重复 , 而且下面我们都把下标 β略去 .我们可以假设 ω = a( x ) d x ∧ … ∧ d x .因
n n n
为 ω中其它各项均含 d x , 而在 σ之位于{ x = 0} 上的一部分中自然有 d x = 0 , 从而 ω = 0 .
在 σ的其它部分上因为已设系数 ( 例如 a( x ) ) 是有紧支集的从而为 0 , 所以 ω中其它各项在 σ
上全为 0 .这样我们只需考虑
∫a( x ) d x
1 n-1
∧ … ∧ dx n
.
x = 0
V
β
n- 1
把它化成 R 上的黎曼积分成为
∫ ∫ ∫
1 n- 1 1 n-1
ω= a( x ) n = 0 d x ∧ … ∧ d x
x = ε a( x ) n
d x …d x ,
x = 0
σ V V
β β
∫ dω =∫ω应有
1 n
里不出现 ε是因为我们已规定了σ中的定向是标准定向 ( x , … , x ) .于是由
σ
σ
α( x ) 1
∫ ∫
1 n- 1 n-1 n
ε a( x ) n
d x …d x = ( - 1) n d x …d x .
V
x =0
σ
x
β
n
因为 a( x ) 是有紧支集的 , 所以不妨认为它定义在整个 H 上 , 而在 supp a( x ) 以外恒为 0 , 于是
上式成为
a( x ) 1
∫ a( x ) ∫
1 n-1 n- 1 n
ε n
d x …d x = ( - 1) n d x …d x .
n- 1
x =0
n
x
R R
但这是一个通常的黎曼积分等式 , 对其右方应用逐次积分 , 有
+∞
a( x ) 1 a( x ) n
∫ ∫ ∫ ∫
n 1 n- 1 1 n-1
n d x …d x = d x …d x n dx = - a( x ) n
d x …d x .
n
x n- 1
0 x x =0
R R
n
这里我们利用了 a 具有紧支集 , 因此当 x = + ∞ 时 a( x ) = 0 .代入上式即得
n
ε = ( - 1) . (28)
n 1 n- 1
这就告诉我们 , M 上的诱导定向应使ε = ( - 1) M 上的自然定向是 ( x , … , x ) .这个
n
结论与通常微积分教材上的是一致的 , 因为通常的微积分 教材在这 里都用了 法向量 .在 R 中 有
图7- 5- 7
( α)
矩阵 ( g i j ( P) ) 定义 v 与 w 之一个正定的内积 :
( α) i j
〈v , w〉α = g i j ( P) vα wα .
现在用单位分解把各个 Uα 上的内积“拼合”起来 , 就可以定义切丛 TM 上的内积
( α)
∑φ ( P) g
i j
〈v , w〉( P) = α ij ( P) vα wα . (30)
α
即得所求的黎曼度量 .证毕
( α)
如果我们令 g ij ( P) = δij , 即在 P 点给出的是欧几里得度量 , 则黎曼度量其实就是由欧几里
得度量拼合起来的 .但是 , 在 T P M 上可以有许多不同的内积 , 对 应于各不 相同的 正交矩阵 , 所 以
M 上也就有无限多种不同的黎曼度量 .
现在回到在 M 上如何定义积分的问题 .上述度量是对 于作为 线性空 间的内 积来 定义 的 .即
令在 M 上给定了一个度量 , 还会因为局部坐标的选择 而得到不 同的表示 .在 通常 的微积 分教 本
中 , 我们总是认为欧几里得的度量 ( 即 gij = δi j ) 是最“自然”的 , 因而讲一维空间上的积 分 , 我 们
总是用 d x 作测度 .二重积分则一定是对 d xd y 而言 .尽管许多 书上一 再强调 不要 把它看 成互 相
正交的 d x 和 d y 相乘 , 而要看成某一个整体 dσ, 特别讲到某一个区域的可测性 ——— 若尔当可测
和勒贝格可测 ——— 就必须这样 .只在讲到富比尼定理时 , 才说 dσ是互相正交的两个轴上的测度
d x 与 d y 之积 .但是对于我们 , 把 d xd y 与一个正交的坐标系联系在一起 , 这个阴影总是挥之不去
n
的 .这是有深刻理由的 .在 §3 定义 6 中 , 正是借助于 R 中某个度量 ( gi j ) 下的 o .n .系 , 来对任意
n 1 n
具有相同定向的基底{ e1 , … , en } 来定义 R 中的体积元 | g | e ∧ … ∧ e .对于黎曼流形 .首先
是采用黎曼度量 ( gij ) .因为它是正定的 , 所以 | g | = | det ( g ij ) | = det ( gi j ) = g , 而且我们就以切
空间上的外微分形式来作为 M 上的体积形式 .
定义 5 设 M 为一可定向的 n 维黎曼流形 , ( gi j ) 为其度量 , 则对任一与此定向相协调的 局
部坐标系 ,
5 32 第七章 微分流形上的微积分
1 n
η= gd x ∧ … ∧ d x , g = det ( gi j ) , (31)
称为其典则的 ( 或自然的 ) 体积形式 ( 或体积元 ) .
这个定义是合理的 , 因为仿§3 定义 6 之 说明 ( 见 ( 33 ) 式 ) 知道 ( 31 ) 是与局 部坐 标的 选择 无
关的 .
由于黎曼流形上有度量 , 所以霍奇 * 算子是可定义的 , 容易看到
1 n
* ( 1) = gd x ∧ … ∧ d x . (32)
定义 6 若 f 是 M 上一个连续的有紧支集的函数 ( 或 M 为紧 ) , 则定义 f 在 M 上的积分为
∫f =∫fη =∫* ( f )
M M M
(33)
∫f ( x )
1 n
= gd x … d x .
M
α
∫
(33) 的最后一项应理解为 ∑ fα , 这个技巧我们已经使用了多次 , 这里就不再详细说明了 .
M
图7- 5- 8
式 fη 在流形 M 上的积分 .
我们想回到通常微积分教本中对曲面积分的讲法 , 这可以 帮助我们 理解为 什么说 (31) 是 体
3 3
积形式 .设有一个曲面 M 在 R 中 , 我们把 R 看成它的包含空间 .在 M 上取一个区域 D, 并设它
2
对应于参数 ( u , v ) 空间的区域 Ω( 图 7 - 5 - 8) .于是 D 可以认为是 R 中的区域 Ω 在映射
Φ: x = x ( u , v ) , y = y ( u , v ) , z = z( u , v ) (34)
下的像 .设以 u 轴和 v 轴方向上的长为 d u , d v 的向量 A B , AC 为棱的矩形被映到 M 上的小区域
§5 微分形式在流形上的积分 5 33
( x u i + yu j + z u k) d u 与 ( xv i + yv j + zv k) d v .
而 A1 B1 C1 …… 之面积将成为
* ( ( x u i + yu j + z u k) d u ∧ ( xv i + yv j + z v k) d v )
= ( yu z v - yv z u ) i + ( z u xv - zv xu ) j + ( x u yv - x v yu ) k d ud v . (35)
它是切平面上的小区域之面积而不是 M 上小区域 的面积 .我 们说二者 相差一 个高 阶无穷 小量 ,
至少应该先已明确了 M 上确有面积存在 .在通常的积分学中 , 用准确的说法 , 我们是说这些切平
面上小区域之面积和有极限 , 而面积和与其极限之差 为无穷 小量 , 现 在我 们暂不 想去 深究 .只 想
指出 ( 35 ) 左方 * 后的外乘积就是面积形式 ( 面积元 ) .怎样从这里衍生出 g 来呢 ?下面马上就清
楚了 .
(35) 是把面积作为一个向量来表出的 , 但是我们想把它的“ 数值”, 即向量长 算出来 , 经过 简
单计算 , 设 d u , d v ≥ 0 , 面积数值用 dσ( dσ≥ 0 ) 表示 , 有
2 2 2
dσ= ( yu z v - yv zu ) + ( z u x v - z v x u ) + ( xu yv - xv yu ) d ud v
2 2 2 2 2 2 2
= ( x u + y u + z u ) ( x v + y v + z v ) - ( xu xv + yu yv + z u z v ) d ud v
2
= EG - F d ud v . (36)
2 2
2 2 2 2 2 2 2 2
E = x u + yu + z u = A 1 B1 ( d u ) , G = x v + yv + zv = A1 C1 ( d v) ,
F = xu xv + yu yv + zu zv = ( A1 B1・A1 C1 ) d ud v .
2 2
E , F, G 的表达式在通常的微积分教本中都有 , 只是没有指出例如 E = ( A1 B1 ) ( d u ) 而已 .
但是 , 用 向量 表 示 面积 终 属不 便 .为 此 , 我们 在 M 上 A1 点 取 一个 单 位 法线 向 量 n, 并 使
( A1 B1 , A 1 C1 , n) 成为右手系 .( 或者说选 n 就是 A1 B1 × A1 C1 方向的单位向量 ) .也就 是说 , 如
果在 ( u , v ) 平面上再加上 w 轴使 ( u , v , w ) 成右手系 , 则 ( 34 ) 保持定向不变 .我们通常的说法是
面积元 dσ是在曲面 M 上 n 所 指 的 一 侧 .这 样做 最 大 的 优 点 是 面 积 将 始 终 为 正 .因 为 这 时 以
3
( A1 B1 , A1 C1 , n) 为棱的平行六面体之体积 ( 它 一定是 正的 , 因为三 个棱 的定向 与 R 中 右手 坐
标系定向一致 ) 之数值与底面积 A 1 B1 C1 …… 数值一致 .而体积是用混合积表示的 :
* ( A1 B1 ∧ A1 C1 ∧ n) = n・ ( A1 B1 × A1 C1 ) = A1 B1 × A1 C1 .
最后一式的来源是 A1 B1 × A1 C1 与 n 有相同方向 .按通常的向量公式计算又得 (36) 式 .总之 我
们得到了一个正的面积的公式 , 而通常微积分教本中曲面面积公式
5 34 第七章 微分流形上的微积分
2
EG - F d ud v
Ω
及其符号规定均由此而来 .
3
E , F, G 和度量有什么关系呢 ?在 R 中有欧几里得度量
2 2 2 2
ds = dx + dy + d z .
以 (34) 代入 , 即得 M 上的一个度量
2 2 2 2
d s = ( x u d u + x v d v ) + ( yu d u + yv d v ) + ( z u d u + z v d v )
2 2
= Ed u + Fd ud v + Fd vd u + Gd v .
2
可见 E = g11 , F = g12 , G = g22 , 而 EG - F = g . g = | g | , 因 为 g 是 正 定 的 .可 见
2 2 2
EG - F d u ∧ d v 就是 M 上之面积形式( 面积元 ) , EG - F d ud v = * ( EG - F d u ∧ d v) 就
是面积 .
3
不过我们在 M 上给出的度量是由 R 中的欧几里得度量衍生 ( 诱导 ) 而来的 .通常的曲 线 L
3
也是作为一个一维流形 , 放在包含空间 R 中 , 由后者的欧几里得度量即可诱导出 L 之通常的 弧
长公式 .如果考虑一般的流形 , 其度量不一定是由包含空 间的 欧几里 得度 量诱导 而来 , 我 们就 说
1 n 1 n
gd x ∧ … ∧ d x 是 其 体 积形 式 (体 积 元) . 也 应 该说 * ( gd x ∧ … ∧ dx ) =
1 n i
gd x … d x ( d x ≥ 0) 是体积 .
求曲线弧长时 , 例如求圆周长时 , 我们既可以用 内接 正多 边形求 极限 , 也 可以 用外切 多边 形
求极限 .第一章介绍穷竭法时就讲到这一点 .可是求曲面面积则不一样 .很早就有例子表明 , 一个
曲面简单如圆柱面 , 若用内接多面体求极限甚至会求 出无穷 大 !但是 对可 微曲面 , 若用外 切多 面
体求极限就不会有这样的问题 .好在我们是用 ( u , v ) 平面上的 A BC…… 经切映射得到曲面的切
平面上的 A1 B1 C1 …… , 所以不会有这样的困难 .
然而 , 研究黎曼 流形上的 函数的积 分 , 主要目 的却不 在于此 .现 在 , 我们想 要在黎曼 流形 M
2
上建立 L 理论 .为了建立这样一个理论 , 本来不必要求 M 是黎曼流形 , 但是确实需要在 M 上能
够定义正的测度 .对一般的微分流形 , 当然也可以仿照定理 6 的作法 , 先作一个坐标邻域的图册 ,
1 n
而在每个坐标邻域 Uα 中利用局部坐标定义一个测度 , 例如勒贝格测度 dμ = d x … d x , 再用单
位分解把它们拼合起来 , 只不过这样作出来的测度没有对坐标的不变性罢了 .而我们作出的黎曼
1 n 1 n
度量以及体积形式也就给了我们一个正的测度 dσ = * ( gd x ∧ … ∧ d x ) = gd x … d x ,
所以我们仍设 M 为一黎曼流形 , 其上有度量 ( gij ) .
2 2
为了建立 L 理论 , 我们 不必如第四章中 那样从可测函数 开始 , 而只要注意到 , L 理论的 基
础是定义内积 .如果有了两个 p 微分形式 ω和σ, 而可以定义其内积 ( ω, σ) ( 请读 者特别 注意 , 我
们这里没有用〈ω, σ
〉这样的记号 , 并不是由于现在的 ω与σ是复的对象 , 而是因为我们在 §3 定
2
理 8 中已用了〈ω,σ〉这个 记号 而 且马 上 就 要再 引 用它 ) , 因 此 也就 可 以 定义 其 范数 ‖ω‖ =
∞
( ω, ω) , 本来 , 我们讲的所有微分形式都是 C 的 , 但是有了范数以后 , 就可以把它们按此范数 完
2 n
备化而得出 L 空间 .至于 ( ω,σ) 的作法 , 在 § 3 中已在一个 n 维线性空间 R 中定义了〈ω,σ〉 .
∞
现在取此空间为 TP M , 则〈ω,σ〉之值因 P 而异成了一个函数 .因为 ω,σ是 C 的外微分形式 , 所
∞
以〈ω, σ
〉( P) 是 M 上的 C 函数 , 今设它们都有紧支集 ( 或者设 M 为紧 ) ——— 这个假设的作用在
于回避反常积分 , 前面已见过多次 ——— 我们有
§5 微分形式在流形上的积分 5 35
∞
定义 7 设 M 为一 可 定 向 的黎 曼 流 形 .ω 和 σ 为 其 上 的紧 支 集 C0 p 微 分 形式 ( 或 设 M
为紧 ) , 则可以定义它们的内积为
∫ ∫
1 n
( ω,σ) = 〈ω,σ〉 = 〈ω,σ
〉( x ) gd x … d x , (37)
2
然后就可以用完备化定义 M 上的平方可积函数空间 L ( M ) .
2
有了 L ( M ) 的理论 , 也就是有了 M 上的希尔伯特空间理论 .而且还可以进一步定 义 M 上
的索波列 夫 空 间 , 可 以 定 义 M 上 的 广 义 函 数 理 论 等 等 . 可 是 我 们 现 在 只 想 简 单 地 讲 一 下
Laplace-Balt rami 算子 .
上节末我们把 Laplace-Beltrami 算子定义为
p n p n
Δ = dδ+ δd : F (R ) → F ( R ) ,
这里的 δ在上节中说是 d 的“ 对偶”算子 , 其定义是 §4 的 (37) 式 .其中用到了霍奇 * 算子 , 其定
n
义及性质见 §3 定理 9 与定理 10 , 其中用到一个参数 s 是由于定义 * 时要考虑到 R 中的度量 .
度量是用一个非蜕化对称矩阵来定义的 .对称矩阵只有实特征根 , 其中正特征根与负特征根个数
都是重要的不变量 . s 就是负特征根个 数 .现 在我 们用 的 黎曼 度量 相应 于正 定 矩阵 ( gij ) , 所 以 s
= 0 .这样由 §3 的 (39) ,
p( n - p)
* * = ( - 1) ,
而有
-1 p ( n - p)
* = ( - 1) * . (38)
n n t n n
那么 , 上节说 δ是 d 的对偶是什么意义呢 ?例如 n 阶矩阵 A : R → R 的转置矩阵 A : R → R , 可
以由
t
〈A u , v〉 = 〈u , A v〉
n p n
来定义 〈
. ・,・〉是 R 的内积 .现在我们考虑的是 F (R ) , 其中的内积由 (37) 定义 .我们要证明 d
t
与 δ的关系就如同矩阵 A 与 A 的关系一样 :
( dω,σ) = ( ω,δσ) . (39)
∞ p-1 p n
这里 ω,σ是具有紧支集的 C 的 F ( M ) 与 F ( M ) 中之元 .但与 R 的情况不同 , 那里的 u , v
n 2
应是 R 中的任意元 , 现在一方面例如 d 涉及微分 , 所以对任意的 ω∈ L ( M ) , dω不一定有意义 ,
再则 (39) 很像 分部积 分法 , 这一 点与第 四章讲的 广义函 数一比较 就清楚了 .要作 分部积 分就 会
∞
出现积分号外之项 , 而我们又必须设法消除它们 .为此我们设 ω, σ均为有紧支集的 C0 的外微分
形式 .这样我们就绕过了 d 与 δ的定 义域究竟是什么 这个问题 .而回避了这 个问题以后 , 我们 就
说 δ是 d 的形式伴算子 (formal adjoin t operator) , 这样我们就有
p-1 p ∞
定理 7 δ是 d 的形式伴算子 , 即若设 ω∈ F ( M ) , σ∈ F ( M ) 均为 C 的而且有紧支集 ,
则有下式成立 :
( dω,σ) = ( ω,δσ) . (39)
n- p n-1
证 由 * 的定义 , * σ∈ F ( M ) , 从而 ω∧ * σ∈ F ( M ) , 而 d( ω∧ * σ) 有意义 .由
外微分算子之性质有
p- 1
d( ω∧ * σ) = dω∧ * σ+ ( - 1) ω∧ d * σ
p -1
= dω∧ * σ - ω∧ * ( - 1) * d *σ
= dω∧ * σ - ω∧ * δ
σ = 〈dω, σ
〉 - 〈ω,δσ
〉.
5 36 第七章 微分流形上的微积分
- 1
这里我们用了 §4 中 δ的定义 ( 39 ) 式以及 * * = id .双方在 M 上积分并用斯托克斯定理 , 即
知左方积分为 0 而得 (39) 式 , 定理证毕 .
这个定理的证明看起来只是形式演算 , 实际上与 用分部 积分 法是一 样的 .说 到底 , 分 部积 分
法也只是一个形式演算 .
最后我们再来看 Laplace-Beltrami 算子的具体表示 .§ 4 中当 度量 矩阵是 对角 阵时给 出了 所
0
需结果 , 现在要看对于一般的黎曼度量 ( gi j ) 又当如何 .我们仍然只看对于 u ∈ F ( M ) ,Δu 怎样
p p-1 0 ∞ -1
表示 .注意到 δ: F ( M ) → F ( M ) , 当 p = 0 时 F ( M ) 即 C 函数 , 而 F ( M ) 只好说是 0 元
0 ∞
素的空间 , 因此 δu = 0 .这样Δ u = δd u .我们假设 u ∈ F ( M ) , 但设 φ∈ C ( M ) , 这与广义函 0
数论中的试验函数是一致的 .于是
∫Δ u・φ
1 n
gd x ∧ … ∧ d x = (δd u , φ) = ( d u , dφ)
M
∫
1 n
= 〈d u , dφ〉 gd x … d x
M
u φ
∫g
ij 1 n
= i j gd x … d x
M
x x
1 u
∫
ij 1 n
= - j gg i φ g d x …d x .
M g x x
所以有
1 ij u
Δu = - j gg i . (40)
g x x
我们前面已证明了
Δ = - div grad,
与 (40) 比较 , 我们应定义 u 之梯度是一个向量场 :
ij u
grad u = g i j . (41)
x x
这是由于这样定义 grad u 后 , 对任意向量场 X 我们有
〈grad u , X〉 = X( u ) = d u( X ) . (42)
i
而且对于向量场 X = X i , 应定义
x
1 j 1 ij
div X = j ( gX ) = j ( gg 〈X , 〉) .
i (43)
g x g x x
这样一来
Δ u = - div grad u
仍成立 .
但是对高次的微分形式 u ,Δ u 的计算是比较复杂的 .它涉及许多较深入的微分几何问题 .
§6 结束语———麦克斯韦方程组简介 5 37
§6 结束语———麦克斯韦方程组简介
本书即将 结束了 .回顾一下 , 我们在 很简略地 介绍了 一点希腊 数学中 有关极 限理论 的研 究
以后 , 很快地就转入了微分学和积分学 .我们介绍了牛顿 如何 从开普 勒三 定律得 出引 力定 律 , 解
决了当时 (17 世纪中叶 ) 科学中最重要的问题 : 太阳系的 运行 规律 .而 微积分 又如 何由此 形成 一
门系统的科学 .我们现在通用的微积分教材中常讲 的一些 静力学 问题 时代 更早 , 都 是 17 世纪 前
科学中的重要问题 .几何光学虽然稍晚一些也差不太 多 .应用 范围虽 然很 大 , 出现 的数学 问题 虽
然形形色色 , 解决这些问题的思想都是一样的 : 都涉及如何处理无穷小量 : 对于微分学 , 就是允许
略去高阶无穷小量 .对于积分 学实际 上是“无穷 多个无穷 小”如何求和 的问题 .虽然从希 腊人 起
就知道存在这些问 题 , 但是过 多的思 辨、抽象的 议论 ( 在当 时条件 也只能如 此 ) 使得对这 些问 题
的解决完全不能适应数学发展的需要 .一直到 19 世纪中 下叶 , 人 们才 摆脱了 那些 抽象的 哲学 思
辨 , 以及缺少分析的直觉 .现在通用的微积分教本的讲 法正是 反映 了 19 世纪 下半 叶我们 对无 穷
小、极限等概念的理解 : 既摆脱了抽象的哲学思辨 , 也摆脱了缺少分析 ——— 主要指逻辑上的分析
——— 的直觉 .我们掌握了它 , 也就可以有把握地前进了 .这一段历史 表明了 数学的发 展与牛顿 所
实现的科学上的第一次大综合的关系何等密切 .由于数学发展到如此成熟的地步 , 我们今天甚至
可以使用一些很直观的语言 , 而不必担心会产生什么问题 .本书里对微分学和积分学的讲法也无
非是从今天的角度再次解释这些基本概念的现代的理解和表述 .说到底还是牛顿的伟大成就 .由
于是牛顿的成就的反映 , 所以还有一个非常重要的特点是 : 解决各种物理问题 , 都是 在牛顿的 框
架思路之下 : 问题本身都很明确 , 解决问题所用到的数学理论也很明确 , 没有太大的变化 .当然有
些问题难度很大 .现在的问题是 , 自微积分学系统地形成了以后 , 有没有更重要的新发展 ?我们在
本书中实际上介绍了一些重要发展 , 例如变分法、勒贝格 积分 及其在 研究 随机现 象上 的应 用 , 还
有调和分析 .它们都有自己的非常广阔的前途 , 都已经超 越了 牛顿的 框架 .但 下面 我们还 要介 绍
一下麦克斯韦 ( 以下都简记为 M ) 关于电磁场的理论 .一方面因为它可以说是物理科 学自牛顿 以
后第二次伟大的综合 , 而且直接为 20 世纪物理学的大革命 ——— 相对论的出现 ——— 开辟了道路 :
M 理论本质上是相对论性的 .更重要的是它所需要的数学与牛顿时代大不相 同了 .19 世 纪中叶 ,
自从高斯、黎曼以后 , 空间的本性问题以一种远远超越哲 学思 辨的形 态提 到人们 面前 .空 间既 然
已不一定限于三维平直的空间 , 则人们很自然地 先是考 查高 维但 是平直 的空 间 ——— 线性 空间 .
于是我们有了线性代数 , 它的作用远不止我们在微分学一章中指出的线性化 , 即作为一般非线性
问题的近似 .它是一个伟大框架前提的一部分 .人们一 直试图 寻找 新的刻 画大 自然 的数学 工具 ,
例如哈密顿 ( W .R .Hamilton , 一位非常重要 的数 学家 和 物理 学家 ) 研究 四元 数就 是 这个 企图 的
表现 .那时 , 四元数十分为 人们看 好 .例如 M 本 人还有 凯尔 文勋 爵 ( Lord Kelvin, 真名 是 William
Thomson) 都想用四元数来作为研究电磁现象的基本工具 .而 现在 知道四 元数 的人 已经不 多了 .
线性代数的研究看来一直是探讨空间本性的大潮流的一 个部 分 , 不过 因为它 是考 察一些 最基 本
的结构 , 而当时这批数学家所关心的应用问题我们 又不甚 熟悉 , 所 以现在 人们 都感 到它太 抽象 ,
似乎与牛顿大相径庭了 .其实并不全然如此 .这个潮流中 有一 位很深 刻的 数学家 格拉 斯曼 .他 的
重要性似乎今天大多数读者估计不足 .到 20 世纪初 , 开拓了比较系统的关于弯曲空间的研究 , 有
5 38 第七章 微分流形上的微积分
A・ ndσ = A1 d yd z + A 2 d zd x + A3 d xd y;
S S
∫A・ds =∫A d x +
L L
1 A2 d y + A 3 d z .
j .ndσ.
S
至于电荷的密度 ρ, 则没有任何困难 .
考虑 j 的通量即得到一个基本的事实 ——— 电荷守恒 .设曲 面 S 包围 了区域 Ω, 而有电流 流
入 , 电流密度向量为 j ( 图 7 - 6 - 1) , 于是在时间 d t 内由 Ω外经过 S 流
入 Ω 的电量 ( 注意 , M 一直是以流体作为电的模型的 ) 是
- d t j・ ndσ.
S
ρ
dt + div j d xd yd z = 0 .
Ω
λt
因此得到连续性方程
ρ
+ div j = 0 . ( 1)
t
这是电磁现象第一个基本的事实———电荷守恒 .
除此以外 , M 总结了当时关于电磁现象的全部研究成果 , 提出了著名的 M 方程组 .这里应该
指出 M 与牛顿的不同 .牛顿在《原理》一书中是把他的三定律当作欧几里得的《几何原本》中的公
理对待 , 而由 此推导出其它一切 结论 .M 则不同 , 他是把以 前的全部成果特别 是实验成果整理 归
结为四个方程 , 后来人们才称为 M 方程组 .而且如电荷守恒这样最基本的 事实也没 有列入 M 方
程组中 .
首先看电场 E 与磁场 B 的通量 .关于电场通量 , 高斯早就证明了 , 穿过封闭曲面 S 的 E 之通
量等于 Ω 中的电荷 .于是应用推导连续性方程的方法即得
div E = 4πρ . (Ⅰ)
注意 , M 方程组 的 写法 各 书常 有 不 同 , 这 里 是 讨 论真 空 中 的 场 , 并 采 用 了 高 斯 ——— MKS 单 位
制 ① .其实方程 ( Ⅰ ) 高斯早已得出 , 并不是 M 的方程 .
用同样方法处理磁场 B, 由于磁 单极 是不 存 在的 : 有磁 南 极则 必有 大小 相同 的 磁北 极在 一
起 , 因此总磁荷必为 0 .这样相应于 ( 1) 必有
div B = 0 . (Ⅱ)
∫A・ds =
L S
(curl A) n dσ .
应用斯托克斯定理有
1 B
(curl E) n dσ = - dσ .
S
c S
t n
1 E 4π
curl B = + j. (Ⅳ)
c t c
这真是神来之笔 !尽管 M 是从一个不合适的连 续介 质模 型出发 , 可是 得到了 一个 十分重 要的 结
论 , 它有十分重要的推 论 , 而 且得到了实验的 证明 .总之 , M 方程组现在是 完备了 , 它成为电动 力
学 ( 电磁场随着时间变化 , 所以称为动力学 ) 的基础 .
由于位移电流概念的极大的重要性 , 我们再从数学角度来考察它 , 看一下为什么没有位移电
流会产生矛盾 .设有电路如图 7 - 6 - 2 , 导线上有传导电流 j , 而导
线连接着电容器的两极 .电容器的两 极间不是 导体 , 而 可能是 某种
媒质 , 其中没有传导电流 .我们按 (2 ) 那样来分析这个电路 , 作一条
绕着导线的曲线 L , 并以 L 为边缘作一个曲面 S1 , 它 与导线相 交 .
在 S1 上指定某一侧的法线为 n .于是 L = S , 而且 L 上有诱导定
3
向 , 如图 上实线 箭头 所示 .诱导定 向是 由 R 中指定 了一 个定 向以
3
后才有的 .我们 指定 的是 R 中用 右手 系 .但 实际上 即使 指定 为左
手系也无关 , 最后会得出同样的矛 盾 .研究 B 在 L 上 的环 流 , 于是
3
F = ke1 e2 r r ( 这里取 k = 1 , 因为我们采用了高斯 ———CGS 单位制 ) , 但是可能不少读者不曾注
意到 , 库伦定律只适用于静止电荷 , 其理由正在于避开了 磁效 应 .同时 适用于 电磁 场中作 用于 运
动电荷的力的公式则是洛伦兹力的公式 :
q
F = qE + v× B . ( 3)
c
其实 , 磁场强度 B 的定义就是 (3 ) 式 : 磁场强度是一个向量 , 它规定了 作用在一 运动电荷 上
而且与速度成正比的那一部分力 .
上面我们说了库伦定律只对静 止电 荷成 立 , 但是 高斯 定律即 ( Ⅰ ) 则 在任 何情 况 下都 成立 ,
而且这可以看成是一个实验事实 .
选择一定的参考系并且考虑这种选择是否会对物理 定律 有影响 , 人们自 然会 得到以 下的 结
论 : 当参考系变动时 , 物理定律应该是协变的 .即由 一个参考 系中 该物 理定律 的数 学形式 应该 能
得出任一参考系中该定律的相应形式 .这就是一般的 相对性 原理 .但 是这 个原理 之所 以有 效 , 却
不是由抽象的思辨得出的 , 而是长期的实验和理论分 析的结 果 .首先 从牛 顿力学 谈起 .牛 顿力 学
主要讲惯性系 , 惯 性系就是惯性定律 在其中成立的参 考系 .如果 Ox yz 是 一个惯性系 而 O′x′
y′z′
对它作匀速直线运动 , 则 O′x′y′z′也是一个惯性系 .在这两个惯性系中一切力学定律形式都是相
同的 .或者换一个常用的说法 , 在一个参考系中作任何力学实验均无法确定它是静止的还是作匀
速直线运动 .这个原理称为狭义相对性原理 , 因为它只涉及力学实验 .现在给它一个数学表述 .观
测者所在的参考系 O x yz 称为实验室参考系 , 他在此参考系中观测某一个物理 对象 .我们常将 另
一个参考系 O′x′
y′z′附着在被观测的对象上 , 并称之为附着参考系 .这个物理对象在实验室中运
动就说 O′
x′y′z′在 O xyz 中运动 .如果 O′x′y′z′在 O xyz 中作匀速直线运动 , 为简单起见 , 设这两
个参考系的坐标轴平行 , 而前者沿 x 轴方向以常速 v 运动 , 我们就会有
x = x′- v t′, y = y′, z = z′; t = t′ ( 4)
( 见图 7 - 6 - 3 ) .(4 ) 称为伽利略变换 .于是牛顿力学中的狭义 相对应性 原理可 以表述为 : 一切 力
学定律在伽利略变换下 是协 变 的 ( 不 变的 ) .若 这两 个 参考 系
同为惯性系 , 则 它 们 在力 学 上 是 完 全等 价 的 , 谁 也 不 比 谁 优
越 : 庄周梦见自己变成了蝴蝶 , 也可以说是蝴蝶梦 见自己变 成
了庄周 .两个说法谁也说服不了谁 .因为在此变换 中时间是 不
变的 , 而空间坐标则发生了变化 , 所以我们说在牛 顿力学中 时
间仍然是绝对 的 , 但 绝对 空 间 不 存 在了 , 是 在 力 学 中 找 不 到
的 .在有了电磁场 理论 以后 , 人 们自 然 会问 : 是 否任 何 物理 实
图7- 6- 3
验 ( 不只是力学实验 ) 均不能在两个惯性系中区别 出何者为 静
止的 ? 如果都不能区别 , 就说有 广义 相对 性原 理成 立 , M 不 是把 电磁 场看 成 某种 媒质———以 太
中的场么 ? 如果真是这样 , 岂不是可以把以太当作一个具有特殊优越性的空间参考系 , 而宣称在
电磁学中找到了绝对空间么 ? 以太是否存在 ? 光速问题给了我们一个线索 .
M 方程组中的 c 正是光速 , 这不但 M 早已知道 , 更早一 些韦伯 和克希荷 夫也 从其它 角度 知
道 .但一直到 1888 年赫兹 ( Heinrich Her tz) 发现了由纯粹的电磁过程产生的电磁波具有光的一切
性质 , 才最后明确了光的本性就是电磁波 .那么假定以太如一条 小河以速 度 v 流 淌 .我们泛舟 顺
流而下 , 向小船前进方向 射出一束光子 , 即光线 , 其速 度为 c, 则岸上的观 测者看到的 光速应是 c
§6 结束语———麦克斯韦方程组简介 5 43
∑( x
2 0 0 2 i i 2
I ( x , y) = ( x - y ) - - y) ( 6)
i =1
用 ω表示 2 阶微分形式
i+ 1 i+ 2
ω = Bi d x ∧dx . ( 8)
i
( i , i + 1 , i + 2 ) 是 (1 , 2 , 3 ) 的轮换排列 , 再令 σ = Ei d x 为一个 1 阶微分形式 , 则由斯托克斯定
理,有
1 ・
∫ Ω
σ=
Ω
dσ = -
cΩ
ω.
因此我们可把方程 ( Ⅲ ) 用外微分形式改写为
§6 结束语———麦克斯韦方程组简介 5 45
1・
dσ = - ω.
c
可以看到 ω应是我们想求的二阶反对称协变张量的“ 一部分”.按我 们记二 阶反对称 协变张量 的
分量 Aμv 时规定 μ < v , 所以应把 ω写成
2 3 1 3 1 2
ω = B1 d x ∧ d x - B2 d x ∧ d x + B3 d x ∧ d x .
0 1 0 2 0 3
另一部分应是 (・) d x ∧ d x + (・) d x ∧ d x + (・) d x ∧ d x , 这些未定的系数当然也可以从物
理上推导出来 , 但因为要利用闵可夫斯基 力与“ 内部乘 积”( in terior product ) 的 概念 , 都是 我们 未
曾讲到的 , 所以我们只好试一下 , 令它们为 E1 , E2 , E3 于是得到
1 2 3 0 2 3 1 3 1 2
F = ( E1 d x + E2 d x + E3 d x ) ∧ d x + B1 d x ∧ d x - B2 d x ∧ d x + B3 d x ∧ d x .
( 9)
B1 1 B1
现在看一下 d F = 0 究竟是什么 .它是一个 3 阶外微分 , 把它算出来 , 并注意到例如 0 = ,
x c t
即有
E3 E2 0 2 3 E2 E1 0 1 2
dF = 2 - 3 dx ∧ dx ∧ dx + 1 - 2 dx ∧ dx ∧ dx
x x x x
E3 E1 0 1 3 1 B1 0 2 3
+ 1 - 3 dx ∧ dx ∧ dx + dx ∧ dx ∧ dx
x x c t
1 B2 0 1 3 1 B3 0 1 2
- dx ∧ dx ∧ dx + dx ∧ dx ∧ dx
c t c t
B1 B2 B3 1 2 3
+ 1 + 2 + 3 dx ∧ dx ∧ dx .
x x x
所以 d F = 0 就化成了 M 方程组中的 ( Ⅲ ) 与 ( Ⅱ )
1 B
curl E = - , div B = 0 .
c t
可见 F 的选法是正确的 .
现在看一下 , 这样选择的 F 怎样把真向量 E 与赝向量 B 结合起来 .为此改到左手坐标系 , 这
2 3
就相当于把 x 与 x 对调一下 , 于是 F 就变成了
图7 - 6 - 4
5 46 第七章 微分流形上的微积分
~ 1 3 2 0
F = ( E1 d x + E2 d x + E3 d x ) ∧ d x
3 2 1 2 1 3
+ B1 d x ∧ d x - B2 d x ∧ d x + B3 d x ∧ d x
1 2 3 0 2 3 1 2 1 3
= ( E1 d x + E3 d x + E2 d x ) ∧ d x - B1 d x ∧ d x - B2 d x ∧ d x + B3 d x ∧ d x .
如果仍把它写为
~ ~ 1 ~ 2 ~ 3 0 ~ 2 3 ~ 1 3 ~ 1 2
F = ( E1 d x + E2 d x + E3 d x ) ∧ d x + B1 d x ∧ d x - B2 d x ∧ d x + B3 d x ∧ d x .
就看出 , 电场强度变成了
~ ~ ~
( E1 , E2 , E3 ) → ( E1 , E2 , E3 ) = ( E1 , E3 , E2 ) :
这只把第二、三分量对换 , 所以是真向量 ; 但是磁场的变化却是
~ ~ ~
( B1 , B2 , B3 ) → ( B1 , B2 , B3 ) = - ( B1 , B3 , B2 ) .
不但二、三分量对换 , 而且全部变了符 号 .所以 是赝向 量 .总之 , 三 维向量 的真 赝之 分只 不过 是 4
维张量反对称性的表现 .
要想得到 M 方程组的另外两个 , 我们先来计算 F 之对偶张量 * F .注意 . F 是 2 阶反对称协
p( n - p) + s
变张量 , p = 2 , 流形 M4 的维数 n = 4 , 而度量中负特征根个数 s = 3 , 所以 ( - 1 ) = - 1 .
这样
2 3 3 1 1 2 0 1
- * F = E1 d x ∧ d x + E2 d x ∧ d x + E3 d x ∧ d x - B1 d x ∧ d x
0 2 0 3
+ B2 d x ∧ d x + B3 d x ∧ d x .
所以
E1 E2 E3 1 2 3 1 E1 B2 B3 0 2 3
- d* F = 1 + 2 + 3 dx ∧dx ∧ dx + + 3 - 2 dx ∧dx ∧dx
x x x c t x x
1 E2 B1 B3 0 1 3 1 E3 B1 B2 0 1 2
+ - + 3 - 1 dx ∧dx ∧dx + + 2 - 1 dx ∧ dx ∧ dx .
c t x x c t x x
1 1 1 2 1 3
现在我们想把 ( Ⅰ ) 和 ( Ⅱ ) 代进去 .(2 ) 和 ( Ⅳ ) 的右方形成一个 4 维向量 4π(ρ, j , j , j ) .
c c c
ij ij
我们先用 M4 中的度量 (5 ) 相应的 ( g ) , i, j = 0 , 1 , 2 , 3 去作用在这个 4 维向量上 .但 因 ( g ) =
1
- 1 - 1 1 1 1 2
( gij ) = = ( gij ) , 所以于是得到 一个 4 维向 量 : J = (ρ, - j , - j ,
- 1 c c
- 1
1 3 0 1 1 1 1 2 2 1 3 3
- j ) = ρd x - j dx - j dx - j d x .如果要换到其他坐标系 , 则把 J 当作一个协变向
c c c c
量来处理 .于是 J 成了一个协变的 4 维向量 , 称为电荷 - 电流向量 .现在对它施用霍奇算子 * 把
它化为 3 微分形式 .利用 §3 中关于计算 * ω的公式于此 , 有
1
j 1
0 2 3 2 3
* J = - ρd x ∧ d x ∧ d x + d x ∧ d x ∧ d x
c
2 3
j 0 1 3 j 0 1 2
- dx ∧ dx ∧ dx + dx ∧ dx ∧ dx .
c c
把它与 d * F 比较 , 立即得出
d * F = 4π* J . (10)
§6 结束语———麦克斯韦方程组简介 5 47
p( n - p) + s
如 果再把它化为 δ = - * d * , 利用 * * ω = ( - 1) ω, 这里 p = 1 , n = 4 , s = 3 , 上式就可
以化为
δF = 4πJ .
总之 , M 方程组现在化成了关于二阶反对称协变张量 F 的两个形状极为简洁的方程
d F = 0, ( MI)
δF = 4πJ . ( MⅡ )
F 称为电磁强度张量 , 或称为法拉第张量 , 它的矩阵形式是
0 - E1 - E2 - E3
E1 0 B3 - B2
F = .
E2 - B3 0 B1
E3 B2 - B1 0
把 M 方程组写成这样简洁的形式 , 就可以很方 便地 把本 章讲的 数学 工具应 用于 它 .作为 一个 例
2
子 , 把算子 d 作用于 (10) 式两侧 , 因为 d = 0 , 所以就有 4πd * J = 0 , 把 * J 的表达式代入 , 立即
有连续性方程
ρ
+ div j = 0 . (11)
t
可见 , 连续性方程即电荷守恒定律 , 其实是 M 方程组的推论 .我们这里未能介绍的关 于电磁场 的
能量关系 , 也都可以由此导出 .这样我 们就 可以 说 , M 方程 组 确实 是整 个电 磁理 论 的基 础 .但 是
关于作用在电荷上的力的洛伦兹力的公式却不能由 M 方程组导出 .因为一则其中出 现了电荷 的
运动速度 v 不曾在 M 方程组中出现 , 而且也不可能出现 , 因为 M 方程组是洛伦兹不变的 , 不论电
荷以什么速度运动 , 只要时间与 空间的坐标的变 化适合洛伦兹变 换 , M 方程组总是不变 的 .有 了
力 , 当然就会考虑牛顿力学如何应用于它 .但是 M 理论本质上是相对论性质的 , 而牛 顿力学则 不
是 .因此 , 要想把牛顿力学应用于电荷的运动 , 就应该加上相对论修正 .
此外 , M 方程组虽然形状写起来十分简 单 , 其内 容仍 是复 杂 的 , 要 去求 解就 很不 容 易 .不 过
我们注意到方程 ( M I) , 由庞加 莱引理 就知道 , 在 M4 的任一 个星形 域中一定 存在 一个一 阶微 分
0 i
形式 A = φd x + Ai d x 使
F = dA . (12)
A 称为势 , φ是它的时间部分 , 它就是经典的物理教本 中的标 量势 , 其余的 三个分 量构成 其空 间
部分 , 我们用古典的向量分析记号 ( 即黑体字母 ) 来表示它 : A = ( A1 , A2 , A3 ) , 它就是通常所 谓
向量势 .于是
Aμ Aν μ ν
dA = ∑
μ< ν xν
-
xμ
d x ∧ d x , μ,ν = 0 , 1 , 2 , 3
3
Ai φ 0 i
= ∑ i= 1 x
0 -
x
i dx ∧ dx
Aj Ai
+ ∑ i< j x
i -
x
j .
与 F 的表达式 ( 9) 比较 , 即得
5 48 第七章 微分流形上的微积分
1
E = - grad φ - A . (13)
c t
B = curl A . (14)
这与传统的讲法完全一致 .
但是同一个电磁场 F 可以有许多不同的势 .因为若 A 是一个势 , 加上一个 0 阶微分形式 λ的
外微分 , 即 M4 上的一个光滑函数 λ的全微分 dλ, 则 A′= A + dλ也是一个势 , 因为
2
d A′= d A + d λ = d A = F .
反过来 , 若 A′是 F 的另一个势 , 则 d( A′- A) = 0 .而由庞加莱引理 , 一定存一个 0 阶微分形式 ,
即一个光滑函数 λ使 A′= A + dλ .这里当然都是在 M4 的一个星形区域中讲的 .总之 A + dλ给
出了全部的势 , 任取一个都可以得到同样的 F .这个性质称为 F 的规范不变性 .这样 的说法来 由
1
如下 : 在原点处一个单位电荷必在 ( x , y, z ) 点产生电势 + C , 通常我们取 C = 0 , 即要求势 在
r
无穷远点为 0 , 这就是一种规范 .现在讲的则与此类似 .物理学中 有许多 场都有规 范不变 性 , 即 所
谓规范场 .我们所讲的只是最简单的情况 .
既然有多种不同的势 , 我们必可取其中一个使所讨论的方程最简单 , 这就是要求 δA = 0 .因
为 δA = ± * d * A , 而
1 2 3 0 2 3 0 1 3
± * A = φd x ∧ d x ∧ d x - A1 d x ∧ d x ∧ d x + A2 d x ∧ d x ∧ d x
0 1 2
- A3 d x ∧ d x ∧ d x .
所以
1 φ
± δA = + div A = 0 . (15)
c t
这里我们采用记号 ± 是为了在计算 δ = * d * 时更 方便一 些 .规 范 ( 15 ) 有特 殊的重 要性 , 称 为
Lorenz 规范 ( 请注意这不是爱 因斯 坦相对 论的 伟大 先行者 洛伦 兹 ( H .A .Loren tz) 而 是另 一个 人
L .Lorenz, 尽管拼法与发音都很相近 ) .这种规范必满足方程
ΔA = (δd + dδ) A = δF = 4πJ . (16)
3 2 2
1
不过这里的 Laplace-Belt rami 算 子 并 非 古 典 的 拉 普 拉 斯 算 子 ∑ i , 而是 波算子 2 2 -
i=0 x c t
3 2 2
1
∑
i= 1 x
2 = 2
c t
2 - Δ3 , 而且时常记成 □ , 称为达朗贝尔算子 ( d′Alembert operator) .因为现在
的度量 不 是 欧 几 里 得 度 量 , 而 是 洛 伦 兹 度 量 .这 里 我 们 没 有 详 细 推 算 . 但 是 不 论 如 何 , 它 是
Laplace-Belt rami 算子 , 而前面指出 , 它作用在 1 阶微分形式 A 上时 , 可以分别作用到各个分量 上
去 .因此有
□φ = 4πρ .
□ A = 4πj .
现在我们把势的时间部分与空间部分完全分开了 .电荷 决定 φ( 而不 是如 我们习 惯想 像的 : 电 荷
决定电场 ) , 电流决定 A ( 而不是如我们习惯想像的 : 电流决定磁场 ) .
这里的方程是著名的波动方程 .它是偏微分方程 中极广 泛的 一个分 支 .由此 我们 看到 了 , 打
开了波动方程以及更一般的双曲型方程应用于电磁波理论的道路 .
可是我们把 M 方程组化为 ( MⅠ ) 和 ( MⅡ ) 还有更重要的意 义 : 它 虽然比较抽象 , 但却是 一
§6 结束语———麦克斯韦方程组简介 5 49
种极重要的框架 .再加上这个框 架的 进一 步发 展 , 其中 可以 包 含许 多更 深刻 反映 大 自然 本质 的
场 , 在 21 世纪中我们必可看到它的大发展 .这当然绝 不是 微积分 的创 始者 们 , 如 17 世纪 的牛 顿
所能梦想得到的了 .