-
Notifications
You must be signed in to change notification settings - Fork 0
/
20150520.tex
837 lines (741 loc) · 39.6 KB
/
20150520.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
\chapter{行列とその演算}
\lectureinfo{2015年5月20日 1限}
今回のテーマは行列の計算です。行列の計算を理解できていない人はいないようでしたが、\textbf{計算ミスをする人が少なくありませんでした}。行列の計算は今後多用しますから、この機会に十分慣れておいてください。
\section[総和記号Σの使い方]{総和記号$\sum$の使い方} \label{section:usage_of_sum_symbol}\index{sigma@$\sum$ (総和記号)}
行列の積の計算やこの後でやる行列式の計算では、とにかく$\sum$記号が式中にたくさん現れます。そこで最初に、$\sum$の色々な使い方をまとめておきましょう。必要に応じて読んでください。
\subsection{最もありふれた使い方}
総和記号$\sum$の使い方として、最もありふれたものは
\[
\sum_{i = 1}^n a_i := a_1 + a_2 + \cdots + a_n
\]
というものでしょう。$n$個の数$a_1,a_2,\ldots,a_n$が与えられたとき、それの全ての和を上に書いたように、$\sum$記号で表すのでした。$\sum$記号は数学でよく現れる「数列の和」を表せるという意味で便利な記号ですが、それ以上に「記号操作で複雑な計算を片付けられる」という点が強力です。そのことを、以下で見ていきましょう。
\paragraph{線型性}
$\sum$の最も大事な性質は、次の\textbf{線型性}です。
\begin{align*}
\sum_{k = 1}^n (a_k + b_k) &= \sum_{k = 1}^n a_k + \sum_{k = 1}^n b_k, \qquad
\sum_{k = 1}^n \alpha a_k = \alpha \sum_{k = 1}^n a_k
\end{align*}
式自体の意味は単純で、$1$つ目は足し算の順序の入れ替え、$2$つ目はかっこでくくる操作を表しています。
\begin{align*}
(a_1 + b_1) + (a_2 + b_2) + \cdots + (a_n + b_n) &= (a_1 + a_ 2 + \cdots + a_n) + (b_1 + b_2 + \cdots + b_n) \\
\alpha a_1 + \alpha a_2 + \cdots + \alpha a_n &= \alpha (a_1 + a_2 + \cdots + a_n)
\end{align*}
実際に式変形をするときは、線型性の公式を左から右、右から左の両方で使います。すなわち今の式を
\begin{itemize}
\item 変数が同じ範囲を走る$\sum$が足されているときは、それをひとまとめにしてよい
\item $\sum$の中に足し算があれば、それを$2$つの$\sum$に分割できる
\item $\sum$の変数と関係ない数は、いつでも$\sum$を前後に飛び越えられる
\end{itemize}
と読むわけです。
\paragraph{変数のシフトと和の順序の反転}
$\sum$の変数は、ずらすことが可能です。たとえば
\[
\sum_{k = 1}^n a_k = a_1 + a_2 + \cdots + a_n, \qquad \sum_{k = 0}^n a_{k+1} = a_1 + a_2 + \cdots + a_n
\]
ですね。項を書き出してしまえば当たり前ですが、$k$が走る範囲をずらしても、それに合わせて$\sum$の中の式に出てくる$k$を適当にずらせば、表す式は全く同じになります。
同じようにして、足す順序を逆順にすることもできます。$a_1 + a_2 + \cdots + a_n = a_n + a_{n-1} + \cdots + a_1$ですから
\[
\sum_{k = 1}^n a_k = \sum_{k = 1}^n a_{n+1-k}
\]
という式が成り立ちます。
これらの変数の変換は、主に線型性と組み合わせて$2$つの$\sum$をくっつけるときに使います。たとえば$\sum_{k = 1}^n k$の公式は、次のようにして導くことができます。
\begin{align*}
2 \sum_{k = 1}^n k
&= \sum_{k = 1}^n k + \sum_{k = 1}^n k
= \sum_{k = 1}^n k + \sum_{k = 1 }^n (n + 1 - k)
= \sum_{k = 1}^n \bigl\{ k + (n + 1 - k) \bigr\}
= \sum_{k = 1}^n (n+1)
= n(n+1)
\end{align*}
もう一つ別の証明を挙げておきます。こっちの手法は、$\sum k^2$や$\sum k^3$の公式を導くのにも使えます。
\begin{align*}
(n+1)^2 -1
&=\sum_{k = 1}^n \{(k + 1)^2 - k^2\}
= \sum_{k = 1} ^n (2k+1)
= 2\sum_{k = 1}^n k + \sum_{k = 1}^n 1
= 2\sum_{k = 1}^n k + n \\
\therefore \sum_{k = 1} ^n k
&= \frac{(n+1)^2-1-n}{2}
= \frac{n^2 + n}{2}
\end{align*}
どちらの証明でも、$1$つ$1$つの式変形が「和の順序の反転」や「線型性で$\sum$をまとめる / ばらす」といった操作だけしか行っていないことに気を付けてください。このように「$\sum$の公式をそのまま当てはめる」という操作を繰り返すだけで証明を完了できることが、$\sum$を使う大きなメリットなのです。
% 差分の話
%\paragraph{公式}
%\[
%\sum_{i = 1}^n i = \frac{n(n+1)}{2}, \sum_{i = 1}^n r^i = \frac{r^{n+1} - 1}{r - 1}
%\]
\subsection{集合を走る変数に関する和}
さて$\sum_{k =1}^n a_k$は「$k$を順番に$1,2,\ldots,n$と動かし、出てくる項を全部足す」という意味でした。ですが「順番に足す」という意味は別に大事ではありません\footnote{ただし、たまに$n = 0$のとき「$\sum_{k = 1}^n a_k = 0$」という式が出ます。このような場合は$\sum$を$1$から「順に足す」という意味で捉えないと、式を正しく解釈できません。}。どうせ足し算だから、順序を入れ替えたって結果は変わらない\footnote{ここで考えているのは有限個の足し算だけです。無限級数などの代数的に扱えない場合は、全く考えていません。}からです。そこで順番を考えず、「集合のそれぞれの元に対応する項を足す」という意味でも$\sum$を使います。たとえば
\[
\sum_{k\in\{1,3,5\}} a_k = a_1 + a_3 + a_5
\]
という感じです。$\{1,3,5\}$の元は$1$と$3$と$5$だから、$k$が$1,3,5$を動くのに合わせて対応する$a_k$、つまり$a_1$と$a_3$と$a_5$を足し合わせるというのが左辺の$\sum$の意味です。新しい$\sum$を使えば、これまで使っていた$\sum$は
\[
\sum_{k = 1}^n a_k = \sum_{k\in\{1,2,\ldots,n\}} a_k
\]
と書き表せます。だから新しい$\sum$の使い方は、今までの$\sum$が拡張されたものになっています。後々見ていくように、$\sum$の変数に整数以外のものを使えるのは、実は非常に役立ちます。
さらに省略した書き方として、$\sum$の下に「変数の満たすべき条件」を書く場合があります。たとえば
\[
\sum_{\substack{1\leq k\leq 5\\ \text{$k$は奇数}}} a_k = a_1 + a_3 + a_5
\]
と書きます。集合$\{k\in\mathbb{N}\mid 1\leq k\leq 5, \text{$k$は奇数}\}$は$\{1,3,5\}$と同じです。この集合を$\sum$の下の狭いスペースに書くと非常に見苦しいので「縦棒の右側に書かれる条件だけを$\sum$の下に書いてしまおう」という魂胆です。だから
\[
\sum_{1\leq k\leq 5} a_k = \sum_{k\in\{1,2,3,4,5\}} a_k = \sum_{k = 1}^5 a_k = a_1 + a_2 + a_3 + a_4 + a_5
\]
などという意味になります。このとき一番左の表記法では``$k\in\mathbb{N}$''という条件が地味に抜け落ちますが、その部分については「読者が空気を読んで察する」という暗黙のルールがあります\footnote{勉強する人に向かって「空気読め」は割とヒドい言葉のような気がするのですが、ちょっとでも新しい$\sum$記号を使ってみると、逆に「一々$\sum$の下に集合を書くなんてかったるい」と思うようになってしまうんですよね……。}。頑張って読み解いてください。
さらに、この$\sum$記法に慣れるとこんなこともできます。
\[
\sum_{k \in A\cup B} a_k = \sum_{k \in A} a_k + \sum_{k \in B} a_k - \sum_{k \in A\cap B} a_k
\]
$\sum$の変数が集合を走る場合、集合の分割に応じて$\sum$を分割できます。もし和にダブりがあればその部分を引いて補正しなければいけませんが、ダブりなくばらせば第$3$項は消えます。このような$\sum$の分割は、$\sum$を部分的に計算する場合に役立ちます。
\subsection{変数について}
ここで、$\sum$の変数について$2$つほど注意をしておきます。
\paragraph{ダミー変数}
次の式を見てください。
\[
\sum_{k = 1}^n a_k = \sum_{l = 1}^n a_l
\]
当たり前の式ですが、ここで大事なのは\textbf{$\sum$で走る文字は自由に取り換えても良い}という点です。左辺の$\sum$では、$k$は「$1$から$n$までの整数を動くこと」だけを示すのに使われているのであって、$k$という文字自体が式全体で意味を持っているわけではありません。$k$という文字は、$\sum$の中だけで有効です。こういう変数を\textbf{ダミー変数}\index{だみーへんすう@ダミー変数}と言います。
$\sum$を$1$個単独で使ってる場合は、ダミー変数の文字を変えるご利益はそんなにありません。せいぜい複素数を足し算する時、虚数単位とこんがらがらないよう変数を$i$から$j$に変えるくらいでしょうか。ですが$\sum$が入った複数個の式をかけて変形するようになると、割と頻繁に変数の衝突が起きたりします。そういう場合に文字の取り換えは、地味ですが計算を遂行するのに大変役立ちます。
\paragraph{変数のスコープ}
今のダミー変数について、$\sum$の変数は\textbf{式中の一部分でのみ意味がある}と言いました。この変数が有効な範囲を、プログラミングの言葉で\textbf{変数のスコープ}\index{へんすうのすこーぷ@変数のスコープ}といいます。たとえば
\[
\sum_{k=1}^n \uwave{(2k - 1)} = n^2
\]
の左辺における$k$のスコープは、下線を引いた$2k-1$の場所です。
当たり前のことですが、$\sum$で使われる変数はスコープ外で意味を持ちません。ですから式を見直してみて「$\sum$の外にダミー変数が飛び出していた」とか「$\sum$の計算をし終わった後にダミー変数が残っていた」などという場合、スコープを考えるだけで明らかに計算ミスがあると分かります。今みたいな単純な式だと気になりませんが、$\sum$の入った複雑な式では変数のスコープを意識すると計算がしやすくなります。心の片隅に置いといてください。
\subsection{二重和} \index{にじゅうわ@二重和}
ここまで$\sum$の使い方を色々説明してきましたが、実用面を考えると、さらに一歩踏み込んで多重の$\sum$を取り扱う必要があります。
計算の定義自体は今までの$\sum$と変わりません。たとえば
\[
\sum_{k = 1}^m \sum_{l = 1}^n a_{k,l} = \sum_{k = 1}^m \Biggl\{\sum_{l = 1}^n a_{k,l}\Biggr\}
\]
というように「内側の$\sum$をまず足し、その結果を外側の$\sum$でさらに足し合わせる」というだけです。$\sum$を元々「$1$列に並べた数を足し合わせる」という方法で使っていたことになぞらえれば、二重和は「長方形に並べた数を足し合わせる」という感じです。ただ二重和の場合
\[
\sum_{k = 1}^m \sum_{l = 1}^k a_{k,l} = \sum_{k = 1}^m \Biggl\{\sum_{l = 1}^k a_{k, l}\Biggr\} = (a_{1, 1}) + (a_{2, 1} + a_{2, 2}) + (a_{3, 1} + a_{3, 2} + a_{3, 3}) + \cdots
\]
のように、「外側の$\sum$のダミー変数を使って、内側の$\sum$における変数の範囲を指定する」という技ができたりします。上の例では、三角形に並べた数を全部足すという意味になります。
このような場合に、足し算の順序を上手くコントロールするための変数の扱い方を見ていきましょう。
\paragraph{和の順序の交換}\index{じゅんじょこうかん@($\sum$の) 順序交換} 一番基本的な二重和
\begin{align*}
\sum_{k = 1}^m \sum_{l = 1}^n a_{k, l}
= \sum_{k = 1}^m (a_{k, 1} + a_{k, 2} + \cdots + a_{k, n} )
=
\begin{array}{c@{\,}c@{\,}c@{\,}c@{\,}c@{\,}c}
&a_{1, 1} &+ &a_{1, 2} &+ \cdots + &a_{1, n} \\
+ &a_{2, 1} &+ &a_{2, 2} &+ \cdots + &a_{2, n} \\
+ & \cdots &\cdots \\
+ &a_{m, 1} &+ &a_{m, 2} &+ \cdots + &a_{m, n}
\end{array}
\end{align*}
を考えてみましょう。この計算は、各行を横向きに足し合わせた結果を縦に足し合わせても、各列を縦向きに足し合わせた結果を横に足し合わせても全く同じ結果になります。これを$\sum$で表現すると
\[
\sum_{k = 1}^m \sum_{l = 1}^n a_{k, l} =
\sum_{l = 1}^n \sum_{k = 1}^m a_{k, l}
\]
となります。一方、
\begin{align*}
\sum_{k = 1}^n \sum_{l = 1}^k a_{k,l}
= \sum_{k = 1}^n (a_{k, 1} + a_{k, 2} + \cdots + a_{k, k})
=
\begin{array}{c@{\,}c@{\,}c@{\,}c@{\,}c}
&a_{1, 1} \\
+ &a_{2, 1} &+& a_{2, 2} \\
+ &\cdots \\
+ &a_{n, 1} &+& a_{n, 2} &+ \cdots + a_{n, n}
\end{array}
\end{align*}
のような場合、外側と内側の$\sum$を安直に入れ替えることはできません。この事実は「内側の$\sum$の上限を与える$k$が、外側の$\sum$のスコープの外に出られない」とも言えます。ですから「内側の$\sum$の範囲指定に外側の$\sum$の変数が使われていない限り、$2$つの$\sum$の順番を入れ替えることができる」というのが結論です。$\sum$の変数が集合を走る場合でも、同じことが言えます。
\paragraph{$\sum$の結合と分割} 次の式を見てください。
\[
\sum_{k = 1}^m \sum_{l = 1}^n a_{k, l} = \sum_{1\leq k\leq m} \sum_{1\leq l\leq n} a_{k, l} = \sum_{\substack {1\leq k \leq m\\ 1\leq l\leq n}} a_{k, l}
\]
こんな感じで、$2$つの$\sum$をくっつけることができます。元々の二重和を「$k$が$\{1,2,\ldots,m\}$を走り、$l$が$\{1,2,\ldots,n\}$を走る」と書き換えた上で、さらに集合の直積を利用して「$(k,l)$が$\{1,2,\ldots,m\}\times\{1,2,\ldots,n\}$を走る」と書き換えました。こういう風に集合の直積を使うと、$2$つの$\sum$を$1$つにくっつけられます。逆に$\sum$の変数が直積集合を走るときは、$\sum$を$2$つにばらすことができます。
あんまり大した意味が無いようにも見えますが、三重以上に$\sum$が重なる状況では、$\sum$を$1$つにまとめると案外式が見やすくなったりします。また「$\sum$の変数は集合の上を走る」という意識を持っておくと、$\sum$の変数を操作するときに、式が正しいかどうかを変数の走る集合が等しいかどうかという問題に帰着させて考えられます。
\paragraph{変数変換} 最後に、$\sum$の変数変換を紹介します。次の二重和を見てください。
\begin{align*}
\sum_{k = 1}^n \sum_{l = 1}^k a_{k,l}
=
\begin{array}{c@{\,}c@{\,}c@{\,}c@{\,}c}
&a_{1, 1} \\
+ &a_{2, 1} &+& a_{2, 2} \\
+ &\cdots \\
+ &a_{n, 1} &+& a_{n, 2} &+ \cdots + a_{n, n}
\end{array}
\end{align*}
この足し方を図示したのが、次の一番左の図です。内側の$\sum$で足される項を、矢印で繋いでいます。
\begin{figure}[h!tbp]
\centering
\begin{picture}(80,90)
\put(0,0){\vector(0,1){80}}
\put(0,0){\vector(1,0){80}}
\put(82,-3){$k$}
\put(5,75){$l$}
\put(10,10){\circle*{3}}
\put(30,10){\circle*{3}}
\put(30,10){\vector(0,1){18}}
\put(30,30){\circle*{3}}
\put(50,10){\circle*{3}}
\put(50,10){\vector(0,1){18}}
\put(50,30){\circle*{3}}
\put(50,30){\vector(0,1){18}}
\put(50,50){\circle*{3}}
\put(70,10){\circle*{3}}
\put(70,10){\vector(0,1){18}}
\put(70,30){\circle*{3}}
\put(70,30){\vector(0,1){18}}
\put(70,50){\circle*{3}}
\put(70,50){\vector(0,1){18}}
\put(70,70){\circle*{3}}
\end{picture}\qquad\qquad
\begin{picture}(80,90)
\put(0,0){\vector(0,1){80}}
\put(0,0){\vector(1,0){80}}
\put(82,-3){$k$}
\put(5,75){$l$}
\put(10,10){\circle*{3}}
\put(10,10){\vector(1,0){18}}
\put(30,10){\circle*{3}}
\put(30,10){\vector(1,0){18}}
\put(30,30){\circle*{3}}
\put(30,30){\vector(1,0){18}}
\put(50,10){\circle*{3}}
\put(50,10){\vector(1,0){18}}
\put(50,30){\circle*{3}}
\put(50,30){\vector(1,0){18}}
\put(50,50){\circle*{3}}
\put(50,50){\vector(1,0){18}}
\put(70,10){\circle*{3}}
\put(70,30){\circle*{3}}
\put(70,50){\circle*{3}}
\put(70,70){\circle*{3}}
\end{picture}\qquad\qquad
\begin{picture}(80,90)
\put(82,-3){$k$}
\put(5,75){$l$}
\put(0,0){\vector(0,1){80}}
\put(0,0){\vector(1,0){80}}
\put(10,10){\circle*{3}}
\put(10,10){\vector(1,1){18}}
\put(30,10){\circle*{3}}
\put(30,10){\vector(1,1){18}}
\put(30,30){\circle*{3}}
\put(30,30){\vector(1,1){18}}
\put(50,10){\circle*{3}}
\put(50,10){\vector(1,1){18}}
\put(50,30){\circle*{3}}
\put(50,30){\vector(1,1){18}}
\put(50,50){\circle*{3}}
\put(50,50){\vector(1,1){18}}
\put(70,10){\circle*{3}}
\put(70,30){\circle*{3}}
\put(70,50){\circle*{3}}
\put(70,70){\circle*{3}}
\end{picture}
\end{figure}
そして図中にも描いたように、この二重和は色々な足し方ができます。この図をじっくり見れば
\[
\sum_{k = 1}^n \sum_{l = 1}^k a_{k, l}
= \sum_{l = 1}^n \sum_{k = l}^n a_{k, l}
= \sum_{p = 1}^n \sum_{k = 1}^{n + 1 - p} a_{p - 1 + k, k}
\]
が分かるはずです。集合で言えば、$\{(k,l)\in\{1,2,\ldots,n\} \mid l \leq k\}$を鉛直な直線や、あるいは軸と$45^{\circ}$の傾きをなす直線でスライスして分割しているわけです。このように二重和では「格子の各点に項が対応している」と捉えることで、外と中の$\sum$をそのまま入れ替えることはできなくても、足し方を色々変えることができます。特に、斜めの足し算はしばしば式変形のキーポイントになります。
$\sum$の変数変換は実際にやってみると案外間違えやすいのですが、そういう時はきちんと格子を描き「どの範囲の項が足されるか」を絵で表しましょう。そうすればぐっと間違いは減るはずです。
\subsection{総積記号}\index{pi@$\prod$ (総積記号)}
ちなみに$\sum$の掛け算バージョンもあって、それは$\prod$ (パイ) という記号で表されます。使い方は$\sum$と全く同じで
\[
\prod_{k = 1}^n a_i = a_1 a_2 \cdots a_k
\]
という意味です。たとえば$\prod_{k = 1}^n k = n!$など。$\sum$のときと同様、変数は集合を走ることもあります。
この記号も色々使いどころがあります。特に
\[
\sum_{k = 1}^n \log a_k = \log \prod_{k = 1}^n a_k, \qquad \prod_{k = 1}^n p^{a_k} = p^{\sum_{k = 1}^n a_k}
\]
という形の式変形は知っておくと、計算がサクサク進むと思います。
\section{行列とその演算}
数を縦に$m$個、横に$n$個並べたものを$m\times n$型あるいは$(m, n)$型の\textbf{行列}\index{ぎょうれつ@行列}といいます。また、行列の中にある一つ一つの数を\textbf{成分}といいます。特に$i$行$j$列\footnote{横の並びが行 (row), 縦の並びが列 (column) です。自動車レースのフロント・ローとか、化学で使うカラムクロマトグラフィーといった言葉を思い出すと「rowが横、columnが縦」を間違えにくくなるかもしれません。}にある成分を指して$(i,j)$成分という呼び方をします。成分を表すときは
\begin{itemize}
\item $A_{ij}$のように右下に$ij$をつけることで、行列$A$の$(i, j)$成分を表す
\item $(i, j)$成分が$a_{ij}$である行列のことを、$(a_{ij})_{\substack{1\leq i\leq m\\ 1\leq n\leq n}}$と表す
\end{itemize}
といった記法も使います。覚えておきましょう。
行列は数学の色々なところで使います。たとえば連立$1$次方程式を解いたり、微分方程式を解いたりといった用途に使えますし、また他の分野への応用もたくさんあります。じっくり勉強して、行列の扱いに慣れていってください。
\subsection{行列の和と積}
行列に対しては和\index{わ@(行列の) 和}と積\index{せき@(行列の) 積}が定義されます。まずはその定義を確認します。同じ型の行列に対しては「同じ位置にある成分を足す」、すなわち
\[
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
+
\begin{pmatrix}
b_{11} & b_{12} & \cdots & b_{1n} \\
b_{21} & b_{22} & \cdots & b_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
b_{m1} & b_{m2} & \cdots & b_{mn}
\end{pmatrix}
=
\begin{pmatrix}
a_{11} + b_{11} & a_{12} + b_{12} & \cdots & a_{1n} + b_{1n} \\
a_{21} + b_{21} & a_{22} + b_{22} & \cdots & a_{2n} + b_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} + b_{m1} & a_{m2} + b_{m2} & \cdots & a_{mn} + b_{mn}
\end{pmatrix}
\]
と定めます。そして積は、$(m,n)$型行列$A$と$(n,l)$型行列$B$との間でだけ定義され、その$(i,j)$成分は
\[
(AB)_{ij} = \sum_{k = 1}^n a_{ik}b_{kj}
\]
です。これだと何をやっているか分からないのですが、行列を
\[
\biggl(
\begin{array}{ccc}
a_{11} & a_{12} & a_{13} \\ \hline
a_{21} & a_{22} & a_{23}
\end{array}
\biggr)
\Biggl(
\begin{array}{c|c|c}
b_{11} & b_{12} & b_{13} \\
b_{21} & b_{22} & b_{23} \\
b_{31} & b_{32} & b_{33}
\end{array}
\Biggr)
\]
と区切れば、$AB$の$(i,j)$成分は「$A$の$i$行目と$B$の$j$列目との内積」だと分かります。慣れないうちは、こうやってきちんと行と列を区切ることをお勧めします。
こんなややこしい定義をするのには相応の事情があるのですが、そんなことよりも\textbf{行列の積は役立つ}という事実が大事です。数学で使うだけでなく、Googleが検索クエリを処理するとき\footnote{学習院大学の田崎晴明先生が執筆中の教科書 \url{http://www.gakushuin.ac.jp/~881791/mathbook/index.html} 内の「グーグルのページランク」の節に、解説があります。あるいは原論文 \url{http://infolab.stanford.edu/pub/papers/google.pdf} を見ても良いでしょう。}とか、生物の記憶のシミュレーションをするときとか\footnote{たとえば池谷裕二『進化しすぎた脳』(講談社ブルーバックス) の付録を参照。}、その他行列の使い道は山ほどあります。理論的な場面でも使うので、計算をコンピュータに丸投げできず、人間が手計算をしなければいけない場面もしばしばあります。ですので行列の掛け算の仕方は徹底的に練習して、体で覚えてください。
\subsection{行列の積の性質}
行列の積で非常に特徴的なのは\textbf{順序を変えると結果が変わる}という性質です。具体例を一つやってみます。
\paragraph{問8の解答$+\alpha$}
\begin{align*}
\biggl(
\begin{array}{ccc}
1 & 2 & 4 \\ \hline
3 & 1 & 1
\end{array}
\biggr)
\Biggl(
\begin{array}{c|c}
-2 & 2 \\
7 & 5 \\
-1 & -3
\end{array}
\Biggr)
=
\begin{pmatrix}
8 & 0 \\
0 & 8
\end{pmatrix},
\Biggl(
\begin{array}{cc}
-2 & 2 \\ \hline
7 & 5 \\ \hline
-1 & -3
\end{array}
\Biggr)
\biggl(
\begin{array}{c|c|c}
1 & 2 & 4 \\
3 & 1 & 1
\end{array}
\biggr)
=
\begin{pmatrix}
4 & -2 & -6 \\
22 & 19 & 33 \\
-10 & -5 & -7
\end{pmatrix}
\end{align*}
\paragraph{非可換性}\index{ひかかんせい@非可換性}
今の例では、行列の積$AB$と$BA$の結果がサイズ違いになりました。他にも「$AB$は掛け算できるが$BA$は掛け算ができない」とか「$AB$と$BA$は同じ形の行列になるが結果は違う」とか色々な場合がありますが、とにかく大事なのは\textbf{行列の積は、ほとんどの場合順序を入れ替えられない}ことです。だから多項式$(x+y)^n$, $(x+y)(x-y)$などの展開公式もそのままは使えません。気を付けてください。
\paragraph{零因子}
さらに行列の場合、\textbf{零行列でない行列同士の積が零行列になる}こともあります。たとえば
$\begin{pmatrix}
0 & 1 \\
0 & 0
\end{pmatrix}^2 = O$
です。このような「上手く行列をかけると$O$にできる」性質を持つ行列は\textbf{零因子}\index{ぜろいんし@零因子}と呼ばれます。零因子の存在も、普通の数や多項式とは大きく違うことです。
\section{有名な公式たち}
今回の計算問題の中には、実は有名な公式がいくつも含まれています。計算の答え合わせをしながら、公式とその使い方を見ていきましょう。
\subsection{Cayley--Hamiltonの定理}\index{Cayley--Hamiltonのていり@Cayley--Hamiltonの定理}
問6 (b) に現れる等式は\textbf{Cayley--Hamiltonの定理}と呼ばれています。この等式が正しいことを確かめましょう。
\paragraph{問6の解答}
(a) $(A - aE)(A - dE) = A^2 - (a+d) A + (ad-bc) E$である。よって
\begin{align*}
(A - aE)(A - dE) &=
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}^2
-
(a+d)
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
+
ad
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix} \\
&=
\begin{pmatrix}
a^2 +bc & ab +bd \\
ac +cd & bc + d^2
\end{pmatrix}
-
\begin{pmatrix}
a^2 + ad & ab +bd\\
ac + cd & ad + d^2
\end{pmatrix}
+
\begin{pmatrix}
ad & 0 \\
0 & ad
\end{pmatrix} \\
&=
\begin{pmatrix}
bc & 0\\
0 & bc
\end{pmatrix}
\end{align*}
(b) $A^2 - (a+d)A + (ad-bc) E = (A - aE)(A - dE) -bc E = O$
\paragraph{対角和と行列式} 一般に$2$次正方行列に対し
\[
\tr
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
:= a+d, \qquad
\det
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
:= ad - bc
\]
をそれぞれ行列の\textbf{対角和}\index{たいかくわ@対角和} (\underline{tr}ace)、\textbf{行列式}\index{ぎょうれつしき@行列式} (\underline{det}erminant)といいます。対角和は文字通り、行列の対角線上にある成分を全部足し合わせたものです。行列式については第$3$回の解答で「$2$本のベクトルが張る平行四辺形の符号付き面積」という意味を説明しました。これらを用いて、Cayley--Hamiltonの定理は$A^2 - (\tr A) A + (\det A) E = O$と書けます。
証明はしていませんが、対角和と行列式はそれぞれ適切な型の行列に対し$\tr (AB) = \tr (BA)$, $\det (AB) = \det (BA)$という式を満たします。重要な公式なので練習問題がてら証明してみてください。$2$次正方行列だったらすぐ示せるはずです。
\subsection{余因子行列と逆行列}
\paragraph{余因子行列}
問4 (3)に現れる行列
$\begin{pmatrix}
d & -b \\
-c & a
\end{pmatrix}$
を
$\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}$
の\textbf{余因子行列}\index{よいんしぎょうれつ@余因子行列}といいます。余因子行列は「元の行列にかけたら単位行列の行列式倍になる」という大事な性質を持っています。次回以降$3$次以上の正方行列に対する余因子行列の定義もやりますが、$2$次の余因子行列は$3$次以上のものと比べて格段に使用頻度が高いです。どんな行列が与えられても脊髄反射で余因子行列が即答できるよう、暗記しておいてください。
まず、余因子行列の掛け算をやってみましょう。
\paragraph{問4 (3)の解答}
\begin{align*}
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\begin{pmatrix}
d & -b \\
-c & a
\end{pmatrix}
=
\begin{pmatrix}
ad-bc & 0 \\
0 & ad-bc
\end{pmatrix}
=
(ad-bc)E
= (\det A) E
\end{align*}
\paragraph{Cayley--Hamiltonの定理の帰結} ここで、先ほどの$A^2 - (\tr A) A + (\det A) E = O$を思い出しましょう。この式を移項すると$(\det A) E = A\bigl((\tr A) E - A\bigr)$が得られます。そして実際に計算してみても
\[
A - (\tr A) E
=
\begin{pmatrix}
a + d & 0 \\
0 & a + d
\end{pmatrix}
-
\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
=
\begin{pmatrix}
d & -b \\
-c & a
\end{pmatrix}
\]
なので、$2$次正方行列$A$の余因子行列が$(\tr A) E - A$と表せることが分かりました。
この式からは、とても大事なことが分かります。一般に同じサイズの正方行列であっても、掛け算の順番を入れ替えると結果が変わることがあるのでした。しかし$A$と$A$、あるいは$A$と$E$の掛け算は、いつでも順番をひっくり返せます。したがって$A\bigl((\tr A) E - A\bigr) = \bigl((\tr A) E - A\bigr) A = (\det A) E$が成り立ちます。余因子行列は\textbf{左右のどちら側からかけても、単位行列の$(\det A)$倍}になるのです。
\paragraph{逆行列}
ここで、さらに$\det A\neq 0$の場合を考えてみます。このとき
\[
A^{-1} := \frac{(\tr A) E - A }{\det A}
= \frac{1}{ad-bc}
\begin{pmatrix}
d & -b \\
-c & a
\end{pmatrix}
\]
とおくと、余因子行列の計算から$AA^{-1} = E$が分かります。単位行列$E$は数における$1$みたいなものだから、$A^{-1}$は$A$の逆数みたいなものですね。そこで$A^{-1}$を$A$の\textbf{逆行列}\index{ぎゃくぎょうれつ@逆行列}といいます。
$A^{-1}$は余因子行列を$\det A$で割っただけですから、$A^{-1}$と$A$の積も交換可能です。よって$A^{-1}A = A A^{-1} = E$が成り立ちます。\textbf{逆行列は、左からかけても右からかけても単位行列になる}のです。行列の積を計算するときに順番がひっくり返せないのは少々面倒ですが、逆行列についてはそういう面倒なことは起きないので安心してください。
問4の残りと問7は、余因子行列の公式に全部押し付けられます。
\paragraph{問4 (1), (2)の解答}
\[
\begin{pmatrix}
5 & 6 \\
4 & 5
\end{pmatrix}
\begin{pmatrix}
5 & -6 \\
-4 & 5
\end{pmatrix}
=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix},
\begin{pmatrix}
1 & 2 \\
3 & 4
\end{pmatrix}
\begin{pmatrix}
4 & -2 \\
-3 & 1
\end{pmatrix}
=
\begin{pmatrix}
-2 & 0 \\
0 & -2
\end{pmatrix}
\]
\paragraph{問7の解答}
\[
\begin{pmatrix}
1 & -2 \\
2 & -3
\end{pmatrix}
\begin{pmatrix}
-3 & 2 \\
-2 & 1
\end{pmatrix}
=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix},
\begin{pmatrix}
-3 & 2 \\
-2 & 1
\end{pmatrix}
\begin{pmatrix}
1 & -2 \\
2 & -3
\end{pmatrix}
=
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\]
\paragraph{逆行列の存在条件} \label{paragraph:existence_of_inverse_matrix}
$0$でない数に対しては常に逆数を考えられますが、行列はいつも逆行列を持つとは限りません。余因子行列から逆行列を作るには$(\det A)$で割る操作が必要なので、$\det A = 0$の場合に破綻が生じます。そして、$\det A = 0$の場合はどうやっても逆行列が作れないことが、次のように示せます。
成分計算によって、$2$つの$2$次正方行列$A, B$に対して$\det (AB) = (\det A)(\det B)$が確かめられます。よって、もし行列$A$の逆行列$A^{-1}$が存在すれば、$A A^{-1} = E$の両辺の行列式を取って$(\det A)(\det A^{-1}) = \det E =1$が得られます。これより$\det A \neq 0$が従います。
この議論で、逆行列が存在するならば$\det A \neq 0$だと分かりました。逆に$\det A \neq 0$の場合は、余因子行列から逆行列を作れることを既に示しています。ですから$2$次正方行列の場合に、\textbf{逆行列が存在することと$\det A \neq 0$は同値}な条件だと分かりました。この条件が一般の$n$次正方行列でも正しいことを、追々証明します。
\subsection{交換子} \label{paragraph:commutator}
同じ大きさの$2$つの正方行列$A, B$に対し、$[A, B] := AB - BA$と書きます。この$[,]$のことを\textbf{交換子}\index{こうかんし@交換子}と言います。$A$と$B$が交換する、すなわち$AB = BA$なら$[A, B] = 0$ですから、交換子は「$2$つの行列がどれくらい交換しないか」を測るものです。実際に、次の$H, X, Y$で計算してみましょう。
\begin{align*}
H =
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}, \qquad
X =
\begin{pmatrix}
0 & 1 \\
0 & 0
\end{pmatrix}, \qquad
Y =
\begin{pmatrix}
0 & 0 \\
1 & 0
\end{pmatrix}.
\end{align*}
\paragraph{問5の解答}
\begin{align*}
[H, X]
&=
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
\begin{pmatrix}
0 & 1 \\
0 & 0
\end{pmatrix}
-
\begin{pmatrix}
0 & 1 \\
0 & 0
\end{pmatrix}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
& &=
\begin{pmatrix}
0 & 1 \\
0 & 0
\end{pmatrix}
-
\begin{pmatrix}
0 & -1 \\
0 & 0
\end{pmatrix}
& &=
\begin{pmatrix}
0 & 2 \\
0 & 0
\end{pmatrix}
& &= 2X \\
[H, Y]
&=
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
\begin{pmatrix}
0 & 0 \\
1 & 0
\end{pmatrix}
-
\begin{pmatrix}
0 & 0 \\
1 & 0
\end{pmatrix}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
& &=
\begin{pmatrix}
0 & 0 \\
-1 & 0
\end{pmatrix}
-
\begin{pmatrix}
0 & 0 \\
1 & 0
\end{pmatrix}
& &= -
\begin{pmatrix}
0 & 0 \\
2 & 0
\end{pmatrix}
& &= -2Y \\
[X, Y]
&=
\begin{pmatrix}
0 & 1 \\
0 & 0
\end{pmatrix}
\begin{pmatrix}
0 & 0 \\
1 & 0
\end{pmatrix}
-
\begin{pmatrix}
0 & 0 \\
1 & 0
\end{pmatrix}
\begin{pmatrix}
0 & 1 \\
0 & 0
\end{pmatrix}
& &=
\begin{pmatrix}
1 & 0 \\
0 & 0
\end{pmatrix}
-
\begin{pmatrix}
0 & 0 \\
0 & 1
\end{pmatrix}
& &=
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
& &= H
\end{align*}
\paragraph{Lie環$\mathfrak{sl}_2$}
今の$[H, X] = 2X$, $[H, Y] = -2Y$, $[X, Y] = H$という公式、ただ計算すればそれで終わりなのですが、実は「Lie環$\mathfrak{sl}_2$\index{sl2@$\mathfrak{sl}_2$}の交換関係」という名前が付いています。また行列$X, Y, H$の$3$つ組は$\mathfrak{sl}_2$-triple\index{sl2-triple@$\mathfrak{sl}_2$-triple}と呼ばれます。今は詳しい説明を省きますが、物理や数学を専攻にすると、将来きっとお世話になることでしょう。
\subsection{特殊な形の行列の積}
最後に問9を解きつつ、線型代数をやる上でよく見かける計算を紹介しましょう。まずは答えを載せておきます。
\paragraph{問9の解答} (a) から (c) までは、地道な計算で示す。
\noindent (a) ${}^t\bm{v}M\bm{v} = 4xy + z^2$
\noindent (b), (c)
\[
A^2 =
B^2 =
C^2 =
\begin{pmatrix}
1 & 0 & 0 \\
0 & 1 & 0 \\
0 & 0 & 1
\end{pmatrix}
, \qquad
{}^t\! AMA =
{}^t BMB =
{}^t CMC =
\begin{pmatrix}
0 & 2 & 0 \\
2 & 0 & 0 \\
0 & 0 & 1
\end{pmatrix}
= M
\]
\noindent(d) ${}^t(A\bm{v})M(A\bm{v}) = {}^t\bm{v}\,{}^t \! AMA\bm{v} = {}^t\bm{v}M\bm{v}$ \qed
\paragraph{転置と行列の積との関係}
行列$A$に対し、その縦と横をひっくり返した行列${}^t\! A$を$A$の\textbf{転置行列}\index{てんち@転置}といいます。ベクトルの転置と記号の使い方は同じです。転置については、明らかに${}^t({}^t A)= A$という式が成り立ちます。
さて$A$, $B$の積$AB$が定義されるとき、${}^t(AB) = {}^t B\, {}^t\!A$という式が成り立ちます。実際$A$が$(m, n)$型、$B$が$(n, l)$型のとき、$AB$は$(m, l)$型なので${}^t(AB)$は$(l, m)$型です。$A$と$B$の転置を組み合わせて$(l, m)$型行列を作るには、$(l,n)$型行列と$(n,m)$型行列の積である${}^tB\, {}^t\! A$という組合せしかありません。そして実際に${}^t(AB)$と${}^t B\, {}^t\! A$の$(i, j)$成分を比較すると
\[
\bigl({}^t(AB)\bigr)_{ij} = (AB)_{ji} = \sum_{k = 1}^n A_{jk} B_{ki} = \sum_{k = 1}^n ({}^t\! A)_{kj} ({}^t B)_{ik}
= \sum_{k = 1}^n ({}^t B)_{ik} ({}^t\! A)_{kj} = ({}^t B\, {}^t\! A)_{ij}
\]
となり、確かに一致しています。この公式はよく使うので、覚えておきましょう。そうすれば (d) は (c) を使ってすぐ解けます。
\paragraph{内積} \label{paragraph:example_of_inner_product}
(a) の問題で計算結果の型を間違える人が多かったです。少し落ち着いて、計算をフォローしてみましょう。
$n$次元の縦ベクトルは、$(n,1)$型の行列と同じです。その転置を取ったものは$n$次元の横ベクトル、すなわち$(1,n)$型の行列です。よって$n$次元の縦ベクトル$\bm{u},\bm{v}\in\mathbb{R}^n$に対し、${}^t\bm{u}\bm{v}$は$(1,n)$型行列と$(n,1)$型の行列の積だから、$(1,1)$型行列になります。たとえば$n=3$で$\bm{u} = {}^t(u_1, u_2, u_3)$, $\bm{v} = {}^t(v_1, v_2, v_3)$の場合に成分で書けば
\[
{}^t \bm{u}\bm{v}
=
\begin{pmatrix}
u_1 & u_2 & u_3
\end{pmatrix}
\begin{pmatrix}
v_1 \\
v_2 \\
v_3
\end{pmatrix}
=
\begin{pmatrix}
u_1 v_1 + u_2 v_2 + u_3 v_3
\end{pmatrix}
\]
です。ここで計算結果の式は$(1, 1)$型行列なので括弧をつけましたが、$(1, 1)$型行列とスカラーとは自然に同一視することができます。ですから普通は計算結果にわざわざ括弧をつけず、単に${}^t\bm{u}\bm{v} = u_1 v_1 + u_2 v_2 + u_3 v_3$と書きます。成分が実数なら、${}^t\bm{u}\bm{v}$はベクトルの内積と一致します。
そしてこの問題の$M$に限らず、$n$次正方行列$M$と$n$次元の縦ベクトル$\bm{u}$, $\bm{v}$が与えられたとき、${}^t\bm{u}M\bm{v}$はやはりスカラーになります。実際$M\bm{v}$が$n$次元の縦ベクトルですから、この式を${}^t\bm{u}(M\bm{v})$と読めば、計算結果が$\bm{u}$と$M\bm{v}$の内積になります。また$M=E$のときは${}^t\bm{u}E\bm{v}={}^t\bm{u}\bm{v}$ですから、${}^t\bm{u}M\bm{v}$は内積の一般化だと思えます。どんな$M$を持って来れば${}^t\bm{u}M\bm{v}$が内積と似た性質を示すかを調べるのが、$1$年生の線型代数の後半で学ぶテーマの$1$つです。
\paragraph{特別な行列の名前}
問9の行列$A, B, C$は$2$乗すると単位行列になるという、特別な性質を持っています。せっかくなのでこれに関連して、特別な行列のクラスを紹介しておきます。
まず$2$乗したら単位行列ということは、逆行列が自分自身ということと同じです。そして$A$, $B$は共に対称行列ですから、$A$, $B$は「自分自身の転置行列が逆行列」という性質を持ちます。このような行列を\textbf{直交行列}\index{ちょっこうぎょうれつ@直交行列}といいます。直交行列は$1$年生の終わりに学ぶ「対称行列の対角化」という話で重要な役割を果たします。
また一般に、何乗かしたら$1$になる行列を\textbf{巾単行列}\index{べきたんぎょうれつ@巾単行列}と言います。$A$, $B$, $C$は全て巾単行列です。こちらも重要な行列ですが、$1$年生の線型代数の範囲ではそこまで活躍しないかもしれません。
\paragraph{随伴作用}
問9 (c) では${}^t\! AMA$を計算しました。ここで${}^t\! A=A^{-1}$ですから、${}^t\! AMA$は$A^{-1}MA$とも書けます。この「正方行列を左から$A^{-1}$、右から$A$で挟む操作」は後々非常に良く出てきて、$A^{-1}$による随伴作用\index{ずいはんさよう@(行列の) 随伴作用}\footnote{普通、随伴作用では$M$を$A^{-1}MA$ではなく$AMA^{-1}$にうつすので、$A^{-1}MA=A^{-1}M(A^{-1})^{-1}$は$A^{-1}$による随伴となります。}という名前までついています。また随伴作用を表す$\Ad_A(M):= AMA^{-1}$という記号も用意されていますが、ここまで覚える必要はたぶんありません。