§ 8. Характеристический многочлен и спектр квадратной матрицы. Функции от матриц

1. Определение характеристического многочлена. На­ряду с квадратной матрицей А € Мп рассмотрим семейство матриц А — XI, где А — числовой параметр, вообще говоря, комплексный.

Определение. Характеристическим многочленом ма­трицы А называется многочлен от переменной A: d.4(A) := «let (А - XI).

Легко видеть, что <1д(Х) — многочлен степени п. Действи­тельно,

au — А      а-22      ■ ■ • «in а>ц      а22 — X   ... а2п

dA(X) =

«nl ап2

(1)

поэтому только один моном, входящий в (А — XI), будет содержать А в степенях п и п — 1, а именно моном, равный произведению всех диагональных элементов матрицы А — XI. Все остальные мономы содержат по крайней мере по два недиагональных элемента А — XI и, соответственно, имеют по Л степень не выше п — 2. Таким образом, два старших коэффициента (при А" и А" ') у полинома йх(А) — те же,что у монома (аи — А)(«22 — А)... (а„„ — А) и равны (—1)" и ( —I)"-1 51]ь=1 акк — (-1)п_1Тг А соответственно. Свободный член полинома с1л(Л) совпадает со значением йд(0) и равен <1е1А. Итак,

йл(А) =      (А - XI) = <5ПА" + бп-хА"-1 + ... + *1 А + />„,

6п = (-1)";   <5„_, = (-1)"-1ТгЛ;   йо=ае1А (2)

Выражения для других коэффициентов — более громоздкие, и мы их здесь не приводим.

2. Собственные значения квадратной матрицы. В со­ответствии с основной теоремой алгебры, характеристический полином матрицы А 6 Мп может быть представлен в виде

аА{Х) = (-\)п(Х - А,)(А - А2)... (А - А„), (3)

где А!----, А„ — корни а^д(Х), вообще говоря, комплексные.

Корни многочлена й"А(Х) называют собственными значениями матрицы А Среди них могут быть совпадающие. В этом слу­чае применяют и другой способ нумерации: обозначают через

ц\...., /ир. р < п, все различные корни йА(Х), а через а\,____ар

их кратности (так называемые алгебраические кратности). То­гда

<1Л(Х) = (-1)»(А - М1Г(А - И2Г • • ■ (А -

(тг + а2 + ... + ар = п.

Если ак = 1, то собственное значение Цк называют простым. Коэффициенты характеристического многочлена можно выра­зить через собственные значения. В частности, из (3) следует, что коэффициент 6„. 1 при А"^1 равен (-1)™-1 Х!Ш А*-, а сво­бодный член дп равен Пь=1 А*. Учитывая (2), видим, что

п п

ТгЛ = ^АА,   detA = YlXk.

к=\ к=1

Как следствие, получаем, что матрица А — неособая в том и только в том случае, когда все ее собственные значения отличны от нуля.

Совокупность собственных значений /ль..., /1Р матрицы А (вместе с их кратностями .....ар) называют спектром ма­трицы А. Таким образом, матрица А — неособая тогда и только тогда, когда число I) не принадлежит ее спектру. Отыскание спектра матрицы требует решения алгебраического уравне­ния «д(А) = 0 степени п. Иногда эта задача упрощается. В частности, если матрица А — треугольная, то ее собственные значения совпадают с элементами главной диагонали. Это видно непосредственно из определения (1) для

3.   Функции от квадратной матрицы.  По определению

положим А1 = АА , А3 = А1 А.....        А"1 = А'"-1 А , А° = I. Ясно,

что

Ат = Агп~\А = А™-*АА = Ат-2А2 = Ат~3АА2 = Ат~яА*

а потому А"' — АГА", где г+« = т. Таким образом, АГА" = А'АГ, иначе говоря, степени матрицы коммутируют между собой. Здесь т,г,в — неотрицательные целые числа.

Определение. Пусть дан полином Рт(х) = р0 -\-p\x + ■ • • + ртхт. Тогда значением полинома Рт от матричного аргумента А называется матрица

Рт[А) =рп1 + руА + ■■■ +рп,Лт.

В силу перестановочности друг с другом степеней матрицы, справедливы соотношения

(Р + <?)(А) = Р(А) + <?(Л) , (РЯ){А) = Р{А)Я(А).

Далее, если А — неособая матрица, то можно ввести в рассмотрение обратную матрицу А~1. Под отрицательной сте­пенью матрицы А будем понимать положительную степень обратной матрицы: А~т = (Л-1)т. Это определение дает воз­можность ввести в рассмотрение матрицы (А — \1)~т, если Л не принадлежит спектру А.

Пусть теперь Р(х), 0.(х) — многочлены, причем корни полинома О, не принадлежат спектру А. Рассмотрим ра­циональную функцию Щх) = Р{х)/С:(х) и воспользуемся ееразложением на простейшие дроби. Это разложение (оно устанавливается в курсе анализа) дает для Я(х) представле­ние в виде линейной комбинации многочлена и натуральных степеней функций (х — хі)~1, где хк — корни многочлена О,. Основываясь на этом, можно определить матрицу Д(А). Легко видеть (проверьте!), что для двух рациональных функций Д](

Л2 ВЫПОЛНеНО

/г,(Л) + Д2(А) = (Л, + Ла)(А).  Д,(А)Д2(А) = (ЯіЛ2)(Л). (4)

В частности, Яі(Л) и В.2ІЛ) перестановочны.

Для любой матрицы А Є Мп можно также определить }{А), если функция /(ж) разлагается в сходящийся при любом х степенной ряд (ряд Тейлора)

/с=0

Тогда по определению

ДА) = Х>А\

где сходимость ряда понимается поэлементно: [/(А)]^ — Т,ыоЫА%- і-.З = Для функций /і(А), /2(А) справед-

лив аналог соотношений (4):

МА) + МА) = (/г +/2)(А),   МА)МА) = (Ш{А).

Примеры.  1) Пусть А = ^ Тогда А"1 =

Действительно, это верно при т=0ит=1, а для последу­ющих значений га получаем по индукции:

о 7 •

Тогда

/ОС ОС \

2-, к\     2- к\

/с=0

О

к=0

£ к\ I

к=0 /

0 с

2)

Пусть теперь А = ^ *   ^ , /(х) = (ж + 1 )/(х - 1). Тогда

/(А)=(А + 1)(А-1)

-1

2 2

3 5

0 2 3 3

= _1(2   2\ (  3   -2\     _1 (  0   -4\     /0   2/3 \ 6 \3   5У 1^-3    0 у       6 \-б   -в)     \1     1 ) '

С другой стороны, так как /(ж) — 1 + 2(х - 1) 1, то /(Л) = 1 + 2{А -/)"':

/(А) = / + 2

О 2 3 3 1 о О 1 з I-з о

0 2/3

1 1

Упражнения. 1) Пусть А, В — две неособые матрицы. Проверьте, что

В

А-1 = В~1(А — В)А 1 = АЛ{А-В)В~\

2) Если А, В перестановочны, то перестановочны любые их натуральные степени. Если при этом А, Я — неособые, то перестановочны любые их целые степени. Проверьте.

4. Тождество Кэли. Так называется соотношение, соста­вляющее содержание следующей теоремы.

Теорема 1. Пусть А е Мп и йА — характеристический многочлен матрицы А. Тогда

йА(А) = а

(5)

Доказательство. Пусть (А — XI)' — матрица, присоеди­ненная к А - XI. В силу (7.8),

(А - Х1)(А - XI)' = сЬа (А -Х1)1 = <1А{Х)1. (6)

Элементы матрицы (А — XI)', с точностью до знака, совпадают с минорами матрицы А — XI порядка п — 1, а следовательно, являются полиномами от А степени не выше п — 1. Введем матрицы В0, В\..... Вп-1, элементы которых совпадают с коэф­фициентами этих полиномов при соответствующих степенях А:

[{А - А/)"]у = Ьо4} + ЪщХ + ■■■ + 6п_1л,Ап-\

то есть

(А - XI)' = В0 + В,Х+ -- +       Ап-'. В соответствии с (6),

(А-Х1)(В0+В1Х+- ■ -+Вп. 1А"-1) = с1А{Х)1 = (й0+б,А+- • -+6пХп)1.

(7)

Приравнивая друг другу коэффициенты при одинаковых сте­пенях А в правой и левой частях (7), находим:

( АВ0 = 801 АВг - В0 = 6Х1 АВ2 -В, = Ь21

(8)

АВ„_1 — Вп-2 — 6„_1/ —Вп-1 — Ьп1.

Умножим теперь слева >е-ое равенство в (8) на Ак~х. Тогда

( АВ0 = 6о1

А2ВХ - АВа = ЬХА А3В2 - А2В1 = Ь2Аг

АпВ„л -Ап-1Вп_2 = К^А I -АпВп^ = ЬпА\

Сложим равенства (9). Все слагаемые в левой части сокраща­ются, а потому

801 + 6, А + ■ ■ ■ + ЬпАп = <1А{А) = О,

что совпадает с (5). •

Одним из полезных следствий тождества Кэли явля­ется то, что матрица Ап (а следовательно, и более высо­кие степени матрицы А) суть линейные комбинации матриц /, А, А2, • • ■, Ап~}. Поэтому вычисление любого полинома р(А) можно свести к вычислению полинома от А степени не выше п — 1. Действительно, р(х) — з(х)<1а(х) + гп_1(х), где «(ж) — частное от деления р на &а, а гп^х — остаток. Поэтому

р(А) = в(А)йА(А)+гп^(А) = гп_!(Л). Пример. А — (   ^   ^ ) • Найдем матрицу А10. Поскольку

1 - А 1

-2     4 - А

А2 - 5А + 6 = (А — 2)(А - 3);

г'О-З10    3.10 _2ю      Зю 210

х - 3 а: - 2   + х - 3 ~ х -2'

то  х10  = + (310(х - 2) - 210(х - 3)),  где  я{х) =

(х10 - 310)(х - 3)-' - (х10 - 210)(х - 2)-1 — полином степени 9. Следовательно, А10 = 310(А - 21) - 210(А - 31).

5. Подобие матриц. Здесь мы обсудим два важных поня­тия — подобие и диагонализуемость матриц.

Определение. Матрицы А, В € Мп называются подобны­ми, если существует неособая матрица X е Мп такая, что В — Х~ХАХ (а тогда и А = ХВХ~Х). При этом X называется матрицей, осуществляюи^ей подобие, или аффинитетом.

Отметим основные свойства подобия.

1. Характеристический многочлен (а, следовательно, и определитель, след, спектр) у подобных матриц один и тот же. Действительно, dB(A) = det (В - XI) = det (X~lAX - \X~lIX) = det (X~l{A - \I)X) - det X-' det (A - XI) det X = dA{\).

Отметим, что подобные матрицы, в силу равенства их определителей, могут быть неособыми только одновременно.

2. Если матрицы Ли В подобны, то подобны и их степени, причем подобие осуществляется той же матрицей. Действи­тельно, если m — натуральное число, то

Вт = (X-lAX)m = X^AXX-lAX ...Х~1АХ = Х~1 АтХ.

Далее, если матрицы А и В неособые, то В 1 = (Х_1АХ')~1 = Х-1 А'1 (Х-1)'1 = Х'ХАХ, а следовательно, и Вт = Х~]АтХ для всех т € Z. Как следствие, любые полиномы или рацио­нальные функции от подобных матриц также подобны с тем же аффинитетом.

3. Если матрицы А и В подобны, то подобны также и матрицы А* и В', А* и В*. Действительно, В* = (Х~хАХ)г = Х*А\Х1)~\В* = Х*А'(Х*)'\ При этом, однако, аффинитет меняется.

Определение. Матрица называется диагонализуемой, если она подобна некоторой диагональной матрице. Поскольку спектр диагональной матрицы

совпадает с числами ац, 022, • • •, апп, то и для диагонализуемой матрицы В — Х"х АХ числа ап,...,а„п суть ее собственные значения.

Не все квадратные матрицы диагонализуемы. В качестве

А = diag{an,tt22

 

примера приведем матрицу

 

Действительно, ее

характеристический многочлен dA(X) есть

dA(X) =

-А О

1

Единственная диагональная матрица с таким же характери­стическим многочленом — нулевая. Однако нулевая матрица не может быть подобна ненулевой: если А = Х~хОХ , то А — О. Из рассмотренного примера следует также, что совпадение характеристических многочленов не является достаточным (а лишь необходимым) условием подобия матриц.

Вместе с тем, "большинство" матриц диагонализуемы. Приведем здесь достаточные условия диагонализуемости, ко­торые будут доказаны в последующих главах курса. Диагона­лизуемы все матрицы с простым спектром, все эрмитовы и все унитарные (см. ниже п. 9.4) матрицы. Эти классы даже в совокупности не исчерпывают все множество диагонализумых матриц.

Легко понять, что для А = diag{A1,..., Ап} будет Ат = diag {А™,..., А™} при натуральном т и т = 0, а если все А^ отличны от нуля, то это верно и для любых целых т. Поэтому, если Щх) — рациональная функция, такая, что Я(А) имеет смысл, то ЩА) = diag{^^(Al),..., Я(А„)}. Теперь естественно для произвольной функции f(x) принять равенство

ДА) ^Наё {ДА,),..., ДАП)}

за определение функции /(А) от диагональной матрицы А. Это определение согласовано с определением рациональной функции от матрицы и с определением через ряды. Заме­тим также, что для диагональной матрицы тождество Кэли очевидно, поскольку

=<11ав{й>,(А1),...,йл(Ап)} =с11ав{0,...,0} = 0.

Это рассуждение переносится и на диагонализуемые матрицы. Действительно, если В = Х~1АХ, где А = diag {А1,..., А„}, то для любого полинома р(х) верно р(В) = Х~1р(А)Х, откуда а'в(В) = (1А(В) = Х-\1Л(А)Х = 0. Формулу

ДЯ) = Х-М1ае{/(А,)...../(Хп)}Х

естественно принять за определение произвольной функции /(х) от диагонализуемой матрицы В.