Équation de Sylvester

En mathématiques, dans le domaine de la théorie du contrôle, une équation de Sylvester est une équation matricielle de la forme[1] :

A X + X B = C {\displaystyle AX+XB=C} .

Les matrices A {\displaystyle A} , B {\displaystyle B} et C {\displaystyle C} sont données ; le problème est de déterminer les matrices X {\displaystyle X} qui satisfont cette équation. Les matrices sont supposées à coefficients complexes. Les matrices sont de tailles appropriées, par exemple elles sont toutes des matrices carrées de même taille, ou plus généralement, A {\displaystyle A} et B {\displaystyle B} sont des matrices carrées de taille n {\displaystyle n} et m {\displaystyle m} respectivement, et X {\displaystyle X} et C {\displaystyle C} sont à n {\displaystyle n} lignes et m {\displaystyle m} colonnes.

Une équation de Sylvester a une solution unique en X {\displaystyle X} si et seulement si A {\displaystyle A} et B {\displaystyle -B} n'ont pas de valeur propre commune. Plus généralement, l'équation A X + X B = C {\displaystyle AX+XB=C} a été considérée comme une équation d'opérateurs bornés dans un espace de Banach (éventuellement de dimension infinie). Dans ce cas, la condition d'unicité d'une solution en X {\displaystyle X} est quasiment la même : il existe une solution unique en X {\displaystyle X} exactement lorsque les spectres de A {\displaystyle A} et de B {\displaystyle -B} sont disjoints[2].

Existence et unicité des solutions

En utilisant le produit de Kronecker et l'opérateur de vectorisation (en) vec {\displaystyle \operatorname {vec} } , on peut réécrire l'équation de Sylvester sous la forme

( I m A + B T I n ) vec X = vec C , {\displaystyle (I_{m}\otimes A+B^{T}\otimes I_{n})\operatorname {vec} X=\operatorname {vec} C,}

A {\displaystyle A} est de taille ( n , n ) {\displaystyle (n,n)} , B {\displaystyle B} est de taille ( m , m ) {\displaystyle (m,m)} , X {\displaystyle X} de taille ( n , m ) {\displaystyle (n,m)} et I k {\displaystyle I_{k}} est la matrice d'identité de taille k {\displaystyle k} . Sous cette forme, l'équation peut être vue comme un système linéaire de taille m n × m n {\displaystyle mn\times mn} [3].

Théorème — Étant données des matrices A C n × n {\displaystyle A\in \mathbb {C} ^{n\times n}} et B C m × m {\displaystyle B\in \mathbb {C} ^{m\times m}} , l'équation de Sylvester : A X + X B = C {\displaystyle AX+XB=C} a une solution unique X C n × m {\displaystyle X\in \mathbb {C} ^{n\times m}} quelle que soit C C n × m {\displaystyle C\in \mathbb {C} ^{n\times m}} si et seulement si A {\displaystyle A} et B {\displaystyle -B} n'ont pas de valeur propre commune.

Démonstration

L'équation A X + X B = C {\displaystyle AX+XB=C} est un système linéaire en m n {\displaystyle mn} inconnues et autant d'équations. Elle a donc une solution unique pour tout C {\displaystyle C} si et seulement si l'équation homogène A X + X B = 0 {\displaystyle AX+XB=0} n'admet que la solution triviale 0 {\displaystyle 0} .

(i) Supposons que A {\displaystyle A} et B {\displaystyle -B} n'ont pas de valeur propre commune et soit X {\displaystyle X} une solution de l'équation homogène. Alors A X = X ( B ) {\displaystyle AX=X(-B)} et par récurrence A k X = X ( B ) k {\displaystyle A^{k}X=X(-B)^{k}} pour tout k 0 {\displaystyle k\geq 0} . Par conséquent, on a p ( A ) X = X p ( B ) {\displaystyle p(A)X=Xp(-B)} pour tout polynôme p {\displaystyle p} . En particulier, soit p {\displaystyle p} le polynôme caractéristique de A {\displaystyle A} . Alors p ( A ) = 0 {\displaystyle p(A)=0} par le théorème de Cayley-Hamilton ; le théorème spectral donne

σ ( p ( B ) ) = p ( σ ( B ) ) {\displaystyle \sigma (p(-B))=p(\sigma (-B))} ,

σ ( ) {\displaystyle \sigma (\cdot )} désigne le spectre d'une matrice. Si A {\displaystyle A} et B {\displaystyle -B} n'ont pas de valeur propre commune, p ( σ ( B ) ) {\displaystyle p(\sigma (-B))} ne contient pas zéro, et donc p ( B ) {\displaystyle p(-B)} est non singulier. Ainsi X = 0 {\displaystyle X=0} comme annoncé. Cela prouve la partie directe du théorème.

(ii) Supposons maintenant que A {\displaystyle A} et B {\displaystyle -B} partagent une valeur propre λ {\displaystyle \lambda } . Soit u {\displaystyle u} un vecteur propre droit associé pour A {\displaystyle A} , et v {\displaystyle v} un vecteur propre gauche associé pour B {\displaystyle -B} , et soit X = u v {\displaystyle X=u{v}^{*}} . Alors X 0 {\displaystyle X\neq 0} , et A X + X B = A ( u v ) ( u v ) ( B ) = λ u v λ u v = 0. {\displaystyle AX+XB=A(uv^{*})-(uv^{*})(-B)=\lambda uv^{*}-\lambda uv^{*}=0.} Ainsi X {\displaystyle X} est une solution non triviale à l'équation homogène, montrant la réciproque du théorème.

La non-singularité de p ( B ) {\displaystyle p(-B)} dans la partie (i) de la preuve ci-dessus peut également être démontrée par l' identité de Bézout pour des polynômes premiers entre eux. Soit en effet q {\displaystyle q} le polynôme caractéristique de B {\displaystyle -B} . Comme A {\displaystyle A} et B {\displaystyle -B} n'ont pas de valeur propre commune, p {\displaystyle p} et q {\displaystyle q} sont premiers entre eux. Il existe donc des polynômes f {\displaystyle f} et g {\displaystyle g} tel que p ( z ) f ( z ) + q ( z ) g ( z ) 1 {\displaystyle p(z)f(z)+q(z)g(z)\equiv 1} . Par le théorème de Cayley-Hamilton, q ( B ) = 0 {\displaystyle q(-B)=0} . Ainsi p ( B ) f ( B ) = I {\displaystyle p(-B)f(-B)=I} , ce qui implique que p ( B ) {\displaystyle p(-B)} est non singulier.

Le théorème reste vrai pour les matrices réelles sous réserve de considérer leurs valeurs propres complexes. La preuve de la partie directe est toujours valable ; pour la réciproque, on note que R e ( u v ) {\displaystyle \mathrm {Re} (uv^{*})} et I m ( u v ) {\displaystyle \mathrm {Im} (uv^{*})} satisfont l'équation homogène A X + X B = 0 {\displaystyle AX+XB=0} , et ils ne peuvent pas être nuls simultanément.

La règle de suppression de Roth

Étant donné deux matrices carrées complexes A {\displaystyle A} et B {\displaystyle B} de taille n {\displaystyle n} et m {\displaystyle m} , et une matrice C {\displaystyle C} de taille ( n , m ) {\displaystyle (n,m)} , on peut se demander quand les deux matrices carrées suivantes

: [ A C 0 B ] {\displaystyle {\begin{bmatrix}A&C\\0&B\end{bmatrix}}\,} et [ A 0 0 B ] {\displaystyle \,{\begin{bmatrix}A&0\\0&B\end{bmatrix}}}

de taille n + m {\displaystyle n+m} sont semblables. La réponse est que ces deux matrices sont semblables exactement lorsqu'il existe une matrice X {\displaystyle X} telle que A X X B = C {\displaystyle AX-XB=C} , en d'autres termes, si X {\displaystyle X} est une solution d'une équation de Sylvester. Cette observation est appelée la règle de suppression de Roth [4].

On vérifie facilement une direction : Si A X X B = C {\displaystyle AX-XB=C} alors

[ I n X 0 I m ] [ A C 0 B ] [ I n X 0 I m ] = [ A 0 0 B ] . {\displaystyle {\begin{bmatrix}I_{n}&X\\0&I_{m}\end{bmatrix}}{\begin{bmatrix}A&C\\0&B\end{bmatrix}}{\begin{bmatrix}I_{n}&-X\\0&I_{m}\end{bmatrix}}={\begin{bmatrix}A&0\\0&B\end{bmatrix}}.}

La règle de suppression de Roth ne se généralise pas aux opérateurs bornés de dimension infinie sur un espace de Banach[5].

Résolutions numériques

Un algorithme classique de résolution numérique de l'équation de Sylvester est l'algorithme de Bartels-Stewart, qui consiste à transformer A {\displaystyle A} et B {\displaystyle B} en forme de Schur par un algorithme QR, puis en résolvant le système triangulaire résultant par substitution. Cet algorithme, dont le coût de calcul est en O ( n 3 ) {\displaystyle {\mathcal {O}}(n^{3})} opérations arithmétiques, est utilisé, entre autres, par le logiciel LAPACK et la fonction lyap dans GNU Octave[6]. Elle est proche de la fonction sylvester dans cet ensemble[7],[8]. Dans certaines applications spécifiques de traitement d'image , la solution de l'équation de Sylvester dérivée a une forme close[9].

Articles connexes

Notes

  • (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Sylvester equation » (voir la liste des auteurs).
  1. On voit aussi l'écriture équivalente A X X B = C {\displaystyle AX-XB=C} .
  2. Bhatia et Rosenthal 1997.
  3. Cependant, cette réécriture de n'est pas conseillée car la solution numérique coûteuse en temps peut être mal conditionnée.
  4. F. Gerrish et A.G.B. Ward, « Sylvester's matrix equation and Roth's removal rule », The Mathematical Gazette, vol. 82, no 495,‎ , p. 423–430 (DOI 10.2307/3619888, JSTOR 3619888).
  5. Bhatia et Rosenthal 1997, p. 3.
  6. « Function Reference: Lyap »
  7. « Functions of a Matrix (GNU Octave (version 4.4.1)) »
  8. La commande syl est obsolète depuis la version GNU Octave Version 4.0.
  9. Q. Wei, N. Dobigeon et J.-Y. Tourneret, « Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation », Transactions on Image Processing, vol. 24, no 11,‎ , p. 4109–4121 (PMID 26208345, DOI 10.1109/TIP.2015.2458572, Bibcode 2015ITIP...24.4109W, arXiv 1502.03121, S2CID 665111).

Références

  • J. Sylvester, « Sur l'equations en matrices p x = x q {\displaystyle px=xq}  », Comptes rendus de l'académie des sciences, vol. 99, no 2,‎ , p. 67–71, 115–116
  • R. H. Bartels et G. W. Stewart, « Solution of the matrix equation A X + X B = C {\displaystyle AX+XB=C}  », Communications of the ACM, vol. 15, no 9,‎ , p. 820–826 (DOI 10.1145/361573.361582, S2CID 12957010)
  • R. Bhatia et P. Rosenthal, « How and why to solve the operator equation A X X B = Y {\displaystyle AX-XB=Y}  ? », Bulletin of the London Mathematical Society, vol. 29, no 1,‎ , p. 1–21 (DOI 10.1112/S0024609396001828)
  • S.-G. Lee et Q.-P. Vu, « Simultaneous solutions of Sylvester equations and idempotent matrices separating the joint spectrum », Linear Algebra Appl., vol. 435, no 9,‎ , p. 2097–2109 (DOI 10.1016/j.laa.2010.09.034)
  • Q. Wei, N. Dobigeon et J.-Y. Tourneret, « Fast Fusion of Multi-Band Images Based on Solving a Sylvester Equation », IEEE Transactions on Image Processing, vol. 24, no 11,‎ , p. 4109–4121 (PMID 26208345, DOI 10.1109/TIP.2015.2458572, Bibcode 2015ITIP...24.4109W, arXiv 1502.03121, S2CID 665111)
  • Garrett Birkhoff et Saunders MacLane, A survey of modern algebra, Macmillan, , p. 213-299

Liens externes

  • Fonction Mathematica pour résoudre l'équation de Sylvester
  • Fonction MATLAB pour résoudre l'équation de Sylvester
  • icône décorative Portail des mathématiques