Vybrané vlastnosti metody sdružených gradientů při aplikaci na ljapunovskou maticovou rovnici
Loading...
Date
2025-06-10
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Diplomová práce navazuje na bakalářskou práci [Lungová, TUL 2023] a je zaměřena na řešení tzv. ljapunovské rovnice, tj. rovnice tvaru AX + XA^T = F, kde A, X a F jsou čtvercové matice řádu n. Předpokládáme, že matice A je řídká a matice pravé strany F má nízkou hodnost. V takovém případě je možné řešení X aproximovat maticí nízké hodnosti. K výpočtu řešení používáme maticový tvar metody sdružených gradientů (MCG). Ukazuje se, že když je navíc počáteční vektor (matice) MCG nízké hodnosti (např. nulový), lze všechny meziprodukty v MCG přepsat v tzv. low-rank aritmetice,
tedy jako by měly také nízkou hodnost.
Z experimentů ale víme, že v průběhu výpočtu dochází k nárůstu a později poklesu numerické hodnosti aproximace přesného řešení Xk (jakož i dalších matic v MCG). Nárůst hodnosti je problematický, protože kvůli paměťovým nárokům na výpočet může učinit úlohu neřešitelnou. Vzdálenějším cílem totiž je řešit ljapunovskou rovnici pro tak velká n, kdy nebude možné matici řádu n uložit do počítače, pokud není řídká nebo nízké hodnosti.
V některých experimentech se ukazuje, že numerické hodnosti matic v MCG jsou omezené číslem ostře menším než n. V této práci se pokusíme tento jev vysvětlit z vlastností metody sdružených gradientů. Konkrétně budeme zkoumat proč v případě ljapunovské rovnice, kde matice A je diskretizací 1D Laplaceova operátoru a pravá strana F je tvořena samými jedničkami numerická hodnost matic X_k naroste jen do poloviny řádu matice. Ukážeme, že toto omezení je důsledkem souhry vlastností obou matic a metody sdružených gradientů a jí příbuzného Lanczosova algoritmu.
The diploma thesis follows on from the bachelor's thesis [Lungová, TUL 2023] and is focused on solving of the so-called Lyapunov equation, i.e. an equation of the form AX + XA^T = F, where A, X and F are square matrices of order n. We assume that the matrix A is sparse and the matrix of the right-hand side F is of low rank. In such a case, the solution X can be approximated by a low-rank matrix. To calculate the solution, we use the matrix form of the conjugate gradient method (MCG). It turns out that when the initial vector (matrix) of the MCG is of low rank (e.g. zero), all intermediate products in the MCG can be rewritten in the so-called low-rank arithmetic, i.e. as if they also were of low rank. However, we know from experiments that during the calculation, the numerical rank of the approximation of the exact solution X_k (as well as other matrices in the MCG) increases and later decreases. The rank increase is problematic because it can make the problem unsolvable due to the memory requirements for the calculation. A more distant goal is to solve the Lyapunov equation for such large n that it will not be possible to store a matrix of order n in a computer unless it is sparse or of low rank. In some experiments, it is shown that the numerical ranks of matrices in MCG are limited by a number sharply smaller than n. In this thesis, we will try to explain this phenomenon from the properties of the conjugate gradient method. Specifically, we will investigate why, in the case of the Lyapunov equation, where the matrix A is the discretized 1D Laplace operator and the right-hand side F consists of all ones, the numerical rank of the matrices Xk grows only to half the order of the matrix. We will show that this limitation is a consequence of the interplay of the properties of both matrices and the conjugate gradient method and the closely related Lanczos algorithm.
The diploma thesis follows on from the bachelor's thesis [Lungová, TUL 2023] and is focused on solving of the so-called Lyapunov equation, i.e. an equation of the form AX + XA^T = F, where A, X and F are square matrices of order n. We assume that the matrix A is sparse and the matrix of the right-hand side F is of low rank. In such a case, the solution X can be approximated by a low-rank matrix. To calculate the solution, we use the matrix form of the conjugate gradient method (MCG). It turns out that when the initial vector (matrix) of the MCG is of low rank (e.g. zero), all intermediate products in the MCG can be rewritten in the so-called low-rank arithmetic, i.e. as if they also were of low rank. However, we know from experiments that during the calculation, the numerical rank of the approximation of the exact solution X_k (as well as other matrices in the MCG) increases and later decreases. The rank increase is problematic because it can make the problem unsolvable due to the memory requirements for the calculation. A more distant goal is to solve the Lyapunov equation for such large n that it will not be possible to store a matrix of order n in a computer unless it is sparse or of low rank. In some experiments, it is shown that the numerical ranks of matrices in MCG are limited by a number sharply smaller than n. In this thesis, we will try to explain this phenomenon from the properties of the conjugate gradient method. Specifically, we will investigate why, in the case of the Lyapunov equation, where the matrix A is the discretized 1D Laplace operator and the right-hand side F consists of all ones, the numerical rank of the matrices Xk grows only to half the order of the matrix. We will show that this limitation is a consequence of the interplay of the properties of both matrices and the conjugate gradient method and the closely related Lanczos algorithm.
Description
Subject(s)
ljapunovská rovnice, metoda sdružených gradientů (CG), Lanczosův algoritmus, krylovovské prostory, low-rank aritmetika, numerická hodnost, omezení hodnosti