Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Seja \(A\) uma matriz \(m \times n\) de posto \(r\). Mostre que \(A\) pode ser expressa como a soma de \(r\) matrizes de posto 1.

0 votos
26 visitas
perguntada Fev 23 em Matemática por claudiaeirado (56 pontos)  

Exercício 10 do Capítulo 4 do Livro "Matrix algebra from a
statistician's perspective - Harville".

Compartilhe

1 Resposta

0 votos
respondida 3 dias atrás por claudiaeirado (56 pontos)  
editado 1 dia atrás por claudiaeirado

Para a resolução do problema, precisamos do Teorema da Fatoração de Posto.

TEO (Teorema da Fatoração de Posto): Seja \(A\) uma matriz \(m \times n\) de posto \(r\). Então \(A\) pode ser escrita como \(A=BC\), em que B é matriz \(m \times r\) de posto \(r\) e C é a matriz \(r \times n\) de posto \(r\).

Prova do TEO: \(A\) é matriz de posto r, então \(posto (A) = dim \ col(A)=r\), em que \(dim\) denota a dimensão e \(col(A)\) é o espaço coluna da matriz A, ou seja \(r=dim(span(a_{1}, \dots, a_{n}))\). Logo, \(A\) possui \(r\) colunas linearmente independentes (\(l.i.\)), ditas \(b_1 \dots b_r\). Cada coluna \(a_j\) de \(A\) é uma combinação linear de \(b_1,\dots,b_r\). Então existem números \(c_{ij}\) tais que \[a_j=\sum_{i=1}^r b_i c_{ij},\] note que \(B=[b_1, \dots ,b_r]\) e \(C=[c_{ij}]\).
Então, considere \(e_j\) a base canônica e
\(Ae_j=a_j=B(Ce_j)=(BC)e_j \Rightarrow A =BC\). E assim, finalizamos a prova do TEO.

Voltando ao problema inicial, e usando o TEO da Fatoração de Posto apresentado, então dado \(A\), existe B e C com postos r tais que \(A = BC\), com \(b_1, \dots ,b_r\) colunas de \(B\) e \(c'_{1}, \dots,c'_{r}\) linhas de \(C\). Temos que \[A = BC = \sum_{j=1}^r A_j ,\]
com \(A_j=b_j c'_{j}\) e \(j=1 \dots r\), isto é \(A_j=(b_{j}c_{ji}, \dots, b_{j}c_{jn})\). Adicionalmente, \(posto(A) = posto(B) =\) \( posto(C) = r\). E temos \(b_1, \dots ,b_r\) , e \(c_{1}, \dots ,c_{r}\) não-nulas e l.i. e por consequência, \(A_1, \dots ,A_r\) é não-nula e l.i. também.

Lema: \(posto(BC)= min \{ posto(B), posto(C) \} \)

Prova do Lema: \(posto(BC) = dim \ col(BC) \leq dim \ col(B) = posto(B)\) e
\(posto(BC) = posto(C'B') =dim \ col(C'B') \leq dim \ col(C') = posto(C)\)

Logo:
\(posto (A) \leq m \) e \(posto (A) \leq n \)
\(posto (B) \leq m \) e \(posto (B) \leq r \)
\(posto (C) \leq n \) e \(posto (C) \leq r \)
\(posto(BC) \leq posto (A)\),
\(posto(BC) \leq posto (B)\) e
\(posto(BC) \leq posto (C )\)

Como sabemos que \(posto (A) = posto (B) = r \), segue das desigualdades acima que \(posto (C ) \geq r \ e \ posto (C ) \leq r \). Logo, \(posto (C ) = r\).
E também sabemos que \( dim \ b_{j}=1\), pois \(b_j\) é um vetor e \(posto(A_j) = min\{posto(b_j ), posto(c_{j})\} \leq posto(b_j) = 1\).

Como as colunas \(A_j\) são não-nulas ( \(b_1, \dots ,b_r\ e \ c_{1}, \dots ,c_{r}\) não-nulas e l.i.) e \(posto(A_{j}) \neq 0\), então, implica que \(posto(A_j) =1\). Logo, \(A\) pode ser expressa como a soma de \(r\) matrizes de posto 1. (c.q.d.)

Segue um exemplo simples, observe a matriz \[A=\left[ \begin{array}{col_1 col_2 col_3 col_4} 1 & 3 & 2 & 6\\ 2 & 1 & 1 & 4\\ 3 & 1 & 1 & 5\\ \end{array} \right] \]

\(A\) é uma matriz 3 x 4 com posto =3. Ou seja, \(A = (a_1, a_2, a_3, a_4)\), em \[a_1=\left[ \begin{array}{col_1} 1\\ 2 \\ 3 \\ \end{array} \right] , a_2=\left[ \begin{array}{col_1} 3\\ 1 \\ 1 \\ \end{array} \right] , a_3=\left[ \begin{array}{col_1} 2\\ 1 \\ 1 \\ \end{array} \right] , a_4=\left[ \begin{array}{col_1} 6\\ 4 \\ 5 \\ \end{array} \right] \]
\(span (A) = span(a_1, a_2, a_3, a_4) = \mathbb{R}^3\) e \(dim (span(A))=3\), então \(posto (A) = 3\). Logo \(A=\sum_{j=1}^3 A_j = A_1+ A_2 + A_3\), e \(A_j=b_j c'_j\), e suponhamos, para simplificar, que \(B=[b_1, b_2 ,b_3]\) é a base canônica, então que \(b_j=e_j\), e por consequênia, \(a_{ij}=c_{ij}\). Isto é,
\[e_1=\left[ \begin{array}{col_1} 1 \\ 0 \\ 0 \end{array} \right] , e_2=\left[ \begin{array}{col_1} 0 \\ 1 \\ 0 \end{array} \right] , e_3=\left[ \begin{array}{col_1} 0 \\ 0 \\ 1 \end{array} \right] \]
Então temos que
\(a_1=1e_1+2e_2+3e_3\)
\(a_2=3e_1+1e_2+1e_3\)
\(a_3=2e_1+1e_2+1e_3\)
\(a_4=6e_1+4e_2+5e_3\)

E podemos construir \(A_j\):

\[A_1=\left[ \begin{array}{col_1 col_2 col_3 col_4} 1& 3& 2& 6\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ \end{array} \right], \]
\[A_2=\left[ \begin{array}{col_1 col_2 col_3 col_4} 0& 0& 0 & 0\\ 2 & 1 & 1 & 4\\ 0 & 0 & 0 & 0\\ \end{array} \right], \]
\[A_3=\left[ \begin{array}{col_1 col_2 col_3 col_4} 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ 3 & 1 & 1 & 5\\ \end{array} \right], \]

e, de fato, \(A=A_1+A_2+A_3\).

comentou 1 dia atrás por Thiago Trafane (6 pontos)  
editado 1 dia atrás por Thiago Trafane
1) Comentários sobre a demonstração do teorema da fatoração de posto:

a) Na parte final da demonstração, você afirma que \( Ae_j=BC \). Ora, mas essa igualdade não pode valer, já que \( Ae_j = a_j \) é um vetor de dimensão \( m \), enquanto que \( BC = A \) é uma matriz \( m \times n \). O que vale é \( Ae_j = (BC)e_j \). E, nesse caso, você poderia explicar melhor o que você está querendo mostrar aqui. Acredito que seja que definindo \( B \) e \( C \) da maneira apresentada, temos de fato que \( A = BC \).

b) Ficou faltando mostrar que o posto de \( C \) é \( r \).


2) Comentários sobre a demonstração do resultado final usando o teorema da fatoração de posto:

a) Logo no início, você escreve "usando o TEO da Fatoração de Posto apresentado, então existe \( A \) tal que \( A = BC \)". Contudo, o teorema diz o contrário: dada uma matriz \( A \), existem as matrizes \( B \) e \( C \) tal que \( A = BC \). Valeria a pena corrigir isso, até porque o resultado final que queremos provar é para uma dada matriz \( A \).

b) Quando você afirma que \( A_j = (b_j c_{ij}', ..., b_j c_{nj}') \) acho que o correto seria \( A_j = (b_j c_{j1}, ..., b_j c_{jn}) \).

c) Na parte final da demonstração, você apresenta uma série de restrições com relação ao posto das matrizes. Não ficou claro para mim quais resultados você está usando e qual o seu argumento. Em particular, a restrição \( posto (A_j) \leq posto(b_j) \leq 1\), que é a restrição relevante para a demonstração, não me parece ser uma consequência das demais. Ademais, após apresentar tais restrições, você afirma que "as colunas de \(A_j\) são não-nulas", quando na verdade podemos ter colunas de \( A_j \) nulas, já que uma das colunas de \( A \) pode não depender de algum \( b_j \). De qualquer forma, dado que \( A_j = (b_j c_{j1}, ..., b_j c_{jn}) \), é fácil ver que \( posto (A_j) =1 \). Afinal, como cada coluna de \( A_j \) é uma combinação linear de \( b_j \), seu posto não pode ser maior ou igual a 2. Ora, mas o posto também não pode ser 0, já que isso só ocorreria se \( b_j = 0 \) ou \( c_{j1} = c_{j2} = ... = c_{jn} = 0\), o que seria uma contradição com o fato das colunas da matriz \( B \) e as linhas da matriz \( C \) serem linearmente independentes. Logo, \( posto (A_j) =1 \) para todo \(j\).

d) Apenas como sugestão: talvez fosse interessante mostrar como se chega ao resultado \( BC = \sum_{j=1}^{r} b_j c_j \), por exemplo, calculando \(BC\) usando \( B = [b_{ij}] \) por \( C = [c_{ij}] \), isto é, calculando essa multiplicação com base nos elementos das matrizes. Acredito que o resultado esteja correto, mas ele não me parece tão direto. O exemplo apresentado ao final auxilia na compreensão, mas poderia até ser retirado com essa argumentação mais detalhada.


3) Demonstração alternativa, sem o uso do teorema da fatoração de posto:

Como \( A \) tem posto \( r \), o espaço coluna de \( A \) tem dimensão \( r \) e, logo, existem  colunas \(b_1, b_2, ..., b_r \) de \( A \) que formam uma base desse espaço vetorial. Então, existem escalares \( c_{ij} \) tal que \( a_j = \sum_{i=1}^{r} c_{ij} b_i \) para todo \(j\), onde \( a_j \) é a \(j\)-ésima coluna de \( A \). Como tal resultado vale para qualquer \( j \), podemos escrever

\[ A = [a_1,...,a_n]=[\sum_{i=1}^{r} c_{i1} b_i,...,\sum_{i=1}^{r} c_{in} b_i] = \sum_{i=1}^{r} [c_{i1} b_i,..., c_{in} b_i] = \sum_{i=1}^{r} A_i \]
onde \( A_i  = [c_{i1} b_i,..., c_{in} b_i] \).

Como as colunas de \( A_i\) são combinações lineares de \(b_i\), o posto de \( A_i \) não pode ser maior ou igual a \( 2 \). Ademais, o posto não pode ser \( 0 \), ou equivalentemente, cada uma dessas matrizes não pode ser a matriz nula, já que \( b_i \neq 0 \) para todo \( i \), dado que \( b_1, ..., b_r \) são linearmente independentes, e não podemos ter \( c_{k1} = ... = c_{kn}=0 \) para algum \( k \). Afinal, se isso ocorresse, teríamos que todas as colunas de \( A \) podem ser escritas sem \( b_k \), o que seria um absurdo, pois \(b_k\) é, por construção, uma das colunas de \( A \) e sabemos que cada elemento do espaço coluna \( A \) pode ser escrito de maneira única a partir da base \(b_1, ..., b_r \).

Em suma, \( A \) pode ser escrita como a soma das \( r \) matrizes \( A_i \), valendo que  \( posto(A_i) < 2 \) e \( posto(A_i) \neq 0 \) para todo \(i\), ou seja, \( posto(A_i) = 1 \) para todo \(i\), como queríamos demonstrar.
comentou 1 dia atrás por claudiaeirado (56 pontos)  
Oi Thiago! Obrigada pelos comentários.

Em 1. a) realmente estava faltando um sinal de implicação, que foi corrigido.

b) Está no enunciado do TEO da Fatoração de Posto que B e C tem postos r.

2. a) Para ficar mais claro, modifiquei a redação, incluindo B e C.

b)Para melhorar a notação, segui a sugestão.

c) Eu tinha utilizado um resultado dado em sala de aula que não havia enunciado, então acrescentei-o para ficar mais claro e elucidar o porquê da conclusão de que
\(posto(A_j)=1\).

d) Os resultados de notações de partições de matrizes estão disponíveis na Seção 2.2 do livro  "Matrix algebra from a statistician's perspective", David A. Harville.

A concepção da demonstração em 3) é bem próxima da apresentada. Muito obrigada pela contribuição!
comentou 1 dia atrás por Thiago Trafane (6 pontos)  
Claudia, obrigado pela resposta!

Apenas um comentário adicional, sobre o 1b. O teorema da fatoração de posto diz que se uma matriz A tem posto r, é possível escrever A = BC, onde B e C também tem posto r. Na sua demonstração, você construiu uma matriz B e C, mostrou que A = BC e mostrou que a matriz B tem posto r. Resta mostrar que a matriz C construída tem posto r. Essa é um resultado do teorema, não uma hipótese.
comentou 1 dia atrás por claudiaeirado (56 pontos)  
Thiago, coloquei lá a prova do posto( C) =r  também.
:)
...