A idéia é bem simples. Para isso considere os passos abaixo:
1) O que é um espaço de Hilbert?
2) Normalmente, em econometria estamos interessados em encontrar o vetor \(\beta\) que é o estimador que minimiza \(||e||^2\), onde \(e=y-\hat y\), \(\hat y=X\beta\), \(y,\hat y\in\Re^n\) e \(X\) é uma matriz com \(k\) colunas em que cada coluna \(x_i,\) \(i=1,\cdots,n\) é um vetor do \(\Re^n\). Em geral, \(k \lt\lt n\).
3) Note que \(\hat y=\beta_1x_1 +\cdots \beta_k x_k\), onde \(\beta_i,\) \(i=1,\cdots,k\) são elementos do vetor \(\beta\). Então, basicamente estamos aproximando um vetor do \(\Re^n\) pela combinação linear de \(k\) vetores.
4) Obviamente, nesse caso simplificado o espaço de Hilbert em consideração é o \(\Re^n\).
5) O teorema da projeção diz que existe um vetor que pertence ao subespaço \(M\) gerado por \(x_1,\cdots,x_n\) que minimiza \(||e||^2\). Esse vetor é a projeção de \(y\) nesse subespaço. De fato, \(e \perp M\), que intuitivamente significa que toda informação disponível foi usada para construir otimamente \(\hat y\).