Indagamos por diferentes espacios para así regalarte la solución para tu inquietud, si continúas con dudas puedes dejarnos tu comentario y contestaremos con gusto.
Solución:
Hablaré de la proyección ortogonal aquí.
Cuando uno proyecta un vector, digamos $v$, en un subespacio, encuentra el vector en el subespacio que está “más cerca” de $v$. El caso más simple es, por supuesto, si $v$ ya está en el subespacio, entonces la proyección de $v$ en el subespacio es $v$ misma.
Ahora, el tipo de subespacio más simple es un subespacio unidimensional, digamos que el subespacio es $U = operatornamespan(u)$. Dado un vector arbitrario $v$ que no está en $U$, podemos proyectarlo en $U$ mediante $$v_ U = fraclangle v , u ranglelangle u , u rangle u$$ que será un vector en $U$. Habrá más vectores que $v$ que tengan la misma proyección sobre $U$.
Ahora, supongamos que $U = operatornamespan(u_1, u_2, dots, u_k)$ y, dado que lo dijo en su pregunta, supongamos que $u_i$ son ortogonales. Para un vector $v$, puede proyectar $v$ en $U$ mediante $$v_ = sum_i =1^k fraclangle v, u_iranglelangle u_i, u_i rangle u_i = fraclangle v , u_1 ranglelangle u_1 , u_1 rangle u_1 + dots + fraclangle v , u_k ranglelangle u_k , u_k rangle u_k.$$
Tome una base $v_1, dots, v_n$ para el “subespacio de señal” $V$. Asumamos que $V$ es de dimensión finita por simplicidad y propósitos prácticos, pero puede generalizar a dimensiones infinitas. Supongamos también que la base es ortonormal.
La proyección de su señal $f$ en el subespacio $V$ es solo
$$mathrmproy_V(f) = sum_i=1^n langle f, v_i rangle v_i$$
y $f = mathrmproj_V(f) + R(f)$, donde $R(f)$ es el resto, o complemento ortogonal, que será 0 si $f$ está en el subespacio $V$ .
El término $i$-ésimo de la suma, $langle f, v_irangle$, es la proyección de $f$ en el subespacio abarcado por el vector base $i$-ésimo. (Tenga en cuenta que si $v_i$ son ortogonales, pero no necesariamente ortonormales, debe dividir el término $i$-ésimo entre $|v_i|^2$).
La proyección del vector es el vector perteneciente al subespacio que mejor se aproxima al primero, es decir, tal que la norma (cuadrada) de la diferencia es la más pequeña.
WLOG toma un subespacio atravesado por tres vectores. Minimizamos para las coordenadas $u,v,w$
$$epsilon=(vec duvec avvec bwvec c)^2.$$
Esto se logra cancelando el gradiente (se omite el factor $2$),
$$begincasos dfracdepsilondu=vec acdot(vec duvec avvec bwvec c)=0,\ dfracdepsilon dv=vec bcdot(vec duvec avvec bwvec c)=0,\ dfracdepsilondw=vec ccdot(vec duvec av vec bwvec c)=0.\ endcases$$ dando un sistema lineal de tres ecuaciones en tres incógnitas.
En el caso especial de que $vec a,vec b,vec c$ formen una base ortonormal, simplemente tenemos
$$u=vec dcdotvec a,v=vec dcdotvec b,w=vec dcdotvec c,$$ y la proyección es
$$vec u^*=(vec dcdotvec a)vec a+(vec dcdotvec b)vec b+(vec dcdotvec c)vec c.$$
Si haces scroll puedes encontrar las críticas de otros desarrolladores, tú además eres capaz insertar el tuyo si lo deseas.