Luego de mucho luchar pudimos hallar el resultado de este rompecabezas que muchos usuarios de esta web han presentado. Si tienes algo que compartir no dejes de aportar tu información.
Solución:
En términos de una imagen de fotones, esto no es realmente misterioso. La fuerza electromagnética está mediada, en su descripción mecánica cuántica, por el intercambio de fotones. Estos pueden ser reales, es decir, representar haces de luz reales, o virtuales, lo que significa que la energía para la existencia del fotón se ha “tomado prestada” durante un pequeño período de tiempo según lo permitido por el principio de incertidumbre de Heisenberg. Los campos electrostáticos y magnetostáticos consisten, en la imagen cuántica, en una gran cantidad de fotones virtuales que vuelan de un lado a otro.
Ahora, cada uno de estos fotones tiene una cierta cantidad de impulso. Deben hacerlo, porque impartirán una fuerza sobre las partículas cargadas que las absorben o las emiten. Dado que cada fotón lleva impulso, no es de extrañar que el campo en su conjunto pueda contener una cantidad neta de impulso. A veces, esto será cero: las contribuciones de los diferentes fotones se cancelarán localmente en cada punto o globalmente una vez que se consideren todos los puntos, pero este no tiene por qué ser el caso. Por lo tanto, el campo electromagnético puede generar impulso.
Ahora, esta es una imagen agradable e intuitiva, pero se basa en un concepto muy exótico, así que lo entendería si te extraña un poco. Más que eso, dado que la existencia de la cantidad de movimiento del campo electromagnético es necesaria dentro de la electrodinámica clásica, también se querría una respuesta que no requiera de la mecánica cuántica para explicarla. (Piense en esto último con cuidado, no es un argumento trivial).
Al final, si el campo “tiene” impulso o no es una cuestión de la definición de la palabra “tener”, que es una construcción humana. Estrictamente hablando, lo cierto es que
- Es posible organizar situaciones en las que las partículas cargadas interactúan de manera que no se conserve su momento mecánico total, pero una vez que todas las partículas se separan nuevamente, su momento total final es igual al inicial.
Esto se ve aumentado por el hecho de que
- existe una cantidad, con unidades de momento, y que se puede calcular a partir de los campos eléctrico y magnético de cada punto, que dará una cantidad conservada si se suma al momento mecánico total de las partículas.
Es importante señalar que la conservación del impulso no es un hecho; es una propiedad de las teorías físicas que cualquier teoría en particular puede tener o no. (Da la casualidad de que todas las teorías físicas que observamos en el mundo real lo observan de alguna forma, pero eso no está garantizado a priori).
Un ejemplo de esto es la mecánica newtoniana con fuerzas que obedecen a la tercera ley de Newton. En este caso, es un teorema de la teoría de que se conserva el moementum mecánico total.
Otro ejemplo es el teorema de Noether, que garantiza una ley de conservación de la cantidad de movimiento en sistemas dinámicos de una determinada clase, cuyas leyes son traslacionalmente invariantes. Para ciertos sistemas, esta invariancia existe y, por lo tanto, se conserva el impulso; para otros no lo es y no se conserva el impulso.
Para partículas mecánicas cargadas que interactúan electromagnéticamente, la tercera ley de Newton no se cumple, por lo que nuestro antiguo teorema no es aplicable (y de hecho su conclusión es falsa, ya que la mecánico no se conserva el impulso). Sin embargo, esto no significa que no podamos encontrar un teorema más inteligente y sofisticado que implique una ley de conservación.
Por lo tanto, es necesario sentarse un poco y jugar con las matemáticas, pero el teorema es realmente demostrable. En esencia, lo que haces es
- anote la fuerza total sobre las partículas mecánicas,
- expresarlo en términos de campos electromagnéticos, cargas y corrientes,
- utilizar las ecuaciones de Maxwell para transformar las cargas y corrientes en campos eléctricos y magnéticos, y así
- Derivar una expresión para la fuerza mecánica total sobre el sistema en términos de la integral de una determinada función de los campos eléctricos y magnéticos en cada punto.
- Luego, es necesario transformar esta cantidad en la derivada del tiempo total de una expresión más simple, que se interpretará como el momento del campo electromagnético. Esto es posible, pero deja un resto que depende del volumen en el que esté integrando.
- Entonces se puede probar que, para los sistemas localizados, este resto desaparece. Cuando lo hace, se conserva el momento dinámico total, mecánico más electromagnético.
En general, le disuadiría de intentar este cálculo hasta que haya tomado cursos sólidos en electromagnetismo y cálculo vectorial a nivel universitario, o simplemente se lastimará contra él. En cambio, céntrese en la física, en un nivel cualitativo.
Si tiene preguntas más específicas, me complacerá intentar responderle, pero si desea obtener detalles sobre las matemáticas, hacer Necesito especificar cuáles son sus antecedentes para que podamos darle respuestas que comprenderá.
Te mostraré “cómo es este el caso”, “cómo funciona esto”, pero esto necesita tiempo. Esta es una pregunta muy interesante y lamento ver que los libros se dividen en dos conjuntos: uno básico que simplemente salta el problema (tal vez mencionándolo o reportando una fórmula diciendo que los cálculos son aburridos, mientras que son emocionantes); y avanzados, que obviamente tratan un problema tan importante, pero lo resuelven todo con pocos símbolos usando matemáticas tan duras que son difíciles de entender por lectores menos capaces (aquí estoy). Encuentro que el mejor compromiso es, como siempre, Griffiths (de donde tomo la mayor parte de esta respuesta). Pero, por una vez, también quiero criticar su libro. Puso al lector frente a la traumatizante divergencia de una matriz, sin prepararlo para manejar tal objeto. Es por eso que pondré en esta respuesta una sección llamada “Teorema de divergencia alternativa”. Aquí siempre usaré coordenadas cartesianas, simplemente averiguo que esta es la forma más sencilla de ver por qué hay una densidad de momento del campo electromagnético y calcular cuánto es. Estos cálculos son largos, pero si el lector confía en mí, quedará satisfecho.
Densidad de corriente de momento
Es necesario introducir el concepto de densidad de corriente de momento. Como densidad de corriente $ mathbf J $ es un vector tal que $ mathbf J cdot d mathbf a dt $ da la cantidad de carga que pasa $ d mathbf a $
en intervalo $ t a t + dt $; La densidad de la corriente de momento es una matriz tal que $ sf M cdot d mathbf a dt $ da la cantidad de impulso que fluye a través $ d mathbf a $ en intervalo $ t a t + dt $. La carga es un escalar, por lo que la densidad de corriente es un vector, pero el impulso es un vector, por lo que parece razonable introducir una matriz para describir su densidad de corriente (el producto escalar con un vector da un vector). En esta definición no digo si tengo que hacer $ sf M cdot d mathbf a $ o $ d mathbf a cdot sf M $, pero esto es lo mismo: veremos que en el momento de coordenadas cartesianas la densidad de corriente es una matriz simétrica.
Una forma interesante de describir la conservación del impulso.
Supongamos que el volumen interior $ V $ están moviendo partículas cargadas en un campo electromagnético (no necesariamente todas dadas por la propia carga). Seamos $ d mathbf p $ el cambio, durante el tiempo $ dt $, del impulso de estos cuerpos en el volumen $ V $. Si podemos escribir esta ecuación,
begin ecuación frac d mathbf p dt = – frac d dt int_V mathbf C d tau – oint_S sf D cdot d mathbf a end ecuación
entonces la única interpretación razonable es que $ mathbf C $ es la densidad de momento del campo y $ sf D $ es la densidad de la corriente de impulso. De hecho, de esta manera, la ecuación anterior dice que el cambio de la cantidad de movimiento del campo en el intervalo $ t a t + dt $ dentro del volumen (es decir $ d left ( int_V mathbf C d tau right) $) es lo opuesto a la variación del momento de los cuerpos (es decir, $ d mathbf p $) menos el impulso de campo que fluyó a través de la superficie $ S $ (es decir $ oint_S sf D cdot d mathbf a dt $). Estamos excluyendo la posibilidad de que los cuerpos atraviesen la superficie. $ S $ a tiempo $ dt $, de lo contrario deberíamos generalizar la ecuación, pero no es necesario hacerlo si estamos interesados en evaluar el impulso del campo electromagnético de la forma más sencilla. Tómese su tiempo para reflexionar sobre esta ecuación y estas consideraciones, y vea cuán razonables son. Entonces sigue.
Vector de Poynting y definición del tensor de Maxwell
Posteriormente usaremos el vector que definimos aquí (introducido por John Henry Poynting en 1884)
begin ecuación mathbf S = frac mathbf E times mathbf B mu_0 end ecuación
Permítanme presentarles esta matriz, por el momento puede sonar un desastre, pero luego verán que se las presentamos a evitar un lío y expresar el teorema de una manera elegante. Tensor de Maxwell $ sf T $ es descrito por
begin ecuación T_ ij = epsilon_0 left (E_i E_j – frac 1 2 delta_ ij E ^ 2 right) + frac 1 mu_0 left ( B_i B_j – frac 1 2 delta_ ij B ^ 2 right) end ecuación
donde index $ i $ y $ j $ se refiere a tres coordenadas $ x $, $ y $ y $ z $ (de modo que el tensor tiene en total 9 componentes: todas las combinaciones posibles $ T_ xx $, $ T_ xy $, $ T_ xz $, $ T_ yx $, etc.) y $ delta_ ij $ es el delta de Kronecker. Explícitamente podríamos escribir (tenga en cuenta que para obtener esto a continuación tenemos que sustituir el campo al cuadrado en la definición con la suma de los componentes al cuadrado)
Teorema de divergencia alternativo
Dado un campo de matriz simétrica $ sf M $, definido en volumen $ V $ rodeado de superficie $ S $, tenemos
begin ecuación int_V ( nabla cdot sf M) d tau = oint_S sf M cdot d mathbf a end ecuación
Por campo de matriz significa un campo análogo al vector, pero con matrices (cada elemento es una función de $ (x, y, z, t) $). La analogía con el teorema de la divergencia ordinaria es fuerte (tenga en cuenta que $ nabla cdot $ baja en uno la dimensión del objeto al que lo aplicamos). A la izquierda hacemos una integral de volumen de productos entre un campo vectorial y volúmenes infinitesimales, a la derecha hacemos una integral de superficie de productos entre un campo matricial y vectores de superficie infinitesimales. En ambos lados tenemos una suma infinita de vectores infinitesimales: un vector finito.
Prueba del teorema de divergencia alternativa
La prueba de este teorema de divergencia alternativo es similar a la del teorema de divergencia ordinaria. Supongamos por simplicidad que el volumen $ V $ es el paralelepípedo $ (a. El flujo del campo matricial $ sf M $ a través de la cara ortogonal a $ x $ eje es
begin ecuación int_e ^ f int_c ^ d sf M (a, y, z) cdot begin bmatrix -dydz \ 0 \ 0 end bmatrix + int_e ^ f int_c ^ d sf M (b, y, z) cdot begin bmatrix dydz \ 0 \ 0 end bmatrix end ecuación
donde usamos $ mathbf hat x dy dz $ como un vector de columna (aquí “sombrero” significa versor). Si $ mathbf M _1 (x, y, z) $ es el campo vectorial que obtenemos tomando la primera columna de la matriz $ sf M $, podemos escribir el flujo a través de las dos superficies de esta manera
begin ecuación int_e ^ f int_c ^ d [ mathbfM_1 (b,y,z) – mathbfM_1 (a,y,z) ] dydz end ecuación
Integrand es un vector que se puede escribir de esta manera
begin ecuación begin bmatrix M_ xx (b, y, z) – M_ xx (a, y, z) \ M_ yx (b, y, z) – M_ yx (a, y, z) \ M_ zx (b, y, z) – M_ zx (a, y, z) end bmatrix end ecuación
Y explotando el teorema fundamental del cálculo podemos escribir
begin ecuación begin bmatrix int_a ^ b frac parcial M_ xx (x, y, z) parcial x dx \ int_a ^ b frac parcial M_ yx (x, y, z) parciales x dx \ int_a ^ b frac parciales M_ zx (x, y, z) parciales x dx end bmatrix end ecuación
Cual es $ int_a ^ b frac parcial mathbf M _1 parcial x dx $. Sustituyendo vemos que el flujo a través de dos superficies se puede escribir
$ int_V frac parcial mathbf M _1 parcial x dV $. De manera similar, podemos encontrar el flujo a través de otros pares de lados: el flujo total a través del paralelepípedo es
begin ecuación int_V left ( frac parcial mathbf M _1 parcial x + frac parcial mathbf M _2 parcial y + frac parcial mathbf M _3 parcial z derecha) dV end ecuación
Para finalizar la demostración solo tenemos que demostrar que el integrando es igual al vector que simbólicamente escribimos como $ nabla cdot sf M $. Es decir, tenemos que demostrar que
begin ecuación frac parcial mathbf M _1 parcial x + frac parcial mathbf M _2 parcial y + frac parcial mathbf M _3 Partical Z = begin bmatrix Displaystyle frac Particular Parcial X & Displaystyle frac Particular Particular y & Displaystyle frac Particular parcial z end bmatrix left[
beginarrayc
& & \
displaystyle mathbfM_1 &
displaystyle mathbfM_2 &
displaystyle mathbfM_3 \
& & \
endarray
right]
end ecuación
A primera vista, esto parece incorrecto, pero $ sf M $ es simétrico por hipótesis, por lo que la ecuación funciona. Si eres escéptico sobre esta conclusión, aquí tienes la prueba. En el miembro izquierdo tenemos la suma de tres vectores:
begin ecuación left[
fracpartial M_xxpartial x +
fracpartial M_xypartial y +
fracpartial M_xzpartial z ,
fracpartial M_yxpartial x +
fracpartial M_yypartial y +
fracpartial M_yzpartial z ,
fracpartial M_zxpartial x +
fracpartial M_zypartial y +
fracpartial M_zzpartial z
right]
end ecuación
mientras que en el segundo miembro tenemos el producto entre un vector (como hacemos en el análisis de vectores ordinario, es útil usar el simbolismo de tratar $ nabla $ como vector) y una matriz:
begin ecuación left[
fracpartial M_xxpartial x +
fracpartial M_yxpartial y +
fracpartial M_zxpartial z ,
fracpartial M_xypartial x +
fracpartial M_yypartial y +
fracpartial M_zypartial z ,
fracpartial M_xzpartial x +
fracpartial M_yzpartial y +
fracpartial M_zzpartial z
right]
end ecuación
si la matriz es simétrica ($ M_ ij = M_ ji $) estas dos expresiones son iguales. Esto muestra que la ecuación anterior es una identidad y la prueba está terminada.
El cálculo del impulso del campo electromagnético.
La fuerza electromagnética que actúa sobre cargas en volumen. $ V $ es
begin ecuación mathbf F = int_V ( mathbf E + mathbf u times mathbf B) rho d tau = int_V ( rho mathbf E + mathbf J times mathbf B) d tau end ecuación
la fuerza por unidad de volumen es
begin ecuación mathbf f = rho mathbf E + mathbf J times mathbf B end ecuación
Aprovechando las ecuaciones de Maxwell, es posible eliminar fuentes a favor del campo. Te mostraré cómo hacerlo ahora. Usando la primera y última ecuación de Maxwell tenemos
begin ecuación mathbf f = epsilon_0 ( nabla cdot mathbf E) mathbf E + left ( frac 1 mu_0 nabla times mathbf B – epsilon_0 frac parcial mathbf E parcial t derecha) veces mathbf B end ecuación
Ahora,
begin ecuación frac parcial parcial t ( mathbf E veces mathbf B) = izquierda ( frac parcial mathbf E parcial t times mathbf B right) + left ( mathbf E times frac parcial mathbf B parcial t right) end ecuación
Entonces, al explotar la ley de Faraday podemos reorganizar de esta manera
begin ecuación frac parcial mathbf E parcial t veces mathbf B = frac parcial parcial t ( mathbf E veces mathbf B) + mathbf E times ( nabla times mathbf E) end ecuación
Sustituyendo tenemos
begin ecuación mathbf f = epsilon_0 left[
(nabla cdot mathbfE) mathbfE – mathbfE times (nabla times mathbfE)
right]
– frac 1 mu_0 left[ mathbfB times (nabla times mathbfB) right]
– epsilon_0 frac parcial parcial t ( mathbf E times mathbf B) end ecuación
Adecuado para hacer las cosas más simétricas, podemos agregar un término $ frac 1 mu_0 ( nabla cdot mathbf B) mathbf B $ (es lo mismo: el campo magnético es solenoide). Ahora tenga en cuenta que aplicando al mismo vector $ mathbf A $ la identidad del vector
begin ecuación nabla ( mathbf A cdot mathbf B) = mathbf A times ( nabla times mathbf B) + mathbf B times ( nabla times mathbf A) + ( mathbf A cdot nabla) mathbf B + ( mathbf B cdot nabla) mathbf A end ecuación
nos permitirá escribir
begin ecuación – mathbf A times ( nabla times mathbf A) = – frac 1 2 nabla (A ^ 2) + ( mathbf A cdot nabla) mathbf A end ecuación
Todo esto nos permite escribir la ecuación anterior de esta manera
begin ecuación begin split mathbf f = & epsilon_0 left[ (nabla cdot mathbfE) mathbfE + (mathbfE cdot nabla ) mathbfE right]
– frac 1 mu_0 left[ (nabla cdot mathbfB) mathbfB + (mathbfB cdot nabla ) mathbfB right] \ & – frac 1 2 nabla left ( epsilon_0 E ^ 2 + frac 1 mu_0 B ^ 2 right) – epsilon_0 frac partial partial t ( mathbf E times mathbf B) end dividir end ecuación
A pesar de las simetrías, esta expresión es fea. La belleza reina en la ley fundamental de la naturaleza, por lo que debe ser posible escribir la ecuación de una manera mejor y más clara. Viene a nuestro rescate el tensor de Maxwell que escribimos antes y la idea de usar el operador $ nabla $ como si fuera un vector. Haciendo producto escalar entre $ nabla $ y el tensor de Maxwell obtenemos el segundo miembro de la ecuación escrita arriba (menor que el término con derivada del tiempo)
begin ecuación begin split nabla cdot sf T = & epsilon_0 left[ (nabla cdot mathbfE) mathbfE + (mathbfE cdot nabla ) mathbfE right]
– frac 1 mu_0 left[ (nabla cdot mathbfB) mathbfB + (mathbfB cdot nabla ) mathbfB right] \ & – frac 1 2 nabla left ( epsilon_0 E ^ 2 + frac 1 mu_0 B ^ 2 right) end split end ecuación
Comprobemos que esto es cierto: tendremos cuidado con la única $ x $ coordenada (por razones simétricas, otras coordenadas funcionarán). los $ x $ La coordenada del segundo miembro de la ecuación anterior es
begin ecuación begin split & epsilon_0 left[
left( fracpartial E_xpartial x + fracpartial E_ypartial y + fracpartial E_zpartial z right) E_x +
E_x fracpartial E_xpartial x + E_y fracpartial E_xpartial y + E_z fracpartial E_xpartial z
right] \ & + frac 1 mu_0 left[ left( fracpartial B_xpartial x + fracpartial B_ypartial y + fracpartial B_zpartial z right) B_x +
B_x fracpartial B_xpartial x + B_y fracpartial B_xpartial y + B_z fracpartial B_xpartial z
right] \ & – frac epsilon_0 2 frac parcial (E_x ^ 2 + E_y ^ 2 + E_z ^ 2) parcial x – frac 1 2 mu_0 frac parcial (B_x ^ 2 + B_y ^ 2 + B_z ^ 2) parcial x end dividir end ecuación
Mientras que la $ x $ coordenada del primer miembro (es decir, el “producto escalar” entre $ nabla $ y la primera columna del tensor de Maxwell es)
begin ecuación begin split & frac epsilon_0 2 frac partial (E_x ^ 2 – E_y ^ 2 – E_z ^ 2) partial x + frac 1 2 mu_0 frac parcial (B_x ^ 2 – B_y ^ 2 – B_z ^ 2) parcial x \ & + epsilon_0 frac parcial (E_x E_y) parcial y + frac 1 mu_0 frac parcial (B_x B_y) y parcial – epsilon_0 frac parcial (E_x E_z) parcial z + frac 1 mu_0 frac Particular (B_x B_z) Particular z end split end ecuación
El lector puede verificar fácilmente que los dos términos son iguales (para simplificar, debido a la simetría, podemos concentrarnos en un solo campo, por ejemplo $ E $). Ahora estamos listos para escribir la ecuación “fea” de una manera hermosa y compacta:
begin ecuación mathbf f = – epsilon_0 mu_0 frac partial mathbf S partial t + nabla cdot sf T end ecuación
donde también usamos el vector de Poynting. Explotando $ c = frac 1 sqrt epsilon_0 mu_0 $ e integrando sobre el volumen tenemos
begin ecuación frac d mathbf p dt = – frac d dt int_V frac mathbf S c ^ 2 d tau + oint_S sf T cdot d mathbf a end ecuación
donde explotamos el “teorema de divergencia alternativa”. Ahora regrese a lo que escribí en la sección “Una forma interesante de describir la conservación del impulso”, y reflexione: la prueba está terminada:
- Densidad de momento: $ frac mathbf S c ^ 2 $
- Densidad de corriente de momento: $ – sf T $
¿Por qué el tensor de Maxwell no se define con signo invertido? Probablemente esto se deba a una desafortunada convención histórica. Si queremos expresar el impulso de campo en función de los campos, obviamente tenemos
Esto puede aprovecharse para demostrar que para las ondas electromagnéticas tenemos $ E = pc $ (no es un caso que este sea el mismo vínculo entre la energía y el momento que tenemos para las partículas relativistas extremas).
Un comentario final
Tenga en cuenta que lo que encontramos adolece de abstracción y da problemas: este teorema de la cantidad de movimiento (como también el teorema de Poynting) es general, no solo para las ondas electromagnéticas: no teníamos ninguna hipótesis especial sobre la naturaleza del campo (la única es que el campo obedece a las ecuaciones de Maxwell). Esto conduce a problemas muy interesantes (¡pero también muy complicados!) Relacionados con impulso. Como vemos a menudo en física, cada vez que resuelves un problema te encuentras frente a problemas más difíciles y de extraño (y por tanto, interesante) punto de reflexión sobre el gran rompecabezas.