Reconstrucción de imágenes: Fase vs. Magnitud

La figura 1.(c) muestra la imagen de prueba reconstruida únicamente a partir del espectro de MAGNITUD. Podemos decir que los valores de intensidad de los píxeles de BAJA frecuencia son comparativamente más altos que los píxeles de ALTA frecuencia.

F ( X , y ) = ( tu = 0 ) ( tu 1 ) ( v = 0 ) ( V 1 )   | F ( tu , v ) | mi X pag ( 1 j 2 Π X tu ) / METRO ) mi ( 1 j 2 Π ( v y ) / norte ) /

La figura 1.(d) muestra la imagen de prueba reconstruida únicamente a partir del espectro de FASE. Podemos decir que los valores de intensidad de los píxeles de ALTA frecuencia (bordes, líneas) son comparativamente más altos que los píxeles de BAJA frecuencia.

¿Por qué está presente esta contradicción mágica de cambio de intensidad (o intercambio) entre la imagen de prueba reconstruida solo a partir del espectro de MAGNITUD y la imagen de prueba reconstruida solo a partir del espectro de FASE, que cuando se combinan forman la imagen de prueba original?

F ( X , y ) = ( tu = 0 ) ( tu 1 ) ( v = 0 ) ( V 1 )   mi X pag ( j a norte gramo yo mi ( tu , v ) ) mi X pag ( 1 j 2 Π X tu ) / METRO ) mi ( 1 j 2 Π ( v y ) / norte )

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Probablemente sería mejor eliminar la imagen adicional (o trabajarla de alguna manera, ¿quizás como una respuesta diferente?). Sin embargo, fue fascinante verlo, gracias.

Respuestas (1)

Potencia espectral – Imagen B (arriba a la derecha).

La naturaleza de las imágenes C y D se explica por la imagen de potencia espectral, B.

Puede ver en la imagen de potencia espectral que la mayor parte de la energía se concentra en bajas frecuencias (la parte central más brillante de la imagen). Las frecuencias más altas (que se alejan del centro) tienen menos energía porque hay menos brillo en esta parte de la imagen.

Este tipo de espectro de potencia es típico en imágenes naturales . La caída de energía con la frecuencia tiende a ajustarse bien a una función exponencial.

Imagen de energía – C (abajo a la izquierda)

Dado esto, la imagen C (abajo a la izquierda) tiene sentido. Esperarías ver formas de manchas que son predominantemente de baja frecuencia, porque ahí es donde está el poder en la imagen. Su simetría se debe a que las fases están todas puestas a cero.

Imagen de fase – D (abajo a la derecha)

Ha proporcionado la función utilizada para reconstruir la función de solo fase. Si elimina las funciones de suma y base, se queda con:

F_phase_only(u,v) = F(u,v) / |F(u,v)|

F(u,v) es un número complejo con fase y magnitud. Está dividiendo por la magnitud para eliminarlo, para que sea 1 para todos los componentes. Entonces, F_phase_only(u,v) solo tiene las fases. La magnitud de F_phase_only(u,v) = 1, para todo u,v.

Ahora, mire la imagen espectral nuevamente (arriba a la derecha). Esto es realmente solo un gráfico de |F(u,v)| – es una imagen de magnitud única.

  • Podemos ver que para u,v pequeños, las bajas frecuencias que están en el medio de la imagen, |F(u,v)| es grande, porque el medio es brillante.

  • Para u,v más grandes, las frecuencias más altas que están lejos del medio, |F(u,v)| es relativamente pequeño, porque estas partes de la imagen son más oscuras.

Entonces, volviendo a F_phase_only(u,v), lo reescribiré muy sutilmente.

F_phase_only(u,v) = F(u,v) . BOOST(u,v).

¿Qué es impulsar?

BOOST(u,v) = 1 / |F(u,v)|

¿Qué podemos determinar sobre la naturaleza de BOOST?

  • Para pequeñas u,v las frecuencias bajas , BOOST(u,v) debe ser un número pequeño. Debe ser pequeño, porque BOOST es el recíproco de la magnitud. Sabemos por el espectro que la magnitud es grande para bajas frecuencias. Por lo tanto, BOOST(u,v) debe ser pequeño y así disminuir las bajas frecuencias .

  • Para u,v más grandes las frecuencias altas , BOOST(u,v) debe ser un número grande. Debe ser grande, porque BOOST es el recíproco de la magnitud. Sabemos por el espectro que la magnitud es pequeña para frecuencias altas . Por lo tanto, BOOST(u,v) debe ser grande y, por lo tanto, mejora las frecuencias altas .

Entonces, la imagen de "solo fase" da a todos los componentes del dominio de frecuencia la misma magnitud. Para un componente individual tomado en relación con los demás, esto enfatiza enormemente los componentes de frecuencia más alta y disminuye en gran medida los componentes de baja frecuencia .

Entonces, si bien lo ha llamado una "imagen de solo fase", en realidad es una imagen en la que los términos de alta frecuencia se mejoran enormemente a expensas de los términos de baja frecuencia.

Por esta razón, la imagen resultante muestra las características de borde que existen en las frecuencias más altas ampliadas.

Imagen de una fase más justa

Teniendo en cuenta el papel que mencioné anteriormente , podría preparar una imagen de fase más justa.

F_fairer_phase(u,v) = Expected(u,v) . F(u,v) / |F(u,v)|

¿Dónde Expected(u,v)está la potencia espectral estadísticamente esperada en u,v? Se deja como ejercicio :-)

Alternativamente, podría derivar Expected(u,v)promediando todo |F(w,x)|donde sqrt(w.w + x.x) = sqrt(u.u, v.v).

señor, he agregado ecuaciones para la reconstrucción de la imagen solo a partir de la magnitud y la fase. Quiero preguntar en el último párrafo que en la parte de reconstrucción de fase solo, ¿por qué solo obtengo bordes o líneas, por qué no componentes de baja frecuencia? porque de la segunda ecuación no tengo idea de que solo se enfatizan las características de borde ... gracias
Muchas gracias señor por sus comentarios. ¿Puede sugerir algún artículo o video o algún enlace para la reconstrucción de la fase solamente? gracias una vez más
señor, leí su respuesta pero tengo dudas sobre "BOOST". En mi segunda ecuación de mi pregunta, si convierto F(u,v) en forma polar, es decir, F(u,v)=|F(u,v)|×exp(1j*angle(u,v)) y lo pongo en la ecuación, el |F(u,v)| plazo será cancelado. Así que creo que el factor de impulso también se cancela y solo queda el término exponencial en el lado derecho de la ecuación.
Eso es precisamente correcto. La magnitud se "cancela" (se convierte en 1) porque se divide por la magnitud. Pero antes (en la imagen original) la magnitud no se anulaba. Entonces, en comparación con el original, la magnitud para frecuencias altas es mayor y para frecuencias bajas es menor. Así se realzan los bordes.
lo siento señor, pero no entiendo lo que quiere decir...
¿pero cómo? Creo que solo queda una parte exponencial y ninguna parte de magnitud en la ecuación.
Señor, he subido una imagen de magnitud y cambio de fase en la pregunta. Gracias por ayudar.
:-) Ese es un efecto realmente interesante, gracias por pasarlo. La siguiente pregunta es: ¿por qué nuestra percepción de las imágenes se basa casi por completo en la información de fase en lugar de la magnitud? No tengo una respuesta para eso. ¡Mis mejores deseos!