¿Cómo detectar el "ruido" de la onda de sonido?

Algunos fonemas como "ssss" son básicamente ruido blanco. ¿Cómo determinaría qué partes de una onda son ruido blanco?

A partir del análisis de frecuencia, el ruido blanco no tendrá tonos, por lo que solo usar esto sugeriría que sería indistinguible de ningún ruido. (multiplicarlo por una onda sinusoidal cancelaría todas las frecuencias).

¿Cómo escuchan nuestros oídos el ruido blanco? ¿Cómo sabe que no es solo una alta frecuencia?

¿Hay alguna manera de detectar, digamos, la entropía de una onda de sonido para determinar qué bits son ruido blanco?

Quiero escribir un software que detecte cosas como el fonema "ssss", por lo que debe determinar qué bits de una onda son ruido blanco.

Editar

Entiendo que necesitas hacer una FFT para encontrar el ruido. Así que di F ( X ) es una onda digital para x=0...1000 bytes.

¿Hay algún tipo de funcional como F [ F ] que dará un número entre 0..1 para decir qué tan cerca está la señal del ruido blanco.

Desde la parte superior de mi cabeza tal vez algo como:

F [ F ] = 1 1 1000 2 0 1000 0 1000 | F ( X ) F ( ( X + a ) metro o d 1000 ) | 2 d a d X

pero esta es una integral doble y llevaría mucho tiempo. Mi idea es que el ruido blanco no tenga repetición, por lo que el integrando nunca será cero. Solo una suposición. No creo que funcione en la práctica. ¿Hay una fórmula más simple quizás con solo una integral o una suma?

Multiplicar no da como resultado cero. La intensidad del ruido blanco fluctúa en todas las escalas. Hay componentes de Fourier en todas las frecuencias.
Digamos que el sonido es f(x)=random(x). Entonces s i norte ( a X ) F ( X ) d X 0 para todos a más o menos. Así que no creo que esta sea una buena prueba. ¿Hay una fórmula mejor para probar el ruido blanco? Puede fluctuar en todas las frecuencias pero minuciosamente. Además, tendrías que probar TODAS las frecuencias.
Bien. Y aproximadamente igual no es lo mismo que igual . ¿Y a qué te refieres con prueba ? No me queda claro cuál es su objetivo final, pero @DanielGriscom podría dar en el clavo cuando sugiere la FFT. Advertencia: la FFT (o más fundamentalmente la DFT --- Transformada discreta de Fourier ---, siendo la FFT una implementación de la DFT) requiere un poco de estudio para usarla e interpretarla correctamente.
Sugerencia: juegue un poco con Audacity, o cualquier software que le permita ver una "imagen" de frecuencia de su discurso. Por cierto, es falso decir que este ruido tiene que tonificar, porque esos ruidos no son blancos, son "coloreados". Dado que incluso con un sonido de guitarra electrónica muy distorsionado, aún puede escuchar una escala musical. ;-)

Respuestas (2)

La definición de ruido blanco (discreto) incluye la propiedad de que la autocovarianza es cero para todos los retrasos de tiempo distintos de cero. (Para un retraso de tiempo cero, es la varianza). Conceptualmente, el ruido blanco no tiene ninguna correlación consigo mismo. Esta propiedad conduce a la densidad uniforme en el espacio de Fourier, pero la autocovarianza es fácil de estimar a partir de un registro de longitud fija. El ruido casi blanco debería tener un pico muy estrecho en la autocovarianza con retraso cero.

Un enfoque más riguroso, que le daría una medida menos subjetiva de la "blancura" de su proceso, sería ajustar la serie temporal a un modelo de promedio móvil autorregresivo (ARMA). R, Matlab y Mathematica tienen paquetes para esto, y estoy seguro de que podría encontrar versiones de código abierto. Cuanto más cerca estén las constantes del proceso de cero, más cerca estará su serie del ruido blanco.

Sin embargo: en mi opinión, esta no es realmente una pregunta de acústica tanto como una pregunta de análisis de series de tiempo. Puede obtener mejores respuestas si migra a los sitios Signal Processing o Mathematics Stack Exchange.

Utilice una FFT para caracterizar el sonido. Con un tono puro, habrá mucha fuerza en uno o dos contenedores adyacentes, y todos los demás tendrán muy poca señal. Con el ruido blanco, cada contenedor tendrá fuerza, ya que habrá elementos de todas las frecuencias presentes. Sí, las fortalezas de los contenedores serán ruidosas, y tendrá que lidiar con eso, pero un poco de estadísticas debería ser de gran ayuda.

Debes ser ingeniero. :) Por alguna razón, los ingenieros llaman a los puntos de contenedores de espacio recíproco . Si una frecuencia está un poco alejada de una frecuencia en el espacio recíproco, pero aún se encuentra en el "contenedor", no encontramos que ese "contenedor" tenga amplitud y otros no. En cambio, encontramos amplitud en todo el espectro. Este fenómeno confunde a los novatos.
@garyp, observe que la respuesta se refiere específicamente a la FFT, que es una implementación de la transformada discreta de Fourier (DFT). Por lo tanto, es natural hablar de contenedores.
El análisis Wavelet es otra herramienta para aprender más sobre la señal. En realidad, utiliza la FFT en los cálculos, pero obtiene más información sobre el comportamiento temporal y de frecuencia.
@ThePhoton FFT, DFT, lo mismo. Encuentra contenedores en histogramas, y DFT/FFT no es un histograma. No hay papeleras. La palabra es común, pero desafortunada para los novatos. La DFT asume que la función es periódica. Una señal sinusoidal pura que tiene una frecuencia desproporcionada con el período asumido produce discontinuidades en el límite del período, y la amplitud FT aparece en todo el espectro, aunque la señal sea un seno puro. Se debe elegir el período con cuidado y utilizar funciones de ventana para reducir el efecto. Pero las ventanas causan "fugas" por sí mismas. La FFT no es algo simple de usar.
@garyp, la palabra "bin" en realidad nos ayuda a recordar que un número en el espectro DFT cubre un rango de frecuencias, no solo una frecuencia precisa. No estoy seguro de por qué piensas que cada palabra (como "bin") solo se puede usar en un contexto (como histogramas).
Por cierto, el artículo de Wiki sobre estimación de densidad espectral tiene una breve sección sobre el uso del periodograma para estimar información espectral, que es esencialmente lo que se recomienda en esta respuesta, que también menciona el problema de la fuga espectral.
@ThePhoton Simplemente no es cierto que un número en el espectro DFT cubra un rango de frecuencias. No es asi. Representa una sola frecuencia precisa. en que esta X norte que muestra que representa un rango? Con la ventana, puede ampliar cada componente de frecuencia en la señal para que las frecuencias "inconmensurables" tengan un componente fuerte en una frecuencia cercana y componentes menores lejos. Esto no es agrupamiento. Esto es tomar la FT de una versión distorsionada de su señal, y esa FT se define, como siempre, en un conjunto de puntos en el espacio recíproco.
@garyp: DFT/FFT is not a histogram. There are no bins. En teoría no lo hay. Pero en la práctica, cuando tiene que escribir código para ello, crea contenedores. Después de todo, el espectro no es más que una matriz de números: una cadena de contenedores. Por eso los ingenieros hablan de contenedores. Lo vemos en el código.
@slebetman Claro, lo sé. Pero para los novatos, hay confusión y preguntas como: "Mi seno puro cae en este contenedor único aquí. ¿Por qué tengo picos en el espectro por todas partes?" (es decir, interpretación de histograma) Es mejor usar un lenguaje que describa con precisión lo que está pasando. No puedo imaginar cómo comenzó el lenguaje bin. ¿Alguien pensó que la realidad era demasiado difícil de entender para los ingenieros?
@slebetman... ¿y dónde están los contenedores en el código? no veo ninguno