¿Qué significa tocar una nota durante medio segundo?

Esta es mi primera mirada seria al lado científico de la música, ya que estoy comenzando con la programación de audio y me saluda un portero incómodo.

Sé que una nota es simplemente una determinada frecuencia para la que tenemos un nombre. Por ejemplo, la música occidental reconoce una onda de sonido con una frecuencia de 440 Hz como A4. Ahora, esto significa que para escuchar un A4, las moléculas/átomos/lo que sea del medio debe vibrar 440 veces en un segundo. Entonces, reproducir un A4 durante medio segundo no tiene sentido para mí porque solo tendrías 220 vibraciones, y eso está lejos de ser un A4. Estoy seguro de que los humanos son sensibles a ese tipo de diferencia de frecuencia. ¿No lo somos?

¿Tiene sentido tocar un A4, o cualquier nota, durante medio segundo (o menos de un segundo en general)? Si es así, por favor explique.

Si estoy equivocado, y tengo un presentimiento de que podría estarlo, ¿qué me he perdido en mi comprensión que me está conduciendo a esta situación paradójica?

(Encuentro esta situación extraña porque puedo escuchar una nota cuando rasgueo mi guitarra y humedezco la cuerda inmediatamente. No lo he cronometrado, pero estoy seguro de que puedo amortiguarlo en menos de un segundo. Sin embargo, escucho la nota. Pueden ser unos pocos Los Hz perdidos en los microsegundos finales no hacen mucha diferencia).

Su automóvil viaja a 60 millas por hora. Lo conduces durante 1/2 hora. ¿Quieres decirme que el automóvil no ha recorrido ninguna distancia porque no pudo viajar durante una hora completa? Por supuesto que no. Su automóvil ha viajado 30 millas. De manera similar, su nota vibra a una velocidad de 440 vibraciones por segundo. Tocas la nota durante 1/2 segundo. ¿Quieres decirme que tu nota no sonó? Por supuesto que no. Tu nota emitió un sonido durante 0,5 segundos. Creo que tu problema es que no entiendes matemáticas.
@WheatWilliams Creo que lo que no entiendo es la física del sonido, las matemáticas las entiendo.
para escuchar un A4, el... lo que sea del medio debe vibrar 440 veces en un segundo . Ahí es donde te equivocas. Deben vibrar a razón de 440 ciclos por segundo, no necesariamente vibrar 440 veces reales en un segundo real. Es la diferencia entre conducir 60 millas en una hora y conducir a 60 mph.
@topomorto aah, entonces es la pequeña tasa de palabras que faltaba en mi entendimiento. Entiendo.
Este hilo ha sido revivido, de lo contrario no habría comentado, pero creo que una característica que falta en todas las respuestas es que un oído humano no toma una muestra de un solo punto a lo largo del tiempo, sino muestras de múltiples puntos con separación espacial simultáneamente. (y en paralelo). Creo que esto es importante de una manera que no puedo articular del todo y probablemente reduce el tiempo necesario para identificar una forma de onda.

Respuestas (6)

Solo necesita 1 ciclo para indicar el tono, por lo que un mínimo de 1/440 s: le llevaría mucho más tiempo a un ser humano reconocer ese tono, tal vez con un buen oído 1/100, pero una computadora, dada una onda sinusoidal pura, podría obténgalo en un ciclo [o técnicamente la mitad de eso, ya que la segunda mitad es un espejo de la primera].
…o, como se ha mencionado en los comentarios, más corto que eso si se garantiza una entrada de onda sinusoidal.

Supongo que aprendí una regla general que es un poco más estricta que tú.
@Dave: me hiciste pensar por un minuto... son 440 ciclos completos, o 220 'mitades'... pero son ciclos completos == 440/s entonces 1/880s para que un algoritmo de computadora pueda estar seguro [ asumiendo senos puros todo el camino].
Seguramente solo necesita un ciclo para indicar el tono , siempre que también se le dé la información de que lo que ha "visto" es un ciclo. De lo contrario, no tiene ni idea de si lo que ha 'visto' hasta ahora es realmente el ciclo completo o no...? El primer cruce por cero no representa necesariamente el final de la primera mitad de la forma de onda, al igual que el segundo cruce por cero no representa necesariamente el final de la forma de onda.
si la entrada está garantizada sinusoidal pura [lo que lo convierte en una cuestión matemática más que 'música', lo admito], solo necesita 'ver' que pase el mismo punto dos veces en la misma dirección durante un ciclo completo, o pase cero dos veces para cualquier cosa menos. Necesitaría a alguien más inteligente que yo para extrapolar de un seno parcial con menos información, pero probablemente se pueda hacer computacionalmente.
Sí, si está garantizado por adelantado que es una onda sinusoidal, entonces (ignorando cosas como el error de medición) puede determinar la frecuencia de una sección infinitesimalmente pequeña del ciclo a partir de una simple operación de seno inverso.
como dije - si eres mejor en matemáticas que yo ;-)
Esta respuesta, junto con su comentario en otro lugar, ha encendido una bombilla. Puedo trabajar desde allí.
Pero en una situación en la que está escuchando/grabando/leyendo en una forma de onda e intentando detectar la frecuencia (¿de qué creo que está hablando en su respuesta?), ¿Cómo podría detectar el tono con precisión en solo un ciclo? No tienes forma de saber cuándo termina ese primer ciclo...
Dado que el oído realiza efectivamente el análisis de frecuencia, se aplica una relación de incertidumbre en.wikipedia.org/wiki/Fourier_transform#Uncertainty_principle ; por lo tanto, una señal muy corta y corta no tiene una frecuencia bien definida, sino que tiene una variedad de frecuencias.
@topomorto: parece que nos estamos volviendo demasiado exigentes. Estaba tratando de explicar un concepto, no escribir una disertación sobre análisis de frecuencia.
Hmm, no estoy seguro de que en un contexto SE solo querer verificar que las declaraciones centrales de una respuesta aceptada sean correctas sea demasiado exigente. Pero de todos modos, como no sé mucho sobre esto, hice una pregunta separada (no exactamente igual, pero relacionada).

Los huevos cuestan un dólar la docena. Pero puedes tener 6 por 50 centavos. Mismos huevos, mismo precio, mismo trato. La nota más baja del piano, A0, tiene una longitud de onda de algo más de 12 m. Entonces, ¿puedes escucharlo en una habitación de 6 m de largo? Seguro que puede. Incluso puede escucharlo cuando usa auriculares, ¡lo que podría considerarse como una "habitación" que mide solo 1 cm más o menos! Y puede estar viajando a 100 mph aunque se detenga después de 5 minutos. ¿Ves a lo que me refiero? El hecho de que midamos la frecuencia de una nota en vibraciones por segundo no significa que necesitemos escuchar el valor de un segundo completo para reconocerla. La música está LLENA de notas MUCHO menos de un segundo. (Y de una manera más larga, por supuesto).

En realidad, lo veo más como vueltas en un maratón, así que no puedo ver cómo funciona.
No estoy seguro de lo que estás diciendo allí, pero si te has aferrado a una analogía que no funciona, ¡deshazte de ella y encuentra una mejor!
@thePetProjectProgrammer, ¿cómo relacionas las vueltas en un maratón con la frecuencia?
@topomorto Si un maratón (bajo techo) necesita N vueltas, correr 0,98 N no se considerará como completar la carrera. Del mismo modo, si no se alcanza la frecuencia necesaria, la nota no debería ocurrir.
@thePetProjectProgrammer: el tono se alcanza en los primeros 1/440, todo lo demás se está ejecutando un poco más. No es una carrera hasta el final. Una carrera consta de muchos pasos, cada uno muy similar. De hecho, podrías extrapolar al ganador en función de cada uno de sus primeros pasos... pero solo si los corredores, como la música, mantuvieran un ritmo constante durante toda la carrera ;-)
@Tetsujin, el tono que se alcanza en los primeros 1/440 parece ser lo que me estaba perdiendo.
@thePetProjectProgrammer que confunde la definición de una unidad con la idea de un valor en esa unidad. Solo puedo reiterar lo que otros han dicho: que un automóvil no tiene que viajar una hora completa para que pueda establecer su velocidad en millas por hora. Puedes indicar su velocidad en cualquier instante...

Sí, todavía hace 220 oscilaciones completas en medio segundo. Siempre que el número de oscilaciones sea significativamente mayor que 1, seguirá escuchando el tono. Solo tendrá que preocuparse por este tipo de efectos cuando la duración de las notas esté por debajo del orden de 1/100 de segundo (quizás del orden de décimas de segundo para las notas bajas).

Esta respuesta parece prometedora, pero todavía no entiendo cómo 220 Hz pueden sonar como 440 Hz. Un poco de explicación ayudaría.
Sospecho que estás bromeando, pero aquí va de todos modos :-) 220 vibraciones en medio segundo ES 440 en un segundo completo (suponiendo que el tono se mantenga constante). Ambos son 440Hz.
@thePetProjectProgrammer Nunca dije 220 Hz; señalé las 220 oscilaciones para enfatizar que todavía hay una gran cantidad de ciclos completos incluso en medio segundo. El único momento en el que te encontrarás con un problema es cuando la duración de la nota es tan corta que no puede completar ni siquiera algunas de ellas.
@LaurencePayne Es asombroso cómo llegas a la conclusión de que estoy troleando, obviamente me perdí la mitad al leer la primera oración. No me importa de lo que me acuses, pero no obstante es asombroso.
@Dave está bien, lo tengo.

La unidad de frecuencia, Hertz (Hz), se define como el recíproco de la unidad de tiempo, el segundo .

Una frecuencia vibratoria dada en Hz, como su nota A de 440 Hz, se puede convertir en un período vibratorio en unidades de segundos tomando el recíproco. 1/440 = 0,00227, por lo que un tono con una frecuencia de 440 Hz tiene un período de 0,00227 segundos.

En esa cantidad de tiempo, la cuerda de tu guitarra ha completado un solo ciclo de vibración. Dentro de dos o tres de esos períodos, su oído y cerebro pueden "fijarse" en esas vibraciones y comprender el tono con una precisión razonable.

El tiempo y la frecuencia tienen una "Unschärferelation", lo que significa que necesita un cierto tiempo para poder reconocer una frecuencia con una certeza particular para una precisión dada y un ruido dado. Muchas otras respuestas sugieren que obtener un período completo mágicamente le permitirá reconocer una frecuencia exactamente mientras que menos no lo hará. Eso es una tontería.

Suponiendo una medición exacta de una onda sinusoidal de frecuencia, fase y amplitud desconocidas, tres puntos determinarán la onda sinusoidal. Esos puntos pueden estar casi arbitrariamente cerca.

Pero eso no responde a la pregunta de si alguna frecuencia es parte de una mezcla compleja con ruido, y no existe un límite definido.

Como regla general, la diferencia de frecuencia que desea poder distinguir y el lapso de tiempo para examinar la señal son de hecho inversos, pero también interviene un factor de proporcionalidad y también la expectativa general de ruido.

La distribución de probabilidad más compacta para una energía dada es una Gaussiana, y $\exp(-\pi t^2)$ tiene como transformada de Fourier $\exp(-pi f^2)$. Entonces tenemos aquí $\sigma_t^2 \sigma_f^2 = (2\pi)^{-2}$. Este es un límite inferior teórico para compacidad en tiempo/frecuencia-espacio. Distinguir picos de frecuencia de frecuencias cercanas requiere una distribución adecuadamente estrecha de la información en el dominio de la frecuencia, lo que requiere una medición apropiadamente larga en el dominio del tiempo.

Un semitono corresponde a un factor de aproximadamente 1,06, por lo que distinguir bien dos semitonos adyacentes a una frecuencia de graves de 35 Hz requiere una ventana de tiempo con una duración de movimiento de la mano de 300 ms. En la práctica, nos las arreglamos con mucho menos porque hacemos la detección de tono principalmente en los armónicos que tienen una frecuencia considerablemente más alta.

Pero si utiliza una fuente de notas graves que carece de armónicos, como la tráquea de un subgrave de órgano, ya no es posible determinar las notas exactas en una ejecución de bajo rápida. Agregue un mixtur o un tubo de caña, y no hay ningún problema.

Básicamente: cuanto más altas sean las notas y, en particular, cuanto mayores sean las diferencias de frecuencia que desea poder determinar, menor será el intervalo de tiempo que necesita para estar razonablemente seguro.

Una soprano de coloratura puede meter tantas notas en una frase como quiera, y escuchará cada nota y cuán precisa es (lástima que todas las vocales suenen igual una vez que la frecuencia fundamental deja atrás los formantes del habla). Un bajo profondo cantando lo mismo tres octavas más abajo: no tanto.

Una flauta baja con su falta de armónicos: bastante peor. Trino en notas bajas es bastante inútil para ese instrumento.

Para volver a su pregunta original: medio segundo es suficiente para casi todas las tareas de detección de tono. A medida que se reduce el intervalo de tiempo, distinguir las diferencias de frecuencia se vuelve más difícil, y esto es un problema de ortografía primero para las notas bajas, donde las diferencias de frecuencia comparativamente pequeñas en hercios ya constituyen un semitono de diferencia musical.

La cuerda de su guitarra o violín no vibraría exactamente a 440 Hz, sino que las oscilaciones de las moléculas de aire alrededor (hasta sus oídos) serían de 440 Hz.

La frecuencia no es más que oscilaciones totales divididas por el período de tiempo. La unidad de tiempo SI es segundos, por lo que debe convertir el tiempo si desea obtener la respuesta en Hz.

440 Hz cuando se escribe en la forma p/q es 440/1, entonces, simplemente 440 Hz significa que el objeto oscila 440 veces cada segundo. Hasta ahora todo bien, espero.

Se debe tener en cuenta que esto es muy similar a la fórmula para Velocidad promedio, Distancia total/Tiempo total tomado. El Número de oscilaciones, el Período de tiempo y la Frecuencia corresponden respectivamente a la Distancia total, el Tiempo total tomado y la Velocidad promedio.

El tono de un sonido o más bien la onda de sonido depende de su frecuencia. 440/1 = 220/0,5 Ambos dan como resultado 440 Hz. El tono es independiente del Número de oscilaciones o del tiempo durante el cual oscila y solo depende de la frecuencia del sonido.

Razón científica: la perturbación de las moléculas de aire que nos rodean a frecuencias específicas en condiciones atmosféricas específicas produce tonos distintos. Es por eso que a medida que cambia la temperatura o la presión, cambia el tono producido por el instrumento. Esto también varía de un instrumento a otro.

Nota: La frecuencia a la que se hace referencia aquí es la frecuencia promedio y no la frecuencia instantánea similar a la velocidad promedio y la velocidad instantánea.

Ejemplo: Las primeras oscilaciones pueden ser muy rápidas y el resto un poco más lentas como resultado de diferentes frecuencias instantáneas pero el promedio será el tono de la nota. Nuestro oído humano no puede detectar cambios tan pequeños y, por lo tanto, generalmente los escuchamos como una sola nota.

Consulte el foro de Física para obtener más preguntas. También lea más sobre armónicos si está realmente interesado.