Cambio de frecuencia sin afectar la longitud de la señal

No físico aquí.

Por lo que aprendí en la universidad y lo que dice el sentido común, un cambio en la frecuencia de una señal da como resultado un cambio en su duración. Por ejemplo, si una señal sinusoidal de frecuencia F y longitud t se transfiere al dominio de la frecuencia, es F dividido por 2 , luego convertida nuevamente al dominio del tiempo, la longitud de la señal sería 2 t .

¡Corrígeme si estoy equivocado! Pero esto es bastante intuitivo. Si haces una señal más lenta, tardará más en terminar y viceversa.

Esta es la razón por la que me han dicho que es imposible cambiar la frecuencia de una señal de transmisión y emitirla con la misma velocidad. Por ejemplo, sería imposible tomar el discurso de un hombre y cambiarlo para que suene como el de una mujer sin hacerlo más rápido.

Ahora he tenido varias observaciones:

  • En Coursera , puede aumentar la velocidad de las conferencias del curso y, por supuesto, también se acelera el sonido. Sin embargo, no hay aumento en el tono de la voz del hablante. De hecho, el altavoz suena muy similar a la velocidad normal. ¿Cómo es posible cambiar la velocidad de la señal sin afectar su frecuencia?
  • Mi amplificador tiene un dial para cambiar el tono. Entonces, mientras juegas, puedes escuchar la salida con un tono diferente. De nuevo, ¿cómo es esto posible? Si el amplificador sube de tono, ¿no debería ser más rápida su salida que su entrada? (¡es decir, una contradicción!) Sin embargo, sospecho que hay algún truco, ya que la salida suena bastante "artificial".

Parece que es algo posible cambiar la frecuencia de una señal sin afectar su longitud. Una forma (teórica) en la que puedo pensar sería comprender las "notas" actuales que se reproducen (es decir, las diferentes frecuencias que hacen la señal) en intervalos muy pequeños, cambiar la nota y reproducirlas durante ese intervalo.

Mi pregunta es, primero, si mi comprensión es correcta. De cualquier manera, ¿existe una forma matemática de cambiar el tono de una señal sin afectar su duración en el tiempo? Si no, ¿cómo pueden hacerlo en la práctica?

En realidad, no sé la respuesta a esto (esperaré a alguien con más conocimientos de procesamiento de señales para responder a esto), pero sospecho firmemente que no se trata solo de un simple estiramiento del dominio de tiempo-frecuencia que se está aplicando. Una forma concebible de aumentar el tono sin acelerar las cosas sería cortar la señal en pequeños parches para generar un espectrograma, aplicar extensiones de frecuencia a los parches, duplicar cada parche y luego volver a convertirlos al dominio del tiempo. En la práctica, siento que esto tendría "efectos de borde" desagradables, por lo que probablemente se necesitaría un procedimiento más delicado.
El truco es usar una transformada de Fourier. En lugar de cambiar el tono comprimiendo la forma de onda (lo que afecta el tiempo de reproducción), el sonido se convierte en el dominio de la frecuencia. Luego, todos los tonos se desplazan hacia arriba y el sonido se vuelve a convertir. Puede pensar en esto como dividir el sonido en un montón de pequeñas ventanas de tiempo. Luego comprimiendo cada ventana de tiempo a la mitad del tiempo (doblando el tono), y luego reproduciendo cada ventana de tiempo dos veces.
-1; En la parte anterior de su pregunta, no entiendo lo que está tratando de decir. ¡Por lo que sé, estás totalmente desinformado! ¿Por qué la longitud de la señal dependería de la frecuencia? en primer lugar, ¿qué quiere decir con longitud de señal? Me pregunto en qué universidad estudiaste esta cosa equivocada?
@RajeshD intenta imaginar lo que sucede si reproduces una cinta a la mitad de la velocidad. Tanto la duración de la señal como su tono cambiarán. Es por eso que existe una relación entre los dos.
@Nathaniel: De la publicación de OP, cito "un cambio en la frecuencia de una señal da como resultado un cambio en su duración", estoy tentado a decir ¿Qué diablos está pasando? ¿A qué te refieres con cambio de frecuencia? y largo? Te equivocas por completo al comunicar lo que pretendes preguntar.
@RajeshD me parece bastante fácil de entender.
@RajeshD: El OP dice que si simplemente hace FT de la transmisión de audio, disminuye las frecuencias y luego IFT, obtiene una versión más lenta (y, por lo tanto, más larga).
@RajeshD, solo para aclarar cómo funciona la serie de sitios web * .SE.com, uno generalmente hace una pregunta cuando no sabe algo. Por lo general, estar mal informado no es una razón para -1, ¡ya que esa es la razón de la pregunta en primer lugar! -1 generalmente se aplica cuando la pregunta es de muy baja calidad o no muestra ningún esfuerzo por encontrar la solución. Aunque sin resentimientos. Sólo quería aclarar eso.
@Shahbaz: ¿Cuál es la diferencia entre frecuencia y tono?
@RajeshD, tenía la impresión de que el tono es el término no técnico para la frecuencia. Leyendo en línea hace un momento, parece que el tono se refiere a la percepción psicológica de esa frecuencia.

Respuestas (1)

Tiene razón en que es imposible cambiar la frecuencia de cada componente de una forma de onda mientras (a) conserva todas las relaciones de fase entre las frecuencias y (b) conserva la longitud de la forma de onda. Sin embargo, aunque es matemáticamente imposible hacer esto con precisión, es posible hacer cosas que suenan bastante parecidas al oído humano. Los algoritmos más básicos para esto son bastante simples, pero hacerlo bien es bastante difícil, y los algoritmos se mejoran todo el tiempo. Se denomina "cambio de tono" si el objetivo es cambiar el tono pero no el tiempo, y "extensión del tiempo" si desea cambiar el tiempo manteniendo el tono.

La razón por la que esto es posible es que el oído distingue el ritmo y el tono como cosas muy distintas. Una secuencia de clics sonará como una secuencia de clics hasta que su frecuencia pase de 20 a 30 Hz, momento en el que se convierte en un zumbido que se percibe como si tuviera un tono. Debido a esto, como dijo DumpsterDoofus, puedes dividir el sonido en pequeños segmentos de corta duración, cambiar el tono de cada uno individualmente y luego volver a unirlos, repitiendo cosas o dejando espacios donde sea necesario.

Por sí mismo, esto no suena tan bien, porque obtienes un clic al final de cada segmento, donde las formas de onda no se alinean. Se puede mejorar mucho superponiendo "ventanas" de sonido, cada una de las cuales tiene un fundido de entrada y de salida aplicado. De esa manera, no escuchará los clics en los extremos de los segmentos, pero tiende a escuchar los efectos de cancelación de fase cuando las ventanas se vuelven a agregar. Por esta razón, esta técnica requiere un poco de ajuste para que suene bien en cualquier sonido de entrada dado.

También existen técnicas de dominio de Fourier, como dijo Brandon Enright. Estos también suelen usar ventanas superpuestas; Supongo que la ventaja de usar el dominio de Fourier es que tienes más control sobre las relaciones de fase. (No sé mucho sobre estas técnicas.)

Un desarrollo bastante reciente es el algoritmo de "agregación de superposición síncrona de tono" (PSOLA). Esto también utiliza ventanas superpuestas, pero sincroniza la longitud de las ventanas con el tono del sonido de entrada. Esto hace que sea mucho más difícil para el oído percibir las ventanas individuales. Lo llamo "el algoritmo que arruinó la música", porque es responsable de ese desagradable efecto de "autoajuste" que se ha usado en exceso en las voces de todos los discos pop durante los últimos diez años más o menos. Sin embargo, también tiene aplicaciones pacíficas, y el dial de tono de su amplificador probablemente use alguna versión de él.

Puede encontrar más detalles sobre estos algoritmos en Wikipedia .