¿Cómo se aísla un tono específico de un archivo de audio?

Lo que estoy tratando de hacer es si, por ejemplo, tengo un archivo de audio donde una persona dice "Hoy", podría aislar un sonido como el sonido "o" y extenderlo como un tono por cualquier período de tiempo.

Entonces, para "objetivo" va a "oooooooooooooo".

Cualquier ayuda será muy apreciada. Gracias chicos por cualquier ayuda de antemano.

Sería difícil de hacer. Puedes probar Audacity
Las preguntas relacionadas con el software generalmente están fuera de tema, por lo que modifiqué un poco el título.

Respuestas (3)

Esto podría hacerse con una pieza de hardware o software llamada sampler , pero debería poder lograr lo mismo con cualquier editor de forma de onda, o una combinación de los dos.

Esencialmente, estará "recortando" el archivo de audio para aislar solo el tono en cuestión, e idealmente de una manera que suene igual tanto al principio como al final del fragmento. Entonces simplemente harías un bucle en ese fragmento.

El equivalente gráfico de esto sería comenzar con una foto familiar, recortarla hasta la cabeza y luego colocar el resultado en mosaico como fondo de escritorio. (Lo siento, no pude resistir.)

Los samplers en particular se utilizan para reproducir fragmentos en bucle, a menudo con otros modificadores especiales como modulación de tono, ataque, liberación y caída. Puede usar uno para crear un sonido especial para su teclado MIDI que consta de una serie de sonidos individuales en capas y bucles de una manera única.

La mayoría del software de transcripción se reproducirá automáticamente; o al menos permitirle reproducir fácilmente una sección de audio, como alguien que hace el sonido "ooh" en "Hoy". Hará esto más fácilmente que un programa completo de edición de formas de onda.

Hacer esto dentro del software de transcripción le evitará tener que editar manualmente la pista, reproducirla en bucle, etc. . Y más.

Esto se puede hacer como se sugiere en Audacity y otros programas de audio, sin embargo, creo que es más simple resaltar la parte seleccionada de una forma de onda, presionar la barra espaciadora y escuchar esa sección de audio una y otra vez.

¡Mi experiencia con esto es principalmente en Transcribe! , o Capo , pero todos actúan de manera similar.

Ahora, cuando quiera exportar esto fuera del software de transcripción:
Sin embargo, el audio probablemente se "recortará" en el sentido de que el ruido comienza de nuevo y tendrá un comienzo abrupto. En ese caso, copiar y pegar el clip de audio dentro de un editor y Cross-Fading debería dejar un flujo de vocales tan indefinido como desee. O cualquier tono para el caso.Visual de desvanecimiento cruzado

Buena nota sobre el crossfading. Otro truco que he usado en alguna ocasión es hacer zoom muy, muy lejos y asegurarme de que el final del segmento esté en la misma fase que el comienzo. Para un sonido bastante consistente, significa que no hay clip, pero si las cualidades tonales cambian abruptamente, no es suficiente.

Usar un editor de forma de onda simple sería una buena idea si estuviera tratando con un tono 'puro', esencialmente, una sola onda sinusoidal, o quizás una pequeña cantidad de ondas sinusoidales como las que se usan en DTMF. El sonido de cualquier vocal del habla humana es más complicado, y el tipo de operaciones que son simples en su forma de onda tienden a introducir artefactos (que pueden o no importarle). Considere que una vocal se compone de muchas frecuencias, con longitudes de onda ligeramente diferentes. , y es muy difícil cortar un trozo de forma de onda que contenga un número entero de las ondas que le interesan, y si obtiene una fracción de cualquiera de ellas, es probable que se produzca un crujido audible en el punto de los extremos de la ventana de bucle se unen.

Por lo general, si desea estirar un sonido complejo como ese mientras reduce los artefactos de edición, querrá comenzar dividiendo el sonido original en su espectro de frecuencia utilizando la transformación de Fourier. La parte seleccionada de esto se puede estirar mecánicamente (o, alternativamente, encoger, si lo desea) repitiendo algunos o todos los fotogramas varias veces, según lo dicte el factor de estiramiento, o omitiendo algunos fotogramas según el factor de contracción, y la forma espectral modificada luego se volvió a sintetizar en una nueva forma de onda. De esta manera, las frecuencias individuales de diferentes longitudes de onda en la ventana del bucle terminarán siendo regeneradas, y no importará que la longitud de la ventana del bucle no sea un número entero de algunas (o, bueno, casi todas) de estas. ondas.

Algunos paquetes de edición de sonido incluyen herramientas para filtrar artefactos crepitantes. En general, puede asumir que estos realizarán la transformación de Fourier entre bastidores, detectarán eventos breves de alto volumen y los suprimirán en el espectro, y luego volverán a sintetizar la forma de onda.