¿Por qué la música MIDI sintetizada por software suena tan mal?

Parece que convertir MIDI en sonido debería ser lo suficientemente simple: grabe todas las notas posibles y luego simplemente superponga los sonidos individuales de acuerdo con los datos MIDI (compensaciones, duración y volumen), y comprima el resultado en MP3 o envíelo a la tarjeta de sonido. .

Sin embargo, los sintetizadores MIDI que probé ( timidityen Ubuntu y algunos otros que no recuerdo) suenan distorsionados y, en general, mucho peor que las grabaciones MP3 de músicos reales.

¿Porqué es eso?

Actualización: acabo de probar Fluid Synth en Ubuntu, que usa alrededor de 100 MB de "fuentes de sonido", comprimidas. Parece ser mucho mejor, pero sigue siendo bastante malo.

Las tarjetas de sonido no suelen decodificar MP3. El MP3 se decodifica en PCM antes de enviarse a la tarjeta de sonido, y los sintetizadores de software simplemente van directamente a PCM (o los samplers simplemente se leen de los archivos PCM).
Creo que estás simplificando demasiado. Un archivo midi listo para usar reproducido en otro conjunto de muestras listo para usar tiene pocas esperanzas de igualar el matiz que incluso un creador no calificado podría hacer usando la misma fuente tanto para la creación como para la reproducción.
Echa un vistazo al software MIDI profesional, como Trillian Bass, Steven Slate Drums o Vienna Symphonic Library .
Los instrumentos de software que probó no están en la categoría de peso adecuada. Una "fuente de sonido" decente para un solo instrumento generalmente ocupa un DVD o una docena de DVD, y cuesta comparable a un instrumento físico decente.
"Parece que convertir MIDI en sonido debería ser lo suficientemente simple" ¿OP podría ser un físico ? :-)

Respuestas (8)

MIDI es solo una especificación de qué instrumento (parche) usar, qué notas tocar, cuánto tiempo y con qué volumen tocar una nota y otras cosas como el tempo, el tipo de compás y la letra del texto. El concepto es muy similar a cómo funciona una vieja pianola. Los datos midi son como el piano roll, el sonido que escuchas proviene del sonido físico producido cuando los martillos golpean las cuerdas. Del mismo modo, la forma en que suena la música cuando se reproduce a través de la especificación MIDI depende de la calidad de los sonidos del parche. Incluso es posible conectar una conexión MIDI a una máquina que toca instrumentos acústicos físicos y que puede sonar muy bien. Del mismo modo, podría darte un conjunto de mi canto para cada parche de instrumento y sonaría horrible. Todo depende del conjunto de parches que tenga o del instrumento que haya conectado al secuenciador o controlador MIDI también.

Un ejemplo de cómo la calidad del sonido puede ser diferente es que en los años 90 había un juego llamado Doom II que usaba archivos MIDI para la música. Dependiendo de la tarjeta de sonido que tengas, el juego sonará mejor o peor debido a la calidad de los parches de instrumentos que incluye tu tarjeta de sonido. Incluso era posible conectar cables MIDI desde su computadora a un sintetizador externo y usar la síntesis de sonido allí. Una vez lo conectamos a un Kurzweil K2000 y fue como tener una banda en vivo tocando la música de Doom II mientras jugabas.

Como protocolo y formato de archivo, MIDI ha sido sorprendentemente hábil y ha requerido poca revisión durante los últimos 30 años o más. Aunque a principios de 2015, la Asociación de Fabricantes de MIDI anunció que se está desarrollando un nuevo "Protocolo HD" MIDI.

Hay un órgano Wurlitzer en Phoenix (en una pizzería de todas las cosas) que hace exactamente lo que describes; un complejo sistema de software/hardware basado en MIDI controla no solo las varias docenas de órganos reales que tiene, sino también un complemento adicional de instrumentos, desde pianos y xilófonos hasta varios instrumentos de viento de madera y metal e incluso un par de guitarras.
Sin embargo, el estándar MIDI está bajo revisión; la idea es primero aumentar la resolución de varios controles continuos como velocidad y modulación, y segundo estandarizar algunos usos de MIDI para control de software, como HUI, que actualmente usa una combinación más o menos propietaria de NRPN. Todo esto, manteniendo la compatibilidad con versiones anteriores de más de 30 años de equipos y software diseñados para usar MIDI "1.0".
Esto también podría ser de interés. Hice un video para climagic hace un par de años que demuestra cuán compacto puede ser el formato de archivo MIDI: youtube.com/watch?v=zRF1S-8P6_k Pude incluir un archivo MIDI corto y su decodificador en un tweet de 140 caracteres.
"MIDI ha sido sorprendentemente hábil y ha requerido poca revisión durante los últimos 30 años" bueno... Lo diría de manera menos halagadora: la gente ha desarrollado cada vez más soluciones para compensar las deficiencias de MIDI, porque nadie se molestaría en implementar un estándar de reemplazo adecuado .

MIDI no es sonido. La especificación MIDI no dicta cómo suena un instrumento, depende del sintetizador generar el sonido. Los sintetizadores gratuitos suenan como una mierda, pero los buenos pueden sonar tan bien como los creadores pueden hacerlo. Por ejemplo, la banda sonora de Piratas del Caribe está completamente sintetizada, pero la mayoría de la gente ni siquiera se da cuenta.

“MIDI no es sonido.” – de hecho, y esa es realmente toda la respuesta a la pregunta. — No estoy del todo de acuerdo con la forma en que contrastas los sintetizadores libres/malos con los buenos; la verdad es que algunos de los más caros hacen que sea más factible lograr resultados cercanos a la interpretación humana en un instrumento real; pero, en última instancia, la calidad depende mucho de lo bien que el arreglista conozca el sintetizador en particular. Las producciones profesionales solo de sintetizadores generalmente no son solo MIDI, al menos no en el sentido tradicional de GM: hay muchos ajustes dinámicos de todos los parámetros requeridos.
(Y FWIW, no creo que la banda sonora final de Piratas del Caribe esté completamente sintetizada (aunque Zimmer aparentemente hizo una vista previa de sintetizador completo); al menos algunos de los pasajes menos grandilocuentes se tocan con instrumentos reales).
De hecho, hay controladores MIDI con muchas fuentes de modulación modeladas a partir de instrumentos reales, por lo que los jugadores pueden impartir todo tipo de expresión que luego se traduce a código de computadora. Incluso con un sintetizador muy modesto, esto puede dar como resultado una música totalmente única y, en última instancia, expresiva. Todo está en cómo lo usas. Un archivo MIDI típico de Internet no contiene nada más que valores de notas y duraciones, mientras que hay MUCHA más información que eso en la mayoría de las interpretaciones musicales.
* En teoría, no hay razón por la que no puedas traducir cada bit de información de una interpretación musical a MIDI si tienes modelos funcionales de la acústica y los generadores de sonido.
Según Wikipedia , hubo músicos reales (mezclados con sonidos secuenciados) para la primera banda sonora de Pirates, al menos.
Creo que es muy común en la televisión usar secuenciadores y luego superponer un violinista real y un jugador de viento de madera, solo para que apeste menos. ¿Pero Hollywood? Je, ese tipo Zimmer es raro.
Lo siento, pensándolo bien, ¿dónde diablos dice ese artículo de Wikipedia que (parte de) la banda sonora fue secuenciada? Dice que Zimmer primero produjo una demostración secuenciada, pero esa es una práctica 100% estándar, especialmente con "compositores" que no pueden orquestar (un orquestador y un copista se encargarán de eso). No reservas una sesión orquestal solo para escuchar al director decirte "oye, en realidad esto apesta, no lo estamos usando".
@SomeDudeOnTheInterwebs: interpreté esta parte de esa manera. Mi comentario tenía la intención de refutar que estaba "totalmente sintetizado", no hay necesidad de irritarse...
Sí tienes razón. Menciona ritmos de batería muestreados y esas cosas. Aunque no veo citas para ese párrafo, por lo que puede ser algo que inventó el autor.

MIDI es solo un flujo de instrucciones, como:

  • "Dile al canal 1 que encienda la nota 60"
  • "Dígale al canal 2 que apague la nota 72"
  • "Dígale al canal 3 que establezca el parámetro 1 al valor 231"

Hay un conjunto de convenciones tales como:

  • El canal 1 es piano, el 34 es bajo eléctrico, etc.
  • El parámetro 1 es modulación, el 7 es volumen, el 64 es sustain, etc.

Esto se llama General MIDI ( Wikipedia ).

General MIDI se especificó más tarde que el propio MIDI. Los usuarios de MIDI son libres de usar cualquier instrumento en el canal 1. Ni siquiera tiene que controlar un instrumento: MIDI puede usarse para controlar luces o cualquier otra cosa.

Si obtiene un archivo MIDI de Internet, es probable que esté escrito para GM, pero a veces no lo es.

Imagine el caso más simple de un archivo MIDI: una grabación de una persona tocando una parte de piano en un teclado. Es un poco como hacer que un robot imite exactamente los movimientos de un pianista y luego poner el robot en el teclado de un instrumento diferente.

Si el robot está en un buen piano, probablemente suene bien. Es posible que este piano no tenga exactamente la misma respuesta de la velocidad de las teclas al volumen, por lo que la expresión sonará sutilmente diferente. Pero sonará bastante bien.

Si sienta al robot en un teclado de juguete, es probable que suene horrible. Un buen músico probablemente podría sacar un sonido decente de ese teclado de juguete. Pero aquí el músico ha "tocado" un buen instrumento y su entrada se ha movido a un instrumento diferente, por lo que no pueden tener en cuenta sus limitaciones.

Luego están todos los demás parámetros. ¿Qué efecto tiene la "modulación 127" en el sonido? ¿Cuánto cambia el tono "100 pitch bend"? Incluso cuando GM los especifica, no todas las implementaciones lo hacen bien.

Luego, multiplíquelo por una cantidad de instrumentos y tenga en cuenta que si estuviera masterizando su propia pieza musical, estaría modificando aspectos que GM no especifica, y se vuelve obvio por qué la reproducción MIDI puede sonar terrible.

Una "fuente de sonido" de alta calidad, el conjunto de cosas que traducen los eventos en sonidos, puede mejorar las cosas, pero incluso así no se alcanzan los estándares de una grabación profesional completa.

Muchos discos electrónicos están hechos completamente con instrumentos secuenciados MIDI, pero los músicos también están configurando cuidadosamente sus instrumentos y efectos para obtener el sonido que desean.

Es muy divertido enviar archivos MIDI a los sonidos integrados de la tarjeta de sonido más barata que pueda encontrar y tocar "adivina la melodía". O intercambiando instrumentos.

Parece que convertir MIDI en sonido debería ser lo suficientemente simple: registrar todas las notas posibles y luego superponer los sonidos individuales de acuerdo con los datos MIDI (compensaciones, duración y volumen), y comprimir el resultado en MP3 o enviarlo a la tarjeta de sonido. .

Y este tipo de pensamiento (es decir, el tipo equivocado) te da exactamente los resultados que escuchas.

En primer lugar, tiene dos problemas principales aquí.

una. Cadenas de sonido de mierda.

b. secuencias de mierda

Veamos por qué.

  1. En instrumentos distintos al piano, no hay dos notas que suenen igual. decir, guitarra. Hay un millón de formas de cambiar el sonido de una nota en una guitarra. Elige entre púa, dedos, púas y tienes diferentes sonidos. Elige dónde trastear la misma nota y tendrás diferentes sonidos. - o registros.

  2. Los instrumentos y efectos eléctricos de uso generalizado en la producción musical suelen ser no lineales. Si ingresa dos notas en un amplificador de guitarra saturado, la salida no será la suma de las notas individuales. Incluso los buenos pianos acústicos antiguos tienen la llamada resonancia simpática.

Aborda esto con una buena cadena ad hoc de instrumento + efecto, resolviendo el problema a, pero timidityni siquiera califica.

Digo ad hoc porque para jugar Limp Bizkit necesitas una configuración diferente a la que necesitas para jugar gospel, en la vida real y en la computadora también. Necesitas encadenar los efectos correctos, las muestras correctas, etc. No querrás reproducir tu parte midi agitada de Limp Bizkit con una muestra de caja piccolo, ¿verdad? Si desea hacerlo correctamente, también desea que sus instrumentos virtuales puedan interpretar los datos de articulación (posición de selección, etc.), generalmente alimentados a través de CC. Esto es muy complicado. Tan complicado que, de hecho, la gente prefiere grabar una guitarra real.

  1. Articulación y expresión. Incluso en algo comparativamente sencillo como un piano, un pianista real no toca de manera robótica como un secuenciador mal programado donde cada nota es exactamente 1/8, 1/16 y los glissandos o "bendings" son perfectamente lineales.

  2. La gente que crea los archivos midifiles que puedes encontrar en Internet suele ser bastante perezosa y te proporciona transcripciones deficientes, donde incluso se omite la articulación trivial.

Si solo toma la salida de un secuenciador, la interpretación sonará robótica y sin expresión, como era de esperar, incluso si obtiene la articulación y la ornamentación correctas. Pero si graba las notas tocadas por un jugador real con, digamos, un teclado MIDI y una guitarra MIDI, los resultados serán muy diferentes.

Esto se encarga de b.

Y ahora estoy tirando la bomba, amigo.

La mayor parte de lo que escuchas en la radio en estos días es MIDI.

El equipo de grabación y edición utiliza MIDI y la mayoría de las pistas de acompañamiento están secuenciadas o grabadas a través de MIDI. Incluso el autoajuste de la pista de voz probablemente esté controlado por eventos MIDI.

Y si vas a un concierto en vivo, probablemente usen código de tiempo y eventos MIDI para impulsar el espectáculo de luces y la cadena de efectos en la pedalera del guitarrista.

La cosa es que Celine Dion no usa timiditypara sus pistas de acompañamiento y sus productores pasan algún tiempo en las secuencias.

Las fuentes de sonido gratuitas que normalmente se instalan con Timidity tienen una calidad muy variada. Enrutar la reproducción a través de algún expansor Midi antiguo de buena calidad mejorará en gran medida los resultados, enrutarla a través de alguna oferta razonablemente actual de buena calidad brindará algunas mejoras adicionales en un tamaño de hardware mucho más portátil. Naturalmente, las rutas analógicas involucradas aquí disminuirán la calidad nuevamente.

Puede mejorar un poco la acción de Timidity trabajando con otras fuentes de sonido y ajustando sus parámetros, pero en realidad no se compara.

Puede haber algunos expansores MIDI de software comerciales que hacen un buen trabajo, pero su vida útil esperada es mucho menor que la de los expansores de hardware (es probable que los expansores de hardware continúen funcionando en 20 años, los expansores de software no a menos que mantenga algo de hardware + OS con ellos ) y hay mucha variación en cuanto a precio y calidad. Y es probable que no se ejecuten en GNU/Linux, y pueden ponerlo nervioso con los esquemas de licencias/DRM.

Alimentar un buen expansor MIDI con buenos datos MIDI en realidad producirá un sonido que es bastante útil para varios propósitos (en parte dependiendo de en qué se especialice el expansor MIDI). Algunos instrumentos con controles continuos y "analógicos", como cuerdas solistas, son bastante difíciles de hacer de manera convincente, especialmente cuando no se usan controladores MIDI continuos (pedales analógicos, acordeón MIDI o instrumento de viento con sensor de presión, etc.): las secciones de cuerda funcionan mejor en ese sentido.

hay 2 posibles problemas aquí.

1) El archivo midi se crea directamente a partir de la partitura. cada nota comienza exactamente en el momento adecuado y dura la duración exacta y todas las velocidades de las notas son 100. Eso hace que la canción no tenga ningún sentimiento. Si tienes un músico que toca la canción con velocidades expresivas, variaciones de tempo, arreglos mejorados, entonces sonará mucho mejor.

2) El sintetizador que estás usando puede ser cojo. Timidity usa fuentes de sonido, creo. Esa es una tecnología bastante antigua en la que la frecuencia de muestreo no siempre es de calidad de CD, las muestras son bucles cortos y no hay muchas muestras por instrumento. Los softsynths modernos suelen tener una tonelada de muestras superpuestas por instrumento.

De todos modos, si eres músico, esa podría ser la única partitura que encontrarás de tu canción pop favorita. Encuentro esas cosas invaluables.

La música basada en MIDI será tan buena como su diseñador. No es que la calidad del sonido de la música basada en MIDI sea intrínsecamente mala; los resultados finales dependen de quien haya diseñado el MIDI y de quien lo esté usando. En otras palabras, si suena mal es por las personas involucradas. Incluso si usted no lo diseñó y solo lo está usando, usted es responsable de la calidad de salida, ya que usted decide qué dispositivo se usará con qué configuración.

Hay dos áreas distintas en el diseño de música MIDI:

  1. El archivo MIDI. Si fue capturado, la calidad dependerá del ejecutante. Si fue programado la calidad dependerá del diseñador/programador. No hay sonido involucrado aquí (todavía), por lo que puede pensar en este paso como la calidad de la talla de las instrucciones que luego serán interpretadas por un dispositivo que entiende MIDI.

  2. El diseño sonoro. Ahora las instrucciones deben ser interpretadas por algo como un sampler, una caja de ritmos, un sintetizador. La calidad aquí depende tanto del dispositivo que esté utilizando como de sus habilidades como diseñador de sonido.

Si no le gusta el resultado, algo salió mal en estos pasos.

No das muchos detalles, por lo que es difícil saber con certeza qué es lo que está mal en tu caso. No estoy familiarizado con Timidity, pero si es un sintetizador (sustractivo, FM, etc.) eres tú quien lo programa, por lo que la calidad de la salida es un reflejo de tu habilidad. Si Timidity es una muestra, tal vez las muestras sean de baja calidad. Tal vez la distorsión provenga del recorte, pueden ser muchas cosas.

No debería haber distorsión, así que intente usar un sintetizador de buena calidad y/o un muestreador de buena calidad con muestras de buena calidad.

Suenan 'mal' porque no son sonidos creados naturalmente. No son los sonidos de los instrumentos acústicos, que tienen una gama mucho más amplia de características en comparación con algunas frecuencias particulares que suenan en un momento determinado.

Incorrecto y fácilmente falsificable. Además, los únicos "sonidos creados naturalmente" son el canto de los pájaros, la Madre Naturaleza no fabrica órganos de tubos.