¿El algoritmo de generación de música AI de FLow Machine se basa sustancialmente en la teoría musical actual?

Un ejemplo del generador de música de inteligencia artificial de Flow Machines se puede encontrar en Soundcloud .

¿Se ha discutido o publicado hasta qué punto sus algoritmos se desarrollaron con conceptos estándar de teoría musical "incorporados" en lugar de simplemente dejar que la IA aprenda "las reglas" de la música popular (u otros tipos de música) completamente por sí sola a partir de ejemplos? ?

Aquí hay una discusión que he leído pero que realmente no entiendo. Los modelos de Markov son una herramienta matemática general y no están específicamente relacionados con la música o la experiencia humana, y eso está bien. Pero aquí solo estoy tratando de preguntar si la teoría musical se incluyó a priori o no.

Relacionado: Algoritmos para la composición musical, pero no vi las máquinas de flujo mencionadas aquí.

Solo he hojeado la página, pero la mención de "Aprendizaje automático" me sugiere que simplemente lanzan un gran conjunto de canciones de entrenamiento en el estilo deseado en el algoritmo y luego lo sueltan. Sin embargo, hay enlaces a algunos documentos en la página, que probablemente respondan la pregunta, simplemente no tuve tiempo de leerlos. Un vistazo rápido al resumen y la introducción del primer artículo vinculado parecen respaldar mi suposición: los únicos conceptos que están "incorporados" son "melodía a dos voces", "armonía" y "medida", pero las reglas son todo aprendido usando Deep Learning.
@JörgWMittag Gracias por su evaluación. Acabo de descubrir que no vinculé "Discusión" correctamente; lo arreglé ahora; se vincula a esta descripción general que profundiza más que la página vinculada incorrectamente. Como me concentré en la página de descripción general, me perdí los documentos de acceso abierto que mencionó . Les echaré un vistazo este fin de semana. Me alegro de que te hayas dado cuenta y los hayas señalado, ¡gracias!

Respuestas (1)

Quiero decir que usa mucha lógica como lo hace típicamente una cadena de Markov, que es usar patrones en las entradas para hacer una salida. Generará melodías, armonías, ritmos, etc. que no son necesariamente conceptos de teoría musical. Si alimentó una cadena de Markov con cualquier libro, parecerá que hace oraciones lógicas, pero no siempre será así y la cadena en realidad no entiende el idioma, solo busca patrones y el resultado puede o no tener sentido. Esta misma idea se aplica a la música como lo hará. La declaración sobre cómo se hace es:

El proyecto Flow Machines adopta una perspectiva informática sobre el estilo: ¿cómo puede una máquina comprender el estilo y convertirlo en un objeto computacional? Un objeto que los usuarios pueden manipular para crear nuevos objetos con sus propias restricciones. Técnicamente desarrollamos nuevas tecnologías basadas en modelos de Markov. Los procesos de Markov son herramientas bien conocidas que se utilizan para modelar propiedades estadísticas de secuencias temporales.

En general, la cadena de Markov por sí sola es bastante débil para hacer música y, de hecho, necesitará al menos una cadena de Markov de segundo orden para que todo tenga sentido desde una perspectiva de armonía, ya que la armonía de la música tonal va a alguna parte. La clave también es bastante importante ya que las notas utilizadas en la melodía y la armonía no tendrán el mismo peso, por ejemplo, cómo se usa un acorde de Do mayor en Do mayor y Fa mayor es diferente. De hecho, el video de ejemplo muestra esta debilidad bastante bien, ya que los acordes utilizados y la melodía tienen sentido, pero no es muy natural y tiene el efecto serpenteante de una cadena de Markov de orden bajo, ya que la melodía no encuentra un buen punto. de descanso.

Mencionan estilos de agrupación que ayudarán a minimizar estos problemas como se menciona en su segundo enlace:

Actualmente estamos investigando el estilo y la creatividad desde varias perspectivas: técnicamente, hemos logrado avances sustanciales en el desarrollo de algoritmos de restricciones de Markov eficientes que pueden aplicar muchos tipos de restricciones a modelos de Markov arbitrarios. Conceptualmente, estamos comenzando a construir herramientas de autoría en composición musical y redacción de textos que permitan a las personas generar contenido manipulando el estilo de un autor existente, posiblemente ellos mismos.

Nuevamente, esto no es teoría, sino solo usar entradas para hacer una salida. La cadena no entenderá ninguno de los conceptos reales de teoría musical ni siempre hará cosas que tengan sentido musical. Incluso hay una gran bandera roja más abajo en esa página:

Si no te gusta la secuencia propuesta el sistema te propondrá otra, y así sucesivamente hasta que estés satisfecho con el resultado.

Lo cual es solo una forma de decir "toma otra oportunidad y puede que te guste lo que escuchas". Si bien usar una cadena de Markov es mejor que simplemente elegir notas al azar, duración, etc., todavía está muy lejos de ser consciente de lo que está haciendo o de la teoría detrás de esto.


No voy a especular sobre la mecánica exacta y sin mirar debajo del capó no lo sabré con certeza, pero en base a todo y lo que están describiendo, hay poca o ninguna teoría musical real detrás de esto. Lo único que es un poco teórico es agrupar las piezas por "estilo" antes de hacer las cadenas, pero eso no es realmente teoría musical, ya que es solo agrupar piezas que quien hizo los grupos pensó que eran similares.