• viernes 03 de febrero del 2023
728 x 90

Amoldan el modelo de inteligencia artificial Stable Diffussion para producir música desde artículo

img

MADRID, 19 Dic. (Portaltic/EP) -

Los programadores del modelo de IA (inteligencia artificial) (inteligencia artificial) Stable Difussion han amoldado esta tecnología a fin de que sea con la capacidad de hacer espectrogramas capaces de transformarse en clips de audio o música desde un artículo.

Stable Difussion es un modelo de estudio automático ('machine learning') de artículo a imagen creado por Stability AI, que se emplea para producir imágenes digitales de alta definición desde artículo.

Dos programadores llamados Seth Forsgren y Hayk Martiros han desarrollado un emprendimiento llamado Rifussion a través de el que amoldan esta solución a la música. Con ella se tienen la posibilidad de producir espectrogramas que se tienen la posibilidad de traducir, por su parte, en clips de audio.

Tal y como comentan los autores de este emprendimiento en su web, un espectrograma de audio o sonograma es una representación visual fundamentada en conjuntos de advertencias de artículo introducidos por el usuario.

Estos sonogramas tienen 2 ejes: X, que representa el tiempo, y también Y, que representa la continuidad. El color de cada pixel de cada espectrograma de audio, en cambio es su amplitud. Precisamente es este apunte el que tiene presente Torchaudio, que toma la imagen generada por Stable Diffusion y la transforma en audio.

Desde Rifussion comunican que no solo es viable producir música desde imágenes y artículo, sino asimismo se deja conjuntar, presenciar y fusionar estilos.

Los programadores han puntualizado que, en el caso de tener una GPU lo bastante fuerte, se tienen la posibilidad de hacer sonogramas con un tamaño de imágenes generadas de 512 x 512 pixeles y de cinco segundos de duración. No obstante, se tienen la posibilidad de ingresar variantes infinitas basándose en exactamente la misma imagen original.

Rifussion incluye en la actualidad un generador de clips, tal como advertencias y datos especialistas para lograr emplear esta tecnología en su web. Además, su código está libre en su repositorio en GitHub.