Meta ha lanzado NotebookLlama, una herramienta de código abierto que transforma anotaciones en audio al estilo de un pódcast, usando sus modelos de lenguaje grande (LLM) de la serie Llama. Esta herramienta se posiciona como una alternativa de código abierto a NotebookLM de Google y está disponible en GitHub.
NotebookLlama toma un documento en PDF, lo analiza y resume mediante Llama 3.2 (1B-Instruct). Luego, usa Llama 3.1 (70B-Instruct) para generar transcripciones de estilo pódcast, incluso permitiendo opciones más creativas o dramáticas con otros modelos de la serie Llama, como el Llama 3.1 (8B-Instruct). Por último, convierte las transcripciones en un pódcast de tipo conversacional usando tecnología de texto a voz.
Aunque el sistema de Meta aún presenta desafíos en la naturalidad de las voces y en el manejo de los turnos de palabra, esta herramienta ofrece un enfoque innovador para crear contenido de audio a partir de documentos escritos, ampliando el uso de la inteligencia artificial en medios digitales.