Meta ha anunciado la expansión de su sistema de transcripción de voz a texto, que ahora admite más de 1.600 idiomas, incluyendo 500 lenguas que nunca antes habían sido reconocidas digitalmente en este tipo de herramientas. La compañía afirma que se trata del proyecto de reconocimiento de voz más inclusivo y multilingüe hasta la fecha, dentro de su apuesta por la inteligencia artificial abierta y el desarrollo de modelos de lenguaje universales.
El avance forma parte de los esfuerzos de Meta AI por mejorar la accesibilidad digital y la comunicación global a través de tecnologías de procesamiento del lenguaje natural (PLN). La iniciativa amplía los resultados obtenidos por el proyecto Massively Multilingual Speech (MMS), presentado por la empresa en 2023, que ya permitía el reconocimiento y la transcripción de más de 1.100 idiomas. Con esta nueva actualización, el sistema incrementa en un 45 % su cobertura lingüística, alcanzando comunidades que hasta ahora carecían de representación tecnológica.
Según Meta, el desarrollo se ha basado en una combinación de técnicas de aprendizaje profundo y modelos de IA generativa, entrenados con corpus lingüísticos diversificados y audios obtenidos de fuentes públicas. La compañía asegura que la metodología empleada garantiza una mayor precisión en contextos multilingües, incluso con variaciones fonéticas o dialectales significativas.
Avances técnicos y accesibilidad
El nuevo modelo de transcripción de Meta utiliza una arquitectura basada en modelos multimodales que integran voz, texto y contexto semántico. Esta estructura permite no solo convertir audio en texto, sino también entender el significado de las palabras en función del entorno comunicativo, una capacidad clave para la traducción automática y las futuras aplicaciones de realidad aumentada.
Además, la compañía ha destacado que el sistema está diseñado para operar tanto en entornos online como offline, lo que facilita su integración en dispositivos móviles y aplicaciones sin conexión. Esto amplía las posibilidades de uso en regiones con conectividad limitada, reforzando el compromiso de Meta con la inclusión digital.
La tecnología también podría mejorar las funcionalidades de plataformas como Facebook, Instagram, WhatsApp y Horizon Worlds, permitiendo la generación automática de subtítulos en vídeos, la traducción de mensajes de voz o la accesibilidad para personas con discapacidad auditiva. No obstante, Meta no ha especificado aún cuándo se implementará de forma generalizada en sus productos comerciales.
Impacto social y lingüístico
El proyecto tiene un componente social relevante: muchas de las lenguas ahora reconocidas pertenecen a comunidades pequeñas o en riesgo de desaparición. Al incluirlas en su sistema, Meta contribuye indirectamente a su preservación digital y a la posibilidad de desarrollar aplicaciones educativas o culturales que promuevan su uso.
Expertos en lingüística digital han destacado que este tipo de avances suponen un paso importante hacia la equidad tecnológica, aunque advierten de la necesidad de garantizar una representación justa y precisa de los diferentes dialectos y contextos culturales.
Privacidad y transparencia
Meta ha asegurado que los datos utilizados para el entrenamiento del modelo proceden de fuentes públicas y grabaciones libres de derechos, y que no se emplean contenidos privados de los usuarios. La compañía ha reiterado su compromiso con la transparencia en el desarrollo de inteligencia artificial responsable, publicando parte del modelo y su documentación en repositorios abiertos para su revisión por la comunidad investigadora.

