CecilIA: la inteligencia artificial cubana que quiere hablar como su pueblo

El modelo de lenguaje cubano avanza como proyecto de soberanía tecnológica y defensa de la identidad nacional.

CeciLIA, el modelo de inteligencia artificial cubano que permitirá soberanía tecnológica, identitaria e informativa.


14 de julio de 2025 Hora: 14:03

CecilIA no es solo el nombre de una novela cubana del siglo XIX. En pleno 2025, es también la apuesta de un grupo de científicos, profesores y estudiantes de la Universidad de La Habana por desarrollar un modelo de lenguaje de inteligencia artificial cubano, pensado desde Cuba, con datos cubanos y al servicio del país. En un contexto global dominado por tecnologías entrenadas con sesgos culturales, intereses corporativos y en idiomas hegemónicos, CecilIA surge como alternativa soberana y con identidad.

LEA TAMBIÉN:

SocIA: la primera plataforma de inteligencia artificial cubana

El modelo, entrenado inicialmente con textos literarios cubanos, prensa nacional, discursos políticos y la Gaceta Oficial, ya ha comenzado a mostrar resultados. Su desarrollo ha sido impulsado por el Grupo de Inteligencia Artificial y Ciencia de Datos de la Facultad de Matemática y Computación (Matcom), y tiene como objetivo final que la IA en Cuba hable y entienda “en cubano”.

Durante su segunda presentación pública, esta vez en la sede de la Unión Nacional de Juristas de Cuba, se compartieron avances técnicos, pero sobre todo, se insistió en algo fundamental: sin datos cubanos, no hay IA verdaderamente cubana. Por eso, los desarrolladores invitan a instituciones, medios, juristas y artistas a sumar documentos, guiones, canciones, noticias y textos legales que permitan nutrir el modelo.

Un proyecto colectivo, desde Cuba y para Cuba

El modelo CecilIA se basa en lo que los especialistas llaman «modelos de lenguaje pequeños» (SLM), que requieren menos recursos y son ideales para países en desarrollo. A partir del modelo base Salamandra (también en español), el equipo cubano realizó un entrenamiento continuo con corpus propios, y ahora trabaja en el diseño de instrucciones cubanas que permitan afinar la interacción y adaptar mejor las respuestas del modelo.

El Dr. Yudivián Almeida, uno de sus líderes, anunció que se espera construir un corpus con al menos 10 000 instrucciones específicas, muchas de las cuales podrán ser propuestas de manera abierta por cualquier persona interesada. Esto apunta a una IA colaborativa, arraigada en los saberes del pueblo.

Pero el reto no es solo técnico. Desde el equipo se subraya la importancia de la ética, la prevención de sesgos, la explicación y la necesidad urgente de digitalizar documentos patrimoniales. Bibliotecas, editoriales y archivos aún tienen valiosa información solo en papel, lo cual limita el acceso y uso para fines de entrenamiento de IA.

Más allá del desarrollo de software, el proyecto CecilIA tiene una dimensión cultural profunda: proteger la identidad cubana en un mundo donde los algoritmos suelen ignorar los matices del Sur Global. La posibilidad de crear aplicaciones de IA que reconozcan el habla, los conceptos y las referencias culturales del país representa una herramienta estratégica para la soberanía informativa.

Durante el encuentro en La Habana, juristas, lingüistas, sociólogos y científicos coincidieron en la necesidad de que todas las disciplinas aporten a este tipo de proyectos. No solo para garantizar calidad técnica, sino para que el resultado final esté alineado con los valores sociales, culturales y éticos de la nación.

CecilIA es una muestra de lo que puede lograrse desde una universidad pública y un sistema científico comprometido. Pero su éxito dependerá de que toda la sociedad entienda que la transformación digital no es un lujo, sino una necesidad nacional. Mientras el trabajo continúa, el modelo ya inspira a otros equipos en todo el país. Como dijeron al cerrar la presentación: “crecimos en todo”.

Autor: TeleSUR-ah-CC

Fuente: Cubahora, Universidad de La Habana,