Buenos días. Comencemos la columna de hoy con una interrogante intrigante. Imaginen que quisieran descifrar cuántas materias, en promedio, cursa un estudiante de la UNAM, cuántas veces reprueba, en qué Escuela Nacional Preparatoria se formó, qué carreras seleccionó en sus opciones y, a partir de esta información, poder ofrecer un plan de carrera personalizado a cada nuevo estudiante que ingresa a la universidad más grande de nuestro país. Ahora, elevemos la apuesta: imaginen conocer las probabilidades de que millones de jóvenes deseen estudiar en la UNAM. ¿Sería posible para una consultora como McKinsey realizar este análisis profundo? ¿O incluso para gigantes de la industria de la Inteligencia Artificial como Google o Microsoft, sin acceso a los ricos datos que posee la UNAM? La realidad es que no. La UNAM es única en su capacidad de influir positivamente en la vida de cientos de miles de estudiantes, gracias no solo a los expertos que pasean a diario por sus pasillos, sino también a que posee los datos necesarios para entrenar todos los modelos de IA, tanto tradicionales como generativos. Estos datos no solo abarcan registros académicos, sino también actividades deportivas, tiempo de graduación y docentes que marcaron la vida de los alumnos. Pocas universidades en el mundo manejan un volumen tan significativo de información desde la educación media superior hasta el posgrado.

Y es precisamente por esto, estimadas lectoras y lectores, que afirmo que los datos son ahora más que nunca el recurso más crítico en el avance de carreras tecnológicas. En una carrera acérrima, empresas como Google y Microsoft buscan acaparar la mayor cantidad de datos posibles para entrenar sus avanzados modelos de lenguaje, los cuales se nutren de la vasta información disponible en Internet.

Pero, ¿qué pasa con los datos que no están en la red, los que residen dentro de instituciones y empresas a lo largo de México? Consideren a Grupo Salinas, que registra datos de consumo televisivo y de manejo de motocicletas Italika, o a Grupo Carso, con sus registros sobre consumo de Internet y servicios telefónicos y financieros. La aparición de la Inteligencia Artificial Generativa ha subrayado aún más la necesidad de estructurar y ordenar estos datos para que puedan servir eficazmente a múltiples propósitos, tanto operativos como de investigación y desarrollo tecnológico.

He escrito sobre cómo el centralismo de instituciones mexicanas clave, como CFE, IMSS y la UNAM, ha creado reservorios de datos posiblemente inigualables a nivel global, y cómo es imperativo que estos se limpien y se pongan al servicio de la nación para mejorar la calidad de los servicios. De aquí que cada funcionario público debería tener una formación sólida sobre gestión de datos, no necesariamente a través de posgrados, pero sí mediante cursos y diplomados que les preparen para explotar estos recursos exclusivos de manera efectiva.

Finalmente, imaginen un futuro en el que, desde el nacimiento, podamos predecir las probabilidades de que un niño se incorpore a la UNAM y qué carrera podría elegir. Con esta información, sería posible diseñar un plan de apoyo financiero y educativo desde sus primeros años de vida, aumentando significativamente sus oportunidades de éxito académico. Este es el potencial real de la inteligencia artificial, un poder que debemos aspirar a dominar y maximizar para el bien de nuestra sociedad.