Cartel

 

Laboratorio de Ciencia de Datos del CITEDI

Capacidades para la enseñanza de ciencia de datos e inteligencia artificial

 

 

I. Antecedentes
Las empresas y las organizaciones están cada vez más interesadas en obtener información y conocimientos a partir de datos para tomar mejores decisiones. Para ello, requieren invertir en infraestructura y en capital humano con formación especializada en ciencia de datos e inteligencia artificial, situación que representa una inigualable oportunidad para que nuestra institución lidere la creación de los profesionales que este cambio demanda mediante la creación de nuevas carreras profesionales e inversión en las tecnologías de vanguardia para su formación.

El Laboratorio de Ciencia de Datos (LabCD) tiene como finalidad enriquecer la formación de los estudiantes de posgrado del CITEDI y de las carreras de Licenciatura de Ciencia de Datos y de Ingeniería en Inteligencia Artificial del IPN, de tal manera que su perfil de egreso les permita enfrentar con éxito los grandes desafíos que se presentan en la actualidad en las organizaciones basadas en el conocimiento y la industria 4.0.

 

II. Capacidades
El LabCD permite a los estudiantes y docentes del IPN adquirir habilidades y conocimientos para desarrollar algoritmos de cómputo de alto rendimiento con aplicación en la solución de problemas usando inteligencia artificial, con estrategias de ciencia de datos, aprendizaje automático, aprendizaje profundo y analítica de datos, entre otras áreas. Las habilidades y conocimientos que se desarrollan abarcan, entre otros: la programación en lenguajes especializados como Phyton y R; el desarrollo de algoritmos de aprendizaje automático, aprendizaje profundo, preprocesamiento y procesamiento de datos masivos y su interpretación; el cómputo paralelo y el cómputo de alto rendimiento. Adicionalmente, el laboratorio tiene capacidad para el diseño y la aplicación de algoritmos a gran escala en ciencia de datos e inteligencia artificial, para la solución de problemas de clasificación, regresión, agrupamiento, procesamiento de lenguaje natural y análisis de imágenes, entre otros.

Los cursos desarrollados hasta el momento tienen dos vertientes: la formación docente especializada y la formación de estudiantes. Para una formación efectiva, los cursos tienen un abordaje práctico trabajando directamente en el servidor, con un máximo de 10 participantes por curso. Además, el LabCD tiene la capacidad para atender las necesidades de cómputo de alto rendimiento para el desarrollo de tesis de los estudiantes de posgrado del CITEDI y de otros posgrados del IPN.

Se contemplan dos enfoques, el primero consiste en la capacitación en programación paralela en general, para entender los conceptos involucrados en el cómputo de alto rendimiento; el segundo enfoque consiste en la aplicación en las áreas de ciencia de datos e inteligencia artificial, con base principalmente en el lenguaje Python. Con estos enfoques se atienden los cursos de Introducción a la Ciencia de Datos, Programación para Ciencia de Datos e Inteligencia Artificial, y Computación Paralela y Distribuida.

 

server lambda

 

III. Descripción técnica del equipamiento
La infraestructura esencial del LabCD es un clúster especializado en Inteligencia Artificial y Ciencia de Datos. La principal característica del clúster es que su configuración se basa en procesadores gráficos de última generación Titan RTX 2080 de la arquitectura Turing, que tienen un diseño especial para el procesamiento computacional en ciencia de datos e inteligencia artificial. El clúster consiste de dos servidores Lambda Blade. Cada servidor tiene dos procesadores Xeon Gold 5218 con 32 hilos de ejecución cada uno; 512 GB de memoria RAM; 3.84 TB de almacenamiento de estado sólido NVMe y 20 TB de almacenamiento de estado sólido SATA; y ocho unidades de procesamiento gráfico (GPU).

El LabCD tiene 73728 núcleos CUDA, 9216 núcleos tensores, 1152 núcleos RT y 384 GB de memoria RAM. La potencia total de cómputo GPU de los dos servidores es de 2080 TFLOPS, equivalente a la potencia de 100 servidores convencionales. Lo que le da la capacidad de almacenar el texto completo de la Encyclopaedia Britannica 20000 veces; procesar 16 transmisiones simultáneas de video en calidad 8K en tiempo real, o reducir el tiempo de procesamiento en problemas complejos de 30 días a 7 horas.

 

Evento de inauguración

 

Contacto:
Dr. Sergio Jesús González
Subdirector Académico
subdir.academica@citedi.mx




CITEDI-IPN :: Ave. Instituto Politécnico Nacional No. 1310 Colonia Nueva Tijuana :: Tijuana, Baja California, México. C.P. 22435 :: (664) 623-1344 :: e-mail: webmaster@citedi.mx
Instituto Politécnico Nacional