Un equipo de cinco argentinos alcanzó el primer puesto en la Competencia 2016 de Ciberseguridad y Data Mining, un certamen organizado este año por la Universidad de Kyoto de Japón, en el que superaron a 42 equipos de 14 países, entre ellos Japón, China, Corea, Malasia, Australia y Estados Unidos. La contienda anual, realizada desde 2010, es una iniciativa de 11 organismos y universidades que incluyen al Instituto Nacional de Información y Comunicaciones de Japón (NICT) y la Unitec de Nueva Zelanda.
Se trata de un grupo de estudiantes de la Maestría en Explotación de Datos y Gestión del Conocimiento (MDEGC) de la Facultad de Ingeniería de la Universidad Austral. El equipo vencedor de Adriana Baravalle, Andrés D’Ambrosio, Diego Tauziet, Pablo Albani y Rafael Crescenzi participaron este fin de semana de la 23° Conferencia Internacional de Procesamiento Neuronal de Información (ICONIP 2016) en Kyoto, donde defendieron su trabajo.
La competencia consistió en resolver tres tareas o problemas mediante la minería de datos, o Data Mining: 1- Minería de texto; 2- Predicción de 8 tipos distintos de fallas en un sistema; 3- Predicción de qué aplicaciones para sistemas Android (APK) eran en realidad maliciosas (malware). Cada tarea de Data Mining incluye a su vez tres etapas: preprocesamiento de datos, entrenamiento de los modelos en los datos y testeo final de los modelos para lograr las predicciones. De los 42 trabajos presentados, el equipo de la Austral logró la mayor tasa de precisión en los tres modelos presentados como solución de cada tarea.
Para Rafael Crescenzi, enfrentarse “a algunos de los mayores exponentes académicos y profesionales del área los obligó a estar actualizados en el estado del arte”. “Eso nos devuelve una gran satisfacción cuando logramos buenos resultados frente a tales adversarios”, agregó.
Por su parte, Diego Tauziet consideró que lograron “armar un gran equipo interdisciplinario que se complementó muy bien, y cada uno pudo extraer del resto conocimientos muy valiosos.”
“Primeramente es una muy buena oportunidad para testear lo que aprendemos en la teoría, y desafiarnos frente a otras personas de nuestro mismo campo en distintos lugares del mundo,” complementó Pablo Albani.
Del mismo modo, Adriana Baravalle explicó: “A medida que fuimos avanzando, el equipo se fue haciendo más sólido y nos fue animando la mejora en los resultados. Competir junto a las mejores universidades en mundo de este tema y quedar bien posicionados nos dio más seguridad y experiencia”.
El equipo ya contaba con experiencia en este tipo de competencias. La primera en la que se presentaron fue en 2015, en la “Neo Santander Challenge”, organizada por el Banco Santarder que se realizó en seis países al mismo tiempo y en la que participaron 90 universidades. El equipo de la Universidad Austral quedó en el segundo puesto de 199 equipos, solo superados por un equipo de la UBA que ganó la competencia.
Además, en febrero y mayo de este año, Crescenzi, Tauziet y Albani participaron de la Data Mining Cup en Alemania. El objetivo de esta competencia fue utilizar modelos predictivos para optimizar el proceso de productos al por menor comprados en tiendas online.
En esta oportunidad, quedaron seleccionados entre los 10 mejores de 120 equipos que participaron, y fueron invitados a Berlín para finales de junio para defender los modelos desarrollados. Los argentinos lograron el 9º puesto en el ranking.
Finalmente, el equipo ganador que viajará a Japón participó en junio y julio de este año en la Data Science Game, en Francia. Lograron el puesto 25º de 117 equipos. En esta oportunidad la competencia contaba en desarrollar modelos de predicción de imágenes y fueron el único equipo Sudamericano que participó.
La 23º Internacional Conference on Neural Information Processing tratará sobre el desarrollo de tecnologías de aprendizaje en línea, tanto en la teoría como en la práctica y como estos modelos pueden manejar con eficiencia la transmisión de grandes volúmenes de datos.
Data Mining es el proceso de extracción de información significativa de grandes bases de datos. Esta información revela factores ocultos, tendencias y correlaciones que permiten al usuario realizar predicciones que resuelven problemas y proporcionan una oportunidad competitiva.
Las herramientas de Data Mining pronostican la situación futura de la empresa y ayudan a tomar decisiones de negocios proactivamente. Las competencias de Data Mining tienen como objetivo crear modelos predictivos, es decir, para predecir la baja de un cliente, devoluciones de productos, la satisfacción de un consumidor, detección de fraudes, entre otros. La evaluación consiste en el nivel de acierto o éxito que tiene el modelo comparado con una base de testeo.