Universidades

Mexicano gana concurso de modelos de detección de plagio en Inglaterra 

El estudiante de doctorado del IPN Miguel Sánchez se sobrepuso a estudiantes de EU, Reino Unido y Alemania, ganando el primer lugar en el Evaluation Lab on Uncovering Plagiarism, Authorship, and Social Software Misuse, concurso de modelos de detección de plagio celebrado en la Universidad de Sheffield, Inglaterra.
Redacción 
05 enero 2015 19:52 Última actualización 05 enero 2015 20:6
IPN

Miguel Ángel Sánchez Pérez, estudiante del doctorado en Ciencias de la Computación. (Cortesía)

El estudiante de doctorado Miguel Ángel Sánchez Pérez del Centro de Investigación en Computación del IPN obtuvo el primer lugar del Evaluation Lab on Uncovering Plagiarism, Authorship, and Social Software Misuse (PAN) celebrado en la Universidad de Sheffield, Inglaterra, por el desarrollo de un modelo de detección de plagio en textos.

El proyecto fue creado con la asesoría de los investigadores Alexander Gelbukh y Grigori Sidorov. El modelo superó a trabajos de competidores de Chile, EU, España, Alemania y Reino Unido.

“En el certamen se proporciona a los equipos competidores un corpus (base de datos) aproximado de 5 mil pares de documentos a comparar, los cuales pueden o no contener plagio”, dijo Sánchez Pérez.

“Para evaluar qué tan bien encontramos un par de fragmentos similares, las medidas usadas son: precisión y exhaustividad. Precisión se refiere a cuántos caracteres del fragmento que detecté realmente fueron plagiados, mientras que exhaustividad se refiere a cuántos, de la cantidad de caracteres que fueron plagiados, detecté”, agregó.

Después de que se evaluó el modelo en el certamen y resultó ser mejor que los otros, Sánchez Pérez se dio cuenta que el proyecto puede tener alcances importantes.

“El sistema podría usarse, por ejemplo, en un administrador de bases de datos de Scopus o de Thomson & Reuters. Cuando se publica un documento el sistema es capaz de decir a qué documentos se parece y solicitar al editor que lo verifique”,dijo Sánchez Pérez.

El alumno del IPN dijo que a diferencia de otros participantes que no dan a conocer la forma en que obtienen sus resultados, ellos tienen el código abierto en la página del doctor Alexander Gelbukh, mismo que puedes descargar aquí.