Wikipedia es el lugar de internet donde los bots campan a sus anchas. Estos programas informáticos que se comportan como humanos en la Red se encargan de tareas que pueden resultar tediosas para las personas, como identificar y deshacer casos de vandalismo, añadir enlaces, corregir la ortografía y guardar la concordancia sintáctica de las oraciones. Aunque a veces pueden entrar en conflicto editándose unos a otros —hasta 4,7 millones de las ediciones de los artículos son correcciones que los bots se hacen constantemente entre sí—, también han demostrado ser útiles. Una de las pruebas es su capacidad para crear manuales revisando, recopilando y clasificando los artículos más relevantes sobre cualquier temática.
Los llamados Wikilibros existen desde hace mucho tiempo. Pero hasta ahora, eran los humanos quienes se encargaban de seleccionar el contenido, una tarea tediosa y compleja debido a la inmensa cantidad de páginas de contenido que hay en Wikipedia. Teniendo esto en cuenta, el investigador Shahar Admati y su equipo, de la Universidad Ben-Gurion del Negev, han desarrollado una forma de generar estos manuales con aprendizaje automático. “La novedad de nuestra técnica es que está pensada para crear un Wikilibro completo sin intervención humana”, detalla el equipo.
Para conseguirlo, primero seleccionaron los Wikilibros existentes creados por humanos que cumplían con todas las características necesarias. Utilizaron los 6.700 manuales que encontraron para entrenar a los algoritmos. La complejidad venía por que cada parte del manual requería una habilidad de aprendizaje automático diferente. El algoritmo analiza las páginas de Wikipedia seleccionadas automáticamente para agruparlas en un tema determinado y decide si al incluirlas en un Wikilibro harían que éste fuera más similar a los libros generados por las personas.
Cada manual temático está estructurado por capítulos. Este fue el siguiente paso para ordenadar el contenido. El algoritmo tenía que “explorar la red formada por todo el conjunto de artículos y descubrir cómo dividirla en grupos coherentes”, explica MIT Technology Review. El último paso era determinar el orden en el que debían aparecer los artículos en cada capítulo. Para hacerlo, el equipo organizó los artículos en parejas y utilizó un modelo de red para determinar cuál debía aparecer primero. Al repetir esto para todas las combinaciones de parejas de artículos, el algoritmo fue capaz de establecer un orden preferido para los artículos y, por lo tanto, para los capítulos.
Fuente: Retina El Pais