Los escritores fantasma lo tienen crudo

Llevamos unas cuantas semanas enredados en discusiones sobre trabajos de fin de máster y tesis doctorales muy por encima de nuestras posibilidades. Me resulta curioso la aparición de dos actores secundarios tecnológicos con fuerza en todo esto, Turnitin y Plagscan, dos programas para la detección del plagio en documentos científicos que ya se han convertido en marcas familiares para mucho. Pero en todo esto de la escritura científica hay mucho más, desde escritores fantasmas (algoritmos pakistaníes que diría un amigo) de carne y hueso, hasta escritores fantasmas de silicio.

De todo esto hablamos esta semana en el #technobits de Capital Radio con Luis Vicente Muñoz:

 

No deja de ser una de esas casualidades del destino con cierta sorna que toda esta discusión sobre documentos «científicos» haya coincidido con la aprobación del Plan S por parte de la gran mayoría de organizaciones públicas de investigación europeas. Con este plan, los firmantes se comprometen a publicar exclusivamente en medios de acceso libre prohibiendo hacerla en medios de pago como por ejemplo Nature. Esta decisión cambia de forma radical el mercado de las publicaciones científicas, pero también la propia divulgación científica, y la polémica que la rodea ha quedado totalmente eclipsado por el embrollo que tenemos por aquí.

Difícil sería que alguno de estos TFM o tesis doctorales que nos han ocupado últimamente hubieran acabado tenido cierta relevancia en el ámbito científico, sin embargo, los escritores fantasma de silicio sí que lo han conseguido.

Hace más de diez años, unos estudiantes del MIT desarrollaron SCIgen, un sistema que generaba artículos científicos impostores sobre informática. Los desarrolladores de SCIgen mandaron un paper generado con el sistema a la WMSCI, una conferencia internacional sobre tecnología a la que rodeaba cierta polémica sobre lo poco estricto de sus ponencias. Consiguieron que les aceptaran el artículo, e incluso les invitaron a dar una ponencia en la conferencia del 2005. Cuando ellos mismos descubrieron el pastel, les retiraron la invitación. Sin embargo, ellos decidieron ir.

Hay una importante lista de gente que utilizó el sistema para conseguir ser invitados a conferencias o conseguir que les publicaran el artículo en alguna revista, pero el bombazo fue cuando un investigador francés, Cyril Labbé, desarrolló un sistema para comprobar si un documento había sido generado con SCIgen. El desarrollador utilizó su sistema para descubrir que se habían publicado decenas de artículos generados con SCIgen en diferentes publicaciones científicas. Sin embargo, esto es sólo la punta del iceberg y es difícil saber cuántos artículos se han colado a nivel mundial.

Para que veáis lo que el sistema podía hacer, aquí os dejo un documento generado con cuatro nombres al azar. Desgraciadamente sólo redacta papers en inglés.

scimakelatex.12384.Pedro+Sanchez.Pablo+Casado.Carmen+Monton.Cristina+Cifuentes

 

Poco después, un matemático tomó parte del código de SCIgen para conseguir lo mismo con artículos sobre matemáticas. Llamó a su herramienta Mathgen. De nuevo los cuatro autores al azar «escriben» este paper.

mathgen-1535991770

 

Pero 13 años en el mundo de la inteligencia artificial son muchos años. En estos años han pasado muchas cosas en el campo de escritores fantasma automáticos. Un profesor también del MIT, reclutó un grupo de estudiantes para desarrollar Babel (aquí un ensayo redactado sobre las palabras ética y políticos en inglés). El sistema en realidad tenía como objetivo demostrar que los sistemas de corrección automática (sí, también existe eso) son un desastre y fáciles de engañar para conseguir buenas notas.

Toda esta tecnología de escritura «creativa» automática en realidad ha encontrado un campo abonado en el mundo de los contenidos en internet. Los algoritmos de búsqueda penalizan el contenido repetido, así que hay demanda para que cuando alguien escribe algo original, se puedan publicar varias versiones utilizando la misma base sin ser perjudicados por los buscadores. Esto es obviamente muy útil para periodistas. Pero alguno de estos servicios va más allá, este te escribe directamente un artículo original dándole unas palabras de contexto, y lo hace también en español. Aquí un ejemplo de un artículo sobre el tema «ética en política».

Articoolo

 

Pero volviendo a los papers cientríficos, hace unos meses se presentó se presentó SCINote, un software de la nueva categoría llamada cuadernos de laboratorio digitales (ELN). Estos programas quieren sustituir al papel dentro de los laboratorios, permitiendo a los investigadores ir tomando notas, añadiendo los resultados de sus experimentos y en general gestionar todas las actividades de su investigación.

SCINote va un paso más allá. Recogiendo toda la información almacenada es capaz de escribir un borrador de paper. Los desarrolladores del software dicen que el borrador recoge toda la información del investigador, dibuja gráficos atractivos en base a los datos recogidos, pero lo que más puede sorprender es que da más profundidad a la bibliografía incorporando artículos e información relevante y relacionada que busca automáticamente en internet. El borrador que escribe es legible, con un estilo adecuado para los documentos científicos, y muy importante, no genera problemas con los programas antiplagio. Si al investigador le gusta el borrador, sólo le quedará escribir las conclusiones para tener un paper completo.

Aunque en esto de engañar a los sistemas de antiplagio tampoco necesitamos la ultimísima tecnología. Una simple búsqueda en google te da bastantes pistas de qué sencillos cambios en un texto plagiado puede engañar a los programas antiplagio. La gran mayoría juega con algo tan sencillo como introducir caracteres que no se vean a simple vista (ni tampoco en una versión impresa) pero que engañe a la máquina al realizar la comparación con otros documentos.

Pero en esto de buscarte escritores fantasma (también llamados «negros» aunque no me gusta nada), parece que de momento lo mejor es utilizar alguno de los «marketplaces» que hay de escritores de tesis. También con una búsqueda rápida en google, es fácil encontrar webs que ofrecen servicios de escritura de documentos científicos.

Sin embargo, me temo que estos escritores fantasmas van a tener cada vez más difícil su trabajo con todo lo que se nos viene encima. Probablemente no los mejores, pero los más baratos y más rápidos en breve serán escritores fantasmas digitales, y ya sabemos como andan de tiesos los universitarios, así que no habrá color.

@resbla

Comentarios bienvenidos!

A %d blogueros les gusta esto: