To BOT or not to BOT, este es el problema

Test de Turing, BOTs y desafíos de la IA

En 1950 Alan Turing propuso un test para comprobar si una maquina puede pensar. En la prueba hay un humano, una máquina, y un juez. El juez formula preguntas a ambos, y ambos jugadores tienen que contestar con el objetivo de convencer al juez de ser humanos. Si el juez finalmente a la hora de decidir quien de los dos es humano, elige la máquina, entonces esta máquina será una maquina pensante.  

En el desarrollo del trabajo Turing da unas definiciones sobre máquinas y computadoras digitales, y describe y resuelve las posibles críticas al planteamiento del problema de la existencia de máquinas pensantes. Algunas de estas últimas hoy en día pueden considerarse un poco estrambóticas e hijas de sus tiempos: incluso se describe y resuelve el “argumento de la percepción extrasensorial”, afirmando sin duda la validez de la telepatía. Al margen de este desarrollo el test en si es aún muy válido y actual.

Lo que más me llama a la atención es el enfoque que atribuye la característica del pensar a la comunicación hacia fuera, al relacionarse, al persuadir, al engañar otros seres. Emerge una idea de capacidad de pensar, y entonces de tener auto-conciencia como fenómeno colectivo basados en las relaciones, antes que en la introspección[1]. Por otra parte una de las principales críticas contemporáneas al test de Turing, el argumento de la sala china, propuesto por el filósofo John Searle en 1980, sitúa pensamiento y conciencia en una perspectiva introspectiva bajo el lema de: ”mientras que una maquina maneje internamente solo la sintaxis (a través de un programa) y no la semántica de los símbolos de comunicación, no puede pensar”[2].

El test de Turing ha sido una fuente de inspiración para toda una rama de desarrollo de la Inteligencia artificial, empezando por el programa ELIZA, desarrollado en 1966 por el profesor del MIT Joseph Weizenbaum. ELIZA fue uno de los primeros procesadores de lenguaje natural, que funcionaba buscando palabras clave en las frases escritas por el usuario y respondiendo con una frase modelo registrada en su base de datos; en ocasiones consiguió engañar a más de un humano[3].

En 1990 se ideó el Premio anual Loebner, una competición que concede premios al programa de ordenador que esté considerado por un jurado como el más inteligente de los que se han presentado. El formato de la competición sigue el estándar establecido en el test de Turing: Un juez humano comunica y recibe respuestas de dos pantallas de ordenador, una bajo el control de un ordenador, y la otra bajo el control de un humano.

En el año 2010 por primera vez un juez confundió al programa Suzette, desarrollado por Bruce Wilcox, con una persona. Suzette, tenía 16.000 reglas de conversación y era capaz de mantener 40 horas de chateo ininterrumpido[4].

En el campo de la inteligencia artificial, sobre el Premio Loebner existe una amplia controversia, y el más prominente de sus críticos, Marvin Minsky, ha mantenido que es un mero truco publicitario que no ayuda en nada al desarrollo de esta ciencia.

A partir del año 2000 una de las aplicaciones más extendida del test de Turing han sido los CAPTCHAs[5], pruebas desafío-respuesta utilizadas para determinar cuándo el usuario es un humano o un programa automático, i.e. un BOT. Su uso principal es para el control de spam, el correo basura, que es generalmente enviado por BOTs desde las cuentas de correo electrónico basadas en la web o a través de servicios de redes sociales.

Los CAPTCHAs están basados en un desafío de reconocimiento de texto en forma de caracteres distorsionados de tal manera que los algoritmos de visión por computadora tienen dificultades para segmentar y reconocer el texto, mientras los humanos sí pueden conseguirlo.

​Los CAPTCHA se han aprovechado para la digitalización de libros antiguos que están dañados por el paso del tiempo. Partes de estos documentos sólo pueden ser identificados correctamente por un ser humano. La comunidad de usuarios de internet, en proyectos colaborativos denominados “Crowdsourcing”, puede resolver eficazmente esta tarea de digitalización artesana y colectiva [6][7].

A partir de 2017 se desarrollaron sistemas software basados en Inteligencia Artificial que han conseguido resolver fácilmente este tipo de CAPTCHAS. De esta forma ha sido necesario rediseñar los CAPTCHAS para desarrollar otros sistemas, basados en preguntas lógicas y operaciones matemáticas.

En el ámbito del maketing digital los chat-BOTs, o BOT conversacionales, se han desarrollado para ejercer la función de atención al cliente de manera rápida y sencilla, ayudándoles a acceder a la información que necesitan. También son capaces de gestionar los procesos de compra y pago en línea, acompañando al cliente a agilizar el proceso y contestando a preguntas recurrentes. Su fiabilidad necesita estar comprobada por un test de Turing, que comprueba la calidad de la industria de los chat-BOTs, para que se puedan enmarcar como asistentes inteligentes. En esta apasionante batalla entre códigos inteligentes y BOTs frente a tests de Turing y jueces, llegamos a la era de las redes sociales, territorios digitales poblados por identidades no-humanas, que comentan, recomiendan, opinan, siguen perfiles. Una reciente investigación del canal público italiano ha sacado algunas pruebas de la creación de decena de miles de BOTs, encargados por un partido de extrema derecha, que actuaban como seguidores y comentadores de sus perfiles sociales, inflando la percepción de su popularidad[8].  

¿Conseguiremos ser buenos jueces de Turing frente a los cada vez más sofisticados BOTs engañosos? To BOT or not to BOT, este es el problema.


[1] Si me puedo atrever a hacer una similitud, pienso en una definición dada por Chiara Valerio, una matemática ensayista actual : “La matemática no es la ciencia de los objetos, sino de las relaciones entre los objetos, así como la gramática es la ciencia de la relaciones entre palabras.”

[2] http://www.scholarpedia.org/article/Chinese_room_argument

[3] https://www.eldiario.es/tecnologia/diario-turing/test-turing-inteligencia-maquinas_1_5043307.html

[4] https://www.lainformacion.com/tecnologia/el-programador-que-desafia-el-test-de-turing_aBVAgpouxS8kjcPcBopAK3/?autoref=true

[5] Completely Automated Public Turing test to tell Computers and Humans Apart (prueba de Turing pública y automática para diferenciar máquinas y humanos)

[6] Por ejemplo, Google colocaba dos palabras en sus pruebas de Captcha. De esas dos palabras una era conocida por el sistema y la otra no. El sistema pedía al usuario, quien desconoce qué palabra es conocida y cuál no lo es, que introdujera ambas palabras como texto. Si la palabra conocida por el sistema es introducida correctamente por un humano, el sistema asumía que hay probabilidades altas de que el usuario también haya introducido la palabra desconocida correctamente. Si la palabra desconocida recibe en múltiples ocasiones la misma transcripción humana (traducción de imagen a texto) se considera que esa transcripción es correcta.

[7] https://www.lavanguardia.com/internet/20120411/54283654339/recaptcha-el-mundo-entero-digitaliza-libros.html#:~:text=Captcha%20es%20un%20sistema%20de,el%20proceso%20de%20digitalizar%20libros&text=Muchas%20veces%20hemos%20tenido%20que,demostrar%20que%20no%20somos%20m%C3%A1quinas.

[8] https://www.rai.it/programmi/report/inchieste/La-macchina-della-paura-dca8d526-bd4d-4130-934b-31e9de5be450.html

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *