Categorías
innovación

¿Máquinas que generan empatía? ¡No, gracias!

Parece que las GAFA no pueden evitar tener ideas pésimas para alrededor de la aplicación de la Inteligencia Artificial. Si la semana pasada ya hablábamos de LaMDA y cómo Google está desarrollando una IA diseñada para hacer creer a los humanos que tiene consciencia, ahora sabemos que Amazon está intentando desarrollar máquinas que generen empatía en sus usuarios.

De todo esto hablamos en este technobits de Capital Radio con Luis Vicente Muñoz:

https://resbla.com/wp-content/uploads/2022/06/alexa-empatia.mp3?_=1

 

Pero antes, volvamos a LaMDA. Justo después de publicar el artículo sobre el tema, entrevistaron a Lemoine, el ingeniero co-protagonista de la historia, en Bloomberg. La entrevista es interesantísima, y deja intuir también la personalidad de Lemoine. Me atrevo a decir que sus sesgos probablemente le hayan convencido de que LaMDA tiene consciencia y es un ejemplo más de cómo máquinas diseñadas para ello podrían hacernos creer cualquier cosa.

Pero volvamos a Amazon. En su última conferencia anual re:MARS (Machine Learning, Automation, Robotics, Space), entre otras muchas cosas, se habló de Alexa e IA empática. Os dejo el vídeo justo dónde se empieza a hablar de ello.

Personalmente, me parece una película de terror. El presentador, el investigador líder de IA de Amazon presenta el vídeo hablando de cómo Alexa es capaz de generar empatía y afecto en los seres humanos, algo muy necesario después de la pandemia del COVID. En el vídeo, un niño pide a Alexa que acabe el cuento con la voz de su abuela… Hay tantas cosas malas en todo esto.

Se lleva observando y estudiando desde hace tiempo que los seres humanos desarrollan empatía hacia robots humanoides. Es decir, nuestra Roomba no nos genera sentimientos, pero si tuviera forma humana (o animal), probablemente nos sentiríamos mal si la hiciéramos trabajar todo el día o si la pisáramos.

Esto tiene unas implicaciones y ramificaciones muy difíciles de predecir. Quizá me repito demasiado, pero si leemos a Asimov y el universo que creó alrededor de los robots, parece que él anticipó muchas de estas cosas. Mientras que en todo el universo se prohibieron los robots que fueran imposibles de distinguir de un ser humano, en un planeta, Solaria, siguieron fabricándolos y cada vez más perfectos. El resultado fue que los habitantes de Solaria acabaron rodeándose de robots y rechazando el contacto humano.

Sé que la ciencia ficción está llena de predicciones distópicas que no se cumplen, pero no me cuesta imaginarme que máquinas diseñadas para generar emociones y empatías hacia ellas pueden generar comportamientos (e incluso trastornos) muy negativos para sus usuarios y las personas que les rodean.

Por otro lado, la tecnología que presenta Amazon y que potencialmente podría llegar a Alexa es impresionante. Con un minuto de voz de una persona, Alexa será capaz de generar una réplica de alta calidad de esa voz. Con su prosodia, tono, timbre… Pero también, muy peligroso.

Las estafas utilizando deepfakes de voz han ido aumentando últimamente. El caso más sonado fue el robo de 35 millones de dólares en un banco de Hong Kong utilizando esta tecnología. Pero tampoco hay que pensar en grandes delitos. ¿Cuánto tardaría un niño en pedir a Alexa que llame a su profesora poniendo la voz de su madre diciendo que está enfermo? ¿O que llame a un amigo para que le pida con la voz de su hermano que le haga un bizum? Por no pensar en que el bullying con los deepfakes podría ser aún más cruel.

Está claro que tecnologías de voz realista pueden tener usos muy positivos en salud. Pero incluso en usos a priori inocuos, call centers, incluso estos asistentes de voz, creo sinceramente que diseñarlos tan perfectos cómo que la gente se lleve a engaño, y por lo tanto, genere expectativas (o sentimientos) erróneos es algo simplemente poco deseable.

Si la industria no se da cuenta de esto y no empieza rápido a poner salvaguardas para que esto ocurra, será el momento de una regulación dura que seguramente no beneficie a nadie.

Aunque hay otra alternativa, que el público en general acabe tan harto y con tanto miedo de estas tecnologías que genere un rechazo que mande a todo el sector a una suerte de «invierno de la IA«. Lo hemos visto antes, ¿os acordáis de las gafas de Google?

@resbla

Categorías
innovación

ClubHouse, el Party-Line del siglo XXI

A estas alturas, es difícil no haber oído hablar de ClubHouse, la última locura en redes sociales. Y también es difícil no haber oído a algún analista hablar sobre ella, sus bondades y las enormes posibilidades que tiene. Así que casi me siento obligado a hablar de ella con la dificultad de que no la he utilizado y dudo que la utilice nunca.

De todo esto hablamos en este #technobits de Capital Radio con Luis Vicente Muñoz:

https://resbla.com/wp-content/uploads/2021/02/clubhouse.mp3?_=2

 

Breve resumen sobre lo que es ClubHouse para los que no hayáis oído hablar sobre ella. Es una red social que se basa en salas en las que depende de cómo estén configuradas, sus participantes pueden hablar libremente o escuchar a las personas designadas como oradoras. Efectivamente, la gran novedad de esta red social sobre otras, es que el medio de comunicación es la voz.

Probablemente no se hablaría tanto de ella sino fuera porque mucho gurú (y alguno que quiere serlo) no la hubiera elegido cómo el nuevo púlpito desde dónde hablar (y esta vez, propiamente dicho). Ante la avalancha de texto en forma de newsletters, tuits, blogs y dado que los podcasts y los zooms ya no son tan novedosos, pues todos los buscadores de novedad se han ido corriendo a ClubHouse.

El hype se ha terminado de disparar cuando celebridades como Zuckerberg (por cierto, parece que facebook estudia lazar una copia) o Musk han aparecido en ClubHouse. La bola está creciendo tanto, que parece que es posible un encuentro en ClubHouse entre Musk y Putin.

Como os decía antes, no he utilizado ClubHouse, así que no voy a hacer el cuñado y dar mi opinión sobre ella. Además, ya lo han hecho otros en mucho más detalle (Enrique Dans o Samuel Gil por ejemplo). Poco más que añadir.

Y eso que tengo una (preciada) invitación desde hace semanas, pero resulta que ClubHouse está sólo disponible para dispositivos Apple. Y no, no he utilizado nunca nada que corriera iOS, y no voy a empezar a hacerlo ahora.

Pero el otro día, mi buen amigo Fede Paredes hablando sobre ClubHouse me dijo, «ClubHouse no es más que el Party-Line del siglo XXI«, lo cual demuestra lo viejos que somos ambos…

Para la chavalada que no sepa lo que fue «Party-Line», pues fue un servicio telefónico que generaba salas para que sus usuarios pudieran hablar con gente de forma aleatoria. Una especie de chatroulette sin vídeo.

Party-Line fue una locura que llegó con el nacimiento de los números de tarificación especial y que significó un dineral para muchas familias que no se enteraron de que sus hijos llamaban de forma compulsiva hasta que fue demasiado tarde.

De todas formas, sigo hablando de dos cosas que nunca utilicé, ni Party-Line, ni chatroulette.

Y esto me trajo algo a la memoria que sólo los más mayores del lugar recordamos (o aquellos que hayan visto Mad Men). Yo en realidad lo vi hace muchísimos años en México cuando ya era algo completamente demodé, y eran bares que tenían teléfonos en las mesas que te permitían llamar a otras mesas.

Todo parece que viene de Alemania en los años 20 (del siglo anterior) y que recoge Cabaret en su «The Telephone Song».


Se llamaban tischtelefonen y desde Europa saltaron a EEUU dónde fueron una atracción durante los años 60 y 70. Parece que algunos clubs de Berlín de la época instalaron tubos neumáticos para además de hablar con otras mesas, también pudieras hacerlas llegar regalos.

Así que voy a acabar con dos reflexiones. No hay nada malo en aplicar a ideas antiguas tecnología nueva. De hecho, es una de las formas más habituales y potentes de innovación. Aunque ClubHouse nos suene a algo muy antiguo, que lo es, no desmerece en nada el intentarlo de nuevo con una tecnología actual.

La segunda es que hay un mínimo común denominador en todos estos ejemplos que se parecen mucho a ClubHouse, y es que al final, sus usuarios los utilizaron principalmente para ligar. Así que me aventuro a decir que los propietarios de ClubHouse van a tener muy complicado evitar en que se convierta en un sitio dónde principalmente se vaya a ligar (lo cual no quita que pueda ser un negocio fabuloso). Por cierto, el nombre ya lo tienen.

Personalmente, y más allá del tema del iOS, no soy público objetivo de ClubHouse, de la misma manera que tampoco lo fui de Party-Line, chatroulette o los tischtelefonen. Nunca vi la diversión en hablar con desconocidos de forma aleatoria, y para ligar, soy más de bares.

Por otro lado, ya he hablado varias veces del aparente contrasentido que hay en que el texto es mejor y más rápido para transmitir información. Personalmente prefiero leer que escuchar a Musk. Llámenme raro.

@resbla

Categorías
innovación

Los altavoces inteligentes no venden

Hace unas semanas Forrester publicaba un estudio sobre lo inteligentes que son los altavoces inteligentes utilizándolos para lo que les diseñaron principalmente.

Y no, sus diseñadores no los pensaron principalmente para que te dijeran la hora, pusieran tu música o te contaran chistes malos, los diseñaron para que compraras a través de ellos utilizando la voz.

Los altavoces inteligentes en realidad es un intento (principalmente de Amazon) de saltarse a Google. Ya que no es posible competir contra Google en búsquedas a través de un navegador, la estrategia para por abrir una nueva forma de hacer búsquedas que se salte a Google.

Precisamente retuiteé un artículo que hablaba sobre ello con uno de mis típicos comentarios que intentan ser graciosos pero que no lo son, y un amable lector (y viejo amigo) me decía que me veía últimamente «muy escéptico con las nuevas tecnologías».

No sé si eso es verdad, pero con la voz, que de nueva tiene poco, soy más que escéptico. De todo esto hablamos en este #technobits de Capital Radio con Luis Vicente Muñoz:

https://resbla.com/wp-content/uploads/2019/06/echo-amazon.mp3

El estudio de Forrester encontró que los asistentes digitales de Apple, Google, Amazon y Microsoft fallan con el 65% de las preguntas que les hicieron simulando un proceso de compra. Por ejemplo, «¿qué marcas hay de detergente líquido?»

Las marcas detrás de estos asistentes, y sus correspondientes altavoces inteligentes, no dan muchos datos sobre lo que están haciendo sus propietarios con ellos.

Pero ya hace casi un año, a través de una encuesta, se encontró que menos del 2% de los propietarios de un Echo de Amazon había hecho una compra a través de ellos, y por lo tanto, con la voz.

Esto está muy lejos de las expectativas que se habían generado (intencionadas obviamente), y sobre todo, muy lejos también de los dispositivos que se han vendido. A finales de 2018, Amazon hablaba de más de 100 millones de dispositivos vendidos y más de 70000 skills para Alexa. Hay una lista infinita de artículos hablando de la explosión del «voice commerce«.

Así que, ¿dónde está la pasta? ¿Por qué la gente le pide chistes malos a Alexa pero no le pide que le compre detergente?

Está claro que el ecosistema está todavía muy lejos de madurar, pero personalmente creo que la voz es un pésimo interfaz para interactuar con máquinas para cosas complejas, y comprar, en la mayoría de los casos, lo es.

Hace cerca de 20 años vi por primera vez una demo de Dragon NaturallySpeaking. Aquello parecía sacado de 2001 Odisea en el espacio. El software ya en aquella época fallaba poco, y todos los avances en machine learning que sustentan los asistentes digitales dan fe de lo que se ha avanzado en la fiabilidad en el reconocimiento de la voz.

Pero es que además, y esto te lo recuerdan constantemente los fans de la voz como interfaz, es que la voz es mucho más rápida que la escritura analógica o digital.

Mientras que de media escribimos a 20 palabras por minuto, 40 si lo hacemos en un ordenador, tenemos una velocidad media al hablar de 150 palabras por minuto. La Universidad de Stanford comparó la velocidad a la que se preparaban mensajes escritos por sistemas de reconocimiento de voz y teclados virtuales en teléfonos móviles y encontró que la voz era tres veces más rápida.

Así que a priori, una vez solucionados los problemas de entendimiento por parte de las máquinas, uno tendería a pensar que es inevitable que terminemos acabando con ratones, teclados e incluso pantallas.

Y sin embargo, no es así.

La voz cómo interfaz tiene unas limitaciones muy importantes y que además son de difícil solución tecnológica. Tan importantes que personalmente creo que la voz siempre tendrá un papel secundario en cuanto a nuestra relación con las máquinas, si no en cuanto al número de interacciones, sí en cuanto a la calidad. Dejadme que me explique mejor.

Para empezar, la voz tiene poco de privada. Cualquiera que esté a nuestro lado escuchará lo que le digamos a Alexa. Tampoco es que estemos comprando condones todos los días, pero ahora que nos preocupamos porque facebook lo sepa todo de nosotros, ¿no nos va a importar gritar la marca de papel higiénico que compramos?

Pero es que además, aunque hayamos generado cierta tolerancia, aún está mal visto ir hablando en alto por según qué sitios. Imagínense el vagón de silencio del AVE con todo el mundo haciendo compras por Alexa.

El segundo gran problema de la voz como interfaz es que retenemos más de lo que leemos que de lo que escuchamos. Leer y escuchar a la vez gana a cualquiera de las dos juntas, pero por separado, parece claro que leer gana. «Escuchar» es la actividad por excelencia para hacer multitarea, y por lo tanto, ss muy fácil distraerse. Leer exige una mayor concentración, y por lo tanto, retenemos más.

A esto hay que añadir que si hablamos más rápido que escribimos, leemos más rápido que hablamos, así que cómo forma de transmitir información rápidamente, la voz es inferior.

Y finalmente, y probablemente la más difícil de solucionar para la voz en esta batalla por ser un canal de venta importante, es que la voz es por naturaleza «lineal» en cuanto a la información que puede dar.

Uno hace una búsqueda en Amazon e inmediatamente tiene muchas alternativas en la pantalla, alternativas que de un vistazo rápido somos capaces de comparar para pasar a un siguiente nivel de detalle.

Con la voz eso no pasa. Imaginad esperar a que Alexa nos describa las 20 alternativas que nos da Amazon ante nuestra petición de buscar un portátil para comprar. ¡Y eso es la primera página de resultados!

Además, cuando estamos escuchando, es difícil «rebobinar» de una forma rápida y eficiente si no hemos entendido algo.

Lo que está claro, y salvo en el mundo de la ciencia ficción de las inteligencias artificiales generales superinteligentes, la voz va a ser imparable como interfaz para interacciones sencillas, con pocas alternativas y lo más unívocas posible. Sin embargo, pensando en las compras, no hay muchas de esas.

Alexa, ¿qué hora es? Alexa, ¿qué tiempo hace? Alexa, compra de nuevo la lista semanal…

Pero que nadie se lleve a engaño. Quien tiene esto más claro es la propia Amazon. Nada de todo esto les va a parar en su intento de desbancar a Google.

Así que… ¿cuál ha sido la gran nueva funcionalidad que han incluido en sus Echos? ¡Una pantalla táctil!

Obvio, si le preguntas por detergente por voz y recibes 40 resultados, utilizar la vista y pinchar con el dedo acelerará el proceso. El cínico en mí diría que lo siguiente que añadirán es un teclado o un ratón, pero cómo mínimo estaréis conmigo en que todo esto haya acabado en una tableta con un pedestal

¿Y lo siguiente que está haciendo Amazon? Y aquí me pongo conspiranoico

Por un lado, Amazon está reduciendo el número de vendedores en su plataforma. Y lo está haciendo en números importantes.

Y por otro, Amazon está dando un empujón importante a sus marcas blancas.

¿Está todo esto relacionado con los problemas que están encontrando para vender a través de los echo? (no hay que olvidar que todos estos dispositivos se venden subvencionados) Probablemente no sean la única razón. Pero es razonable pensar que en un catálogo de productos simplificado en el que su marca propia sea predominante y fácil de encontrar, las ventas a través de los echo serían mucho más sencillas.

Ya hemos estado aquí. Las grandes marcas fueron capaces de aguantar a las grandes cadenas de supermercados y sus marcas blancas. ¿Serán ahora capaces de resistir a Amazon?

@resbla

Salir de la versión móvil