Tabla de Contenidos

Nuevos actores: Big Data, IA y Bots

Nuevos actores: Big Data, IA y Bots

Big Data, un concepto agridulce

Para conocer lo que Google sabe sobre ti https://myactivity.google.com/myactivity

Sandy Pental, en la revista Investigación y Ciencia de Octubre de 2014 en el artículo El buen uso de los macrodatos propone el método de “dividir el pajar” para evitar la concentración de bases de datos:

Los distintos tipos de datos deberían gaurdarse separados: los financieros en una base de datos, los relativos a la salud en otra, etcétera. […] ¿Cómo ayuda la distribución de datos a los individuos? La respuesta es que permite seguir el rastro a las pautas de comunicación entra las bases de datos y los agentes humanos que las usan. Estas huellas pueden usarse para vigilar el uso que se está haciendo de las comunicaciones por otra lado privadas“.

¿Cuál es el problema del argumento de Pental? Que los datos desagregados no pueden usarse en entornos Big data avanzados (tales como entrenar a una inteligencia artificial). Esto tendrá como consecuencia previsible que, lejos de separar los datos y encriptarlos y custodiarlos por separado, la tendencia será a la agregación, algo que hará prácticamente imposible la anonimización del dato.

El artículo Libertad y privacidad en la web indica lo agridulce que resulta el concepto Big Data.

Los avances en desarrollos electrónicos, la multiplicación de la velocidad de procesadores, el abaratamiento del coste de sensores y la posibilidad de procesar grandes bases de datos han hecho que abunden los registros de casi cualquier tipo de datos, y que analizarlos con software ya no sea privativo de grandes corporaciones o gobiernos, sino que esté al alcance de casi cualquier persona o institución.

Los corpus de datos crecen rápidamente porque los datos son recolectados por un número creciente de dispositivos, que son cada vez más baratos y numerosos: móviles con sensores, dispositivos aéreos, registros automáticos de programas de computación (logs), cámaras, micrófonos, lectores de identificación de radiofrecuencias (RFID) y redes inalámbricas de sensores, entre otros. La capacidad mundial per capita de guardar información se ha multiplicado por dos aproximadamente cada 40 meses desde los años ochenta. En 2013 se estima que la cantidad total de información almacenada en el mundo es de alrededor de 1200 exabytes, de los que menos del 2% es no digital.

Cuando hablamos de lo que se puede hacer con estos datos, la escala es tan grande que los análisis permiten resultados que de ninguna manera podríamos obtener con muestras más pequeñas. Podríamos establecer una analogía con la nanotecnología: cuando se alcanza el nivel molecular, las propiedades físicas pueden alterarse. A la inversa, cuando aumentamos la escala de datos con los que trabajamos podemos hacer cosas nuevas que no eran posibles cuando trabajábamos con cantidades más pequeñas o con muestras que podían estar sesgadas.

Gracias al procesamiento de datos masivos hemos logrado decodificar el genoma humano. Algo que originalmente tomó 13 años y más de 3 mil millones de dólares para procesarlo, ahora puede ser logrado en menos de un día por menos de 1000 dólares. Estos avances permiten diagnosticar enfermedades incluso antes del nacimiento y abren nuevas puertas a la investigación del cáncer y otras enfermedades.

Hay otros casos de análisis de datos que nos hacen sentir un poco incómodos, sobre todo cuando vemos implicados nuestros datos personales. Un estudio presentado en marzo de este año por científicos de datos de Stanford mostró cómo solo los metadatos telefónicos podían arrojar una cantidad sorprendente de información sensible (como datos sobre la salud) de las personas. Se analizaron los registros de más de 250.000 llamadas y 1,2 millones de mensajes de texto de 800 voluntarios. Los investigadores pudieron inferir, por ejemplo, que una persona padecía una arritmia cardíaca, o que otra tenía en su casa un rifle semiautomático.

21 scary things Big Data knows about you
http://www.iotcentral.io/blog/21-scary-things-big-data-knows-about-you

3 Ways Big Data and IoT Can Improve Our Health in 2016
http://www.datasciencecentral.com/m/blogpost?id=6448529:BlogPost:379010

Google DeepMind: la lucha contra la ceguera y los datos de 1,6 millones de pacientes
http://m.xataka.com/medicina-y-salud/google-deepmind-y-nuestras-retinas-un-escaner-inteligente-sin-pasarse-de-cotilla

IA (Inteligencia artificial)

Concrete Problems in AI Safety: “In this paper we discuss one such potential impact: the problem of accidents in machine learning systems, defined as unintended and harmful behavior that may emerge from poor design of real-world AI systems”
https://arxiv.org/abs/1606.06565

Google Developing Panic Button To Kill Rogue AI
www.informationweek.com/iot/google-developing-panic-button-to-kill-rogue-ai/d/d-id/1325783

Microsoft frena un experimento de inteligencia artificial tras volverse xenófobo en las redes
http://www.elespanol.com/ciencia/tecnologia/20160324/111988921_0.html
https://es.wikipedia.org/wiki/Tay_(bot)

De máquinas obedientes a máquinas que aprenden: Deep Learning

Rubén Martínez: “Skynet is coming. Big data para predecir crímenes” http://globbsecurity.com/ruben-martinez-mundo-hacker-38509/

Award-winning short sf film written by an AI is pretty good
http://boingboing.net/2016/06/10/award-winning-short-sf-film-wr.html

Deep Learning: qué es y por qué va a ser una tecnología clave en el futuro de la inteligencia artificial
http://www.xataka.com/robotica-e-ia/deep-learning-que-es-y-por-que-va-a-ser-una-tecnologia-clave-en-el-futuro-de-la-inteligencia-artificial

Google DeepMind: la lucha contra la ceguera y los datos de 1,6 millones de pacientes
http://m.xataka.com/medicina-y-salud/google-deepmind-y-nuestras-retinas-un-escaner-inteligente-sin-pasarse-de-cotilla

Ejemplo: Google permite almacenar gratuitamente (y sin límite) todas tus fotos porque así tiene una cantidad ingente de imágenes para entrenar sus programas de IA para interpretar imágenes.

Introducing DeepText: Facebook's text understanding engine
https://code.facebook.com/posts/181565595577955/introducing-deeptext-facebook-s-text-understanding-engine/

Getting started with vulnerability Discovery using Machine Learning https://conference.hitb.org/hitbsecconf2016ams/materials/D1T3%20-%20Gustavo%20Grieco%20-%20Vulnerability%20Discovery%20Using%20Machine%20Learning.pdf

Las marcas ya predicen tu comportamiento mirando videos en las redes sociales.
http://www.marcvidal.net/blog/las-marcas-ya-predicen-tu-comportamiento-mirando-videos-en-las-redes-sociales

Cuando se empiece a aplicar Deep Learning al diagnostico y tratamiento de enfermedades tendremos un problema: de dónde obtener los datos (ingentes cantidades de datos) para entrenar a dichas inteligencias artificiales.

Habrá que agrupar datos clínicos procedentes de distintas fuentes, por lo que habrá que asegurar que dichos datos estén convenientemente anonimizados.

Pero ¿y si descubrimos que indicando las circunstancias personales de los enfermos la inteligencia artificial consigue diagnosticar de forma más fiable?

Bots: ¿salvar la web y asegurar privacidad?

Empieza la era Post-App

Escenarios de bots con privacidad

¡El bot del curso!

Está disponible en Telegram un bot llamado @esaludBot que puedes agregar como contacto en Telegram y con el que puedes buscar la información contenida en el wiki de este curso y aceptar que el bot te haga pensar en lo que has aprendido mostrándote una imagen o un documento al azar.