spinner

Cómo te vamos a ayudar con federated learning en 2022

El aprendizaje federado y otras tecnologías para preservar la privacidad del dato, pueden ayudarte a poner en marcha algunas iniciativas interesantes sobre la integridad y privacidad de los datos dentro o fuera de tu organización.

¿Qué es Federated Learning?

Es una tecnología enmarcada dentro de las PET (Privacy-Enhancing Technologies) que nos permite entrenar un modelo de forma remota sin disponer del acceso a los datos. En vez de que los datos viajen a un nodo central, es el modelo el que viaja a donde se encuentran los silos para ser entrenado, preservando así la privacidad de los datos de los que aprende. Supone un cambio de paradigma en la forma que venían aprendiendo los modelos hasta ahora.

Si quieres profundizar más en el concepto de Federated Learning, puedes leer esta publicación, Federated Learning: Introducción, para ponerte al día.

¿Qué aporta Federated Learning?

Al permitir que los datos no tengan que salir de sus silos para poder ser usados, ayuda a la hora de preservar la privacidad de los mismos. Reduciendo el riesgo de fuga de datos y limitando el acceso directo a los mismos. Al disponer de mayores cantidades de datos para entrenar, los modelos pueden generalizar mejor y por lo tanto son más robustos. Además al llevar el cómputo a los silos o dispositivos permite realizar un entrenamiento distribuido otorgando una mayor escalabilidad a la solución.

¿Ha llegado aprendizaje federado a la industria?

El aprendizaje federado todavía está en sus fases iniciales y todavía no se ha extendido su uso en la industria, aunque existe una gran cantidad de empresas con interés e impulsando su adopción. Encontramos early adopters en la industria sanitaria debido a la sensibilidad de los datos con los que se trabaja y la necesidad de poder compartir información de pacientes entre las diversas entidades. Gracias al aprendizaje federado se está trabajando en romper ciertos silos de información con dos objetivos concretos en este sector.

  • La primera es la facilitación al crear nuevos fármacos entre distintas compañías gracias a poder compartir los distintos ensayos clínicos que disponen los laboratorios sin comprometer los datos de los mismos.
  • La segunda es la detección de cáncer de mama mediante modelos de inteligencia artificial que son entrenados con los datos de muchos hospitales. Esto permite aumentar la robustez de los modelos por la gran diversidad de datos que se incorporan, sin exponer datos de pacientes.

En el resto de sectores se percibe una gran presión por el cumplimiento con las limitaciones legales, como por ejemplo con la GDPR en Europa, Federated Learning no te exime de ello, pero te puede ayudar demostrar que dispones de mecanismos para cumplirlo en tu empresa.

Otra reflexión que poco a poco va permeando en las organizaciones es que no es necesario para cada nueva iniciativa replicarte una parte de tu sistema de datos; hasta ahora prácticamente no había posibilidad de separar los datos de los desarrollos o de los modelos, tener conciencia de que custodiar datos supone al menos mantenerlos actualizados, con integridad, con calidad, bien documentados, automatizados, seguros y controlar su acceso, puede ayudarnos a optimizar nuestros esfuerzos.

Para concluir, en la industria se están detectando muchos problemas de compartición de datos entre silos, principalmente silos en una misma empresa, datos que podrían facilitar el día a día, potenciar nuestras ventas o mejorar lo que ofrecemos, resulta que NO los compartimos para no perder el control de los mismos y, por ende, limitamos los resultados que podemos obtener como empresa.

¿Cómo trabajamos nosotros con Federated Learning?

Actualmente, en Emerging Services, el área de BBVA Next Technologies más pegada al futuro, que explora nuevas tendencias para tratar de estar a la vanguardia tecnológica, nos encontramos trabajando en el caso de uso de fraude en transacciones de tarjeta bancaria.

Un servicio de gran relevancia para las entidades bancarias es ser capaces de detectar de manera fiable cuando se ha producido algún robo o fraude al realizar un pago con tarjeta, pero hay una serie de factores que complican esta tarea. Para empezar es un problema muy desbalanceado, existen muy pocos casos de fraude frente a la gran cantidad de transacciones existentes.

Por otro lado los datos son muy sensibles, por lo que su exposición o compartición son muy difíciles y además son datos relevantes para el negocio por lo que compartirlo con la competencia no es una opción. Por lo que si no disponemos de datos suficientes y existen dificultades a la hora de compartir o juntar datos de diferentes silos, usar una técnica como Federated Learning es una buena opción para solucionar nuestro problema de negocio sin exponer nuestro recurso más valioso, los datos.

Si quieres saber más sobre cómo aplicamos el aprendizaje vertical en este caso de uso, puedes consultar el siguiente artículo de BBVA Next Technologies: ¿Cómo aplicar aprendizaje federado y no morir en el intento? Aplicación en fraude de tarjetas de crédito.

Adicionalmente, puedes bucear en nuestro blog “Pills”, donde por ejemplo puedes encontrar un overview sobre Privacidad y ML aquí o algunos de los principales frameworks open source para implementarlo aquí.

Benefíciate de nuestra experiencia en FL y PET

Desde Emerging Services seguimos trabajando en los casos de uso mencionados, tanto internamente, como en el banco y con colaboradores externos. Si consideras que Federated Learning puede implementarse en algún caso de uso específico para tu empresa o sector, escríbenos; esto nos ayudaría a tener mayor contexto en las posibles áreas de aplicación de esta tecnología.

Concretamente nos interesan colaboradores con problemas de compartición de datos y necesidades de privacidad de los mismos, ya sea entre distintos departamentos y áreas funcionales o incluso entre distintas empresas. En esos escenarios, Federated Learning, y algunas otras tecnologías PET, pueden ser una alternativa real que ayude en mayor o menor medida a atacar esas casuísticas.

Cuéntanos tu caso, tu experiencia o tu opinión al respecto de Federated Learning y de otras tecnologías PET, nos encanta compartir ideas, generar debate y ampliar el conocimiento.
Si quieres saber más sobre Federated Learning y sobre nuestro trabajo en BBVA Next Technologies, ponte en contacto con nosotros.

Las opiniones vertidas por el autor son enteramente suyas y no siempre representan la opinión de BBVA Next Technologies.

¿Quieres saber que más cosas hacemos en BBVA Next Technologies?