¿Puede explicar de forma sencilla, cómo se puede hacer el seguimiento de la evaluación de una epidemia utilizando el big data?
Lo que el big data aporta son dos factores que están resultando muy importantes para mejorar la calidad de los modelos predictivos. Por ejemplo, la capacidad de incorporar fuentes de datos muy diversas (redes sociales, noticias en la web, registros de vuelos internacionales, clima, movilidad de personas, entre otras muchas) sin tener que desplegar personal sobre el terreno. También la posibilidad de procesar ingentes volúmenes de datos y proporcionar resultados en minutos, de forma que los modelos se actualizan constantemente.
¿También puede predecir la evolución de la epidemia?
El problema de predicción sigue siendo muy complejo por la cantidad de variables que inciden en él. Por ello, a día de hoy el big data y la inteligencia artificial han mejorado la precisión en las predicciones, pero no ha resuelto el problema. Además, el hecho de que cada epidemia sea diferente a la anterior obliga a rehacer gran parte del trabajo en cada nuevo brote.
"Uno de los aspectos claves que determinan la expansión de una enfermedad transmisible es la movilidad de las personas"
¿Y cómo funciona esta cierta capacidad predictiva?
Uno de los aspectos claves que determinan la expansión de una enfermedad transmisible es la movilidad de las personas. Entender las ubicaciones entre las que más personas se mueven es clave para predecir donde será el próximo foco de la enfermedad. Hasta hace unos pocos años se usaban modelos que hacían estimaciones precalculadas a partir del volumen de población de ciudades, la distancia entre las mismas y otros parámetros económicos, pero no las dinámicas reales de movilidad de la población. Nuestros teléfonos móviles son una fuente de información de tremendo valor en este sentido.
Para ello hace falta disponer de una cantidad ingente de datos como la que solo grandes compañías como Telefónica posee...
LUCA, la unidad de datos de Telefónica, ha construido las capacidades para para impactar positivamente en la sociedad, respetando la privacidad y seguridad de la información. Hay que tener en cuenta que estos datos provienen de millones de líneas telefónicas, una muestra inabarcable si se intentara capturar esta información a través de encuestas. Se trata de usar información anónima y agregada sobre cuantas líneas móviles que están bajo la cobertura de una determinada antena, pasan a estar en otra ubicación unas horas o días después. De esta forma se construyen matrices Origen-Destino, que reflejan el volumen de trayectos entre cualesquiera dos ubicaciones de un país.
"En el caso del virus Zika en Colombia logramos mejora en torno al 27 por ciento respecto a los modelos clásicos de predicción"
¿Puede poner algún ejemplo de alguna enfermedad contagiosa contra la que se haya hecho este servicio?
Esta información se usó, en colaboración con UNICEF y la Universidad de Notre-Dame, para mejorar los modelos epidemiológicos de predicción de expansión del virus del Zika en Colombia. El resultado fue una mejora en torno al 27 por ciento respecto a los modelos clásicos de predicción (modelos gravitacionales y de radiación)
¿En qué manos se suele dejar esta información: autoridades sanitarias, gobiernos, fuerzas y cuerpos de seguridad, medios de comunicación?
La información se pone a disposición de los organismos públicos que lo hayan solicitado que son los responsables de custodiarla y decidir si compartirla o no con quien estimaran oportuno.
Imagino que no habrá problemas de privacidad al ser siempre datos agregados, ¿no es así?
Efectivamente, hablamos de datos totalmente anónimos y agregados que hacen imposible la identificación de ningún individuo. Hablamos de big data y la información relevante es la que arrojan miles de datos acumulados.