Desmontando mitos: verdades y falsas creencias sobre el big data

0

Todos hemos oído hablar del big data, esos enormes conjuntos de datos (de cualquier cosa, desde meteorología hasta tendencias de compra, flujos de tráfico o visualización de vídeos, entre otros muchos, muchísimos temas) que flotan en el hiperespacio y que solo pueden ser manejados con aplicaciones informáticas y a ser posible por profesionales cualificados en la materia. Su análisis puede ayudarnos a predecir quién marcará el gol de la victoria, cuándo aparecerá la próxima pandemia o cuándo tendrá lugar la siguiente nevada del siglo…, ¿o no?

En numerosas ocasiones leemos que el big data va a cambiar el mundo, y eso es cierto, pero a veces se confunden los deseos con la realidad. A pesar de la enorme versatilidad de las soluciones basadas en datos, también hay creencias o mitos en torno a esta disciplina que se repiten y que carecen de base. Aquí están los siete mitos del big data más extendidos en los últimos tiempos:

  1. Muchos datos = big data. No siempre, puede que estemos recogiendo un volumen enorme de información pero que no sirva para el problema que queremos resolver porque no es representativa. Por ejemplo, si tenemos acceso a millones de historias clínicas en España, esos datos no nos permitirán hacer predicciones correctas sobre las posibilidades de un paciente de desarrollar diabetes o melanoma en Filipinas o Guatemala, aunque el sistema sea muy preciso para la población española. Tampoco podemos deducir los gustos musicales de los mayores de 50 años estudiando las listas de reproducción de los estudiantes de bachillerato.
  1. Con big data podemos predecir cualquier fenómeno. Para que esto sea cierto es imprescindible que lo que estemos estudiando no sea completamente aleatorio. No podemos predecir qué número resultará premiado en el sorteo de la lotería de Navidad, aunque sepamos los resultados de los 100 años previos, porque está relacionado con el puro azar. Por el contrario, sí podemos estimar que el equipo de fútbol A ganará al equipo B siete de cada diez veces que se enfrenten por el análisis de resultados recientes. El deporte no es completamente aleatorio.
  1. El big data puede solucionar ‘todos’ los problemas. Según muchos, el big data iba a parar el COVID-19 a principios de la pandemia, pero ¿por qué no fue capaz de impedir su propagación? En las primeras semanas vimos muchos modelos predictivos que estimaban la evolución del número de contagiados o fallecidos, y casi todos fallaron de manera estrepitosa. Esta pandemia no tiene precedentes, afortunadamente no tenemos siglos de experiencia, ni datos, y por eso resultaba muy aventurado hacer predicciones. Por el contrario, todos los años las autoridades sanitarias prevén con gran acierto cuantos contagios va a haber de gripe y en qué semana va a suceder el pico. La clave está en que la gripe es recurrente y tenemos una serie histórica de datos representativa sobre la que basarnos.
  1. Elecciones sin sorpresas con big data. La experiencia nos demuestra que no, podemos predecir con exactitud el resultado de las próximas elecciones estudiando lo que sucede en las redes sociales. Esta es una leyenda que se basa en la predicción exitosa de los resultados de las elecciones presidenciales de Estados Unidos en 2012, cuando Barak Obama resultó reelegido. Sin embargo, esas mismas predicciones fallaron en las elecciones de 2016, cuando Donald Trump fue el ganador contra todo pronóstico. La realidad es que el comportamiento electoral es extremadamente difícil de modelar, y las redes sociales no son una representación fidedigna de la sociedad, sino solo de su parte más bulliciosa.
  1. Tu futuro laboral depende del big data. Parece que, en el futuro, los procesos de selección de personal o los despidos los decidirán algoritmos usando big data. Pero si bien es cierto que la toma de decisiones usando datos es una herramienta muy poderosa en manos de las empresas, la última palabra la tendrá siempre un ser humano. Echar la culpa al algoritmo es la versión 2021 de aquella excusa de los años 90, “las líneas están muy cargadas” o “el ordenador va muy lento”.
  1. Mis datos no importan a nadie, no hay ningún peligro en compartirlos con aplicaciones o plataformas. Todo dato que generamos al usar internet queda en la red para siempre y no sabemos quién lo va a usar ni cómo se va a comercializar, ahora o dentro de 20 años. Es muy importante que eduquemos a los más jóvenes en cuidar la información que difunden.
  2. El big data y los algoritmos son mágicos. Este es el mito más pernicioso de todos. Detrás de esta tecnología solo hay matemáticas y computación, nada irracional, y la desarrollan seres humanos que conocen bien lo que están haciendo y no utilizan conjuros ni realizan ceremonias ocultas. No hace falta ningún poder sobrehumano para entenderlo, solamente estudio y dedicación.

About Author

director académico del área de Ingeniería y Ciencias en el Centro Universitario U-tad

Leave A Reply