Big data y un big debate

Por Tomás Reneboldi
Compartir

Entre las mieles del progreso provenientes de los centros mundiales y la tentación de una perspectiva crítica anacrónica, asoma una discusión sobre el rol de las políticas públicas de un país periférico en la generación, distribución y acceso a la gigantesca masa de datos que dejamos en cada acción cotidiana.

Por distintos motivos, hoy nos encontramos con una discusión a nivel sociedad acerca de los datos y su utilización.

Ya sea por la popularidad de los últimos documentales de Netflix o HBO, por el conflicto con Cambridge Analytica y su influencia sobre las elecciones en nuestro país, por la relación entre la campaña electoral de Cambiemos y la big data, o por los errores garrafales en las encuestas que hacen cuestionar hasta qué punto la abundancia de datos puede predecir el comportamiento de las personas. En los medios de comunicación y las redes florecen las notas hablando del Big Data, el Big Brother y cómo nuestra privacidad se ve vulnerada por grandes empresas que nos espían, escuchan y conocen todo sobre nuestra vida.

Pero no solo porque circunstancialmente sea el tema de moda, del cual se debate en cenas, almuerzos o descansos de trabajo, sino también porque la discusión sobre los datos y la información constituye un tema central en la agenda contemporánea en todo Occidente. Qué va a pasar con el trabajo, la automatización, el reemplazo de funciones humanas por robots, máquinas o algoritmos. También el rol de Facebook, Google y otros gigantes tecnológicos cuyo principal activo son los datos recabados sobre los usuarios. En el centro de este debate se encuentran la protección de la privacidad de los datos, con la paradigmática sanción de la GDPR (ley de protección de datos europea) o los mundialmente conocidos casos de filtraciones generados por Snowden o Assange.

Esta enumeración basta para reconocer que la discusión sobre los datos es una de las más actuales y apasionadas de la arena pública. Por eso se vuelve necesario aportar una visión desde la periferia que pueda contemplar no solo la protección de derechos individuales o personales sino también el rol que debe cumplir el Estado en un país subdesarrollado para poder poner esos datos al servicio del desarrollo y la mejora de las condiciones de vida de las mayorías.

Antes de pasar a una posible agenda de gobierno de datos, es necesario repasar algunas ideas centrales para delimitar los alcances del problema. ¿Por qué discutimos hoy en día los datos como un problema central? Uno de los rasgos distintivos del avance civilizatorio en el Occidente urbano (o urbanizado) durante el siglo XXI tiene que ver con la progresiva digitalización, tanto de las operaciones económicas fundamentales como de la vida social en general. El universo digital permite un seguimiento y un registro de esas operaciones mucho más inmediato, fácil y barato. No solo por la facilidad en el seguimiento de la huella digital (la estela de datos que vamos dejando a nuestro paso mientras interactuamos con estas plataformas) sino por el progresivo abaratamiento del costo tanto del almacenamiento como del procesamiento de esa información.

Para ilustrar este punto, podemos pensarlo con un ejemplo hipotético. Me despierto un día a mediados de los ‘80, voy a comprar un desayuno al almacén de barrio, pago en efectivo, me fijo en una guía como arribar a una dirección, tomo un transporte público que pago con monedas, llevo la dirección anotada en un papel, toco timbre y me siento a tomar un mate y charlar. Me voy a dormir y me despierto en el año 2019. Por la mañana voy a comprar a una cadena de supermercados, pago con mi tarjeta de débito los productos previamente escaneados con un láser, activo el GPS, consulto cómo llegar a destino, pido un Uber y antes de llegar envío un whatsapp para pedir que me bajen a abrir. Una vez arriba, nos sacamos una selfie y la compartimos en redes sociales mientras nos enseñamos los últimos memes o videos en YouTube con el celular.

En el primer caso, el registro de todas las acciones llevadas a cabo resulta engorroso, caro, descentralizado y analógico. En el segundo, por el contrario, nos encontramos con sistemas que forman parte del universo digital y generan automáticamente señales medibles y almacenables en grandes servidores para ser procesadas más tarde. Tanto el supermercado como el proveedor de mapas de geolocalización, la aplicación de transporte privado o las empresas de mensajerías y redes sociales, cuentan con enormes bases de datos para analizar el comportamiento de los usuarios e incluso en muchos casos dichas bases pueden cruzarse para dar mayor volumen al análisis.

En este punto es donde se vuelve necesario hacer una distinción sobre qué es y qué no es, a nuestro entender, el almacenamiento masivo de bases de datos sobre acciones y comportamientos en el entorno digital (más conocido como big data). Esta masividad de datos son utilizados habitualmente como herramientas de marketing que permiten trabajar sobre los imaginarios y deseos de las personas para contribuir a una decisión de consumo, ya sea sobre un producto, una marca, un determinado comportamiento o el voto a un candidato en unas elecciones.

Sin embargo, en este punto podemos aclarar que esto no difiere esencialmente, sino solo en escala y alcance, de las herramientas con que contaban los grandes estudios publicitarios de fines del siglo pasado, ni con los estudios del comportamiento realizados mediante focus group u otras técnicas del marketing o la publicidad, ni con el alcance o la masividad de los grandes medios de comunicación a la hora de influenciar sobre hábitos de consumo o sobre el pensamiento o el voto de una porción de la sociedad.

Remarcamos este punto. La diferencia es de escala y de accesibilidad. ¿Por qué de escala? Por lo dicho anteriormente, la cantidad de datos que dejamos a nuestro paso se multiplicó por decenas. ¿Por qué de accesibilidad? Porque estos datos hoy se encuentran tan masificados que carecen de valor en tanto y en cuanto no puedan ser procesados o utilizados productivamente. Es por ese motivo que se puede acceder no solo gratuita, sino libre y fácilmente a grandes bases de datos disponibilizadas por empresas o gobiernos con el fin de que cualquier persona pueda trabajar esos datos y encontrarles una aplicación. Hoy faltan más aplicaciones o utilizaciones que datos. Y sin embargo, hay ciertos datos que son más valiosos que otros y por eso están en el centro de la disputa entre grandes grupos económicos.

Ahora bien, si la generación de datos a escala masiva en la sociedad actual no difiere en lo esencial de los problemas que ya planteaba la publicidad o la concentración de los grandes medios de comunicación, podemos decir que estamos antes un problema frente al cual ya hay una respuesta: la necesidad de la intervención del Estado para la regulación de esta actividad. En el caso de la big data, el Estado debería intervenir sobre tres puntos o áreas distintas. Por un lado, para la generación de los datos, aprovechando la extensa red de conexiones o vinculaciones que tiene el Estado con la mayoría de la población vía programas sociales, acción de ministerios, trámites u otros procedimientos administrativos. Por otro lado, para la gestión o administración de esos datos en beneficio de la mayoría de la sociedad, ya sea para el diseño o el mejoramiento de políticas públicas o simplemente para la provisión de información a la población. En tercer lugar, para garantizar el acceso democrático a esa data, evitando monopolios o concentraciones que puedan afectar la disponibilidad, utilidad o explotación de los datos recogidos. Por último, garantizando la protección a los derechos elementales de privacidad para la mayoría de la población sobre la información recabada.

Creemos que esta agenda podría traducirse en políticas concretas a impulsar desde el Estado:

1) Ley de protección de datos. En Europa ya fue sancionada una ley de regulación del acceso y la explotación de la información personal, modelo que busca ser replicado en otras partes del mundo (incluso en algunos estados norteamericanos, supuesto paradigma de la libertad de información). Es imprescindible estar a la altura de esas legislaciones para poder garantizar la protección de información sensible y la necesidad del consentimiento para la obtención de datos personales de navegación en dispositivos digitales.

2) Creación de un organismo de acceso y control a datos sensibles. Necesitamos un organismo estatal con el suficiente poder y facultades para poder gobernar sobre el acceso a determinados datos. El caso más elocuente se vincula al mundo bancario, donde el registro de morosidad y activos financieros hoy está en manos de una empresa estadounidense que compró la firma Veraz. Esto implica una lesión a la soberanía del país sobre datos sensibles como pueden ser la mora en activos financieros por parte de cada individuo, además de un fabuloso negocio que queda puertas para afuera de nuestro país. Necesitamos recuperar éste y otros datos estratégicos para nuestro país.

3) Área de centralización y curación de datos para diseño de políticas públicas. En función de mejorar el desarrollo de política pública desde el Estado para paliar situaciones de hambre y miseria o bien para apuntar a un desarrollo productivo del país, se vuelve imprescindible poder centralizar bajo un área el monitoreo, gestión y curación de bases de datos para su utilización efectiva en dichos programas estatales. Además de una reducción en las trabas burocráticas para la utilización de esta información, debería garantizarse la disponibilidad y calidad de los datos recabados. Sería tomar algunas de las líneas del Ministerio de Modernización para aplicarlas a la inversa: en vez de utilizarlo para el despido de trabajadores y trabajadoras estatales, servirse de la información disponible para mejorar el alcance de programas de asistencia desde el Estado.

4) Desarrollo de industria del conocimiento. Hoy en día es uno de los sectores con mayor perspectiva de crecimiento y con grandes posibilidades de desarrollo en Argentina dado el sistema científico y universitario ampliamente desarrollado, gratuito y de prestigio con el que cuenta nuestro país. No solo desarrollar programas orientados a la graduación de profesionales en áreas del conocimiento vinculadas a la tecnología y la informática sino también la articulación con pooles productivos para generar una retroalimentación entre el sector público y privado bajo regulación estatal. Esto podría estar acompañado por la creación de una incubadora de proyectos con financiamiento por parte del Estado y condiciones de desarrollo que permitan preservar patrimonio económico e intelectual dentro del país.

El debate sobre los datos suele caer en dos trampas. La primera es pensar que esta agenda resulta ajena a los intereses de un país en desarrollo como Argentina, con necesidades de primera urgencia generadas en gran medida por cuatro años de neoliberalismo, sumadas a desequilibrios estructurales de nuestro desarrollo económico, unitario, agrocéntrico y exportador. Es evidente que hoy la principal prioridad para una agenda de gobierno en Argentina tiene que ser resolver el hambre. Sin embargo, es necesario no pensar ambos objetivos como contrapuestos sino como complementarios. La segunda trampa tiende a asociar la generación masiva de datos con teorías conspirativas o con la apropiación de esa información por grandes consorcios empresariales globales, sin pensar en cómo podemos hacer para traducir esa herramienta y ponerla al servicio de los intereses del desarrollo del país y las necesidades de la mayoría de la población.

Cualquier perspectiva conservadora corre el riesgo de quedar desfasada de los nuevos tiempos. La ola de digitalización y, por ende, de generación masiva de datos, parece imposible de frenar. Hoy el contacto con plataformas digitales es parte de la vida cotidiana de toda la población. Si desde una agenda progresista no se busca incluir la temática con una perspectiva de desarrollo y popular, se corre el riesgo de convertirse en un sector que aspira a una vuelta al pasado, a la preservación de un estado anterior de las cosas y, por ende, a adoptar una perspectiva conservadora. Sin embargo, también es preciso no dejarse llevar por las mieles del progreso y el desarrollo técnico que muchas veces es originado en centros de poder económico y financiero alejados de nuestro país, al servicio de otros intereses. Por ese motivo, recuperar la centralidad del Estado en su función de organizador y democratizador de la vida social resulta de gran importancia en el contexto actual, tanto para ésta como para otras discusiones.

Fecha de publicación:
Tomás Reneboldi

Economista, data scientist, estudiante de la maestría en Data Mining, ex-futbolista