Diario de un sociólogo en el mundo del Big Data (I)


Diario de un sociólogo en el mundo del Big Data (I)


Manuel Ángel Santana Turégano.

Me llamo Manuel, soy sociólogo y no pienso que la tecnología tenga la solución para todos nuestros problemas. Tradicionalmente las reuniones de la asociación Alcohólicos Anónimos suelen empezar de una forma parecida: “hola, me llamo “X” y sí, soy alcohólico. Basta poner en buscador “cómo suelen empezar las reuniones de alcohólicos anónimos” y le aparecen a uno páginas en que diversas personas que han sido alcohólicas cuentan que uno de los motivos que les llevaron a ser inicialmente reticentes a acercarse a dicha asociación era el pensar que era algo así como una secta. Tras menos de un mes de inmersión parcial en él tengo la sensación de que el mundo del Big Data es, en cierta manera, una secta. Al fin y al cabo, si uno se conecta al que es uno de los portales de formación en el área más potentes a nivel mundial, www.datacamp.com se encuentra que algunos de los profesores se definen a sí mismos como  Data Evangelist. Y, al terminar de leer el primer bloque del manual de la institución en que he decidido inscribirme para cursar estudios sobre la materia me encuentro con que se habla de que el paso final de la implantación de procesos de Big Data es el de “evangelizar la organización”. Literalmente: evangelizar. Así que, antes de empezar a hablar de Big Data se hace necesario hacer una pequeña introducción a la Sociología de las Religiones.

En el que es uno de los libros más importantes de la disciplina, La ética protestante y el espíritu del capitalismo, Max Weber, al analizar cómo el surgimiento de una determinada ética entre las sectas protestantes favoreció el florecimiento del espíritu del capitalismo establecía la diferenciación entre iglesia (ecclesia) y secta en términos de universalidad. Simplificando se podría decir que las iglesias (la católica es el mejor ejemplo) tienen pretensiones de universalidad: su mensaje es para todos, y la salvación que prometen es para toda la humanidad. Las sectas, por el contrario, no tienen pretensiones de universalidad: su mensaje, y la salvación que prometen es para el pequeño núcleo de elegidos que por sus excepcionales capacidades no sólo han de ser el faro del resto de la humanidad sino también el núcleo de los elegidos. Que los datos puedan ser tomados como una nueva religión es una idea que leí por primera vez en el libro de Esteban Hernández “Los Límites del deseo”, pero ha sido tratada por algunos de los pensadores más influyentes de la actualidad, como el isrelí Yuval Noah Harari (el autor del bestseller Sapiens) y el coreano-alemán Byung-Chul Han (el padre del concepto de “la sociedad del cansancio”) y que tiene incluso una entrada en la wikipedia[1].

Las sectas creen que sólo se pueden acceder al conocimiento en el seno de ellas, y desprecian cualquier tipo de conocimiento que venga de fuera. En el Big Data, entendido como secta, la verdad no se alcanza mediante la interpretación de lo que se considera la palabra de Dios revelada en un libro, como pueda ser la Biblia o el Corán; ni tampoco mediante la meditación y la ascesis más propias de religiones orientales. Sino, se dice, mediante el método científico, la data science. ¿En qué consiste ésta novedosa Ciencia de Datos? La entrada en la Wikipedia al respecto nos ilustra: “La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados (…) También se define la ciencia de datos como "un concepto para unificar estadísticas, análisis de datos, aprendizaje automático, y sus métodos relacionados, a efectos de comprender y analizar los fenómenos reales[2]": ¿Una ciencia que se basa en el uso de los datos para comprender y analizar los fenómenos reales? Que yo sepa, uno de los requisitos para poder hablar de “ciencia” y no de conocimientos esotéricos es precisamente la existencia de datos contrastables. Y respecto al uso de la estadística… en fin, desde la Sociología a la Biología pasando por la Psicología, todas las “%logías” (luego explicaremos esta terminología) la utilizan. En fin, como no es mi intención ser sectario, sino más bien “eclesiástico”, y poner el conocimiento de los revelados al alcance del gran público, hablemos de forma que cualquiera lo pueda entender: ¿de qué hablamos cuando hablamos de Big Data? Aunque se trata de un campo y una terminología que hoy en día se tiende asociar con la informática, son conceptos que surgen en la Administración de empresas, y para entender la idea de Big Data hay que entender el contexto en el que éste se enmarca. En el libro de Josep Curto “Introducción al Business Intelligence” se parte de este concepto para llegar al de Big Data a través del de Business Analytics.

La inteligencia de negocios (business intelligence, BI) podría entenderse como: “conjunto de metodologías, aplicaciones, prácticas y capacidades enfocadas a la creación y administración de información que permite a los usuarios de una organización tomar mejores decisiones”. Hasta aquí nada que, como sociólogo de la empresa y las organizaciones me resulte del todo extraño. En todas las organizaciones hay sistemas para tomar decisiones, tradicionalmente los sociólogos solíamos dejar a ingenieros y economistas ese tipo de cuestiones mientras que nosotros nos solíamos dedicar a estudiar cómo, en cualquier organización, tiende a haber distintas definiciones de lo que es una “mejor decisión[3]”. La cosa se complica un poco cuando vemos cómo se define el concepto de analítica de negocios (business analytics, BA): “el conjunto de estrategias, tecnologías y sistemas que permiten analizar el rendimiento pasado de una organización para poder predecir comportamientos futuros, así como para detectar patrones ocultos en la información”. Intentar analizar el comportamiento pasado de una persona o grupo de personas (una organización) no es nada nuevo, es lo que los científicos sociales, desde los economistas a los sociólogos, pasando por los psicólogos, llevan más de 150 años haciendo. Ahora bien, precisamente porque tenemos el bagaje propio de éstas disciplinas tenemos claro que una cosa es “intentar hacerse una idea de cómo se va a comportar en el futuro un ser humano o un grupo de seres humanos” y otra cosa muy distinta “predecir comportamientos futuros”.

Y cuando pasamos a la definición de Big Data resulta más fácil comprender el mensaje salvador de este nuevo evangelio. El Big Data se define como: “conjunto de estrategias, tecnologías y sistemas para el almacenamiento, procesamiento, análisis y visualización de conjuntos de datos complejos, que frecuentemente está definida por volumen, velocidad y variedad del dato”. Cualquier persona que haya hecho investigación habrá dicho en más de una ocasión: “me encantaría tener más datos, pero el hecho es que de momento no lo sé”. Pero pensar que gracias a que tengamos muchos datos podremos responder cualquier pregunta que nos podamos plantear en una organización está entre el positivismo ingenuo y el encubrimiento de intereses. Pues, al fin y al cabo, en el mejor de los casos, nos tendremos que remitir a la cuestión que estaba implícita en la definición de business intelligence: ¿para quién es mejor la decisión que gracias al Big Data logramos definimos como “mejor”?  El documental Por qué hacemos clic[4] muestra, entre otros, el trabajo de James Williams, del Oxford Internet Institute, y de Tristan Harris, del “Center for Humane Technology”[5],  que ponen de manifiesto que, lo “mejor” para Facebook o Google en muchas ocasiones no es lo mismo que lo “mejor” para el usuario final. Por lo tanto, la cuestión clave, cuando pensamos que la tecnología nos va a llevar a que las organizaciones logren mejores decisiones, sería: ¿mejore decisiones para quién? No es que esté planteando la vuelta al mundo analógico por considerarlo un paraíso utópico, sino que, como persona formada en la tradición de la Sociología Económica creo que es importante ser siempre consciente de que todo cambio tecnológico es causa o consecuencia de cambios en los equilibrios sociales. Y ésta es, por lo tanto, una cuestión socio- política de en qué mundo queremos vivir y no una cuestión técnica que puedan definir los poseedores de un conocimiento esotérico.

Lo primero que habría que lograr para que el Big Data nos ayudara a construir un mundo mejor “en concreto”, es decir, mejor para los ciudadanos normales y corrientes, porque lo de “mecanismos que permiten tomar mejores decisiones” se acaba convirtiendo en “mejor” para grandes compañías y gobiernos totalitarios como el chino, es que los ciudadanos normales entendamos de qué se habla cuando se habla de Big Data. Así que terminaré esta primera entrada de blog traduciendo al lenguaje común corriente el esotérico lenguaje en que el Big Data se suele presentar. La promesa de este nuevo evangelio a empresas y organizaciones es que les permitirá pasar de decisiones basadas en intuiciones a decisiones basadas en datos, mejores y que por lo tanto les permitirá “triunfar”. ¿Qué puede significar el Big Data para la panadería del barrio? Antes, la panadería decidía qué horarios poner y qué productos ofertar, si poner un refuerzo de personal a unas horas u otras, en función de “intuiciones”. Si el “panadero-emprendedor”, por casualidad, acertaba, tenía éxito. Si no, se iba al garete. El desarrollo actual de la tecnología permite que cualquier empresa, incluso las más pequeñas, puedan acumular una enorme cantidad de datos (Big Data): a qué horas vienen más clientes, si los lunes hay muchos clientes que compran pocas cantidades, si los sábados hay menos clientes que hacen compras más grandes; si quienes compran pan ecológico de masa madre suelen preguntar si venden también margarina ecológica. Ello permitiría organizar no sólo la cadena logística (pidiendo más o menos cantidades de unos u otros productos) sino también adaptar mejor la oferta a los perfiles de los clientes; e incluso condicionar los gustos de los clientes. Al fin y al cabo, esto es lo que hace ya bastante tiempo que hacen los grandes gigantes tecnológicos.

Por ello, para terminar, diré que, desde mi humilde punto de vista como sociólogo, los retos del Big Data en la actualidad son dos. Por un lado, desde la parte de los Data Analyst es necesario un acercamiento a las Ciencias Sociales en un doble sentido. El primero el de la humildad epistemológica: podemos darle al panadero unas herramientas perfectas… y a pesar de ello es posible que su empresa fracase, porque como han demostrado las corrientes críticas en economía, muchas de las grandes empresas de éxito que a menudo se ponen como ejemplo no han logrado sus logros adaptándose al mercado, sino logrando construir un mercado que se adaptara a ellas. Y el segundo, anterior a aquel, el de la humildad intelectual: hay que lograr que la gente que la gente común entienda de qué se habla cuando se habla de Big Data. Y si no lo entiende es que algo estamos haciendo mal. Así que terminaré esta primera entrada advirtiendo de que, si en los ritos de la Iglesia Católica el lenguaje que se usaba, hasta no hace tanto, era el latín, en esta “secta” el lenguaje que se usa es una versión curiosa del inglés, y adaptaciones macarrónicas desde estas lenguas a las lenguas vernáculas, que a menudo dificultan la comprensión. Y un último aviso a navegantes: no se piense usted que por saber inglés va a entender de qué se habla, ya que a menudo se trata de una versión un tanto extraña del inglés.


[3] La teoría de los campos de acción estratégica de Fligstein en quizá una de las teorías de alcance medio más interesantes en este campo. 
[5] Harris abandonó Google en 2015 para fundar una OBG, “Time well spent”, para combatir lo que creaba que era la “adicción por diseño” que generaba Internet. En 2017 la ONG cambió a su nombre actual, su web es: https://humanetech.com/. La página personal de Tristan Harris https://www.tristanharris.com/ y su entrada de Wikipedia https://en.wikipedia.org/wiki/Tristan_Harris.

Comentarios

Entradas populares de este blog

Razones para abandonar las redes. Primera: te hacen menos libre.