13/3/2024

"Los datos son transversales a las preguntas fundamentales que nos hemos hecho en la sociedad civil": conversación con Nicolás Velásquez

En la primera edición del año de Vértices, en la sección Voces, conversamos con Nicolás Velásquez, científico social y de datos y cofundador de Linterna Verde.

Nicolás compartió su perspectiva sobre la importancia de integrar la ciencia de datos en las organizaciones de la sociedad civil. Abordamos los desafíos de la implementación de este campo en la cultura organizacional y estrategias para que las organizaciones sin experiencia previa en el uso de datos se acerquen a esta área y puedan fortalecer su impacto social.

A continuación, presentamos la entrevista completa.

Nicolás Velásquez, científico de datos y cofundador de Linterna Verde

Hoy se habla de la ‘datificación del mundo’ y, particularmente en el sector social, crece cada vez más la demanda para que las organizaciones incorporen la ciencia de datos en sus decisiones. ¿Podrías explicar en qué consiste este campo y cuál es su aplicabilidad en el contexto de las organizaciones de la sociedad civil?

Estamos en lo que llamamos la revolución de la informática o de las tecnologías de la información. Eso quiere decir que hoy en día los datos abundan y son una materia prima que fácilmente podemos generar y aprovechar plusvalía en los ámbitos públicos y privados de la sociedad civil.

Las organizaciones en el mundo siempre han trabajado con datos. Hoy en día, llamamos analista de datos a alguien que trabaja en Excel o en SQL. A la hora de la verdad, todos los que somos analistas, científicos de ciencias sociales, humanidades, derecho, siempre hemos trabajado con algunos datos. La diferencia es que hoy tenemos acceso a un volumen mucho más grande de datos a un precio relativamente bajo; ya sea consiguiendo los datos, teniéndolos en un computador o utilizando herramientas o técnicas que nos permitan abordar ese volumen de información.

Los datos son transversales a las preguntas fundamentales que nos hemos hecho en la sociedad civil: ¿cuáles son nuestros derechos?, ¿cuáles son nuestros roles?, ¿cuál es el proyecto de sociedad que quisiéramos construir? Entonces, el análisis de datos para la sociedad civil es examinar aquella fuente que se está dinamizando hoy en día, desde lo económico, desde lo productivo, desde nuestros derechos a poder reclamar privacidad sobre ciertos datos que, de otras formas, son públicos.

¿Cuáles son los principales desafíos que enfrenta la sociedad civil al momento de integrar el trabajo con datos en sus organizaciones?

Existen tres desafíos sumamente comunes. El primero es ahogarse en datos. Muchas veces, queremos algo y no sabemos buscarlo bien, lo que nos lleva a tener más datos de los que necesitamos. En esa necesidad se definen dos aspectos: el primero es qué pregunta puedo responder y, para una organización como Linterna Verde, es muy importante llegar a un segundo, cómo entregamos los datos. ¿Hacemos una tabla estadística o un relato?

Distintas organizaciones tienen distintos equipos que pueden sacar provecho de manera diferenciada de estos insumos. En Linterna, muchas veces entregamos datos narrativos soportados en tablas estadísticas, y una organización nos dice: 'Nos sirvió mucho la tabla estadística, pero realmente no miramos la narrativa que nos proporcionaron porque decidimos crear otra', o también ha ocurrido lo contrario: 'Nos fascinó la narrativa, por favor, ayúdenos a entender esta tabla porque realmente en nuestro equipo no hay nadie que sepa entender este concepto'. Entonces, es clave un diálogo previo que nos ayude también a entregar un producto que sea adecuado al equipo humano que va a sacar provecho.

El valor de la ciencia de datos depende del modelo de la pregunta o diseño de investigación.

El segundo desafío, sumamente común, es lo que a veces llaman dataísmo: creer que, porque algo pasó por la magia de las ciencias de datos o de la estadística, es más cierto, más autoritativo o más valioso que si no. El valor de la ciencia de datos depende del modelo de la pregunta o diseño de investigación. La modelación de datos debe ajustarse a los criterios de lo que nos estamos preguntando y tiene que ser valorada, más allá de lo estadístico, por expertos en la materia. Luego, viene un proceso de datos que genera unos resultados. Entonces, no es cierto que porque algo sea estadístico o de ciencias de datos es más cierto.

Por último, el tercer desafío lo relacionamos con la privacidad y los derechos sobre los datos. Dependiendo de la pregunta de investigación, muchas veces vamos a encontrar cosas que no necesariamente es sensato mostrar, o al menos hacer públicas a todo el mundo. Esto se debe a que tal divulgación podría comprometer la seguridad de individuos ya vulnerables o porque nos topamos frecuentemente con datos relacionados con actividades potencialmente ilegales. Surge, entonces, una responsabilidad inherente sobre qué se divulga, a quién y cómo se reporta.

¿Cómo una organización de la sociedad civil que no se especializa en datos podría aproximarse a ellos y por qué debería hacerlo?

Deberían hacerlo porque muy probablemente van a encontrar insights o conocimientos soportados en un gran volumen de datos que responden a preguntas esenciales de cada organización.

Ahora, lo primero que hay que hacer para trabajar con datos es dialogar. Esto aplica tanto para organizaciones grandes como pequeñas. Todos los procesos de ciencias de datos, para que sean útiles, requieren de un tríptico: los estadísticos, los expertos en tecnología y los expertos en la materia. El diálogo entre esos tres saberes es lo que racionaliza y genera preguntas de investigación para resolver problemas relevantes del sector social.

Para que un ejercicio de ciencias de datos sea fecundo, se necesita esta intersección, porque no existe una herramienta técnica que sirva a todo el mundo de principio a fin. Ahora bien, quienes dirigen ese diálogo son los expertos en la materia; ellos son los que entienden para qué se van a usar los datos y son quienes tienen que validar que la información que están recibiendo de las otras dos experticias tenga sentido con la realidad y responda a las preguntas correctas.

Teniendo en cuenta que muchas ONGs y organizaciones de la sociedad civil carecen de la infraestructura tecnológica y el talento técnico para esto, ¿qué recomendarías para dar el primer paso?

Las organizaciones pueden conseguir un recurso humano, ya sea entrenando a alguien del equipo ya consolidado o contratando a un técnico externo. Lo que se necesita en un equipo de datos es tener expertos en la materia. Entonces, si hablamos de una organización civil, ellos ya tendrían estos expertos; el siguiente paso sería traer a un ingeniero o técnico de datos que sepa utilizar herramientas técnicas.

Por otra parte, la inteligencia artificial puede ayudar a las organizaciones a utilizar otras herramientas de captura de datos. Hoy en día, si yo tuviera que entrenarme en algo para una organización de la sociedad civil, sería en prompt engineering. Esto no es otra cosa que el diseño de investigación crítica. Son las preguntas o las interacciones que tenemos con una herramienta con un transformador, como ChatGPT o Copilot, las cuales van poco a poco complejizando la pregunta de investigación, descartando algunos resultados y pidiendo que se agreguen otros. Estoy seguro de que una organización de la sociedad civil con científicos sociales, abogados, humanistas o personas que hayan trabajado en el campo de la movilización social, tienen la capacidad y el espíritu crítico necesario para entrenarse en ello.

¿Cómo puede aplicarse el análisis predictivo para monitorear y evaluar el impacto en la sociedad civil organizada?

Debido a la disponibilidad de datos que tenemos hoy en día, estamos en capacidad de modelar comparaciones entre lo ocurrido en el pasado y lo que deseamos hacer en el futuro. Es un hecho la capacidad que tenemos actualmente de realizar esos análisis o abstracciones estadísticas para proyectar el resultado de un modelo de intervención o de política pública que implementen las organizaciones de la sociedad civil.

La estadística sirve para decir poco de muchas cosas, y el análisis cualitativo a profundidad usualmente sirve para decir mucho de pocas cosas.

Esto, hace 20 años, cuando hice el pregrado, lo hacíamos a partir de leer tres o cuatro estudios de caso; hoy, con diferentes herramientas, se puede modelar un comparador que incluya una cantidad abrumadora de casos desde una perspectiva más estadística que cualitativa, con los riesgos y las ventajas de utilizar estadísticas. La estadística sirve para decir poco de muchas cosas, y el análisis cualitativo a profundidad usualmente sirve para decir mucho de pocas cosas.

Ahora, un tema importante para la sociedad civil es preguntarse cuál es el modelo de datos a seguir y tener muy claro que la estadística y los grandes datos no justifican prácticamente nada, no aportan mucho más que un estudio basado en tres o cuatro casos a profundidad. Ambos tienen valores y retos, y un científico de datos, desde un criterio muy bien informado, tiene que decidir hasta dónde le cree a los datos. Lo que finalmente justifica las cosas es una lógica de diseño de investigación que debemos sustentar y que tiene unos valores fundamentalmente políticos, morales y sociales.

¿Hacia dónde ve que se dirige la intersección entre ciencia de datos e impacto social? ¿Qué tendencias cree que serán importantes en los próximos años?

No hay duda de que para toda organización de la sociedad civil, adoptar soluciones basadas en datos o herramientas analíticas será cada vez más crucial, ya sea para implementarlas directamente o para comprenderlas. Esto se debe a que se enfrentarán a otras organizaciones o instituciones equipadas con estas herramientas, que estarán generando valor agregado. Así que aprender a manejar y responder a estas capacidades es imprescindible.

Ahora, hay dos temas que creo que van a ser súper importantes en los próximos 20 años. Primero, los derechos y deberes relacionados con los datos. La forma en que generamos y manejamos nuestros datos ya cuenta con cierta regulación. Sin embargo, los roles de consumidores, productores o procesadores de datos, especialmente en lo que respecta a derechos como la propiedad intelectual y la privacidad, aún están sujetos a debate y definición. Surge la pregunta: si una organización o institución, sea pública o privada, obtiene un beneficio adicional de los datos recopilados, ¿de quién y de dónde provienen esos datos? ¿Con qué derecho se capturaron? ¿Con qué propósito? ¿Qué obligaciones surgen una vez procesados los datos y extraídos los insights? ¿Cuál es la responsabilidad respecto al almacenamiento o eliminación de dichos datos?

Segundo, la necesidad de regulación es indiscutible, ya que estamos hablando de una dinámica de poder. En nuestra sociedad, las relaciones de poder suelen estar sujetas a regulación. Los detalles específicos de lo que debe ser regulado son una cuestión más compleja y profunda, que va más allá de lo que se puede abordar en una sola hora de estudio. Sin embargo, es probable que muchas de estas cuestiones se regulen de una forma u otra, o que como sociedad decidamos regular ciertos aspectos y dejar otros sin regulación.