26/9/2024

Cómo usamos la IA para la investigación social

Comprender el ecosistema digital implica navegar entre grandes volúmenes de datos para identificar patrones, narrativas y actores clave. Las metodologías tradicionales, basadas en el análisis manual de la información, han empezado a rezagarse frente al tamaño de las bases de datos y sus constantes cambios. Con estas dificultades, la inteligencia artificial (IA) puede ser una herramienta innovadora para mejorar la eficiencia y profundidad de las investigaciones digitales. 

Recientemente en Linterna Verde hemos combinado metodologías de análisis cualitativas y cuantitativas con un modelo de codificación deductiva asistido por IA.  Este enfoque ha sido empleado para identificar categorías simples como temas, actores o lugares, pero en nuestra experiencia el modelo ha alcanzado hasta un 95% de éxito en categorizaciones complejas. Aunque las categorías utilizadas fueron predefinidas mediante un libro de códigos, la capacidad de la IA para procesar grandes volúmenes de datos permitió detectar patrones y narrativas con mayor rapidez y precisión en etapas posteriores de la investigación, facilitando el mapeo detallado de actores y redes en el ecosistema mediático.

Una de las principales ventajas de la IA en el análisis de datos es su capacidad para optimizar el tiempo y los recursos humanos. Actividades que antes requerían la colaboración de varios investigadores durante semanas ahora pueden completarse en pocas horas bajo la supervisión de una sola persona. Esta eficiencia no solo reduce significativamente el tiempo invertido, sino que también libera a los investigadores para que se concentren en tareas más sustanciales, incrementando tanto la productividad como la calidad del trabajo.

Además, la IA permite una transición fluida entre un análisis a pequeña escala y uno a gran escala. Al trabajar con grandes bases de datos, es posible generar prompts —instrucciones específicas para el modelo— basados en una muestra reducida que luego se generaliza al resto de los datos. Esto nos ofrece la oportunidad de perfeccionar las categorías analíticas y ajustarlas con mayor precisión a los objetivos del estudio. De este modo, la IA mejora la eficiencia y la profundidad del análisis, permitiendo a los investigadores obtener resultados más robustos y exhaustivos.

La implementación de estas herramientas también presenta desafíos. Los usos de ingeniería de prompts y el diseño de categorías para la investigación social todavía están poco documentados. Esta falta de referencias obliga a los equipos a partir de un nivel básico en cada nuevo proyecto, lo que ralentiza el avance del conocimiento y dificulta la adopción más generalizada de estas tecnologías. Resulta esencial que los investigadores compartan sus experiencias y conocimientos para que el uso de la IA se extienda y se optimice en el campo.

Por otro lado, aunque los modelos de IA tienen la capacidad de generar inferencias por sí mismos, los resultados son más precisos cuando se les proporcionan categorías predefinidas por los investigadores, basadas en una revisión de la literatura. La precisión de los resultados no solo depende de la calidad de los datos introducidos, sino también de la claridad y rigurosidad de los prompts utilizados. Esto subraya la importancia de un diseño metodológico cuidadoso para garantizar que la IA contribuya de manera efectiva al análisis y a la consecución de los objetivos de la investigación.

A pesar de los temores iniciales sobre el impacto de la IA en las ciencias sociales, la evidencia muestra que esta tecnología no sustituye a los investigadores, sino que amplifica sus capacidades. Los modelos de codificación facilitan el análisis de grandes volúmenes de datos y automatizan las tareas más repetitivas, permitiendo a los investigadores centrarse en los aspectos más complejos y creativos del proceso. De esta forma, esta herramienta complementa el trabajo humano, mejorando tanto la eficiencia como la profundidad del análisis cualitativo.

Para que el uso de la IA en la investigación social sea efectivo y accesible, es crucial que se compartan los aprendizajes obtenidos en su implementación. Dado que el manejo de estas herramientas requiere de un conocimiento técnico especializado, su uso en el campo aún es relativamente reducido. La difusión de estos avances contribuirá a cerrar la brecha de conocimiento y a democratizar el acceso a estas tecnologías, lo cual es especialmente importante en contextos con grandes necesidades de investigación social como Colombia.

Bibliografía

Chang, K., Xu, S., Wang, C., Luo, Y., Xiao, T., & Zhu, J. (2024). Efficient prompting methods for large language models: A survey. arXiv. https://arxiv.org/abs/2404.01077

Chew, R., Bollenbacher, J., Wenger, M., Speer, J., & Kim, A. (2023). LLM-assisted content analysis: Using large language models to support deductive coding. RTI International. https://arxiv.org/abs/2306.14924

Törnberg, P. (2023). How to use large language models for text analysis. Institute of Language, Logic and Computation, University of Amsterdam. https://arxiv.org/abs/2307.13106