28/3/2023

Investigación digital en imágenes: algunas herramientas para superar las limitaciones metodológicas

La visualización de videos en línea ha aumentado significativamente en los últimos años, convirtiéndose en una de las principales razones por las que las personas utilizan la red. Según el informe Digital 2023, que muestra un panorama global sobre el uso de internet, redes sociales y dispositivos móviles, ver videos ocupa el cuarto lugar en la lista de las actividades más comunes en línea en todo el mundo.

La transición que intentan hacer plataformas convencionales como Instagram y Facebook al formato de video, sumado al éxito de redes emergentes como TikTok, donde los usuarios pasan cerca de 24 horas al mes, no solo ha aumentado la demanda de datos de video sino que representa nuevas limitaciones para recopilar y sistematizar información de estas fuentes.

Algunas de las dificultades a las que se enfrentan quienes buscan comprender los entornos digitales están relacionados con la enorme cantidad de información que se genera a través de fuentes de video, las escasas herramientas para extraer y procesar datos relevantes, así como la falta de estandarización en la forma en que se almacenan y presentan estos datos. 

En nuestro blog ‘TikTok: Una mina de información a la espera de ser explorada’, abordamos este y otros retos que la red social y el formato de video han generado en la investigación digital. En esta entrada pondremos la lupa en las iniciativas que buscan subsanar esta barrera de acceso a la información y en los avances que se han dado en materia de análisis de imágenes en movimiento. 

Recopilación de información y bases de datos 

Además del contenido en sí mismo, la investigación digital se apalanca en métricas que permiten medir el alcance, el nivel de influencia y la forma en que la información se divulga en las redes sociales. Con el tiempo, las presiones de la academia, los medios de comunicación y la sociedad civil, las plataformas han terminado por ofrecer accesos a sus API (interfaces de programación), en las cuales es posible obtener algunos datos relevantes para este propósito. 

Sin embargo, esta información no siempre es completa o no permite conocer a profundidad las dinámicas de las redes sociales. En el caso de TikTok, una plataforma que cada vez toma más importancia para la comprensión del debate digital, las limitaciones a su API son aún más marcadas, pues no permite descargar metadatos en bloque o acceder al flujo de contenido relevante de la página “Para ti”, una de las secciones más importantes en la infraestructura de esta red social. 

Además, la construcción de bases de metadatos supone dificultades adicionales al momento de incursionar e intentar comprender contenidos audiovisuales. Información tan relevante como los me gusta, las reproducciones, los comentarios y los hashtags, entre otros registros, han quedado fuera del alcance de los investigadores, que en caso de querer recopilarlos han tenido que asumir esta tarea manualmente. Estas son algunas de las herramientas que se han implementado con este propósito: 

Zeeschuimer

Zeeschuimer es una extensión del navegador que monitorea y recopila información sobre elementos de la interfaz de una plataforma o red social, como los datos de navegación, los menús, las plantillas, los sonidos y, en general, los canales de interacción que tiene el usuario con el contenido y la aplicación. Este monitoreo, en conjunto con otras herramientas, permite hacer un análisis sistemático posterior. Por ejemplo, para el caso de TikTok, permite exportar una lista de todas las publicaciones vistas en el orden de reproducción para luego ser leídas a través de herramientas como 4CAT para su lectura, análisis y almacenamiento. 

4CAT

4CAT es una herramienta de investigación que se puede utilizar para procesar datos de redes sociales en línea. Su objetivo es hacer que la captura y el análisis de datos sean accesibles para las personas a través de una interfaz web, sin necesidad de conocimientos de programación. 4CAT crea un conjunto de datos de la plataforma a través de parámetros determinados por el usuario. Esta herramienta enlazada con Zeeschuimer, facilita la lectura de los datos de redes sociales como TikTok. 

Youtube Data API

Youtube Data API es una extensión de la aplicación que fue desarrollada en el 2007 para programadores e investigadores. La herramienta, que ya va en la versión 3.0,  permite hacer búsquedas en los datos de Youtube por temáticas determinadas por el usuario, acceder a metadatos como las cifras de interacción de los contenidos y lecturas de audiencias dentro de la aplicación. Aunque esta es una versión experimental, ha sido ampliamente utilizada para acceder a un modelo de lectura de datos en los que YouTube, una de las aplicaciones de streaming menos estudiadas, sea incluida en la investigación. 

Visión por computadora 

Los formatos de vídeo e imagen contienen otro tipo de características que, desglosadas y agrupadas, pueden ser leídas por la inteligencia artificial. A este campo de investigación de la IA se le llama visión por computadora. Esta técnica permite hacer de los objetos, colores, cuerpos, gestos, representaciones, sonidos o acciones un dato de utilidad para el análisis. Además, las herramientas que utiliza permiten detectar aspectos de formato como la velocidad, las composiciones del video o el rastreo de imágenes coincidentes que abren la posibilidad de referenciar con otras fuentes. El uso de estas herramientas ha sido un obstáculo tanto por sus altos costos como por la falta de accesibilidad para organizaciones e investigadores independientes. Sin embargo, recientemente se han adaptado otro tipo de herramientas para realizar acciones de lectura de video y complementar las funciones de visión por computadora que son de libre acceso. Estás son algunas de ellas: 

API de Video de Google

La API de Google Video Intelligence es una herramienta de libre acceso que extrae y anota el marco central de cada toma del video en función de su contenido visual. Es decir, hace identificación de datos como los cuerpos, las plantillas, los colores, etc. Este es un método de gran utilidad cuando se trata de arcos narrativos y transiciones de tomas múltiples porque desglosa las tomas y permite codificar la información de manera cuantitativa y cualitativa. Además, puede ser usada para el análisis del reparto de audio  identificando si es un sonido original o si proviene de la biblioteca de sonidos dentro de la red social, una función muy pertinente para la investigación en TikTok. 

Memespector-GUI

Memespector-GUI es un servidor multiplataforma que permite la lectura de datos obtenidos por herramientas de visión por computadora como Google Video Intelligence. Con esta herramienta es posible identificar nodos de interés dentro de los datos del video. Por ejemplo, es posible detectar y clasificar imágenes a través de parámetros como texto reconocido, sitios de referencia, logotipos o rostros de personas, entre otros. Estas funciones, permiten ubicar el contenido en un contexto más amplio que puede aportar a la investigación. 

El alto consumo de contenidos en video los ha convertido en un objeto de interés clave para la investigación digital. En Linterna Verde nos cuestionamos constantemente por nuevas estrategías que complementen nuestras metodologías de investigación en redes sociales. Conjugar distintas técnicas y herramientas permitirá a académicos y a la sociedad civil mantenerse al día frente a los constantes avances de las redes sociales, comprender cómo opera el flujo de información en línea y su impacto en el debate público digital.  

Fuentes 

Capturing TikTok Data with Zeeschuimer and 4CAT, Digital Methods Initiative 

DeepTikTok: Three Methods for tracing video memes, Elena Pilipets

Images in Social Media Research: Digital Tools and Methodological Challenges, NFDI4Culture