Buscando herramientas de visualización en buscadores no es muy fácil encontrarse con NodeXL: un template gratis, de código abierto y que funciona bajo el entorno de Microsoft Excel (junto con la plantilla incluye un complemento de Excel). Su uso nos permitirá la visualización de datos de Twitter de forma fácil y rápida.
Desde su web podemos descargar la última versión (19-6-13), consultar la documentación y acceder a una galería para visualizar trabajos ya creados con la herramienta.
Su potencia y relativa facilidad de uso se centra en varios puntos destacables:
- Entorno de trabajo conocido (Excel).
- Compatible con varios proveedores de datos sociales (en este caso veremos los datos de Twitter).
NodeXL nos permitirá importar rápidamente los datos en un libro Excel y visualizarlos de forma gráfica.
Al trabajar en Excel tendremos una serie de ventajas como la facilidad para filtrar los datos y la posibilidad de realizar cálculos estadísticos sobre los mismos. De hecho, la misma herramienta, en la hoja final llamada ‘Overall metrics’ ya nos ofrece algunas estadísticas, en este caso, en referencia a los datos visualizados gráficamente.
La potencia y posibilidades son enormes pero, en este artículo, sólo veremos un pequeño ejemplo de visualización de datos de Twitter con NodeXL.
UN PEQUEÑO EJEMPLO
Veamos los pasos:
1.- Tras la descarga e instalación abrimos el programa y nos aparece una plantilla de Excel caracterizada por la plantilla en sí (zona izquierda con varias hojas de Excel, columnas con título, etc), una zona derecha dónde aparecerá el gráfico y un menú tipo ribbon llamado ‘NodeXL’ en la parte superior.
2.- Desde el menú de la herramienta seleccionamos Import>Import from Twitter Search Network y aparece la siguiente ventana:
En el cuadro de texto superior podemos introducir las keywords a buscar. En nuestro caso introducimos AnaliticaWeb (nuestro ejemplo) y limitamos a 25 tweets con la idea de obtener sólo una pequeña muestra reciente, suficiente para evaluar y empezar a jugar con la herramienta ).
3.- En la siguiente pantalla Introducimos nuestro nombre de usuario y damos permiso (Twitter otorga permisos temporales por lo que NodeXL usa un sistema de validación por tiquets). Tras todo el proceso de autentificación observaremos como los datos se han importado a la plantilla y de forma ordenada según columnas.
4.- En la zona derecha del gráfico hacemos clic en ‘Refresh Graph’ para obtener el gráfico de los datos importados.
Si pasamos el ratón sobre el gráfico obtendremos información en forma de tooltip y si hacemos clic en alguno de los nodos, sus datos se seleccionarán en la parte izquierda (hoja Excel). Del mismo modo, si hacemos clic en algún registro de la hoja de Excel, éste quedará seleccionado dentro del gráfico.
5.- Podemos mejorar rápidamente la visualización de varias formas. Una es haciendo clic en el botón ‘Autofill Columns’ con lo que nos aparece una ventana con 3 pestañas y si en la llamada ‘Vertices’ seleccionamos ‘Vertex’ en la caja ‘Vertex Label’, aparecerán los nombres de usuario en cada nodo del gráfico.
ALGUNAS CARACTERÍSTICAS BÁSICAS
-
Encima del gráfico podemos seleccionar las líneas o los nodos y cambiar sus propiedades.
-
Desde el Excel podemos filtrar resultados y obtener nuevas visualizaciones según los nuevos datos disponibles (por ejemplo, tuits por día, por hora, etc.).
-
Podemos arrastrar los nodos del gráfico para recolocarlos.
-
Podemos cambiar colores desde la hoja Excel o desde el mismo gráfico, pero también de forma automatizada a partir del botón ‘Autofill Columns’ o mediante la agrupación (clic en ‘Groups’ y agrupados por color según si está conectados o no).
-
Finalmente podemos guardar la imagen obtenida (la 1ª imagen de este artículo).
ENTENDIENDO UN POCO MÁS A NodeXL
Si queremos profundizar un poco más en esta herramienta se hace indispensable conocer algunos términos y conceptos con los que nos encontraremos al usarla.
Para este cometido tenemos la documentación de NodeXL pero voy a realizar algunas pinceladas más.
De forma visual podemos realizar:
-
un análisis global, dónde aparecerá el concepto de densidad (la cantidad de nodos en relación a otra variable como el tiempo) y el de conectividad (la relación entre nodos y la distribución de estos enlaces). En referencia a la conectividad hablaremos (NodeXL lo hace) de ‘componentes conectados a la red‘ y en referencia a la distribución nos referiremos como agrupamientos o clusters.
-
un análisis individual, en el que aparece el concepto de centralidad (ver si el individuo/nodo tiene un papel importante según algún criterio). Cada tipo de centralidad asignará un valor a cada individuo (por un determinado criterio) por lo que podremos ordenarlos en base al mismo.
Tipos de centralidad:
-
de grado (grado nodal): indica qué nodo tiene mayor cantidad de enlaces entrantes (in-degree) o salientes (out-degree). De esta forma podremos observar visualmente si hay reciprocidad en los enlaces.
-
por cercanía: el nodo bien conectado con los demás y ubicado a menor distancia (a medio camino entre los demás nodos conectados).
-
de intermediación: nodos que actúan como ‘puente’ entre grupos dispersos.
-
de autovector (eigenvector): nodos mejor conectados y conectados a los mejor conectados.
-
de PageRank: se determina a través de los enlaces entrantes a un nodo (la idea es parecida al PageRank de páginas web que establece Google).
La siguiente imagen puede aclarar un poco más estos conceptos:
Saludos!