Charla: Twitter Dynamics. Adquisición, procesado y visualización de datos
Esta charla pretende dar una visión introductoria sobre técnicas de adquisición, procesado y visualización de datos sociales provenientes de Twitter. Se presentarán técnicas básicas de adquisición de información en tiempo real a través de la API de Twitter y su posterior persistencia en la base de datos NoSQL MongoDB. Ésta información se almacenará en forma de "raw data", por lo que se mostrarán procesos para extraer información útil que pueda ser visualizada utilizando algunos de los frameworks de visualización más potentes actualmente, como Gephi o GraphStream. Se presentarán dos casos de uso de procesado/visualización que el equipo de Paradigma Labs ha aplicado con éxito en situaciones reales, tales como la detección de influenciadores y amplificadores de información en una red.
¿Cómo llegar?
La Escuela Politécnica Superior de la Universidad San Pablo CEU está situada en el campus de Montepríncipe, cerca de Boadilla del Monte. Puede llegarse allí a través de la línea ML3 del metro ligero -estación “Montepríncipe”-; mediante coche -la escuela cuenta con un amplio parking gratuito-, o mediante autobús. Podéis encontrar más información sobre el seminario e información de cómo llegar aquí.
Seminario impartido por Roberto Maestre y F. Javier Alba
Roberto Maestre desarrolla su trabajo, junto con sus compañeros de Paradigma Labs, en los campos de Procesado de lenguaje natural, análisis de redes, rastreo de información y web semántica. Estudió Informática en la UPM, y actualmente se encuentra realizando su doctorado en el campo de los modelos algebraicos para la construcción de sistemas expertos y de razonamiento automático en el DIA FI-UPM. Anteriormente trabajó en el CSIC en el proyecto TECT de la ESF relacionado con el estudio de redes dinámicas de cooperación. Siempre dispuesto a probar una nueva tecnología o poner a prueba una teoría.
F. Javier Alba Javier Alba es un desarrollador de software con más de 5 años de experiencia. Ha trabajado principalmente en áreas como Information Retrieval, NLP y Sentiment Analysis, aplicadas a la creación de sistemas de monitorización de medios y medición de opinión online. Sus herramientas principales son lenguajes como Java, Perl y Python, frameworks NLP como Freeling, Unitex y NLTK, motores de búsqueda como Apache Solr, y bases de datos NoSQL como MongoDB. Junto con sus compañeros de Paradigma Labs, actualmente trabaja en proyectos de Sentiment Analysis y monitorización online, así como en proyectos experimentales de adquisición y visualización de datos de redes sociales.
Noticia enviada por: paradigmatec Paradigma Tecnológico
Reader Comments