Ciencia de Datos
Parte del proyecto final de grado en ingeniería informática. Desarrollo de un módulo de evaluación probabilistica basado en curvas ROC para los algoritmos, C4.5, Näive Bayes, KNN, MLBP y SMO.
Estudio y diseño de un sistema basado en reglas de asociación y Big Data capaz de minar la red social Twitter y obtener información relevante acerca de un influencer en concreto. La información que el sistema ofrecerá será la evolución a lo largo del tiempo de la opinión que este personaje o influencer despierta en los usuarios de la red social.
Realización de cálculos y aplicación de algoritmos de aprendizaje automático sobre los datos de carácter sanitario captados e interpretados por Rocío Cuenca en el proyecto final de grado cursado en la Universidad de Extremadura.
La minería de medios sociales es uno de los ámbitos de aplicación de la minería de datos más estudiados en los últimos años. Tanto en el ámbito de empresarial como en el de investigación, estas técnicas suscitan un gran interés debido a que con el correcto procesamiento pueden obtenerse una gran cantidad de información y valor de datos que apriori parecen desectru- turados. En este trabajo, se propone un sistema basado en minería de textos para análisis de medios sociales mediante en cual se dará un flujo de análisis de datos en Big Data en Twitter. Esto se conseguirá mediante el análisis de patrones, proporcionados por reglas de asociación, cuya utilidad en este ámbito de aplicación quedará constatada en el exhaustivo estudio del estado del arte llevado a cabo. Se discuten y compran diversas técnicas de extracción de reglas así como se evidencian las limitaciones de los algoritmos habituales, los cuales queda demostrada su poca utilidad en problemas enmarcados en el paradigma Big Data. Para poder constatar que los resultados son aceptables o se ajustan a la realidad, el sistema será probado con un caso de uso real de Big Data sobre las elecciones generales del Gobierno de España del 28 de abril, constando el buen funcionamiento del sistema, a pesar de tener más de 1.5 millones de transacciones.
Cloud Computing
Desarrollo de la infraestructura cloud de un sistema gestor de contenidos. Se propone todo lo necesario para provisionar una arquitectura de microservicios basada en contenedores Docker y máquinas virtuales de Amazon Web Services. La orquestación y provisionamiento se haran con Vagrant y Ansible y tambien de explicará el uso de ciertos SaaS para deslocalizar ciertas tareas críticas de la aplicación.