Guía docente de Inteligencia de Negocio (496114K)
Grado
Rama
Módulo
Materia
Curso
Semestre
Créditos
Tipo
Profesorado
Teórico
Tutorías
Salvador Gutierrez Salcedo
Ver email- Primer semestre
- Miércoles de 10:00 a 13:00 (Ceut (Ceuta))
- Jueves de 10:00 a 13:00 (Ceut (Ceuta))
- Segundo semestre
- Martes de 10:00 a 13:00 (Ceut (Ceuta))
- Miércoles de 10:00 a 13:00 (Ceut (Ceuta))
Prerrequisitos y/o Recomendaciones
Se recomienda tener conocimientos de programación en Python.
Breve descripción de contenidos (Según memoria de verificación del Grado)
- Data Warehousing
- Minería de Datos
- Herramientas de Business Intelligence
Competencias
General competences
- CG08. Conocimiento de las materias básicas y tecnologías, que capaciten para el aprendizaje y desarrollo de nuevos métodos y tecnologías, así como las que les doten de una gran versatilidad para adaptarse a nuevas situaciones.
Competencias Transversales
- CT01. Capacidad de organización y planificación así como capacidad de gestión de la Información.
Resultados de aprendizaje (Objetivos)
El título de Graduado/a en Ingeniería Informática de la Universidad de Granada ha obtenido, con fecha 5 de junio de 2019, el sello Euro-Inf, otorgado por ANECA en colaboración con el Consejo General de Colegios Profesionales de Ingeniería en Informática (CCII) y con el Consejo General de Colegios Oficiales de Ingeniería Técnica en Informática (CONCITI). Esta acreditación garantiza el cumplimiento de criterios y estándares reconocidos por los empleadores españoles y del resto de Europa, de acuerdo con los principios de calidad, relevancia, transparencia, reconocimiento y movilidad contemplados en el Espacio Europeo de Educación Superior.
- Conocer y manejar herramientas y técnicas enfocadas a la creación y uso de conocimiento mediante el análisis de datos existentes en una organización o empresa.
- Conocer la estructura de un almacén de datos y las distintas arquitecturas con las que puede implantarse en una organización.
- Valorar la mejor arquitectura de data warehouse para una organización basándose en sus características y el uso esperado del mismo.
- Conocer el modelo multidimensional de datos y utilizar apropiadamente las operaciones OLAP para diseñar estrategias de consulta sobre el mismo.
- Comprender la necesidad de un buen diseño conceptual del almacén de datos y desarrollar la capacidad de obtenerlo basándose en las necesidades de información de la empresa y la disponibilidad de datos de los sistemas operacionales.
- Aplicar las técnicas de la Ingeniería del Software al ámbito de los proyectos de desarrollo de Data Warehouses.
- Conocer y utilizar herramientas para el desarrollo e implementación de Data Warehouses presentes en el mercado.
- Conocer las distintas técnicas de visualización de datos que se pueden utilizar en un entorno OLAP.
- Concienciarse de la necesidad de utilizar técnicas de procesamiento analítico dirigidas por los datos en el seno de una organización empresarial.
- Analizar el conjunto de datos disponibles en la empresa y seleccionar aquellos que son de interés para realizar un proceso de Minería de Datos.
- Describir los distintos modelos de minería de datos más ampliamente utilizados en el ámbito de la Inteligencia Empresarial.
- Comprender y aplicar las principales técnicas de Minería de Datos para encontrar asociaciones o tendencias relevantes en un conjunto de datos.
- Entender y ser capaz de utilizar apropiadamente los métodos más extendidos para realizar agrupamiento o segmentación de los datos de un conjunto.
- Conocer y diferenciar las distintas técnicas de clasificación que se pueden aplicar sobre un conjunto de datos y utilizarlas adecuadamente.
- Ser capaz de evaluar la calidad del modelo obtenido mediante la aplicación una de las técnicas anteriores.
- Valorar la técnica de Minería de Datos que mejor se ajusta a un problema concreto de los que se plantean en el ámbito empresarial.
- Ser capaz de preparar el conjunto de datos para adecuarlo a la técnica de Minería de Datos concreta que se va a utilizar.
- Conocer el panorama de herramientas de Bussiness Intelligence más extendidas en el mercado.
- Ser capaz de evaluar la adecuación de una herramienta de Bussiness Intelligence para su implantación y uso en una organización.
Programa de contenidos Teóricos y Prácticos
Teórico
Tema 1: Introducción a la inteligencia de negocio
- Elementos de una herramienta de business intelligence
- Procesos de extracción, transformación y carga. Data warehouse.
- Reportes y consultas
- Retos en Inteligencia de Negocio
- Business Analytics
Tema 2: Introducción a la ciencia de datos
- La era de los datos
- Proceso de extracción de conocimiento de una base de datos
- Etapas en el proceso de extracción de conocimiento
- Aprendizaje automático
- Big data
- Casos de uso: salud, márketing, negocios, emergencias
Tema 3: Análisis exploratorio de datos mediante visualización avanzada
- Introducción y motivación: la imagen como herramienta de comunicación
- Ejemplos de visualización, pros y contras, alternativas
- El proceso de visualización: el dataset, el mensaje, la gráfica, interactivo/vídeo, la forma y el color
- Visualización para distintos tipos de variables: categóricas, temporales, espaciales, múltiples, distribuciones
- Herramientas
- Aplicaciones en problemas reales: deporte, banca, social, energía, turismo
Tema 4: Predicción: clasificación, regresión y series temporales
- Técnicas de clasificación: árboles, reglas, lazy, redes bayesianas, regresión logística, redes neuronales artificiales, support vector machine, bagging y boosting, ensemble learning
- Evaluación en clasificación
- Problemas multiclase
- Regresión: regresión lineal múltiple, árboles de regresión, reglas difusas
- Análisis de series temporales: regresión simple, multivariante, descomposición, ARIMA, métodos avanzados
- Aplicaciones
Tema 5: Preprocesado de datos
- Integración, limpieza y transformación de datos
- Datos imperfectos: valores perdidos, ruido
- Reducción de datos: selección de instancias, selección de características, discretización
- Secuenciación de técnicas de preparación de datos
- Aplicaciones
Tema 6: Clustering
- Medidas de distancia y similaridad
- Tipos de clustering
- Métodos de particionamiento: k-means, Mean Shift, DBSCAN
- Medidas de rendimiento
- Métodos jerárquicos: aglomerativo y divisivo
- Aplicaciones en problemas reales: segmentación de clientes y productos
Tema 7: Patrones frecuentes y reglas de asociación
- Descubrimiento de asociaciones
- Algoritmos de reglas de asociación: Apriori, FP-Growth
- Medidas de interés
- Descubrimiento de subgrupos
- Aplicaciones en problemas reales: cesta de la compra, valoración de riesgo
Tema 8: Deep learning
- Red neuronal convolucional
- Auto-encoders
- Red generativa antagónica
- Aplicaciones en problemas reales: reconocimiento de imágenes, procesamiento del lenguaje natural, análisis de imágenes médicas
Tema 9: Problemas singulares
- Clasificación no balanceada
- Aprendizaje multi-etiqueta y multi-instancia
- Clasificación ordinal
- Aprendizaje semisupervisado
- Detección de anomalías
- Aplicaciones en problemas reales
Tema 10: Aprendizaje incremental y minería de flujo de datos
- Aprendizaje incremental vs. flujo de datos
- Concept drift
- Árbol Hoeffding
- Clustering incremental
- Patrones frecuentes en flujo de datos
- Aplicaciones en problemas reales: monitorización de uso del móvil, análisis relacional en EEG
Tema 11: Big data
- ¿Qué es big data?
- Modelos de programación MapReduce: Hadoop y Spark
- Big Data Analytics: Mahout, MLlib, H2O
- Aplicaciones en problemas reales
Tema 12: Justicia (fairness) en aprendizaje automático
- Discriminación en aprendizaje automático
- Medidas de justicia
- Técnicas de mejora de la justicia: preprocesado, entrenamiento y postprocesado
- Líneas abiertas de investigación
Práctico
Seminarios
- Seminario 1: Introducción a KNIME
- Seminario 2: Problemas de clasificación. Aspectos prácticos.
- Seminario 3: Herramientas de visualización de datos.
- Seminario 4: Introducción a Python y scikit-learn
- Seminario 5: Problemas de segmentación y asociación. Aspectos prácticos
- Seminario 6: Problemas de preprocesamiento de datos. Aspectos prácticos.
- Seminario 7: Problemas de escalabilidad de datos. Aspectos prácticos.
Prácticas
- Práctica 1: Resolución de problemas de clasificación y preprocesado básico. Visualización. Análisis experimental comparado
- Práctica 2: Resolución de problemas de aprendizaje no supervisado mediante agrupamiento y/o asociación. Visualización
- Práctica 3: Competición en Kaggle o DrivenData con clasificación/regresión y preprocesamiento avanzado
Bibliografía
Bibliografía fundamental
- Larissa T. Moss, Saku Atre. Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support Application. Addison-Wesley Professional, 2003.
- Ramesh Sharda, Dursun Delen, Efraim Turban. Business Intelligence, Analytics, and Data Science: A Managerial Perspective. Pearson, 2017.
- Wayne W. Eckerson. Performance Dashboards: Measuring, Monitoring, and Managing Your Business. Wiley, 2011.
- Nathan Yau. Data Points: Visualization that Means Something. Wiley, 2013.
- Gordon S. Linoff, Michael J. Berry. Data Mining Techniques: for Marketing, Sales and Customer Relationship Management. John Wiley & Sons, 2011.
- Charu C. Aggarwal. Data Mining: The Textbook. Springer, 2015.
- Jiawei Han, Micheline Kamber, Jian Pei. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2012.
- Salvador García, Julián Luengo, Francisco Herrera. Data Preprocessing in Data Mining. Springer, 2015.
- Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning. MIT Press, 2016.
- Albert Bifet, Ricard Gavaldà, Geoff Holmes, Bernhard Pfahringer. Machine Learning for Data Streams. MIT Press, 2018
- Michael Minelli, Michele Chambers, Ambiga Dhiraj. Big Data, Big Analytics: Emerging Business Intelligence and Analytic Trends for Today's Businesses. John Wiley & Sons, 2013.
Bibliografía complementaria
- Ian H. Witten, Eibe Frank, Mark A.Hall. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, 2016
- José Hernández Orallo, M. José Ramírez Quintana, Cèsar Ferri Ramírez. Introducción a la Minería de Datos. Pearson Educación, 2004.
- Jake VanderPlas. Python Data Science Handbook: Essential Tools for Working with Data. O'Reilly, 2016
Enlaces recomendados
Blogs y tutoriales:
- Python Data Science Handbook
- BzST
- Plural Sight
- Kaggle
- Jorge Casillas (vídeos) https://ccia.ugr.es/~casillas/videos.html
Software:
Metodología docente
- MD01. Lección Magistral (Clases Teóricas-Expositivas)
- MD02. Actividades Prácticas (Resolución de Problemas, Resolución de Casos Prácticos, Desarrollo de Proyectos, Prácticas en Laboratorio, Taller de Programación, Aula de Informática, Prácticas de Campo).
- MD03. Seminarios (Debates, Demos, Exposición de Trabajos Tutelados, Conferencias, Visitas Guiadas, Monografías).
- MD04. Actividades no presenciales Individuales.
- MD05. Actividades no presenciales Grupales.
- MD06. Tutorías Académicas.
Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final)
Evaluación Ordinaria
Con objeto de evaluar la adquisición de los contenidos y competencias a desarrollar en la asignatura, se utilizará un sistema de evaluación diversificado, seleccionando las técnicas de evaluación más adecuadas en cada momento, que permita poner de manifiesto los diferentes conocimientos y capacidades adquiridos por el alumnado. De entre las técnicas evaluativas a aplicar se utilizarán alguna o algunas de las siguientes:
- Pruebas escritas: exámenes de desarrollo, exámenes de tipo test, resolución de problemas, casos o supuestos, pruebas de respuesta breve, informes y diarios de clase, trabajos periódicos escritos.
- Pruebas orales: exposición oral de trabajos en clase, individuales o en grupo, sobre contenidos de la asignatura (seminario) y sobre ejecución de tareas prácticas correspondientes a competencias concretas.
- Pruebas en los laboratorios de prácticas: elaboración y defensa de supuestos prácticos en el laboratorio de informática.
- Técnicas basadas en la asistencia y participación activa del alumno en clase, seminarios, tutorías y en el desarrollo y defensa de los trabajos en grupo.
El sistema de calificaciones se expresará mediante calificación numérica de acuerdo con lo establecido en el art. 5 del R.D. 1125/2003, de 5 de septiembre, por el que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y validez en el territorio nacional. Todo lo relativo a la evaluación se regirá por la normativa vigente de la Universidad de Granada.
La calificación global responderá a la puntuación ponderada de los diferentes aspectos y actividades que integran el sistema de evaluación. Se aplicará la siguiente ponderación:
- Pruebas evaluativas escritas u orales dirigidas, principalmente, a la evaluación de competencias conceptuales: 50%. Se realizarán exámenes finales o parciales y entregas de ejercicios sobre el desarrollo y los resultados de las actividades propuestas.
- Actividades y trabajos individuales del alumno/a encaminados a la evaluación, principalmente, de competencias procedimentales y actitudinales: 50%. Se realizarán prácticas de laboratorio, resolución de problemas y desarrollo de proyectos (individuales o en grupo), y se valorarán las entregas de los informes/memorias realizados por el alumnado.
La evaluación de la adquisición de las competencias básicas y transversales está presente, implícitamente, en la realización de las diferentes pruebas evaluativas.
El resultado de la evaluación será una calificación numérica obtenida mediante la suma ponderada de las calificaciones correspondientes a la parte teórica (50%) y la parte práctica (50%). Para poder superar la asignatura será necesario obtener una nota final igual o superior a 5 puntos, habiendo obtenido al menos 2 puntos (sobre 5) en la parte de teoría y 2 puntos (sobre 5) en la parte de prácticas.
Evaluación Extraordinaria
El examen extraordinario (evaluado de 0 a 10), tendrá 2 partes: parte teórica y práctica (evaluadas de 0 a 5 cada una). Incluirá cuestiones de índole teóricas y problemas de índole práctica (puede plantearse que se resuelvan utilizando un ordenador o por escrito). Para aprobar la asignatura será necesario obtener al menos 2 puntos (sobre 5) en la parte de teoría y 2 puntos (sobre 5) en la parte de prácticas. No obstante, el alumno o alumna podrá optar por conservar la calificación de prácticas obtenida en la convocatoria ordinaria del mismo curso en caso de haber superado esa parte; no necesitando, por tanto, ser evaluado/a de las prácticas en la convocatoria extraordinaria.
Evaluación única final
De acuerdo a lo establecido en la Normativa de evaluación y de calificación de los estudiantes de la Universidad de Granada aprobada en Consejo de Gobierno de 20 de mayo de 2013 (NCG71/2), la evaluación será preferentemente continua. No obstante, el estudiante que no pueda acogerse a dicho sistema por motivos laborales, estado de salud, discapacidad o cualquier otra causa debidamente justificada podrá acogerse a la evaluación única final. Para ello deberá solicitarlo al Director del Departamento en las dos primeras semanas de impartición de la asignatura o, excepcionalmente, en las dos primeras semanas tras la matriculación en la asignatura (NCG78/9: Instrucción relativa a la aplicación del artículo 8.2).
La evaluación única final se realizará en un solo acto académico el día de la convocatoria oficial de examen para la asignatura. La prueba, que será evaluada de 0 a 10. Tendrá dos partes, parte teórica y parte práctica, que se evaluarán con hasta 5 puntos cada una. Incluirá cuestiones de índole teóricas y problemas de índole práctica (puede plantearse que se resuelvan utilizando un ordenador). Las dos partes garantizarán que el alumno ha adquirido la totalidad de las competencias descritas en la presente guía docente. Para poder superar la asignatura será necesario obtener una nota final igual o superior a 5 puntos, habiendo obtenido al menos 2 puntos (sobre 5) en la parte de teoría y 2 puntos (sobre 5) en la parte de prácticas.
Información adicional
- La asistencia a las clases teóricas y prácticas no será obligatoria.
- Más información en el Departamento de Ciencias de la Computación e Inteligencia Artificial.