Guía docente de Ciencia y Minería de Datos (21411A3)
Grado
Rama
Módulo
Materia
Curso
Semestre
Créditos
Tipo
Profesorado
Teórico
Práctico
Tutorías
Óscar Cordón García
Ver email- Primer semestre
- Lunes de 11:00 a 14:00 (Soc1 (Fcpys))
- Miércoles de 11:00 a 14:00 (D01 (Etsiit))
- Segundo semestre
- Jueves de 08:30 a 14:30 (D01 (Etsiit))
Prerrequisitos y/o Recomendaciones
- No es necesario que el estudiantado tenga aprobadas asignaturas, materias o módulos previos como requisito indispensable para cursar esta asignatura.
- La asignatura tiene un perfil técnico. Aunque las explicaciones serán de bajo nivel y se centrarán más en técnicas algorítmicas y la comprensión de su utilidad práctica para la resolución de la tarea de Ciencia de Datos en Sociología a resolver, se requiere una mínima base matemática para su adecuada comprensión.
- Tanto las clases de teoría como las de prácticas se impartirán en aula de teoría, haciendo uso de ordenadores portátiles. Todas las prácticas harán uso de software libre. Esto permite dinamizar la docencia y proporciona autonomía al estudiantado para la realización de los trabajos prácticos.
- Alternativamente, los/las estudiantes sin portátil pueden contactar con Secretaría del Centro para el Servicio de Préstamo o hacer uso de PoliSocioLAB (los laboratorios de la Facultad de Ciencias Políticas y Sociología), que agrupa el Laboratorio de Estudios Cuantitativos (SPSS, R, Visual QSL, Bellview Cati, Phyton...), el Laboratorio de Estudios Cualitativos y Análisis Multimedia (NVIVO, QDA miner liter...), y el Laboratorio de Radio. En concreto, los ordenadores del Laboratorio de Estudios Cuantitativos tienen instalado el software que emplearemos en las prácticas de la asignatura.
Breve descripción de contenidos (Según memoria de verificación del Grado)
- Introducción a la minería de datos en Sociología. Localización y recopilación de datos: organismos, fuentes y bases de datos.
- Filtrado y transformación de datos.
- Análisis estadístico de datos, software y visualización.
- Técnicas de minería de datos. El proceso de extracción de conocimiento. Clasificación, clustering y regresión.
- Minería de datos no convencionales.
- Aplicación práctica de la minería de datos en el dominio de la Sociología.
Competencias
General competences
- CG01. Capacidad de análisis y síntesis
- CG02. Capacidad de organización y planificación
- CG03. Habilidades informática relativas al ámbito de estudio
- CG04. Capacidad de gestión de información
- CG05. Saber resolver problemas
- CG06. Capacidad para la toma de decisiones
- CG07. Capacidad para comunicar resultados y conocimientos
- CG12. Compromiso ético
- CG13. Compromiso con la igualdad de género
- CG14. Compromiso con el respeto a los derechos humanos y la no discriminación
- CG15. Capacidad de aprendizaje autónomo
- CG16. Capacidad para adaptarse a situaciones nuevas
- CG17. Capacidades para desarrollar trabajos creativos
- CG19. Capacidades de iniciativa y espíritu emprendedor
- CG20. Motivación por la calidad y el conocimiento
- CG23. Habilidades para contextualizar e identificar actores clave
- CG24. Capacidades en reconocer la complejidad de los fenómenos sociales
- CG25. Capacidades para relacionar los conocimientos de la Sociología con otras disciplinas afines
Competencias Específicas
- CE03. Conocimiento de los conceptos y de las técnicas estadísticas aplicadas a la sociedad humana.
- CE04. Conocimiento de la metodología de las ciencias sociales y de sus técnicas básicas y avanzadas (cuantitativas y cualitativas) de investigación social; con especial atención a los aspectos de muestreo y de los programas informáticos de aplicación.
- CE13. Habilidades para plantear y desarrollar una investigación aplicada en las diferentes áreas de la sociedad.
- CE14. Habilidades en la búsqueda de información secundaria en las diferentes fuentes (instituciones oficiales, bibliotecas, internet, etc.).
- CE15. Habilidades técnicas para la producción y el análisis de los datos cuantitativos y cualitativos (interpretar y construir figuras, tablas, gráficos así como redactar informes, etc.).
- CE16. Capacidades en elaborar, utilizar e interpretar indicadores sociales e instrumentos de medición social.
- CE17. Habilidades para aplicar técnicas de muestreo y de trabajo de campo.
- CE18. Saber elegir las técnicas de investigación social (cuantitativas y cualitativas) pertinentes en cada momento.
- CE20. Capacidades en reconocer la complejidad de los fenómenos sociales.
- CE30. Capacidades en adecuar los objetivos a los recursos económicos, temporales y humanos.
- CE32. Habilidades en el desarrollo de las organizaciones: asesoramiento, diseño y gestión de organizaciones e instituciones.
- CE33. Habilidades para la evaluación y realización de estudios de calidad y satisfacción.
- CE35. Actitud crítica frente a las doctrinas y las prácticas sociales.
- CE36. Actitudes de ética profesional.
- CE37. Actitud de compromiso frente a los problemas sociales y culturales.
Resultados de aprendizaje (Objetivos)
- Comprender el concepto de la ciencia y minería de datos, la ciencia de Redes y el Aprendizaje Automático en Inteligencia Artificial, y su papel en los procesos de extracción de conocimiento y Minería de Medios Sociales en el área de la Sociología.
- Conocer los fundamentos de la Minería de Medios Sociales, basada en el empleo de técnicas de Ciencia de Datos para extraer conocimiento útil (patrones significativos) a partir de datos no convencionales (no estructurados, con una dimensión masiva, ruidosos y con una naturaleza dinámica, instantánea y multimedia) provenientes de actividades sociales humanas en medios sociales.
- Aprender cómo el estudio de las redes puede revelar aspectos interesantes acerca de las conexiones existentes en distintos tipos de sistemas complejos (sociales, políticos, económicos, tecnológicos, biológicos,...) y en particular ayudar a estudiar y optimizar el comportamiento humano mediante investigación colaborativa entre las ciencias sociales y la computación.
- Conocer problemas prácticos en diferentes disciplinas científicas que han podido resolverse gracias a distintos modelos de redes sociales.
- Conocer los aspectos fundamentales del análisis de redes sociales, concretamente, las distintas medidas de centralidad para determinar la importancia de los actores de la red.
- Comprender el funcionamiento de los algoritmos de poda y visualización de redes sociales.
- Entender la formación y evolución de comunidades en redes sociales y redes sociales online. Aprender el funcionamiento de los métodos empleados para detectar dichas comunidades de forma automática.
- Conocer los fundamentos y la problemática asociada a la minería de opiniones y sentimientos, así como las técnicas fundamentales para desarrollarla.
- Aprender cómo se extienden infecciones, opiniones, rumores, memes y modas en una red (es decir, estudiar problemas de difusión de información en redes sociales).
Programa de contenidos Teóricos y Prácticos
Teórico
- Tema 1. Introducción a la Minería de Medios Sociales y la Ciencia de Redes. Aplicaciones.
- Tema 2. Aspectos Básicos de las Redes Sociales.
- Tema 3. Propiedades Estructurales y Análisis General de Redes Sociales.
- Tema 4. Análisis de Redes Sociales. Centralidad.
- Tema 5. Poda y Visualización de Redes Sociales.
- Tema 6. Detección de Comunidades.
- Tema 7. Ciencia y Minería de Datos. Minería de Opiniones y Análisis de Sentimientos.
- Tema 8. Procesos de Contagio, Difusión de Información y Formación de Opiniones.
Práctico
TEMARIO PRÁCTICO
- Práctica 1. Análisis preliminar y visualización básica de una red social con Gephi.
- Práctica 2. Análisis de centralidad de una red social con Gephi.
- Práctica 3. Detección y visualización de comunidades con Gephi.
- Práctica 4. Análisis de sentimientos en Reddit.
SEMINARIOS
- Seminario 1. Instalación de Gephi.
- Seminario 2. Introducción al análisis de redes sociales con Gephi.
- Seminario 3. Formatos de ficheros de redes sociales.
- Seminario 4. Análisis de centralidad con Gephi.
- Seminario 5. Poda y visualización de redes en Gephi.
- Seminario 6. Detección y visualización de comunidades con Gephi.
- Seminario 7. Herramientas software para análisis de sentimientos.
Bibliografía
Bibliografía fundamental
- Albert-Laszlo Barabasi: “Network Science”. Cambridge University Press, 2016. ISBN: 9781107076266. Interactive Book Project, http://networksciencebook.com/
- Stanley Wasserman & Katherine Faust: “Social Network Analysis. Methods and Applications”, Cambridge University Press, 1994. ISBN 9780521387071.
- Reza Zafarani, Mohammad Ali Abbasi, Huan Liu: “Social Media Mining. An Introduction”. Cambridge University Press, 2014. ISBN: 9781107018853. http://www.socialmediamining.info/
- Bing Liu: “Sentiment Analysis. Mining Opinions, Sentiments, and Emotions”. Cambridge University Press, 2015. ISBN: 9781139084789.
- José Hernández Orallo, Mª. José Ramírez Quintana, César Ferri Ramírez: “Introducción a la Minería de Datos”. Pearson, 2004. ISBN: 8420540919.
Bibliografía complementaria
- Mark Newman: “Networks: An introduction”, Oxford, 2010. ISBN: 0199206651.
- Chaomei Chen: “Information Visualization: Beyond the Horizon”, Springer, 2004. ISBN 9781852337896.
- David Easley & Jon Kleinberg: “Networks, Crowds, and Markets: Reasoning About a Highly Connected World”, Cambridge University Press, 2010. ISBN: 9780521195331
- Mark Newman, Albert-Laszlo Barabasi, Duncan J. Watts (Eds.): “The Structure and Dynamics of Networks”, Princeton University Press, 2006. ISBN: 9780691113579.
- Derek Hansen, Ben Shneiderman: “Analyzing Social Media Networks with NodeXL: Insights from a Connected World”, Morgan Kaufmann, 2010. ISBN: 9780123822291.
- Herbert Jones: “Ciencia de los datos: La guía definitiva sobre análisis de datos, minería de datos, almacenamiento de datos, visualización de datos, Big Data para empresas y aprendizaje automático para principiantes”. Independently published, 2019. ISBN: 9781090802965.
Enlaces recomendados
Sobre Análisis de Redes Sociales:
- Página web del Barabasi Lab, Northeastern University: http://barabasilab.com/
- Libro electrónico “Network Science Interactive Book Project”: http://networksciencebook.com/
- Web de Mark Newman, University of Michigan: http://www-personal.umich.edu/~mejn/
- Web de Réka Albert, Pennsylvania State University: https://www.ralbert.me/
Sobre Minería de Medios Sociales:
- MIT Laboratory for Social Machines: http://socialmachines.media.mit.edu/
- Stanford Network Analysis Project: http://snap.stanford.edu/
Sobre Minería de Datos:
- Portal web KDnuggets: http://www.kdnuggets.com/
Sobre Visualización de Información:
- Portal web “InfoVis Cyberinfrastructure”: https://iv.cns.iu.edu/
- Curso “Information Visualization”, Indiana University: https://ivmooc.cns.iu.edu/
- Web de Chaomei Chen, Drexel University: http://cluster.cis.drexel.edu/~cchen/
- Página web del grupo “SCImago”, CSIC-Universidad de Granada-UC3M: http://www.scimagolab.com/
Metodología docente
- MD01. Lección magistral/expositiva
- MD02. Sesiones de discusión y debate
- MD03. Resolución de problemas y estudio de casos prácticos
- MD06. Prácticas en sala de informática
- MD07. Seminarios
- MD08. Ejercicios de simulación
- MD09. Análisis de fuentes y documentos
- MD10. Realización de trabajos en grupo
- MD11. Realización de trabajos individuales
Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final)
Evaluación Ordinaria
Todo lo relativo a la evaluación se regirá por la Normativa de Evaluación y Calificación de los Estudiantes vigente en la Universidad de Granada, aprobada en Consejo de Gobierno de 20 de mayo de 2013 (NCG71/2), que puede consultarse en: https://www.ugr.es/universidad/normativa/texto-consolidado-normativa-evaluacioncalificacion- estudiantes-universidad-granada. La evaluación será preferentemente continua siguiendo el artículo 7 de dicha normativa.
La adaptación del sistema de evaluación general propuesto a las características de esta asignatura, con indicación explícita del peso de la evaluación continua de cada actividad formativa, se ajustará a lo indicado en la siguiente tabla para la convocatoria ordinaria:
Actividades Formativas | Ponderación |
---|---|
Parte Teórica | 40.00% |
Parte Práctica | 50.00% |
Otros (Trabajo autónomo, seminarios, ...) | 10.00% |
Más detalladamente, se utilizarán de las siguientes técnicas de evaluación continua:
- Para la parte teórica se realizará un examen con múltiples cuestiones que incluirán varios problemas sobre los contenidos teóricos de la asignatura. No se incluirán cuestiones teóricas. La ponderación de este bloque será del 40%.
- Para la parte práctica se realizarán trabajos prácticos usando el ordenador, resolución de problemas y desarrollo de proyectos colaborativos, y se valorarán las entregas de los informes/memorias realizados por los/las estudiantes o, en su caso las entrevistas personales con ellos/ellas y las sesiones de evaluación. En concreto, se considerará un proyecto práctico compuesto por cuatro partes. Este proyecto se realizará por parejas. La ponderación de este bloque será del 50%.
- La parte de trabajo autónomo y los seminarios se evaluarán teniendo en cuenta la asistencia a los seminarios y los problemas propuestos que hayan sido resueltos y entregados por los/las estudiantes. La ponderación de este bloque será del 10%. Para este apartado también será posible considerar las actividades que el estudiantado desarrolle en el marco del Programa de Educación Abierta de la Facultad de Ciencias Políticas y Sociología siempre que tengan relación, al menos parcial, con el temario de la asignatura.
La calificación global en la convocatoria ordinaria corresponderá, por tanto, a la puntuación ponderada de los diferentes aspectos y actividades que integran el sistema de evaluación. Así, el resultado de la evaluación será una calificación numérica obtenida mediante la suma ponderada de las calificaciones correspondientes a una parte teórica, una parte práctica y, en su caso, una parte relacionada con el trabajo autónomo de los/las estudiantes, los seminarios impartidos y el aprendizaje basado en proyectos. Para poder superar cada una de las partes y que sea posible realizar dicha suma, hay que obtener en cada parte al menos un 1 (del total de 4 o 5 puntos alcanzables). Si no se supera una parte, el/la estudiante debe presentarse a la prueba de la convocatoria extraordinaria correspondiente a dicha parte. La nota obtenida en la parte superada se guarda para la convocatoria extraordinaria. En el caso en que, aun no superando una parte, la nota sumada fuera igual o superior a 5, la calificación que constaría en acta en la convocatoria ordinaria sería Suspenso (4).
Evaluación Extraordinaria
En el caso de la convocatoria extraordinaria, la evaluación se realizará mediante un único examen escrito, con una parte relacionada con la teoría (50%) y otra con las prácticas (50%). El/la estudiante podrá optar por mantener la calificación correspondiente a la parte superada (teoría o prácticas) obtenida en la convocatoria ordinaria. Se entenderá que dicha parte está superada siempre que alcance la calificación de 5 puntos sobre 10 en la parte correspondiente.
En cualquier caso, el sistema de calificaciones se expresará mediante calificación numérica de acuerdo con lo establecido en el art. 5 del R. D 1125/2003, de 5 de septiembre, por el que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y validez en el territorio nacional.
Evaluación única final
El estudiante que no pueda acogerse al sistema de evaluación continua por motivos laborales, estado de salud, discapacidad o cualquier otra causa debidamente justificada podrá acogerse a la evaluación única final. Para ello deberá solicitarlo al Director del Departamento o al Coordinador del Grado en las dos primeras semanas de impartición de la asignatura o, excepcionalmente, en las dos primeras semanas tras la matriculación en la asignatura (NCG78/9: Instrucción relativa a la aplicación del artículo 8.2 de la Normativa de evaluación y calificación de los estudiantes de la Universidad de Granada ya comentada). Esta modalidad de evaluación se realizará en un único acto académico y consistirá en una prueba realizada el día de la convocatoria oficial. Dicha prueba incluirá cuestiones tanto de tipo teórico, correspondientes al 50% de la nota, como práctico, correspondientes al otro 50%, que garanticen que el/la estudiante ha adquirido la totalidad de las competencias descritas en esta guía docente.
Información adicional
- Durante la impartición de la asignatura se usarán distintos ejemplos cotidianos de sistemas sociales para facilitar la adquisición de los conceptos estudiados. En algunos casos, esos ejemplos son estereotipos de personajes relevantes en sistemas sociales como películas, celebrities, influencers, whatsapps o tuits muy conocidos en el pasado o en el momento actual, etc. El uso de esos ejemplos es únicamente didáctico, como ejemplos paradigmáticos de las técnicas de análisis de redes estudiadas, y no implica que el profesor esté de acuerdo con el contenido de los mismos ni con la naturaleza de los estereotipos considerados, ni con la opinión vertida por las personas o personajes implicados en los mismos.
- Los contenidos y competencias adquiridos en esta asignatura tienen una relación directa con un perfil profesional muy reciente y que muestra un interés creciente en el mercado laboral para el estudiantado que disponga de un Grado en Sociología, el de Sociólogo/a Computacional, integrado por profesionales de la Sociología con un perfil híbrido con la Ciencia de Datos. Este tipo de profesionales están orientados al análisis del comportamiento humano haciendo uso de métodos computacionales avanzados.
- Se recuerda que la Universidad de Granada dispone de un Protocolo para prevenir, evitar y afrontar las posibles situaciones de acoso de cualquier tipo, disponible en: https://www.ugr.es/sites/default/files/2017-09/NCG1125.pdf.
- Siguiendo las recomendaciones de la CRUE y del Secretariado de Inclusión y Diversidad de la UGR, los sistemas de adquisición y de evaluación de competencias recogidos en esta Guía Docente se aplicarán conforme al principio de diseño para todas las personas, facilitando el aprendizaje y la demostración de conocimientos de acuerdo a las necesidades y la diversidad funcional del alumnado.