Este Curso de Doctorado se encuentra incluido en el Programa Interdepartamental de Doctorado
Índice
Justificación de su inclusión en el programa
Los métodos de clasificación de información juegan un importante papel en problemas que surgen en el campo de las Ciencias de la Biblioteconomía y Documentación. Por ejemplo, en tales disciplinas, la clasificación de información tiene una influencia destacada a la hora de optimizar los procesos de recuperación de información, siendo ésto uno de los fines últimos de la clasificación de la información. Además, las técnicas de clasificación proporcionan las herramientas básicas para abordar algunos de los problemas que se presentan en el análisis de la circulación de información, en el que el problema de la co-citación constituye un caso particular.
El presente curso pretende presentar y analizar el problema de la clasificación de información desde el punto de vista de la Estadística y del Análisis de Datos, con objeto de proporcionar una alternativa cuantitativa para dicho problema en las Ciencias de la Biblioteconomía y Documentación.
Breve descripción del contenido del curso
Introducción al Análisis Multivariante. Descripción multivariable de problemas en Biblioteconomía y Documentación. El problema de la clasificación de información.
Análisis de Tablas de contingencia: independencia y asociación.
Técnicas estadísticas de reducción de dimensión con variables cuantitativas y cualitativas: Análisis de componentes principales, Análisis de coordenadas principales, Análisis factorial de correspondencias.
Técnicas de clasificación estadística de información: Análisis Cluster y Análisis discriminante.
Análisis de la circulación de información: co-citación.
Ana M. Aguilera del Pino
Departamento de Estadística e Investigación Operativa
Facultad de Ciencias
Universidad de Granada
Francisco A. Ocaña Lara
(Coordinador)
Departamento de Estadística e Investigación Operativa
Facultad de Biblioteconomía y Documentación
Universidad de Granada
El presente curso consta de 4 créditos (40 horas) que se impartirán a lo largo de los siguientes días:
Mes | Días | Aula | Horario |
---|---|---|---|
Abril | 18, 20 y 22 | Seminario 3 | 17h a 21h |
Abril | del 25 al 29 | Seminario 3 | 17h a 21h |
Introducción al Análisis Multivariante.
Regresión y correlación lineal múltiple.
Análisis de datos cualitativos.
Análisis en componentes principales (ACP).
Análisis factorial
Análisis de proximidades (Multidimensional scaling).
Análisis Cluster
Agirre, K. Fz., Piris, J.M. y Tussell, F. (1991). An analysis of citations in statistical journal, en: Proceedings of the 5th International Symposium on Applied Stochastic Models and Data Analysis (Gutiérrez, R. y Valderrama, M.J., eds.), World Scientific, Singapur.
Agresti, A. (1996). An introduction to categorical data analysis, Nueva York: Willey & Sons.
Aguilera, A.M. (2001). Tablas de contingencia bidimensionales, Colección Cuadernos de Estadística, Madrid: La Muralla-Hespérides.
Alt, M. (1990). Exploring hyperspace: A non mathematical explanation of multivariate analysis, Londres: McGraw Hill.
Cuadras, C.M. (1991). Métodos de análisis multivariante, Barcelona: PPU.
Egghe, L. y Rousseau, R. (1990). Quantitative methods in Library, Documentation and Information Science, Amsterdam: Elsevier.
Gnanadesikan, R. (1997). Methods for statistical data analysis of multivariate observations, Nueva York: John Wiley & Sons.
Greenacre, M.J. (1984). Theory and applications of Correspondence Analysis, Londres: Academic Press.
Ruiz-Maya, L., Martín-Riego, F.J., Montero, J.M. y Uriz-Tomé, P. (1995). Análisis estadístico de encuestas: datos cualitativos, Madrid: AC.
Sánchez Carrión, J.J. (1984). Introducción a las técnicas de Análisis Multivariable aplicadas a las Ciencias Sociales, Madrid: Centro de Investigaciones Sociológicas.
Stigler, S.M. (1994), "Citations patterns in the journals of statistics and probability", Statistical Science, 9(1), 94-108.
Valderrama, M.J., Aguilera, A.M. y Ocaña, F.A. (2000). Predicción Dinámica mediante Análisis de Datos Funcionales, Colección Cuadernos de Estadística, Madrid: La Muralla-Hespérides.
Estadística de Bibliotecas 1994. Instituto Nacional de Estadística (INE), Madrid, 1996.
García-Caro, Concepción. Aplicación del método ARL para la evaluación del sistema de bibliotecas universitarias REBIUN y de sus servicios (1997-2001): el caso del préstamo interbibliotecario. Universidad de Granada, Departamento de Biblioteconomía y Documentación, 2003. Director: Félix Moya-Anegón
The european report on science and technology indicators 1994. Office for Official Publications of the European Communities, Bruselas, Luxemburgo, 1994.
A continuación aparecen los ficheros de los artículos que serán comentados a lo largo de este curso. Cada alumno debe preparse el que tiene asignado y leer el resto de los trabajos que están asignados sus compañeros. Los ficheros estarán en esta web tan sólo esta semana. Cada artículo será expuesto por la persona a la que ha sido asignado, tras su exposición se abrirá un turno de preguntas sobre el mismo entre todos los alumnos, quedando la labor crítica del artículo a un alumno que será designado tras la exposición.
Para la exposición de trabajos, el alumno podrá utilizar PowerPoint, transparencias o cualquier otro medio que considere oportuno. Los trabajos serán expuestos en el mismo orden que aquí aparece, pero no necesariamente en el mismo día. Para cada uno de ellos, se especifica una fecha tentativa para su exposición.
Liao, Z. y Cheung M.T. (2001).
"Internet-based e-shopping and consumer attitudes: an empirical study",
Information & Management, 38.
Ponente: José Antonio Reyes
Fecha: 25-4-2005.
Liu, C. y Arnett, K.P. (2000).
"Exploring the factors associated with Web site success
in the context of electronic commerce",
Information & Management, 38.
Ponente: Björn Jürgens
Ranganathan, C. y Ganapathy, S. (2002).
"Key dimensions of business-to-consumer web sites",
Information & Management, 39.
Ponente: Jerónimo Nsue
Aladwani, A.M. y Palvia, P.C. (2002).
"Developing and validating an instrument for measuring
user-perceived web quality",
Information & Management, 39.
Ponente: Carmen López
Cada alumno deberá preparar la exposición del artículo que ha sido asignado. Para más detalles, ir a la sección de material
Cada alumno deberá almacenar en un fichero SPSS una matriz de datos con datos reales relativos al área de la Documentación que él desee. Asimismo, en un documento aparte (Word o fichero de texto), explicar de donde ha obtenido los datos, describiendo su procedencia y su naturaleza. En dicho documento, incluir tambien la definición de las variables consideradas en la matriz de datos almacenada.
Introducción al Análisis Multivariante (AM): ¿para qué necesitamos el AM?. Elaboración de un diagrama de dispersión en Excel. Elementos básicos del AM: matriz de datos, vector de medias y matriz de covarianzas. Presentación del Problema I: una descripción de la situación de las bibliotecas en las CC.AA. en España. Introducción a SPSS. Introducción de datos en SPSS: introducción de datos desde el teclado, importación de ficheros de texto y definición de variables.
Resolución de algunas dudas en la elaboración con SPSS de los ficheros de datos propuestos por los alumnos. El problema de la regresión lineal simple. El módulo de regresión lineal con SPSS.
Regresión lineal múltiple. Interpretación del modelo. Estimación y diagnóstico del modelo. Regresión lineal con SPSS. Introducción al Análisis en Componentes Principales (ACP).
Análisis en componentes principales. Descomposición de la varianza. Distancia euclídea y distancia estadística (Mahalanobis): ventajas e inconvenientes. Comportamiento de las distancias en el ACP. Realización del ACP con SPSS. Utilidad del ACP
Variables categóricas: definición y clasificación. Tablas de contingencia bidimensionales: distribución de frecuencias observadas y esperadas. Independencia poblacional y muestral. Test chi-cuadrado de Pearson de independencia. Medidas de asociación basadas en el estadístico chi-cuadrado. Medida gamma de Goodman y Kruskall para una tabla ordinal-ordinal. Resolución de ejercicios con SPSS.
Francisco A. Ocaña Lara