Fundamentos de Clasificación Estadística de Información Científica

Curso 2004-2005

Este Curso de Doctorado se encuentra incluido en el Programa Interdepartamental de Doctorado

Información Científica: Tratamiento, Acceso y Evaluación (910/3)
(Certificado como Doctorado de Calidad 2004-2005, Agencia Nacional de Evaluación y Calidad)
de los Departamentos de Biblioteconomía y Documentación y de Estadística e Investigación Operativa, en ambos casos de la Universidad de Granada.


Índice


Justificación de su inclusión en el programa

Los métodos de clasificación de información juegan un importante papel en problemas que surgen en el campo de las Ciencias de la Biblioteconomía y Documentación. Por ejemplo, en tales disciplinas, la clasificación de información tiene una influencia destacada a la hora de optimizar los procesos de recuperación de información, siendo ésto uno de los fines últimos de la clasificación de la información. Además, las técnicas de clasificación proporcionan las herramientas básicas para abordar algunos de los problemas que se presentan en el análisis de la circulación de información, en el que el problema de la co-citación constituye un caso particular.

El presente curso pretende presentar y analizar el problema de la clasificación de información desde el punto de vista de la Estadística y del Análisis de Datos, con objeto de proporcionar una alternativa cuantitativa para dicho problema en las Ciencias de la Biblioteconomía y Documentación.


Breve descripción del contenido del curso


Profesores del curso


Horario

El presente curso consta de 4 créditos (40 horas) que se impartirán a lo largo de los siguientes días:

Mes Días Aula Horario
Abril 18, 20 y 22 Seminario 3 17h a 21h
Abril del 25 al 29 Seminario 3 17h a 21h


Temario


Bibliografía

Fuentes de datos


Material para el curso

Artículos:

A continuación aparecen los ficheros de los artículos que serán comentados a lo largo de este curso. Cada alumno debe preparse el que tiene asignado y leer el resto de los trabajos que están asignados sus compañeros. Los ficheros estarán en esta web tan sólo esta semana. Cada artículo será expuesto por la persona a la que ha sido asignado, tras su exposición se abrirá un turno de preguntas sobre el mismo entre todos los alumnos, quedando la labor crítica del artículo a un alumno que será designado tras la exposición.

Para la exposición de trabajos, el alumno podrá utilizar PowerPoint, transparencias o cualquier otro medio que considere oportuno. Los trabajos serán expuestos en el mismo orden que aquí aparece, pero no necesariamente en el mismo día. Para cada uno de ellos, se especifica una fecha tentativa para su exposición.

Datos cualitativos:
Resumen de técnicas de análisis de datos cualitativos (Ana M. Aguilera del Pino)

Análisis Factorial:
Esquema resumen de Análisis Factorial: Trasparencia 1 Trasparencia 2

bibio.txt
Fichero de datos con formato texto (MS-DOS) que contiene información sobre distintos indicadores relativos a Biblioteconomía para las distintas CCAA de España.

bibio.sav
Fichero de datos con formato SPSS que contiene la misma información que el anterior fichero de texto bibio.txt.

revidat.sav
Fichero de datos con formato SPSS que contiene información sobre citas recibidas y realizadas por revistas de Estadística y Probabilidad.

ARL03.xls
Datos proporcionados por la Profesora Concepción García-Caro, Dpto. de Biblioteconomía y Documentación, UGR. (para más información, pinche aquí)


Tareas del alumno


Cuaderno de bitácora

Sesión 18-4-05:

Introducción al Análisis Multivariante (AM): ¿para qué necesitamos el AM?. Elaboración de un diagrama de dispersión en Excel. Elementos básicos del AM: matriz de datos, vector de medias y matriz de covarianzas. Presentación del Problema I: una descripción de la situación de las bibliotecas en las CC.AA. en España. Introducción a SPSS. Introducción de datos en SPSS: introducción de datos desde el teclado, importación de ficheros de texto y definición de variables.

Sesión 20-4-05:

Resolución de algunas dudas en la elaboración con SPSS de los ficheros de datos propuestos por los alumnos. El problema de la regresión lineal simple. El módulo de regresión lineal con SPSS.

Sesión 22-4-05:

Regresión lineal múltiple. Interpretación del modelo. Estimación y diagnóstico del modelo. Regresión lineal con SPSS. Introducción al Análisis en Componentes Principales (ACP).

Sesión 25-4-05:

Análisis en componentes principales. Descomposición de la varianza. Distancia euclídea y distancia estadística (Mahalanobis): ventajas e inconvenientes. Comportamiento de las distancias en el ACP. Realización del ACP con SPSS. Utilidad del ACP

Sesión 26-4-05:

Variables categóricas: definición y clasificación. Tablas de contingencia bidimensionales: distribución de frecuencias observadas y esperadas. Independencia poblacional y muestral. Test chi-cuadrado de Pearson de independencia. Medidas de asociación basadas en el estadístico chi-cuadrado. Medida gamma de Goodman y Kruskall para una tabla ordinal-ordinal. Resolución de ejercicios con SPSS.


Francisco A. Ocaña Lara
Última actualización 19 de abril, 2005