Thinkepi
    Thinkepi


Anuario ThinkEPI


ISSN: 1886-6344

Referenciado en:

Dialnet
DICE
Latindex

Tablas de contenidos:

Anuario 2009
Anuario 2008
Anuario 2007

Formulario de pedido

Canales de difusión:




Suscripción a ThinkEPI



ThinkEPI en Facebook



ThinkEPI en Twitter





Add to Technorati Favorites



Enlaces patrocinadores:




Póliza seguro coche




Temporada actual:





Twitter y las (micro)arquitecturas de información social



Más sobre iSchools



Arquitectura de información y Diseño de interacción, dos disciplinas diferenciadas en el marco de la Experiencia de usuario



¿El año de las tabletas y los e-readers? Dispositivos de lectura para medios de comunicación



Biblioteca, aprendizaje y acceso a la información en medio del temporal tecnológico



Software para el acceso a la información. Situación del mercado en 2009



Sobre usabilidad y experiencia de uso



Los libros electrónicos: una realidad emergente



Archivos y software libre



Reflexiones y buenas prácticas sobre la presencia personal en la Web académica



Las bibliotecas escolares en España ante una nueva década: brotes verdes e incertidumbres



Gestores de referencias sociales: la información científica en el entorno 2.0



Del correo electrónico a la conversación dinámica, la comunicación como documento



Los recursos de información sobre cómics: la nueva base de datos especializada en Carlos Giménez (y II). Definición y alcance del proyecto



Los recursos de información sobre cómics: la nueva base de datos especializada en Carlos Giménez (I). Estado de la cuestión



RIA (Rich Internet Applications): la pluralidad del contenido



Primeros pasos hacia la gestión de datos de investigación en las universidades: la iniciativa DAF



El libro como excepción



Los servicios de publicaciones de las universidades en épocas de esplendor de la evaluación científica



Dr Paper & Mr Web



La revolución de internet y los paradigmas bibliotecarios emergentes: las bibliotecas digitales comerciales



Visibilidad y accesibilidad de las tesis de Documentación en España



Algunas reflexiones otoñales a propósito de la ‘infoxicación’



La acción de las bibliotecas públicas en tiempos de crisis



Compartir datos (data sharing) en ciencia: el contexto de una oportunidad



Biblioteca pública Sociedad Limitada



Las interfaces de usuario del mañana, hoy: ¿están siendo los dispositivos móviles el acicate necesario?



El vídeo en los cibermedios: algunas certezas y muchas dudas



Congresos españoles de biblioteconomía y documentación: de la inevitable fragmentación a la necesaria transversalidad



¿Qué nos aportan las redes sociales?



Implicaciones éticas de la minería de datos



Leyendo (y gestionando) blogs desde el móvil



Ranking de universidades en la Unión Europea: aproximación multidimensional a una realidad compleja



Repositorios digitales: un concepto, múltiples visiones



Academia y Ciencia colectiva



El debate de la formación universitaria en ByD: más allá de Bolonia



¿Por qué “Bolonia” en los estudios de Información y Documentación?



El fomento de la lectura en la biblioteca pública 2.0: una apuesta por la innovación y el riesgo



Revistas españolas en WoS



Google Scholar: ¿una herramienta para la evaluación de la Ciencia?



Rediseñando Google: Propuesta base para el desarrollo de un sistema operativo multimodal ubicuo




Buscador:




Archivos:






Presentación del Grupo Thinkepi Objetivos y áreas de actuación de Thinkepi Participantes del Grupo Calendario de textos Wiki del Grupo Notas ThinkEPI Anuario Enlaces de interés Buzón de sugerencias Menú en Thinkepi

Google Scholar: ¿una herramienta para la evaluación de la Ciencia?

Por Daniel Torres-Salinas, Rafael Ruiz-Pérez y Emilio Delgado-López-Cózar
19 March 2009

1. Introducción

En noviembre de 2004 Google, consciente de la gran penetración de su buscador entre la comunidad científica (Friend, 2006), lanzó Google Scholar (G-S). Su capacidad para ofrecer las citas que reciben las publicaciones pronto captó el interés tanto de los científicos como de la comunidad bibliométrica. Esta última, además, prestó una especial atención tratando de describir sus principales características, bien a favor (Harzing, 2008) o en contra (Jacso, 2008a, 2008b).

Una de sus características más celebradas es su cobertura, radicalmente diferente, a la de otras bases de datos, empleando conjuntamente fuentes de información que de otro modo debían consultarse de forma aislada, a saber: repositorios (ej: E-Lis), portales de revistas (ej: ACM Digital Library), bases de datos (ej: PubMed), Editores comerciales (ej: Springer), Sociedades Científicas (ej: American Physical Society), catálogos online de bibliotecas (ej: Dialnet), Institutos de investigación (ej: NIH), los propios productos de Google (ej: Google Books) y páginas webs institucionales de universidades, profesores y científicos.

Gracias al rastreo de cualquier sistema de información académico G-S localiza citas emitidas por documentos no cubiertos por otras bases de datos como pueden ser el caso de preprints, tesis, informes o libros, particularidad, esta última, especialmente útil para disciplinas como las Humanidades, Ciencias Sociales e Ingenierías. Además, por su vocación universal abarca todas las lenguas científicas.

Sin embargo, pese a las ventajas reseñadas, G-S presenta aún enormes lagunas para su uso sistemático como herramienta de evaluación científica. En esta nota tratamos de reseñar algunos de los problemas más importantes que nos podemos encontrar frente a los índices de citas como Web of Science (WoS) y Scopus.

2. Principales limitaciones de G-S como herramienta de evaluación científica

a) No todos los documentos indizados en G-S se pueden considerar académicos o sus contenidos han sido sometidos a revisión por expertos.

Debido al rastreo automático e indiscriminado de múltiples fuentes de información, muchos de los contenidos presentes en G-S distan mucho de ser académicos (Noruzi, 2005). De hecho, Google no aclara cuál es su concepto de “Scholar” por lo que se incluyen, entre sus resultados y los documentos citantes, guías de bibliotecas, bibliografías de asignaturas o documentos administrativos. Asimismo, aparecen mezcladas citas provenientes de revistas arbitradas con otras que no emplean ningún sistema de evaluación; y no tiene el mismo significado ser citado por un documento científico acreditado que por otro que no lo es.

Los indicadores bibliométricos, al medir el impacto científico, deben construirse sobre fuentes de acreditada solvencia. Hay que recordar por ejemplo que la WoS sólo contempla en su cobertura revistas científicas arbitradas que cumplen los estándares científicos con rigor.

b) Es un producto oscuro y poco transparente ya que no ofrece ninguna información sobre las fuentes que cubre o los acuerdos que alcanzan con editoriales comerciales.

Hemos de tener en cuenta que si las bases de datos son empleadas como herramienta de evaluación, es esencial saber cuál es el universo de revistas empleado y su distribución. Al respecto, la política de G-S es oscura al no ofrecer información de las editoriales con las que ha firmado acuerdos y mucho menos de las revistas que forman parte de su colección. Esta información es absolutamente fundamental si queremos conocer la validez de cualquier tipo de material científico (Bauer y Bakkalbasi, 2005). En el lado opuesto, tanto WoS como Scopus, para informar de su cobertura, ofrecen detallados Master List.

c) Cuando se trata de revistas científicas, G-S sigue presentando una cobertura disciplinar tan desigual como WoS y Scopus de las revistas de Ciencias Sociales y Humanidades.

Uno de los estudios que mejor refleja la cobertura de las revistas científicas por parte de G-S es el conducido por Neuhaus et. al. (2006), que chequea las revistas indizadas en 47 bases de datos de diversos campos. Este trabajo manifiesta que la cobertura de G-S de diferentes disciplinas no es homogénea: cubre el 10% de las revistas de Humanidades, el 39% de Ciencias Sociales, el 41% de Educación, el 52% de Economía y el 76% en Ciencia y Medicina. En este sentido no consigue resolver la proverbial mala cobertura de las Humanidades y las Ciencias Sociales de la WoS, situación, por otro lado, que tampoco resuelve Scopus.

d) G-S no soluciona el problema de la citación y, al igual que WoS y Scopus, presenta enormes lagunas en su cobertura.

Aunque diversos estudios manifiestan la solvencia de G-S para recuperar citas de publicaciones diferentes de las revistas científicas (Kousha y Thelwall, 2008), no consigue recuperar todas las citas que recibe una publicación, por lo que al igual que otras bases de datos sigue ofreciendo un retrato parcial.

Por ejemplo, Kousha y Thelwall (2007), sobre una muestra de 882 trabajos de diferentes áreas, muestra cómo G-S rescata 5.589 citas, mientras que la WoS recuperaba 4.184; G-S recuperaba 3.202 citas únicas, sin embargo no recuperaba 1.797 que eran exclusivas de WoS.

En un estudio similar (Meho y Yang, 2007), también se revelaba cómo G-S perdía el 40% de la citación de revistas científicas del WoS y Scopus. Estos estudios manifiestan G-S no ofrece una solución definitiva.

e) La interfaz de G-S es demasiado básica para las exigencias de consulta que requieren los estudios bibliométricos.

La interfaz de G-S apunta al minimalismo y la presentación de resultados es pobre, quedando restringida a los 1.000 primeros resultados sin posibilidad de ordenarlos. Asimismo, los campos de búsqueda se limitan tan solo a tres: autor, revista y año. La WoS, sin embargo, nos ofrece 12 y Scopus 17. Asimismo, estos dos productos tienen diversas opciones de filtrado de resultados (categorías, autores, etc.), pudiéndose obtener informes bibliométricos de los mismos como en el caso de los Citation Reports de WoS.

Convendría subrayar la ausencia en G-S de una opción específica de búsqueda para las citas como el Cited Reference Search o la posibilidad de búsquedas avanzadas de autores como el Author Search en Scopus o el Author Finder en WoS. Otras opciones como los historiales de búsqueda o la capacidad de exportar los resultados en diferentes formatos tampoco se contemplan en G-S.

f) Ausencia absoluta de normalización en los datos de G-S, como consecuencia de las variadas fuentes de información empleadas y el procesamiento automático de la información.

En líneas generales, podríamos definir G-S como un banco de datos tóxico. Su principal problema radica en que su herramienta de indización intenta detectar los campos que componen los documentos de forma automática, y no siempre funciona. Así, en ocasiones, se toman como autores de un trabajo elementos constitutivos del cuerpo del texto. Por ejemplo, si a través de la búsqueda avanzada introducimos como autor el texto “Introducción” nos devuelve un 7.160 trabajos; “Índice” nos da 4.320 y “Contenido” 6.180.

Otro problema es la absoluta ausencia de índices; así, no existe siquiera control del título de las revistas (ej: aparece tanto BMJ como British Medical Journal). También el campo de año de publicación provoca errores; una búsqueda para el período 2004-2008 nos devuelve 139.000 documentos; sin embargo, una búsqueda entre 2000-2008 reduce los documentos a 109.000.

Otro inconveniente es la presencia de trabajos duplicados. Si buscamos la producción en 2008 de “Lancet“, G-S nos devuelve 3.250 referencias, Scopus 1.653 y WoS 1.688; por tanto, se duplican los registros.

La consecuencia final de estas inconsistencias es un aumento enorme del coste en el tratamiento ya que el tiempo necesario para un estudio puede multiplicarse por 10 con G-S frente a WoS y Scopus (Lokman y Kiduk, 2007).

3. Consideración final

Efectivamente, en este trabajo hemos expuesto los problemas que nos podemos encontrar en G-S como herramienta bibliométrica. Sin embargo, con la exposición de estas limitaciones no queremos restarle valor como herramienta referencial, sobre todo para buscar publicaciones a texto completo y de forma gratuita, para realizar diversas búsquedas documentales (autor, tema o revista) o incluso para que los investigadores averigüen su impacto en la Web científica en Acceso abierto (sobre todo en determinadas disciplinas).

En líneas generales, en esta nota no se recomienda como instrumento para la realización de estudios bibliométricos, sobre todo de media y gran escala, donde la información a emplear exige altos grados de normalización y fiabilidad.

4. Referencias

Bauer, K.; Bakkalbasi, N. “An examination of citation counts in a new scholarly communication environment”. D-Lib Magazine, 2005, v. 11, n. 9.

Friend, F. “G-S: Potentially Good for Users of Academic Information”. Journal of Electronic Publishing, 2006, v. 9, n. 1.

Harzing, Anne-Wil k.; Van Der Wal, Ron. “G-S as a New Source for Citation Analysis”. Ethics in Science and Environmental Politics, 2008, v. 8, n. 1, pp. 61-73.

Jacso, Peter. “G-S Revisited”. Online Information Review, 2008a, v. 32, n. 1, pp. 102-114.

Jacso, Peter. “The Pros and Cons of Computing the H-Index Using G-S”. Online Information Review, 2008b, v. 32, n. 3, pp. 437-452.

Kousha, Kayvan; Thelwall, Mike. “G-S Citations and Google Web/Url Citations: a Multi-Discipline Exploratory Analysis”. Journal of the American Society for Information Science and Technology, 2007, v. 58, n. 7. pp. 1055-1065.

Kousha, Kayvan; Thelwall, Mike. “Sources of G-S Citations Outside the Science Citation Index: a Comparison Between Four Science Disciplines”. Scientometrics, 2008, v. 74, n. 2, pp. 273-294.

Lokman, I Meho; Yang, K. “Impact of data sources on citation counts and rankings of LIS faculty: WoSvs Scopus and G-S”. Journal of the American Society for Information Science and Technology, 2007, v. 58, n. 13, pp. 2105-2125.

Noruzi, A. “G-S: the New Generation of Citation Indexes”. Libri, 2005, v. 55, n. 4, pp. 170-180.

Neuhaus, Chris; Neuhaus, Ellen; Asher, Alan; Wrede, Clint “The Depht and Breadth of G-S: An Empirical Study”. Libraries and the Academy, v. 6, n. 2, pp. 127-141.

Daniel Torres-Salinas y Emilio Delgado López-Cózar son miembros del Grupo ThinkEPI





documenéame documenéame -


Next Page »  Anterior artículo