Inicio » Notas ThinkEPI 2011 » Archivos centralizados versus proyectos institucionales

Archivos centralizados versus proyectos institucionales

Resumen:
Se defienden las ventajas de los repositorios centralizados frente a la dispersión de proyectos institucionales. La aparición constante de nuevos recursos, archivos abiertos y bibliotecas digitales, afecta tanto al medio académico como a las instituciones de fondo antiguo. La “cultura del corte de cinta” debería ir acompañada de garantías para la preservación y la prestación de buenos servicios. Se citan algunos servicios cooperativos en el ámbito académico y un ejemplo concreto de digitalización de fondo antiguo sobre revistas españolas en la Universidad de Connecticut.

[Leer más...] Archivos centralizados vs institucionales: ¿estamos equivocando el camino con la fragmentación de repositorios?



Cómo citar este artículo:
Rodríguez-Yunta, Luis. “Archivos centralizados vs institucionales: ¿estamos equivocando el camino con la fragmentación de repositorios?”. Anuario ThinkEPI, 2011, v. 5, pp. 195-202.

Etiquetas: , , , ,

7 respuestas a Archivos centralizados versus proyectos institucionales

  1. LA PRIORIDAD ABSOLUTA ES POBLAR LOS REPOSITORIOS

    Por Isidro F. Aguillo

    Creo que Luis mezcla en su mensaje dos propósitos que, aunque complementarios, son distintos y requieren diferentes aproximaciones. El objetivo primario de los repositorios es el de facilitar el acceso al conocimiento generado y aunque es relevante su función de preservación de dicho conocimiento, poner el énfasis en este último aspecto puede hacer peligrar la viabilidad de las iniciativas Open access, dividiendo esfuerzos, haciendo de proyectos que deben ser sencillos unas tremendas pesadillas de complejidad y burocracia,que al final puede alejarnos del mainstream de los procesos de comunicación científica.

    Dejaré de lado el aspecto preservacionista en el resto de mis argumentos.

    Puede que en el futuro la mayor parte de la producción científica esté disponible en abierto, pero ahora que esa cifra raramente roza el 15%, me parece inadecuado discutir si son galgos o podencos. La prioridad absoluta es poblar los repositorios, convencer a los autores de las ventajas de depositar y facilitarles la tarea en la medida de lo posible.

    Por eso veo con sorpresa que en nuestra comunidad se plantean estrategias que a menudo ignoran al usuario clave de todo esto, el autor (científico, investigador, profesor, doctorando, etc…). Y como autor me llama la atención que los “recolectores” me roben el posicionamiento de mis artículos en las búsquedas en Google cuando se trata de intermediarios de escaso valor añadido que además diluyen la identidad institucional de la organización que financia dichos trabajos.

    Soy un firme defensor de los repositorios institucionales ya que creo que son el camino más rápido para promover el acceso abierto. Para un autor su repositorio institucional es tanto el palo (mandatos) como la zanahoria (prestigio), pero si se los ningunea, al final el autor acabará por no contribuir y la pirámide caerá por su base.

    No, no me niego a la colaboración. Sólo digo que priorizarlo ahora es canibalizar los esfuerzos que deben hacerse desde las instituciones productoras de contenidos.

  2. Luis Rodríguez-Yunta
    COMPARTIR ESFUERZOS EN REDES

    Por Luis Rodríguez-Yunta

    Gracias por los comentarios, Reme e Isidro, sin duda aportan ideas muy relevantes y atinan de lleno en el tema, lo cual siempre es de agradecer pues frecuentemente los debates en Iwetel se dispersan con gran facilidad.

    Mi intención desde luego no es pontificar, sino sólo plantear la duda sobre lo que tenemos, porque me pongo en la posición del usuario y ver la lista actual de repositorios creo que marea a cualquiera y temo que los recolectores no son capaces de ofrecer un servicio de valor añadido idéntico al de los repositorios.

    Y sobre todo me asombra descubrir que algunos repositorios son de tamaño ridiculamente pequeño. Y bueno, lo de juntar bibliotecas digitales de fondo antiguo con repositorios de universidades y centros de investigación, no es una idea original mía, es algo que está ocurriendo ya en algunos sistemas de búsqueda que utilizan OAI, luego la relación es evidente aunque su naturaleza sea distinta.

    No pretendo ningunear a los repositorios institucionales. Como apunta Isidro, pueden ser indispensables hoy en día. Pero también veo grandes ventajas en la centralización o al menos en compartir esfuerzos en redes. Simplemente, no todas las instituciones necesitan crear un repositorio o una biblioteca digital, para las instituciones pequeñas o para proyectos de digitalización muy concretos, puede ser mucho más rentable asociarse. Esta es en realidad mi opinión, que admito que no he sabido resumir en el texto (o no he querido pues mi intención era plantear la duda más que dar una solución).

    Respecto a la corrección que envía Reme sobre eSciDoc, en este ejemplo lo que hago en mi texto es reseñar lo que expresan Romary y Armbruster en el artículo que cito. Allí estos autores se refieren a eSciDoc como un sistema multidisciplinar en el que colaboran Max Planck Society y FIZ Karlsruhe. ¿No he recogido bien la idea de estos autores?

    Finalmente lo que no he entendido es la frase final de Reme diciendo que no basta con creer que algo puede funcionar, que hay que demostrarlo. Bueno, por eso puse ejemplos de sistemas que yo considero que funcionan y otros citados por Romary y Armbruster, que ellos ponen de modelo. Son sistemas existentes, ejemplos válidos, no creencias.

  3. LA AVENTURA DEL INTENTO DE AUTOARCHIVAR

    Por Reme Melero

    Casualmente ayer me imprimí el boletin de P. Suber del mes de octubre 2010 y lo leí por la noche. En la primera parte habla de su “aventura en el intento de autoarchivar” (interpretación propia), y entre muchas de las cosas que menciona, hay un párrafo que viene al hilo de esta discusión:

    “There are great advantages in having authors deposit in their own institutional repository. It helps institutions *share, analyze, and evaluate their own research output*. It adds local incentives to funder mandates to prod and reward author participation. It *adds robustness to preservation*, *on the LOCKSS principle*, by distributing the literature around a large network. It ensures that the *system will scale with the growth of published research*, simply* from the fact that distributed networks are more capacious than any individual node*. Above all, *it nurtures local cultures of self-archiving at every university*, which will benefit non-funded research and research funded by non-mandating funders….“.

  4. AGREGACIÓN DE CONTENIDOS OPORTUNOS

    Por Pablo de Castro

    Abundando en el argumento de Reme, si uno trata de listar mentalmente los repositorios temáticos o cooperativos que hay disponibles en las proximidades, no encuentra precisamente el cuerno de la abundancia.

    Está Recercat, ya citado por Luis, y de ahí hay que pasar a arXiv (EE.UU.), PubMed Central (EE.UU.) y UKPMC (UK). Entonces, si la disyuntiva es entre un esquema de repositorios distribuidos que -con sus posibles puntos débiles a nivel conceptual- progresa con ritmo sostenido y unos repositorios centralizados de los que no se tiene excesivas noticias salvo en lo que atañe a sus dificultades de financiación, creo que la alternativa es clara (si es que fuera preciso escoger, que sinceramente creo que no).

    Uno diría que Romary (INRIA) y Armbruster (MPS), estrechos colaboradores en el proyecto PEER, estan argumentando en realidad a favor de crear un unico repositorio centralizado donde se recojan todas las publicaciones resultantes de proyectos financiados por la UE (y afectados por su mandato de archivo abierto de resultados de investigación).

    Esto, teniendo detrás toda la infraestructura OpenAIRE, puede ser una excelente idea, pero no veo la necesidad de oponer los dos modelos. Claro que probablemente pudiera tambien recopilarse este gran conjunto de producción científica -bien que más lentamente- por agregación de los contenidos oportunos de los repositorios institucionales distribuidos, y entonces qué sería de toda esa infraestructura potencialmente redundante.

  5. DIRECTRICES DE OpenAIRE

    Por Eloy Rodrigues

    Se me permiten la intrusión, desde Portugal, en vuestra interesante discusión, me gustaría, además de compartir los argumentos de Reme, Isidro y Pablo sobre la importancia y las ventajas para el progreso del Open access del archivo en los repositorios institucionales, clarificar la estrategia del proyecto OpenAIRE.

    La estrategia, siguiendo lo definido en el proyecto-piloto de Open access de la Comisión Europea (que afortunadamente no exige el archivo en un repositorio especifico -como lo ha hecho NIH con PubMed- más el archivo en cualquier repositorio de acceso abierto), no es la de construir una infraestructura para el archivo central. Al contrario, la estrategia de OpenAIRE es de recolectar las publicaciones de las centenas de repositorios institucionales (o temáticos) que existen en los países europeos.

    Para eso OpenAIRE ha creado unas Directrices para garantizar la “compliance” de los repositorios institucionales con los requisitos de OpenAIRE.

    Solamente para los autores que no tengan un repositorio institucional (o temático) donde archivar sus publicaciones OpenAIRE ofrece un repositorio para archivo central, que en el proyecto llamamos por eso mismo, de repositorio huérfano (pero que sería mejor llamar de “homeless” para las publicaciones que no tienen “habitación” en otro repositorio).

  6. José Manuel Barrueco
    LOS REPOSITORIOS DEBEN DEMOSTRAR SU UTILIDAD

    Por José Manuel Barrueco

    Es interesante comprobar que el viejo tema de centralizados versus institucionales sigue provocando debates. Desde mi experiencia de trabajar con ambos creo que la solución está en la convivencia y la cooperación. El papel del repositorio (RI) es almacenar la producción de la institución y proporcionar los mejores metadatos posibles para que los recolectores puedan, a su vez, proporcionar buenos servicios de valor añadido.

    El problema viene cuando el RI no cumple con su función: tiene contenidos cuestionables (la cultura de corte de cinta hace que se llenen a toda costa) y, lo que es peor, pésimos metadatos. Sobre esa base los recolectores no pueden hacer nada. Como se suele decir, de donde no hay…

    Plantear la duda sobre lo que tenemos, porque me pongo en la posición del usuario y ver la lista actual de repositorios creo que marea a cualquiera y temo que los recolectores no son capaces de ofrecer un servicio de valor añadido idéntico al de los repositorios“.

    No es que no sean capaces, es que con los contenidos que proporcionan los repositorios, poco más se puede hacer…

    Tamaño ridículamente pequeño. Y bueno, lo de juntar bibliotecas digitales de fondo antiguo con repositorios de universidades y centros de investigación, no es una idea original mía, es algo que está ocurriendo ya en algunos sistemas de búsqueda que utilizan OAI, luego la relación es evidente aunque su naturaleza sea distinta“.

    La única relación es que utilizan un mismo protocolo. Yo no veo qué servicios de valor añadido comunes a un manuscrito y a a un artículo de física nuclear se puedan prestar. Más allá de tener una ventana de búsqueda, que es precisamente en lo que se quedan estas iniciativas.

    Finalmente lo que no he entendido es la frase final de Reme diciendo que no basta con creer que algo puede funcionar, que hay que demostrarlo. Bueno, por eso puse ejemplos de sistemas que yo considero que funcionan y otros citados por Romary y Armbruster que ellos ponen de modelo. Son sistemas existentes, ejemplos válidos, no creencias“.

    Echo en falta en la lista de Luis otro sistema que funciona: RePEc (Research Papers in Economics).

    RePEc es la suma de más de 1.200 “repositorios institucionales” agregados para formar un dataset de 900.000 documentos. Con un crecimiento mensual de 18.000 nuevos papers. Con más de 600.000 descargas “reales” de documentos al mes…

    RePEc funciona sin necesidad de mandatos, por el mero hecho de que es una iniciativa útil para el investigador. Porque el estar en RePEc proporciona a los autores visibilidad y una serie de valores añadidos:

    – Páginas personales
    – Alertas temáticas
    – Análisis de citas
    – Rankings de autores e instituciones
    – Datos de uso: descargas y vistas de sus documentos
    – Directorio de economistas
    – y también: motores de búsqueda.

    Cuando los repositorios consigamos demostrar nuestra utilidad, entonces los autores vendrán a nosotros. Para ello tenemos que empezar por construir repositorios hacia afuera, pensando más en los recolectores que en nuestra institución. Teniendo en cuenta que no somos un fin en nosotros mismos, sino un camino para conseguir entre todos una alternativa válida de comunicación.

    Esos son los deberes pendientes que tenemos los bibliotecarios…

  7. CENTRALIZADOS O DISTRIBUIDOS: DEPENDE

    Por Remedios Melero

    No se puede generalizar, y lo que hay que barajar, como en cualquier “proyecto/negocio”, es la versatilidad la sostenibilidad y los servicios que presta.

    ¿Estamos equivocando el camino con la fragmentación de repositorios? Archivos centralizados versus proyectos institucionales

    El título quiere dar a entender que parece un error la construcción de repositorios, la palabra fragmentación induce a “división”, y ésta a pérdida de fuerza, sin embargo, en un sistema de repositorios de lo que se habla es de distribución.

    Las garantias a las que alude Luis son válidas para todos los proyectos, si bien los de digitalización tienen su funcion científico-académica y de uso común, los objetivos y sus funciones no son las mismas que las de un repositorio institucional de acceso abierto, por lo tanto deben tener un trato diferente.

    En los últimos años estamos asistiendo a una auténtica fiebre de creación de archivos digitales institucionales. El directorio español BuscaRepositorios identifica 66 recursos de este tipo en el medio académico a fecha de 1 de octubre de 2010. Por su parte, en el recolector Hispana se relacionan en la misma fecha 503 proyectos y 129 repositorios participantes. Parece que cada institución desea ofrecer sus propios recursos, manteniendo el control sobre la versión digital de sus fondos o sobre los documentos generados por sus investigadores. Es un esfuerzo loable, pero ¿es el mejor camino para llegar a los usuarios y garantizar la sostenibilidad de los recursos?

    Hispana y recolecta son harvesters “recolectores” de metadatos segun el protocolo OAI-PMH, obviamente si los proveedores de datos se eligen con diferente criterio no pueden ofrecer los mismos resultados.

    “Esta dinámica tiene sus riesgos: no todos los organismos tienen el mismo potencial para asegurar la preservación de sus archivos digitales o para adaptarse con facilidad a las nuevas demandas tecnológicas que vayan surgiendo. Es muy probable que los actuales formatos de edición o versión digital queden obsoletos en poco tiempo y tengan que ser transformados. Y ya es necesario instalar versiones adecuadas para los nuevos dispositivos de lectura. Otro inconveniente es la dispersión de fuentes para localizar información y la posible duplicación de proyectos. En esta dinámica de trabajo disperso los recursos centralizados, como Hispana o Recolecta, se limitan a la integración y recuperación de los metadatos, manteniendo meros enlaces a los documentos, y limitando generalmente la capacidad de recuperación de contenidos. Al excluir la consulta del texto completo se está muy lejos de competir con la capacidad de buscadores como Google”.

    La preservación es un factor a tener en cuenta antes de poner en marcha cualquier iniciativa con contenidos digitales, aunque la realidad es distinta. En eso sí que estoy con la centralización, entre otras cosas porque es costosa y porque la centralización en la preservacion permitiria estándares comunes de migración, transformacion etc.

    La alternativa a este funcionamiento es la explotación de repositorios colaborativos con un servicio técnico que garantice todas las prestaciones deseables. Con ello, la centralización de los recursos es plena y los documentos generados por una institución se integran en un servicio global, sin perder el carácter de colección identificable en sus páginas de navegación. Esta alternativa afecta tanto al ámbito de los archivos abiertos de carácter científico, en el que se han multiplicado los proyectos universitarios y de centros de investigación, como a las bibliotecas digitales de fondo antiguo, donde a estas instituciones se suman las iniciativas de centros e instituciones culturales de cualquier tipo“.

    Pueden haber servicios colaborativos y repositorios insitucionales, ambos son compatibles, de hecho en eso se basaba DRIVER y ahora COAR.

    Acerca de la inflación de repositorios académicos se han referido Chris Armbruster y Laurent Romary en varias contribuciones (Armbruster y Romary, 2009; Romary y Armbruster, 2009). Hay que alabar la aportación de los proyectos institucionales a la promoción del autoarchivo entre los investigadores, especialmente cuando existe un mandato institucional de depósito. Sin embargo, la mayoría de estos recursos no alcanzan un tamaño suficiente, no ofrecen servicios de calidad a la comunidad académica y no logran un buen posicionamiento en el Ranking Web of World Repositories“.

    Ofrecer servicios es un argumento que he esgrimido muchas veces para que un repositorio tenga Éxito, donde se sitúe es cuestión de criterios.

    Frente a la fragmentación de proyectos institucionales, los archivos temáticos como arXiv o PubMed Central pueden ocupar un lugar central en la comunicación internacional para una disciplina. Los investigadores están interesados en suscribirse a las alertas de nuevos depósitos sobre un tema y consecuentemente en incluir sus propios pre-prints, mientras que usualmente no desean recibir este tipo de datos sobre una única institución. Romary y Armbruster (2009) destacan además dos ejemplos que marcan una nueva tendencia hacia los esfuerzos colaborativos: el sistema HAL en Francia y eSciDoc en Alemania. Ambos son recursos centralizados en los que participan varias instituciones con el objetivo de garantizar la preservación y ofrecer servicios de valor añadido: estadísticas, páginas de autor, portales temáticos y enlaces a recursos disciplinares, múltiples formatos de exportación y sistemas de búsqueda avanzada que incluyen la interrogación del texto completo“.

    Es cierto, ambos repositorios temáticos son un éxito, pero hay que ver porqué, del primero, huelga decirlo, pero del segundo hay que recordar que la medicina y ciencias afines son areas inmensamente ricas en producción cientifica, y que la mayoría de entidades financiadoras con mandatos OA tienen que ver con éstas y que además las editoriales facilitan el deposito directo a las bases de PUBMED.

    Respecto al HAL en francia y eSciDoc en Alemania, el primero sí es totalmente multidisciplinar, nacional y centralizado pero el segundo lo es del Max Planck, digamos equivalente al Digital CSIC.

    Respecto a los proyectos de digitalización de fondo antiguo, quiero destacar un ejemplo concreto de la Universidad de Connecticut (Ramos y Bennett, 2010), que muestra este modo alternativo de trabajar frente a la fragmentación de recursos. El Centro de Investigaciones Thomas J. Dodd de esta universidad, posee desde la década de 1970 una rica colección de revistas y periódicos españoles que perteneció a Juan Pérez de Guzmán y Boza, Duque de T’Serclaes, con publicaciones desde al siglo XVIII hasta principios del siglo XX, en especial editadas en Andalucía. Se trata por tanto de un recurso de alto interés que forma parte del patrimonio cultural español, depositado fuera de nuestro país y probablemente al margen de las fuentes recopiladas en Europeana“.

    Estoy segura de que la duplicacion de fuentes primarias digitalizadas es importante, ¿cuántos Don Quijotes habrán digitalizados en el mundo?

    Lo que hay que hacer es localizar lo que ya existe para no duplicarse, en este caso los recolectores harían un gran papel.

    La existencia de repositorios consorciados permitiría abordar con mayor agilidad las sucesivas renovaciones tecnológicas. La lectura desde nuevos dispositivos es ya una realidad, y sus usuarios no pueden quedarse al margen de los servicios que se ofertan. Pronto vendrán otros formatos de exportación o de navegación y los sistemas de archivo tendrán que adaptarse a ello. La dispersión de repositorios no favorece este proceso“.

    Dispersión y distribución no son sinónimos, si hablamos de islas es una cosa y si hablamos de sistemas interoperales es otra.

    Una comparación similar podría hacerse para las revistas digitales: ¿hemerotecas institucionales o proyectos centralizados? En España hay un riesgo claro de dispersión por la sólida implantación de la “cultura del corte de cinta”: hay que inaugurar y presentar nuevos productos, nuevos proyectos, nunca hablar de sostener y financiar lo ya existente. ¿Cómo revertir esta tendencia? ¿Por qué no aplicar en la propia institución aquello que más se valora como usuarios?

    Estoy de acuerdo en que crear algo nuevo cuando ya existe es una pérdida de tiempo y de recursos económicos y humanos, pero eso no es exclusivo de los repositorios o revistas, es propio del que se quiere poner medallas. Por cierto, supongo que al hablar de proyectos centralizados de revistas te refieres a portales de revistas, porque si no llegariamos a una enciclopedia de babel seriada.

    Quería ser más breve pero no lo he conseguido, terminaré como he empezado, centralizados o distribuidos, “depende”.

    Cuando solía ejercer de química, las ventajas o inconvenientes de un método u otro se tenían que demostrar y avalar con resultados, no bastaba con creer que podría ser de una manera u otra, creo que eso no es exclusivo de un área de conocimiento.

    PD. Mis opiniones son propias y no obedecen a ninguna posicion institucional en particular