Thinkepi
    Thinkepi


Anuario ThinkEPI 2007
Anuario ThinkEPI 2008

Formulario de pedido

Enlaces patrocinadores:







Búsqueda:









Temporada actual:


  • Ni libros vencedores ni libros vencidos
  • Contando bajo la lluvia: preguntas sobre el análisis de las fuentes de tráfico en los espacios web de las bibliotecas
  • Poner Web 2.0 en la Administración pública: algunas respuestas
  • ¿Sistemas de gestión de información y documentación certificados?
  • Reutilización e intercambio de objetos digitales compuestos en la Web: el proyecto OAI-ORE
  • Biblioteca 2.0: ¿revolución o nuevo maquillaje para viejas formas de hacer?
  • Accesibilidad de los contenidos en Internet de las bibliotecas públicas desde dispositivos móviles
  • Nativos digitales
  • La responsabilidad sobre el contenido que generan los usuarios en la Internet colaborativa
  • Sobre la viabilidad del código abierto. El caso de Alfresco.
  • Las universidades y el apoyo institucional al Open access
  • El investigador y el editor ante la evaluación de revistas científicas
  • Artefactos para el desarrollo cognitivo e intelectual y superficies interactivas: por qué triunfa el ASUS EEE PC
  • Blogs en publicaciones periodísticas y científicas en España: dos situaciones divergentes. El caso del blog de EPI
  • La deficiencia consentida en el servicio de biblioteca: ¿los profesionales somos conscientes de ello?
  • Referencia digital y servicios electrónicos de información
  • Periódicos y visualización de información
  • Movilidad de información: de la biblioteca al salón de casa
  • Microblogging y live blogging: ¿qué estás haciendo?
  • El acceso abierto llevado a su extremo: ¿necesitamos las revistas?
  • Attention Profile: ¿información a la que prestamos atención?
  • Nuevos perfiles de profesionales para nuevos proyectos de bibliotecas públicas
  • Las diez claves de la Web social
  • Poner Web 2.0 en la Administración pública
  • Métrica de repositorios y la evaluación de la investigación
  • La evaluación de los científicos en el currículo para la acreditación nacional



  • Archivos:



  • October 2008
  • September 2008
  • July 2008
  • June 2008
  • May 2008
  • April 2008
  • March 2008
  • February 2008
  • January 2008
  • December 2007
  • October 2007
  • September 2007
  • July 2007
  • June 2007
  • May 2007
  • April 2007
  • March 2007
  • February 2007
  • December 2006
  • May 2006
  • April 2006
  • March 2006
  • February 2006
  • January 2006
  • December 2005
  • November 2005
  • October 2005
  • September 2005
  • July 2005
  • June 2005
  • May 2005


  • Redifusión de contenidos:



    Suscripción a ThinkEPI



    Add to Technorati Favorites
    Presentación del Grupo Thinkepi Objetivos y áreas de actuación de Thinkepi Participantes del Grupo Calendario de textos Wiki del Grupo Repositorio de textos Anuario Enlaces de interés Buzón de sugerencias Menú en Thinkepi

    Recuperación de información, procesamiento de lenguaje natural y web semántica

    Por José R. Pérez-Agüera
    28 November 2005

    En los últimos tiempos uno de los términos más utilizados cuando nos referimos a la Web es la Web Semántica. Como si de Harry Potter se tratara, todo experto en Internet que se precie, debe conocer estas dos palabras mágicas símbolo del futuro de una Internet más ordenada, más organizada, más catalogada, en definitiva más bibliotecaria (esta frase es de la insigne entre las insignes: Eva Méndez).

    No es mi objetivo definir ni discutir el significado del término Web Semántica, ya que insignes científicos y pensadores se han encargado de hacerlo con mucha mayor claridad de lo que yo podría hacerlo jamás. Sin embargo, como persona pragmática que soy, si voy a entrar a comentar en esta breve nota thinkepiana cuales son los elementos, herramientas y utilidades que son necesarias para que la Web Semántica deje de ser un concepto y se convierta en una realidad. Por supuesto, toda originalidad en mis planteamientos queda descartada, y no pretendo más que convertirme en un mero compilador de evidencias existentes en el panorama investigador que en la actualidad se encuentra en torno al concepto de Web Semántica.

    En el último congreso internacional sobre Web Semántica, celebrado en Osaka, del 18 al 21 del mes pasado, la presencia de aplicaciones centradas en Procesamiento de Lenguaje Natural (PLN) fue más que notable. De hecho, Gate, una conocida aplicación para ingeniería lingüística diseñada en la universidad de Sheffield, fue una de las estrellas invitadas (de forma no oficial) al figurar referenciada en un buen número de los trabajos presentados al congreso.

    Ahora bien, la utilidad del PLN para la implementación de una Web más Semántica, no es un descubrimiento de este año. En el pasado 2004, Ricardo Baeza-Yates firmo un interesante trabajo (otro más) sobre la aplicación de técnicas de PLN a la Recuperación de Información (RI) donde proponía a la Web Semántica como una de las principales aplicaciones prácticas de técnicas convidadas de PLN y RI.

    Sin duda deben existir bastantes más referencias a la vinculación entre PLN, RI y Web Semántica que ahora mismo se me escapan. Pero mi objetivo aquí no es el de presentar una relación exhaustiva de la vinculación entre estos tres elementos, sino, más bien, y continuando con mi proselitismo tecnológico en el área de ByD, animar a todos aquellos atrevidos documentalistas que se introducen en la Web Semántica como área de investigación, a bucear en la literatura de PLN y RI que ya existe y que es fundamental para hacer realidad el sueño de Tim Berners-Lee. Animarles también a manejar las herramientas necesarias para implementar la Web Semántica, tales como Gate, Protege, Lucene, Nutch, o tantas otras, aunque para ello haya que aprender a programar, ya que esta es la única forma de hacer que, realmente, la Web Semántica sea una Web más bibliotecaria, y no solamente más informática.

    Muchos pueden argumentar que el propio padre de la idea defiende que la Web Semántica no es una Web basada en técnicas pertenecientes al área de Inteligencia Artificial (IA), pero esto no significa que nos podamos utilizar estas técnicas como base y apoyo para la implementación de su idea, ya que, más allá de rencillas de carácter académico, todo lo que nos ayude a hacer realidad una nueva Web es útil independientemente de conceptualizaciones de carácter teórico.

    Hay que tener en cuenta que, hoy por hoy la Web Semántica no existe como tal, más allá de implementaciones puntuales de carácter experimental. El hecho de que exista pasa inexorablemente por la generación de contenidos web semánticos que den cuerpo a la idea de una web más organizada. La generación de contenidos de carácter semántico no es asimilable de forma manual por lo usuarios y autores de la Web, por lo que es necesario la automatización de todas, o por lo menos parte de las tareas de generación de contenidos web semánticos. Es aquí donde el PLN y la RI tienen mucho que aportar, ya que permiten la implementación de aplicaciones capaces de generar información de tipo semántico que dote de cuerpo a la Web Semántica y la conviertan en una realidad.

    Analizadores sintácticos, que permitan comprender la estructura de las frases de forma automática, etiquetadores léxicos, reconocedores de entidades como nombres, fechas lugares, todas ellas son herramientas automáticas esenciales para la generación de contenidos web semánticos, es más, me atrevo a decir que sin ellas no es posible una web semántica real, ya que el coste de elaboración manual de contenidos semánticos no es asimilable desde ningún punto de vista.

    Una buena forma de ver en práctica las ideas a las que brevemente hago referencia en esta nota es acudir a la jornada organizada por el grupo Normaweb de SEDIC el próximo día 12 de diciembre en madrid, donde hablarán Asunción Gómez y Richard Bejamins a los cuales merece mucho la pena escuchar cuando hablan de estos temas (también hay otros ponentes cuyo interés es mucho menor, pero claro, no se puede tener todo).

    Lo aquí expuesto no invalida ni mucho menos otras ideas sobre la implementación de la Web Semántica, pero si se acerca, o al menos ese es el objetivo, a lo que supone la implementación real de la idea, lo cual es desde mi punto de vista la mejor forma de acallar a aquellos que opinan que la Web Semántica es un concepto vacío, una entelequia sin sentido o una utopía irrealizable.

    Referencias interesantes:

    La profusión con la que se ha utilizado Gate en la ISWC 2005 es una muestra del uso y la aplicación del PLN en la Web Semántica.

    documenéame documenéame -


    Otras aportaciones

    COMENTARIO INCONVENIENTE

    Por Blanca Rodríguez Bravo

    Tras leer la aportación que J. R. Pérez Agüera nos ha remitido en el marco de la iniciativa Thinkepi, deseo llamar la atención sobre la inconveniencia del comentario que realiza en el penúltimo párrafo entre paréntesis.

    Por favor, para vestir a un santo no es necesario desvestir otro.

    Gracias.

    LA OPINIÓN ES LIBRE

    Por José Ramón Pérez Agüera

    El texto enviado tiene la forma de un artículo de opinión, y lo que expreso en todos sus párrafos es precisamente eso, mi opinión, no la del resto de integrantes de Thinkepi, los cuales pueden discrepar tanto sobre el fondo como sobre la forma.

    Para mi es tan importante destacar lo bueno como resaltar lo malo, ya que en eso se basa la forma crítica que pretendo utilizar en mi trabajo. Jamás pretendo atacar personalmente a nadie con mis comentarios, más allá de la mera crítica científica, pero me niego a omitir información que desde mi punto de vista es relevante para todos aquellos que piensen en asistir a ese evento, únicamente porque alguien se pueda ofender. Lo que pienso es lo que he escrito, si no estoy en lo correcto espero que se me rebata y se me reprenda apelando al método científico, no a las buenas maneras. Muchos me dirán que no son incompatibles la buena educación con el método científico, lo cual es cierto, pero no es menos cierto que si debemos elegir entre ser educados o ser honrados como científicos, debemos optar por la franqueza y la honradez profesional, le pese a quien le pese, al menos esas es mi opinión y actuo en consecuencia.

    Todas las personas son respetables, pero no lo son todas las ideas.