Thinkepi
    Thinkepi


Anuario ThinkEPI


ISSN: 1886-6344

Referenciado en:

Dialnet
DICE
Latindex

Tablas de contenidos:

Anuario 2009
Anuario 2008
Anuario 2007

Formulario de pedido

Canales de difusión:




Suscripción a ThinkEPI



ThinkEPI en Facebook



ThinkEPI en Twitter





Add to Technorati Favorites



Enlaces patrocinadores:




Póliza seguro coche




Temporada actual:





Twitter y las (micro)arquitecturas de información social



Más sobre iSchools



Arquitectura de información y Diseño de interacción, dos disciplinas diferenciadas en el marco de la Experiencia de usuario



¿El año de las tabletas y los e-readers? Dispositivos de lectura para medios de comunicación



Biblioteca, aprendizaje y acceso a la información en medio del temporal tecnológico



Software para el acceso a la información. Situación del mercado en 2009



Sobre usabilidad y experiencia de uso



Los libros electrónicos: una realidad emergente



Archivos y software libre



Reflexiones y buenas prácticas sobre la presencia personal en la Web académica



Las bibliotecas escolares en España ante una nueva década: brotes verdes e incertidumbres



Gestores de referencias sociales: la información científica en el entorno 2.0



Del correo electrónico a la conversación dinámica, la comunicación como documento



Los recursos de información sobre cómics: la nueva base de datos especializada en Carlos Giménez (y II). Definición y alcance del proyecto



Los recursos de información sobre cómics: la nueva base de datos especializada en Carlos Giménez (I). Estado de la cuestión



RIA (Rich Internet Applications): la pluralidad del contenido



Primeros pasos hacia la gestión de datos de investigación en las universidades: la iniciativa DAF



El libro como excepción



Los servicios de publicaciones de las universidades en épocas de esplendor de la evaluación científica



Dr Paper & Mr Web



La revolución de internet y los paradigmas bibliotecarios emergentes: las bibliotecas digitales comerciales



Visibilidad y accesibilidad de las tesis de Documentación en España



Algunas reflexiones otoñales a propósito de la ‘infoxicación’



La acción de las bibliotecas públicas en tiempos de crisis



Compartir datos (data sharing) en ciencia: el contexto de una oportunidad



Biblioteca pública Sociedad Limitada



Las interfaces de usuario del mañana, hoy: ¿están siendo los dispositivos móviles el acicate necesario?



El vídeo en los cibermedios: algunas certezas y muchas dudas



Congresos españoles de biblioteconomía y documentación: de la inevitable fragmentación a la necesaria transversalidad



¿Qué nos aportan las redes sociales?



Implicaciones éticas de la minería de datos



Leyendo (y gestionando) blogs desde el móvil



Ranking de universidades en la Unión Europea: aproximación multidimensional a una realidad compleja



Repositorios digitales: un concepto, múltiples visiones



Academia y Ciencia colectiva



El debate de la formación universitaria en ByD: más allá de Bolonia



¿Por qué “Bolonia” en los estudios de Información y Documentación?



El fomento de la lectura en la biblioteca pública 2.0: una apuesta por la innovación y el riesgo



Revistas españolas en WoS



Google Scholar: ¿una herramienta para la evaluación de la Ciencia?



Rediseñando Google: Propuesta base para el desarrollo de un sistema operativo multimodal ubicuo




Buscador:




Archivos:






Presentación del Grupo Thinkepi Objetivos y áreas de actuación de Thinkepi Participantes del Grupo Calendario de textos Wiki del Grupo Notas ThinkEPI Anuario Enlaces de interés Buzón de sugerencias Menú en Thinkepi

Recuperación de información, procesamiento de lenguaje natural y web semántica

Por José R. Pérez-Agüera
28 November 2005

En los últimos tiempos uno de los términos más utilizados cuando nos referimos a la Web es la Web Semántica. Como si de Harry Potter se tratara, todo experto en Internet que se precie, debe conocer estas dos palabras mágicas símbolo del futuro de una Internet más ordenada, más organizada, más catalogada, en definitiva más bibliotecaria (esta frase es de la insigne entre las insignes: Eva Méndez).

No es mi objetivo definir ni discutir el significado del término Web Semántica, ya que insignes científicos y pensadores se han encargado de hacerlo con mucha mayor claridad de lo que yo podría hacerlo jamás. Sin embargo, como persona pragmática que soy, si voy a entrar a comentar en esta breve nota thinkepiana cuales son los elementos, herramientas y utilidades que son necesarias para que la Web Semántica deje de ser un concepto y se convierta en una realidad. Por supuesto, toda originalidad en mis planteamientos queda descartada, y no pretendo más que convertirme en un mero compilador de evidencias existentes en el panorama investigador que en la actualidad se encuentra en torno al concepto de Web Semántica.

En el último congreso internacional sobre Web Semántica, celebrado en Osaka, del 18 al 21 del mes pasado, la presencia de aplicaciones centradas en Procesamiento de Lenguaje Natural (PLN) fue más que notable. De hecho, Gate, una conocida aplicación para ingeniería lingüística diseñada en la universidad de Sheffield, fue una de las estrellas invitadas (de forma no oficial) al figurar referenciada en un buen número de los trabajos presentados al congreso.

Ahora bien, la utilidad del PLN para la implementación de una Web más Semántica, no es un descubrimiento de este año. En el pasado 2004, Ricardo Baeza-Yates firmo un interesante trabajo (otro más) sobre la aplicación de técnicas de PLN a la Recuperación de Información (RI) donde proponía a la Web Semántica como una de las principales aplicaciones prácticas de técnicas convidadas de PLN y RI.

Sin duda deben existir bastantes más referencias a la vinculación entre PLN, RI y Web Semántica que ahora mismo se me escapan. Pero mi objetivo aquí no es el de presentar una relación exhaustiva de la vinculación entre estos tres elementos, sino, más bien, y continuando con mi proselitismo tecnológico en el área de ByD, animar a todos aquellos atrevidos documentalistas que se introducen en la Web Semántica como área de investigación, a bucear en la literatura de PLN y RI que ya existe y que es fundamental para hacer realidad el sueño de Tim Berners-Lee. Animarles también a manejar las herramientas necesarias para implementar la Web Semántica, tales como Gate, Protege, Lucene, Nutch, o tantas otras, aunque para ello haya que aprender a programar, ya que esta es la única forma de hacer que, realmente, la Web Semántica sea una Web más bibliotecaria, y no solamente más informática.

Muchos pueden argumentar que el propio padre de la idea defiende que la Web Semántica no es una Web basada en técnicas pertenecientes al área de Inteligencia Artificial (IA), pero esto no significa que nos podamos utilizar estas técnicas como base y apoyo para la implementación de su idea, ya que, más allá de rencillas de carácter académico, todo lo que nos ayude a hacer realidad una nueva Web es útil independientemente de conceptualizaciones de carácter teórico.

Hay que tener en cuenta que, hoy por hoy la Web Semántica no existe como tal, más allá de implementaciones puntuales de carácter experimental. El hecho de que exista pasa inexorablemente por la generación de contenidos web semánticos que den cuerpo a la idea de una web más organizada. La generación de contenidos de carácter semántico no es asimilable de forma manual por lo usuarios y autores de la Web, por lo que es necesario la automatización de todas, o por lo menos parte de las tareas de generación de contenidos web semánticos. Es aquí donde el PLN y la RI tienen mucho que aportar, ya que permiten la implementación de aplicaciones capaces de generar información de tipo semántico que dote de cuerpo a la Web Semántica y la conviertan en una realidad.

Analizadores sintácticos, que permitan comprender la estructura de las frases de forma automática, etiquetadores léxicos, reconocedores de entidades como nombres, fechas lugares, todas ellas son herramientas automáticas esenciales para la generación de contenidos web semánticos, es más, me atrevo a decir que sin ellas no es posible una web semántica real, ya que el coste de elaboración manual de contenidos semánticos no es asimilable desde ningún punto de vista.

Una buena forma de ver en práctica las ideas a las que brevemente hago referencia en esta nota es acudir a la jornada organizada por el grupo Normaweb de SEDIC el próximo día 12 de diciembre en madrid, donde hablarán Asunción Gómez y Richard Bejamins a los cuales merece mucho la pena escuchar cuando hablan de estos temas (también hay otros ponentes cuyo interés es mucho menor, pero claro, no se puede tener todo).

Lo aquí expuesto no invalida ni mucho menos otras ideas sobre la implementación de la Web Semántica, pero si se acerca, o al menos ese es el objetivo, a lo que supone la implementación real de la idea, lo cual es desde mi punto de vista la mejor forma de acallar a aquellos que opinan que la Web Semántica es un concepto vacío, una entelequia sin sentido o una utopía irrealizable.

Referencias interesantes:

La profusión con la que se ha utilizado Gate en la ISWC 2005 es una muestra del uso y la aplicación del PLN en la Web Semántica.





documenéame documenéame -


Next Page »  Anterior artículo