Información = Matemáticas
| 14 julio, 2005 |
Por José R. Pérez-Agüera
en Notas ThinkEPI 2007 |
El pleno siglo XVIII Michael Faraday sentó las bases del electromagnetismo a partir de muchas horas de laboratorio. Desgraciadamente, este famoso científico carecía de conocimientos matemáticos suficientes como para formalizar sus observaciones de manera que pudiesen ser expresadas en términos matemáticos. Hizo falta esperar 100 años para que otro eminente científico, James Maxwell, formalizara las observaciones de Faraday en sus ya famosas ecuaciones del campo electromagnético. El desconocimiento matemático de Faraday le costó, como poco, la tediosa tarea de describir en lenguaje natural sus conclusiones, con la consiguiente ambigüedad que esto conlleva, además del gasto desmesurado de papel, y con el consiguiente retraso que, hasta cierto punto, esto supuso para su disciplina.
Me disculpara el lector este comienzo tan poco usual, pero teniendo en cuenta la pertinencia del ejemplo con el tema que aquí nos ocupa, junto con el hecho de que nos encontramos en el Año Mundial de la Física, he pensado que era una buena forma de comenzar esta mini-reflexión sobre la importancia de las Matemáticas en la Documentación. Y es que desde mi perspectiva, siempre parcial, de lo que es la Documentación hoy en día, creo que gran parte de los documentalistas se encuentran en una situación muy similar a la del afamado científico inglés al que hacíamos referencia en la introducción, lo cual no deja de ser curioso y hasta cierto punto paradójico, si seguimos un poco la pista al desarrollo de la Ciencia de la Información en los últimos 60 años.
Hace ya un buen puñado de años, Shannon definió matemáticamente el concepto de información gracias a formalismos matemáticos (recordemos que definió el bit, la unidad elemental de información). Investigaciones posteriores como la de Dekang Lin dejan claro que la propuesta de Shannon iba más allá de la mera transmisión física de información. Algunos años después, Salton formalizó una colección documental gracias a un espacio vectorial n-dimensional, donde cada documento se correspondía con un vector. Hoy en día, los tesauros, una herramienta típicamente documental, se pueden representar como un grafo, el cual está definido mediante una función matemática, ó como una matriz, donde cada término corresponde a un vector cuyas componentes pueden ser documentos u otros términos, de cara a establecer la relaciones que existen dentro del tesauro a partir de cálculos de similitud entre los vectores que representan a los términos que forman parte del tesauro.
Los ejemplos de tratamiento matemático de la información y el conocimiento no se detienen aquí e inundan nuestro área de actividad miremos donde miremos. Uno de los temas más recurrentes entre la comunidad de documentalistas hoy en día, como son los buscadores de Internet, tiene un sólida base matemática, centrada en operaciones probabilísticas de cierta complejidad como son el teorema de Bayes para probabilidad condicionada y los modelos de Markov. El análisis de información en bases de datos, léase dataminning y datawarehouse, no pueden ser entendidos sin conocimientos de Ãlgebra. La Web Semántica y las Ontologías, otro de los temas en boga, no puede entenderse en profundidad sin conocimientos sólidos de Ãlgebra, Matemática Discreta y Lógica Matemática (en particular Lógica Descriptiva si nos centramos en ontologías).
Peligroso rechazo a las matemáticas
A la vista de estos ejemplos ¿puede el gestor de información desconocer la naturaleza matemática de la misma?
Desde mi perspectiva, todos los elementos con los que trabaja el documentalista y/ó gestor de información hoy en día pueden y deben ser representados en función de abstracciones y formalismos matemáticos, y no sólo esto, sino que la formalización de estos elementos ayuda enormemente a su tratamiento, hasta el punto de mejorar en muchos aspectos las tareas de gestión de información. Pese a esto, se encuentra un rechazo innato, en muchos casos incomprensible, a la inclusión real de las matemáticas en la Documentación. Los planes de estudio son un buen ejemplo de esto, pues son escasas las asignaturas referentes a los aspectos matemáticos de la información, y cuando se encuentran, los contenidos no son quizás todo lo pertinentes que deberían.
Sin duda existe una buena parte de científicos de nuestro área que dominan perfectamente el lenguaje matemático, pero mi reflexión se centra más en un sentir general que, creo yo, impera en la comunidad de científicos y profesionales de la Ciencia de la Información. Sin duda, este sentimiento tienen su origen en la herencia archivística y bibliotecaria de nuestro área, pero a la larga puede suponer una rémora que perjudique profundamente a las futuras generaciones de gestores de la información que se están formando hoy en día. Hemos de ser conscientes que existen asignaturas como Estructura de Datos y de la Información, que no son impartidas en facultades de Documentación sino, en facultades de Informática.
Sin duda este enfoque cientifista-matemático de la Documentación, no será del agrado de muchos, pero dado que nos encontramos en plena Sociedad de la Información no estaría de más reflexionar sobre este hecho de cara a adaptar nuestra profesión a las necesidades de la sociedad. Creo que es hora de olvidarse un poco de Otlet y La Fontaine y centrarse en Shannon, en Feynman, en Salton, en Sparck-Jones, en Zipf inluso en Cutter, si queremos retrotraernos al apogeo positivista en el que se desarrolló esta disciplina.
Muchos se preguntarán que en base a esta reflexión se difumina la diferencia entre informáticos y documentalistas, como si las fronteras entre disciplinas se pudieran marcar tan claramente como para decir que un conocimiento es Documentación y otro es Informática. Si esto fuera así deberíamos dejar de hablar de Web Semántica, de Recuperación de Información, de Bases de Datos, etc.
No creo que este sea el caso, y opino que la Documentación tiene mucho que aportar al resto de ciencias que trabajan con información, y que, desde mi perspectiva particular, forman la verdadera Ciencia de la Información, eso sí, creo que debemos jugar con todas las reglas del juego, incluidas las matemáticas, ya que de esa forma nuestra aportación será mucho más palpable y no tendremos que esperar 100 años a que alguien formalice matemáticamente lo que nosotros ya demostramos en base a un empirismo centrado en la práctica documental.
Pérez-Agüera, José-Ramón. “Información = Matemáticas”. Anuario ThinkEPI, 2007, v. 1, pp. 127-129.












LO QUE OTRAS DISCIPLINAS PUEDEN APORTAR A LA DOCUMENTACIÓN
Por Jorge Serrano Cobos
Aprovechando el mensaje de Jose Ramón y conectándolo con los de Teresa, Amalia, etc, sobre tags, folksonomies, sociologÃa, Luhman, etc, si sirve de algo una opinión, por mà por favor, haced referencia en la lista a todos esos temas y más.
Tengo un compañero de trabajo que es fÃsico, y con él me he enterado de la la entropÃa de la información (ver http://club.telepolis.com/ohcop/bb7.html) o de la teorÃa cuántica de la información (http://www.tendencias21.net/index.php?action=article&id_article=67988). Todo es ponerse las pilas con el tema a ver qué nos aporta.
La cuestión, creo yo, es aprender qué podemos aplicar de forma práctica de esas disciplinas en nuestro trabajo y luego, como dice Jose Ramón, qué podemos aportarles desde la Documentación (como han hecho Rosenfeld y Morville en el campo del diseño web, por ejemplo).
Lo único que necesitarÃamos (al menos un servidor) es que se tenga en cuenta que muchos lo miraremos desde la óptica y el sesgo de la lista, y que muchos no habremos hecho carreras especÃficas de cada temática (hacen falta unos cuantos clones, vaya) ni tenemos mucho tiempo. Pero el saber, al menos con el Gmail, no ocupa -tanto- lugar
Un abrazo y buen veranito.
ENTROPÃA, TEORÃA DE LA INFORMACIÓN, CAOS…
Por Teresa Silio
Hola Jorge y co-listeros
Por alusiones, animo a Amalia a que mande su interesantÃsimo mensaje sobre teorÃa de la comunicación, Luhman y Habermas, y me refiero a lo que decÃa Jorge, la TeorÃa de sistemas de Von Bertalanffy, creada con el afán de tipificar las relaciones (comunes) que existen entre sistemas de distintas disciplinas. Esta teorÃa unifica sistemas formados por elementos y relaciones, que son equivalentes desde un punto de vista interdisciplinar. Ahà va una idea: la web tiene una
estructura recursiva (se repite) y es autosimilar (Berners Lee) y el lenguaje humano también tiene esas cualidades, o sea, que ambos tienen las mismas estructuras a grandes y pequeños niveles. Esto puede ser considerado como un tipo de ordenación de la información.
Y en cuanto a la entropÃa de la información, es lógica. La entropÃa (desorden) es una constante en todo el universo, es un principio fÃsico (termodinámica), ¿por qué la entropÃa no deberÃa formar parte de la información, si la información no es humana, es animal, es celular. Sin información no habrÃa nada; la información y la comunicación permiten que dos entidades se relacionen, sean las que sean.¿Qué es un enlace? ¿Y un protocolo como HTTP? algo que COMUNICA.
Cornella recoge como una de las leyes informacionales la EntropÃa de Shannon revisitada, por Ramon Bori (22/12/2004). Por si a alguien le interesa la TEORÃA DE LA INFORMACIÓN desde un punto de vista matemático, en
http://www.dia.fi.upm.es/licenciatura/asignaturas96/teoria_de_la_informacion.htm se explica:
La TeorÃa de la Información es una teorÃa matemática creada por Claude Shannon en el año 1948 y que forma la piedra angular sobre la que se ha desarrollado toda la teorÃa actual de la comunicación y la codificación. Esta teorÃa establece los lÃmites de cuánto se puede comprimir la información y de cuál es la máxima velocidad a la que se puede transmitir información. La TeorÃa de la Información es, por tanto una teorÃa de lÃmites alcanzables: máxima compresión de datos y
máxima tasa de transmisión de información transmitida sin errores. Las aplicaciones de esta teorÃa son enormes y abarcan desde las ciencias de la computación (criptografÃa, aprendizaje), la ingenierÃa eléctrica (TeorÃa de la comunicación y teorÃa de la codificación), la estadÃstica o la biologÃa (secuencias de ADN, código genético). La última parte de la asignatura (Unidad Temática 6) estudia el hecho de que la información es algo que inevitablemente necesita un soporte
fÃsico sobre el que manifestarse. AsÃ, se verá que la termodinámica sólo impone un coste energético mÃnimo a la operación de borrar información mientras que las restantes operaciones se pueden ejecutar de forma reversible.
Siguiendo este estudio de la fÃsica de la información, la asignatura termina estudiando las diferencias entre la información clásica (bit clásico) y la información cuántica (bit cuántico). Los avances tecnológicos actuales y futuros harán que la informática trabaje con este nuevo tipo de información. La criptografÃa cuántica se muestra actualmente como una de las aplicaciones más prometedoras dentro de la TeorÃa de la Información cuántica.
Si alguien ha llegado hasta aquÃ, ahà va este link donde se habla de Von Bertalnffy y Shannon y demás:
http://pespmc1.vub.ac.be/CYBSWHAT.html.
Y para acabar, la teorÃa del caos, la complejidad y los fractales: http://www.mathjmendl.org/chaos/.
Saludos.