Thinkepi
    Thinkepi


Anuario ThinkEPI


ISSN: 1886-6344

Referenciado en:

Dialnet
DICE
Latindex

Tablas de contenidos:

Anuario 2009
Anuario 2008
Anuario 2007

Formulario de pedido

Canales de difusión:




Suscripción a ThinkEPI



ThinkEPI en Facebook



ThinkEPI en Twitter





Add to Technorati Favorites



Enlaces patrocinadores:








Temporada actual:





Twitter y las (micro)arquitecturas de información social



Más sobre iSchools



Arquitectura de información y Diseño de interacción, dos disciplinas diferenciadas en el marco de la Experiencia de usuario



¿El año de las tabletas y los e-readers? Dispositivos de lectura para medios de comunicación



Biblioteca, aprendizaje y acceso a la información en medio del temporal tecnológico



Software para el acceso a la información. Situación del mercado en 2009



Sobre usabilidad y experiencia de uso



Los libros electrónicos: una realidad emergente



Archivos y software libre



Reflexiones y buenas prácticas sobre la presencia personal en la Web académica



Las bibliotecas escolares en España ante una nueva década: brotes verdes e incertidumbres



Gestores de referencias sociales: la información científica en el entorno 2.0



Del correo electrónico a la conversación dinámica, la comunicación como documento



Los recursos de información sobre cómics: la nueva base de datos especializada en Carlos Giménez (y II). Definición y alcance del proyecto



Los recursos de información sobre cómics: la nueva base de datos especializada en Carlos Giménez (I). Estado de la cuestión



RIA (Rich Internet Applications): la pluralidad del contenido



Primeros pasos hacia la gestión de datos de investigación en las universidades: la iniciativa DAF



El libro como excepción



Los servicios de publicaciones de las universidades en épocas de esplendor de la evaluación científica



Dr Paper & Mr Web



La revolución de internet y los paradigmas bibliotecarios emergentes: las bibliotecas digitales comerciales



Visibilidad y accesibilidad de las tesis de Documentación en España



Algunas reflexiones otoñales a propósito de la ‘infoxicación’



La acción de las bibliotecas públicas en tiempos de crisis



Compartir datos (data sharing) en ciencia: el contexto de una oportunidad



Biblioteca pública Sociedad Limitada



Las interfaces de usuario del mañana, hoy: ¿están siendo los dispositivos móviles el acicate necesario?



El vídeo en los cibermedios: algunas certezas y muchas dudas



Congresos españoles de biblioteconomía y documentación: de la inevitable fragmentación a la necesaria transversalidad



¿Qué nos aportan las redes sociales?



Implicaciones éticas de la minería de datos



Leyendo (y gestionando) blogs desde el móvil



Ranking de universidades en la Unión Europea: aproximación multidimensional a una realidad compleja



Repositorios digitales: un concepto, múltiples visiones



Academia y Ciencia colectiva



El debate de la formación universitaria en ByD: más allá de Bolonia



¿Por qué “Bolonia” en los estudios de Información y Documentación?



El fomento de la lectura en la biblioteca pública 2.0: una apuesta por la innovación y el riesgo



Revistas españolas en WoS



Google Scholar: ¿una herramienta para la evaluación de la Ciencia?



Rediseñando Google: Propuesta base para el desarrollo de un sistema operativo multimodal ubicuo




Buscador:




Archivos:






Presentación del Grupo Thinkepi Objetivos y áreas de actuación de Thinkepi Participantes del Grupo Calendario de textos Wiki del Grupo Notas ThinkEPI Anuario Enlaces de interés Buzón de sugerencias Menú en Thinkepi

La métrica de las lenguas en internet

Por José-Antonio Millán
21 September 2005

La Web pública es un objeto de estudio abierto a todos (por definición). En una red dominada inicialmente por el inglés, los hablantes de otras lenguas con pujanza cultural pronto intentaron descubrir cuál era su posición (Millán, 1997).

Los primeros estudios se desdoblaron en dos aspectos, los cuantitativos y los cualitativos. Desde el punto de vista cuantitativo interesaba ver qué cantidad de páginas había en cada lengua. Cualitativamente, importaba ver la presencia de determinados elementos de una cultura en las páginas web de distintas lenguas. El pionero de ambos estudios fue Daniel Pimienta, desde la Fundación Redes y Desarrollo (FUNREDES, 1996a y b), inicialmente para el español y el francés (en relación con el inglés), y que hoy en día abarca (con el apoyo de Unión Latina y de la Délégation générale à la langue française) las otras lenguas romances y además el alemán. El catalán ha estado ausente de estas medidas, porque Unión Latina se ocupaba sólo de las lenguas oficiales de los estados miembros (este año acaba de adherirse Andorra) y porque ninguna institución catalana ha requerido hasta ahora la colaboración de FUNREDES.

Para el estudio cuantitativo, que es el que nos ocupará, Pimienta utilizó inicialmente el buscador Altavista y un algoritmo de reconocimiento de lenguas (mediante palabras exclusivas de cada lengua) para determinar las cifras totales (FUNREDES, 1996a). Estudios posteriores como el de Alis Technologies (1997), con el apoyo de Internet Society, utilizaron un muestreo muy pequeño de sitios.

Las medidas, más fiables, que se extraían utilizando buscadores generales tenían el problema fundamental de saber si el buscador indizaba la totalidad del espacio web, o si se centraba en el conjunto más antiguo de páginas, dando poca cuenta de las nuevas incorporaciones a la Web, y primando de esta manera las cifras de las páginas en inglés (para una perspectiva global de la situación en aquel momento de los buscadores con respecto a la totalidad véase Millán, 2000). El catalán —que se había iniciado en la Red muy tempranamente: Partal, 2004— acogió una iniciativa precoz para decir a los buscadores en qué lengua estaban sus sitios, mediante etiquetas meta (Yzaguirre, 1997), como forma de aumentar su visibilidad.

La evolución de los estudios con una misma metodología (los de FUNREDES, véase la página resumen: 2005) a lo largo de los distintos años ha conducido a refinar no sólo el uso simultáneo de varios buscadores y los procedimientos de cálculo, sino también las medidas absolutas, poniéndolas en relación con el número de hablantes y también con el numero de personas con conexión a la Red (productvidad de un espacio web) . Estos parámetros se pueden utilizar también para cada país, lo que proporciona una visión muy rica de comunidades geográficamente dispersas como la hispanohablante.

Según el estudio en vías de publicación, del que he recibido un adelanto provisional (Pimienta, 2005), la presencia relativa del inglés no ha dejado de bajar desde 1998 (cuando tenía el 75% de la red) hasta el 45% en la actualidad. El resto de las lenguas estarían, RESPECTO AL INGLÉS, así: alemán 15,42%, francés 11,00%, español 10,23%, italiano 6,77%, portugués 4,15%, rumano 0,37%. La novedad de las cifras anteriores (2003) es que el español pierde el primer lugar de las lenguas romances frente al francés.

Con casi una década de datos tal vez estemos en situación de aventurar evoluciones cuantitativas para las lenguas que se incorporan a la Red: inicios de crecimientos rápidos, seguidos de mesetas de estabilización. El inglés se estabilizó hace años, el español habría alcanzado ya una de esas mesetas y el francés estaría llegando a la suya. Pero para estas y otras muchas cosas es mejor esperar la publicación definitiva del último estudio de FUNREDES. Y en cuanto a los estudios cualitativos… pueden ser objeto de otra nota.

Referencias:





documenéame documenéame -


No hay nuevas aportaciones.