En este trabajo recoge una introducción a los conceptos del posicionamiento de contenidos en la red, un método de análisis y una selección de métricas así como diversas recomendaciones dirigidas a optimizar el posicionamiento de un sitio en Internet. Aunque el contenido de este trabajo es aplicable a cualquier sitio web, para ilustrarlo se han utilizado diversos ejemplos del ámbito de los Museos e Instituciones culturales en el que actualmente el autor desarrolla su actividad profesional.
Organización de Internet
Al estudiar el posicionamiento de sitios web en Internet se imprescindible tener claro cómo se organiza la información en la Red. El siguiente diagrama de clases UML representa de forma muy esquemática los elementos más importantes en los que se estructura la documentación en Internet y sus relaciones.
Según este diagrama Internet se organiza en millones de sitios web que publican documentos web.
Cada documento web puede ser:
-
Página Activa: Un documento activo que es generado bajo demanda a partir de datos almacenados en una base de datos. Son páginas Asp, JSP, PHP u otras con código que se ejecuta en el servidor como paso previo al envío de la página al usuario.
-
Página Estática: Página que contiene en un único fichero toda la información necesaria típicamente en formato html. Este tipo de páginas son servidas directamente y no es necesario su procesamiento.
-
Fichero Rico: Ficheros
en formatos: pdf, doc, ppt, etc. Este tipo de ficheros típicamente recogen información muy elaborada y suelen situarse en los últimos niveles del árbol de un sitio web.
Los documentos web están compuestos de:
-
Contenidos: Textos e imágenes que recogen la información que se desea publicar y accesible por parte de los Internautas. Estos contenidos son maquetados haciendo uso de etiquetas que también aportan un contenido semántico al identificarse por ejemplo los elementos más importantes mediante etiquetas como las de encabezado o las fuentes negritas.
-
Metadatos: Información etiquetada que describe el contenido y otros aspectos del documento web. Existen diversos proyectos orientados a la estandarización de los metadatos. Entre estos proyectos destaca el Dublín Core.
-
Enlaces: Los enlaces constituyen recomendaciones entre documentos web que es establecen típicamente a partir de un texto. Existen diversos estándares amplían la semántica de los enlaces permitiendo por ejemplo la definición de nuevas relaciones. Entre estas iniciativas destacan: HTML 4.0, Xlink y RDF.
Workflow de la Información en Internet
Los documentos web desde que son publicados en un servidor web hasta que aparecen como resultado de una consulta a través de un buscador pasa por una serie de procesos. Entre estos procesos destacan los siguientes descritos:
-
Recolección: La recolección de documentos web es realizada de forma automática por unos agentes web denominados robots o arañas. Estos robots van navegando por la web de forma autónoma saltando de una página a otra a través de los enlaces. Las páginas leídas son enviadas a un servidor para su posterior indexación. Estos agentes tienen programado un motor de recolección que limita el tiempo que dedican a un sitio web o la profundidad máxima de exploración. Estas limitaciones se fijan en función de la reputación de cada sitio. La buena reputación, tal y como se indica en , es primordial ya que los buscadores asignan sus recursos a los sitios web en función de esta reputación.
-
Indexación: La indexación consiste en la extracción de palabras y frases más importantes de cada documento. Posteriormente se genera un índice que relaciona estas palabras con la URL del documento. En el proceso de análisis e indexación se contemplan también los enlaces dándose mucha importancia a las palabras incluidas en el texto del enlace de forma que las palabras de los textos de enlace pueden quedar asociadas al documento enlazado aunque este no contenga estas palabras.
-
Recuperación: El proceso de recuperación analiza la frase de búsqueda y selecciona las URL cuyo contenido es más relevante generándose un conjunto de URLs resultado. Este conjunto es ordenado finalmente haciendo uso de un índice que en el caso de Google es el Page Rank, un índice para cuya generación se utilizan múltiples variables entre las que destacan los enlaces recibidos.
Posicionamiento en Internet
El termino de Posicionamiento en Internet se aplica a lo largo de este capitulo a la posición que ocupa las páginas de un web en los resultados proporcionados por buscadores como Google o Yahoo.
El motivo de la importancia del posicionamiento y por lo tanto de la inclusión de un capitulo dedicado a este tema es que si una página no es conocida por un buscador, nunca podrá ser localizada haciendo uso de sus servicios de búsqueda.
Pongamos dos ejemplos, recientemente la biblioteca Virtual Miguel de Cervantes (cervantesvirtual.com) ha publicado “El divino cazador” una edición facsímile de la obra de Pedro Calderón de la Barca. Esta publicación realizada a partir de la publicada en 1981 por el Ministerio de Cultura ofrece, además, de la imagen del original, enlaces a varias transcripciones textuales. Si la página no está posicionada en los buscadores cuando alguien busque “divino cazador” en Google, la página que con tanto esfuerzo a elaborado esta institución quedaría oculta y sería accesible tan sólo por aquellos internautas que accedieran al web cervantesvirtual.com.
Para verificar que Google ha indexado esta página se realiza la consulta del titulo del libro y se restringe la búsqueda al dominio cervantesvirtual.com obteniéndose el siguiente resultado donde se verifica que la página ya ha sido recolectada por Googlebot, el robot de Google, e indexada por el buscador.


Posicionamiento Actual de Sitios Españoles
En la actualidad son pocas las Instituciones culturales que han incorporado la mejora del posicionamiento en Internet como parte fundamental de su estrategia en Internet. Algunos Museos como el Museo Thyssen-Bornemisza, el Museo Nacional Centro de Arte Reina Sofía o la Fundación Lázaro Galdiano vienen desarrollando desde el primer trimestre del año 2004 trabajos de optimización de sus sitios web con objeto de optimizar su posicionamiento, trabajos cuyos resultados ya son visibles.
Destacan también las jornadas Posicionamiento.es organizadas por el Instituto Cervantes, La Biblioteca Virtual Miguel de Cervantes, Casa de América y el Consejo Superior de Investigaciones Cientificas que tuvieron lugar en Alicante en Mayo de 2004 donde representantes de las principales instituciones culturales, científicas y educativas de habla hispana debatieron sobre el estudio del posicionamiento en Internet.
Motores de Búsqueda y Directorios
Los buscadores son sitios web que tienen como objetivo organizar la información de Internet de forma que pueda ser fácilmente encontrada por los internautas a los que ofrecen diversos servicios de búsqueda. Atendiendo a la forma en la que un buscador incorpora un web y su contenido, se pueden clasificar en: Motores de Búsqueda y en Directorios.
Un motor de búsqueda es un web que hace uso de unos programas denominados robots para recolectar la información este programa navega de forma autónoma a través de Internet saltando de una página a otra haciendo uso de los hiperenlaces y recolectando información que después es tratada para la generación de un índice el que se realizan las búsquedas. Por lo tanto podemos identificar en dos procesos: un proceso de recolección de información y un posterior proceso de análisis y clasificación automática de la información.
Una vez que un motor de buscador tiene conocimiento de un nuevo Web, sus robots realizan visitas periódicas para actualizar la información que tiene catalogada de cada página. Estos buscadores tendrán conocimiento de nuestro web si alguna de las páginas que ya conoce tiene enlaces a nuestro sitio, si se lo hemos indicado en dando de alta nuestra URL en el www.DMOZ.org (Open Directory Proyect) en el caso de Google o directamente en www.yahoo.es en el caso de Yahoo. Obviamente si los buscadores no conocen la existencia de nuestro web, sus contenidos nunca aparecerán como resultado de ninguna búsqueda. El ejemplo más destacado y utilizado de motor de búsqueda es Google.
Un directorio es una clasificación de sitios web realizada por humanos que incluyen cada web en la categoría mas adecuada a su contenido generándose un gran índice temático. A diferencia de los Motores de Búsqueda que guardan información sobre cada página, los directorios realizan la clasificación a nivel de sitio web ofreciendo a los usuarios la posibilidad de localizarlos mediante la navegación por temas. El ejemplo mas destacado de directorio es Yahoo o DMOZ.
Esta es una clasificación teórica puesto que los dos buscadores mas utilizados por los internautas Google y Yahoo ofrecen tanto la posibilidad de navegar por temas como la posibilidad de buscar en el contenido de las páginas.
En Internet existen miles de buscadores pero al analizar las encuestas de uso de los Internautas y las estadísticas de navegación de diversos web queda patente que sólo un pequeño número aportarán visitantes a nuestro web y es precisamente en la forma de funcionar de estos buscadores en la que se debe pensar a la hora de analizar y optimizar el posicionamiento de un web.
Actualmente mas de 55 millones de europeos utilizan Google para buscar información en Internet lo que supone un 47% del universo total en enero de 2004 le siguen MSN Search 27,1% y Yahoo Search con un 12,6% , en España el uso de Google asciende al 61,55% seguidos de MSN y Terra. Estas son cifras de uso de los buscadores pero si tenemos en cuenta que actualmente las búsqueda de MSN son realizadas con tecnología Yahoo nos encontramos con una situación en la que las búsquedas son realizadas bien por Google 44% o por Yahoo 51%. Sin embargo esta situación podrá variar en los próximos meses con la aparición de nuevos buscadores como el A9 desarrollado por Amazon y el desarrollo de nuevos sistemas de recolección clasificación y búsqueda de información por parte de Yahoo y MSN.
Los Robots
Los robots o arañas, son programas que navegan de forma autónoma a través de Internet saltando de una página a otra y de una página a otra haciendo uso de los hiperenlaces en un proceso de recolección de información.
Mediante este proceso de recolección el robot va recorriendo páginas que son enviadas a un servidor donde son almacenadas. Para asegurarse que una correcta recolección de información de un web habrá que tener en cuenta a la hora de su diseño y programación, la forma de navegar de los robots. Para saltar de una página a otra un robot tan sólo puede seguir un enlace y en muchas ocasiones no pueden seguir los típicos enlaces incluidos en menús dinámicos.
Un problema típico de los web de Museos es el disponer de una base de datos con toda la información de un conjunto de obras que permite al usuario realizar búsquedas por autor, título, etc. Cuando un robot llega a un web de este tipo, no puede alcanzar las páginas particulares de cada obra puesto que no sabe teclear el nombre de un autor o un título. Para solventar este problema conocido como “Internet Oculta” será necesario el desarrollo de páginas que permitan la navegación entre obras mediante un simple clic que es lo que en definitiva sabe hacer un robot.
El objetivo de cualquier institución debería ser el que los robots de los buscadores mas importantes leyeran el 100% de sus páginas, es decir si un museo dispone de información sobre 100 obras organizadas en tres páginas: autor, ficha e imagen, los robots deberían leer 300 páginas.
Posteriormente se realiza el proceso de indexación y optimización donde se analiza el número de palabras de cada página, la frecuencia con que aparecen, la relevancia de cada una como su posición en el texto, su fuente, tamaño y metatag asociado.
Finalmente cuando un internauta realiza una consulta, el buscador compara la frase de búsqueda con la información de palabras almacenadas y realiza una selección de páginas que son ordenadas en función del grado de ajuste a la frase de búsqueda y del Page Rank.
Es habitual que los sitios web evolucionen e incorporen nuevos contenidos quedando otros obsoletos que no deberían ser leídos por los robots. Para indicar a los robots que páginas no deseamos sean recolectadas, se deberá incluir un fichero robots.txt en la carpeta raíz de nuestro web. El formato que debe tener este fichero así como su utilidad, se describen en detalle en la página web oficial en la que se describe el formato de este fichero.
Ranking de Páginas
Recientemente casi todos los buscadores han incorporado el concepto de ranking de página que asigna un valor numérico a cada página indexada en función de diversas variables. Este valor es utilizado por el buscador para ajustar la ordenación final del resultado de cada consulta así como para asignar la frecuencia de las visitas de los robots del buscador al sitio web así como la profundidad de la búsqueda.
Google asigna a cada página una puntuación entre 1 y 10 a la que llama Page Rank (PR) en función de los enlaces que reciba una página así como del PR de la página desde la que se enlaza. Para poder visualizar el Page Rank de una página es necesario tener instalada la barra de navegación de Google donde aparece un icono donde se indica el PR de cada página. Un error común es considerar que el page rank está asociado al dominio sin embargo está asociado a la página de forma que en un mismo sitio web existirá páginas con page rank 5 y otras con page rank 0.
Un PR a partir de 4 puede considerarse bueno, un page rank de 10 es una puntuación tan sólo al alcance de sitios como Yahoo o Google. Normalmente las páginas con PR 0 son páginas que no han sido revisadas por Google por que hayan sido publicadas recientemente o por no ser accesible por los robots. Puede ocurrir que una página sea accesible desde un navegador pero los robots no puedan llegar a ella.
La importancia que últimamente los buscadores dan a la popularidad de enlaces hace recomendable que las instituciones culturales establezcan políticas razonables de intercambio de enlaces entre sus web orientadas a mejorar esta popularidad en todas ellas. Un objetivo razonable de cualquier institución debería ser el obtener una valoración en este tipo de índices superiores a 5.
Internet Invisible
Tal y como se hacia referencia en la introducción de este trabajo, bajo el termino Internet invisible se conoce a todos aquellos contenidos disponibles a través de Internet pero que no son accesibles directamente desde los buscadores.
El punto crítico donde un contenido se convierte en invisible es el proceso de recolección que los robots realizan mediante una navegación automática de la Red. Los principales motivos que limitan esta recolección tal y como se indica en son:
-
Accesos Denegados: Aunque en teoría este problema se deriva del deseo del administrador de un sitio web de limitar el acceso a la información, lo cierto es que en muchas ocasiones se constata que muchos de estos accesos denegados son provocados por una deficiente administración así como un desconocimiento del impacto que tiene en la visibilidad de la información a través de los buscadores. Las principales causas de esta denegación de acceso son: falta de permisos en los permisos asignados por el sistema operativo o el servicio web a los archivos, presencia de un cortafuegos que limita el acceso a contenidos tipo Intranet, restricciones incluidas en el fichero robots.txt.
-
Problemas de Interpretación: La dificultad de interpretación surge cuando los contenidos son publicados haciendo uso de protocolos inusuales, formatos de difícil indexación como flash y formatos gráficos o de impresión con texto difícilmente reconocible sin la utilización de software OCR.
-
Dificultades en el Descubrimiento: Los robots son agentes de recolección con unas capacidades de navegación entre páginas limitadas. Esta capacidad es similar a la que tendría un usuario con un ratón y sin teclado, es decir, todo aquello que no pueda ser accedido con un simple clic de ratón, queda fuera del alcance de los robots. Ejemplo de esta limitación son las bases de datos de consulta de autores u obras típicas de los Museos en la Red. Como el robot no sabe cumplimentar la palabra Picasso en el formulario del buscador de obras, será necesario elaborar un índice de autores que dé acceso con un simple clic a la lista de obras de este autor.
-
Dependencia Temporal: En Internet hay mucha información con una vida temporal muy breve, información como las noticias, ofertas de comercios on line, información bursátil, etc. Esta dependencia hace que la dirección de la información indexada pueda no ser coherente al cabo del tiempo. Para solventar este problema, buscadores como Google han incorporado una copia en caché de la información indexada.
Recomendaciones para un buen Posicionamiento
Como es lógico, las instituciones culturales, especialmente los Museos prestan una gran atención y esfuerzo a los aspectos de diseño de todo el material impreso que se produce en torno a sus obras y servicios. Esta situación se ha trasladado al mundo Internet donde se han elaborado muy buenas páginas desde el punto de vista del diseño pero cuyos contenidos son difíciles de localizar por los buscadores.
Muchas de las páginas desarrolladas en los últimos años, especialmente las que han hecho uso de tecnología flash o animaciones con tecnología java, no pueden ser leídas correctamente por los robots por lo tanto sus contenidos no son recolectados y en consecuencia nunca podrán formar parte del resultado de una consulta en un buscador.
Imaginemos un museo con 1.000 obras de diversos pintores como Picasso o Monet con una gran página web desde el punto de vista del diseño pero de la que los buscadores tan sólo conocen su página principal. Si un internauta realizara una búsqueda incluyendo la palabra Picasso, no aparecerían las páginas de las obras de Picasso de este museo. Esta situación es desgraciadamente mas habitual de lo deseable puesto que es completamente incompatible con la difusión cultural que debe ser uno de los objetivos principales de las instituciones culturales.
Para lograr un buen posicionamiento, algunos elementos que se deben evitar en una página web son los popups y los frames: los popups han sido un recurso utilizado masivamente para realizar campañas de marketing OnLine y cada vez mas usuarios disponen de navegadores que bloquean estos popups. El uso de frames puede provocar la indexación parcial de una página de forma que la página recuperada como resultado de una consulta en un buscador, sea incompleta. Hay que asegurarse que desde cualquier página de aparezca como resultado en un buscador, el internauta pueda continuar la navegación hacia el resto de canales del web.
La tecnología Flash permite realizar magníficos diseño pero actualmente tiene la limitación de que los robots no son capaces de leer el contenido completo de páginas desarrolladas con esta tecnología, parece ser que algunos buscadores como Google ya están trabajando para eliminar esta limitación. Tal y como índica Ricardo Baeza en su estudio de los sitios web de Chile, el 70% de estos sitios no son bien indexados por los robots al hacer uso de tecnología Flash. Si el posicionamiento es realmente una de las prioridades de un sitio web, debería de restringir el uso de esta tecnología a elementos muy puntuales estéticos o de contenidos multimedia.
Evitar Internet Invisible
Los primeros web desarrollados se basaban en páginas estáticas HTML. En el mundo de las instituciones culturales estas primeras versiones de sus sitios web cumplían el objetivo principal de explicar quien era la institución y cuales eran sus objetivos. En el mejor de los casos incluían una breve muestra de los contenidos culturales que gestionaban, en ningún caso daban acceso a la totalidad de los mismos.
La evolución tecnológica junto con la demanda de contenidos culturales en Internet por parte de la “sociedad de la información” hizo que estos primeros sitios web estáticos evolucionaran e incorporarán un gran número de contenidos (pinturas, esculturas, estudios,…) gestionados por las instituciones. Para poder ofrecer estos contenidos se desarrollaron nuevos sitios web donde las páginas estáticas fueron sustituidas por páginas dinámicas que gestionaban contenidos alojados en bases de datos. El principal motivo de almacenar los contenidos en base de datos fue el facilitar su mantenimiento por parte del personal de la institución (el departamento de conservación actualiza la descripción de las obras o el departamento de prensa da de alta nuevo material para los medios de comunicación).
Este nuevo modelo dio lugar a que los contenidos que se almacenaban en la base de datos no fuesen recolectados por los robots constituyendo los que se ha llamado “Internet Invisible”, páginas que aún estando publicadas no son conocidas por los buscadores (sus robots no las han recolectado) y por lo tanto no son accesibles desde ellos.
Reflexionemos unos segundos sobre el echo de que estamos hablando por ejemplo de un Museo que ha realizado una inversión económica y humana, en introducir todas sus obras en una base de datos (descripción, biografías, imágenes) y sin embargo cuando alguien busque en Google por el nombre exacto de un título de una obra, esta no aparecerá en los resultados.
Sin duda, al igual que en otros sectores, en el mundo cultural la Internet invisible es probablemente el mayor problema para la difusión de los bienes culturales gestionados por las instituciones. A la vez, en muchos casos es uno de los problemas de más fácil solución mediante la creación de páginas índice que den acceso a los contenidos mediante enlaces que puedan ser recorridos con un simple clic que es lo que saben hacer los robots.
En un proceso de optimización y haciendo uso entre otras de esta técnica de generación de índices, el web del Museo Thyssen-Bornemisza alcanzó los siguientes objetivos:
-
Todas las obras de la colección fueron recolectadas por Googleboot en el plazo de 2 meses.
Actualmente es posible acceder a la ficha de todas las obra realizando una consulta por su título directamente en Google.
El gráfico adjunto recoge el número de páginas indexadas por los tres principales buscadores de algunos de cuatro de los museos más europeos más importantes. Al analizar esta información destaca:
Los principales buscadores actualmente se encuentran compitiendo por ser los que más documentos web tienen indexados. Esta competencia se ha visto incrementada en el último año tal y como se ve en el gráfico adjunto donde se observa como sitios web como Museothyssen.org han casi triplicado sus páginas indexadas por Google.
El incremento del número de páginas indexadas indica una reducción de los contenidos invisibles debido principalmente al incremento de recursos dedicados por los buscadores a la recolección de datos y por otro a las mejoras realizadas en los sitios web dirigidas a mejorar su visibilidad y por lo tanto su posicionamiento en la Red.
Estructura una página Web
De cara a obtener un buen posicionamiento en los buscadores, las páginas web deben de cumplir con una serie de requisitos que estructuren su información correctamente y faciliten el trabajo de los buscadores en los procesos de recolección e indexación de la información.
Las páginas web típicamente están programadas en un lenguaje llamado HTML que organiza la información haciendo uso de etiquetas que van entre los símbolos “<” y “>” y se estructuran en dos partes fundamentales: la cabecera de la página que contiene información que describe la página y su contenido y el cuerpo que recoge el contenido propiamente de la página. En HTML estos dos partes se identifican con las etiquetas <Head></Head> y <Body></Body>.
Las información contenida en ambas partes debe ser coherente, es decir si la página recoge en su cuerpo información sobre el turismo cultural en Madrid, la cabecera debe tener un contenido sintetice este contenido. Las páginas que no guardan esta coherencia no son bien valoradas por los buscadores y en consecuencia su posicionamiento se resiente.
Cabecera de la Página
La cabecera de la página debe contener una información que describe coherentemente el contenido del cuerpo de forma que ofrezca a los buscadores una buena información para una correcta indexación de la página. Esta información se estructurará mediante etiquetas HTML y debería recoger los siguientes datos:
-
Título <TITLE>título de la página</TITLE>: Breve descripción de no mas de 100 caracteres del contenido de la página y el web en general.
-
Descripción <META NAME=”description” CONTENT=”descripción del contenido”>: Breve descripción del contenido del cuerpo de la página.
-
Palabras Clave <META NAME=”keywords” CONTENT=”palabras clave”>: Conjunto de palabras principales, puesto que el la cabecera debe ser coherente con el cuerpo siendo una buena practica la extracción de parte de estas palabras del cuerpo de la página. Esta lista de palabras junto con la información del cuerpo, será utilizada por los buscadores a la hora de realizar la indexación de la página.
Cuerpo de la página
El cuerpo de la página recoge el contenido propiamente dicho de la página, lo que el internauta podrá visualizar en un navegador y que incluye tanto texto como imágenes y otros materiales multimedia.
Todas las palabras incluidas en el cuerpo tendrán una frecuencia de repetición así como una posición relativa en el documento. Estas son dos de las variables que junto con la información de la cabecera, utilizan los buscadores a la hora de indexar una página y posteriormente a la hora de valorar el grado en el que la estructura de palabras de una página se ajusta a las palabras consultadas por un internauta.
No se debe abusar de la repetición de palabras en el contenido de la página, una página donde se incluyera 100 veces la palabra museo no sería valorada por los buscadores y es seguro que no aparecerá en primeras posiciones en el resultado de una búsqueda en Google por la palabra “Museo”. Todos los buscadores disponen de sistemas para identificar y penalizar este tipo de prácticas.
Para organizar el cuerpo y destacar palabras se hará uso de las etiquetas de cabecera <H1></H1> así como de la negrita y diferentes tamaños de fuente de esta forma el buscador identificará los textos que el creador de la página considera mas relevantes y les dará prioridad en el proceso de indexación.
Las imágenes al igual que el resto de contenido de la página también es analizada por los robots e indexada por el buscador, de hecho, todos los buscadores incluyen la posibilidad de buscar sólo imágenes por lo que es recomendable ofrecer información sobre las mismas haciendo uso de los textos alternativos e incluso el nombre del fichero por ejemplo, el nombre de una imagen de una obra podría ser segadores.jpg o vangogh-01.jpg en vez de 10-98.jpg.
Otro de los elementos que mas se valoran en el cuerpo de una página son los enlaces, el texto de estos deberían describir la página a la que dan acceso, sustituyendo enlaces del tipo “ficha” por “biografía Gauguin”.
Como ya se indicaba previamente, el primer paso en el posicionamiento es facilitar la recolección de datos por los robots y puesto que estos son programas, les es mas fácil la lectura de páginas HTML bien estructuradas por lo que es muy recomendable seguir recomendaciones como las elaboradas por el W3C (World Wide Web Consortium) dirigidas a mejorar la accesibilidad de las páginas web.
Estrategia de Enlaces
Como ya se indicaba en el punto 2.1 de este estudio, Internet puede ser observada como un gran repositorio de documentos que se relacionan entre si mediante los enlaces. Estos enlaces que de forma simple pudieran ser considerados como simples caminos entre archivos, encierran gran cantidad de Inteligencia humana al constituir una recomendación y relacionar dos documentos. Los buscadores actualmente dan mucha importancia a estas recomendaciones y a los textos asociados a las mismas, tanto en la página de origen como en la de destino.
Buscadores como Google además incluyen un ranking, el Page Rank de importancia de páginas que se basa entre otras variables en el número de enlaces que recibe y el ranking de las mismas. Actualmente el estudio de los enlaces como medida de la importancia de una página constituye una de las principales líneas de trabajo de los buscadores que orientan sus algoritmos de recuperación hacia modelos como valoren la conectividad y la importancia de los enlaces en el ámbito de una consulta como el HITS.
El HITS clasifica las páginas en dos tipos Hubs y Autoridades:
-
Autoridades: Páginas que son muy relevantes para una búsqueda y reciben muchos enlaces de páginas que le reconocen esta autoridad.
-
Hubs: Páginas que apuntan a varias páginas con autoridad. Son típicamente páginas con poco contenido y muchos enlaces.
La importancia que tiene el número y calidad de los enlaces que recibe una página hace imprescindible el establecer una política clara de enlaces con sitios web de temática similar o complementaria.
Una buena estrategia de enlaces debería tener las siguientes características:
-
Primar la calidad sobre la cantidad.
-
Utilizar directorios, portales temáticos y agregadores como; DMOZ, Yahoo, europeanmuseumguide.com o pricerunner.co.uk.
-
Diseñar contenidos de calidad para publicarlos en sitios relacionados.
Posicionamiento Inicial
De cara a obtener un buen posicionamiento la selección de un buen dominio es muy importante, este nombre debería incluir las palabras clave que consideremos mas importantes por ejemplo una biblioteca debería incluir la palabra “biblioteca” en su nombre de dominio.
Museo-Arte-Thyssen.org probablemente sea un buen dominio desde el punto de vista del posicionamiento pero desde el punto de vista de los usuarios es mas fácil recordar Museothyssen.org.
Esta recomendación de incluir palabras clave en el nombre del dominio debe ser compatible con que esta sea fácil de recordar y que esté asociada a la imagen de marca que la institución tenga fuera de Internet.
Una vez desarrollado el web y seleccionado el dominio asociado deberemos proceder a darlo a conocer a los buscadores y directorios para lo cual haremos uso de los servicios de inclusión que nos ofrecen. Como mínimo debería incluirse en Yahoo y en DMZ que es el directorio que toma como referencia Google.
Es aconsejable apoyar el conocimiento de nuestro web con acciones de marketing tradicional como pueden ser incluir la dirección de nuestro web en todos los folletos publicitarios que se elaboren en la institución.
Método de Análisis del Posicionamiento
La mejora del posicionamiento es un proceso continuo y en muchos aspectos experimental de forma que se necesario establecer un método de análisis que nos permita realizar un seguimiento eficiente del posicionamiento en Internet así como del resultado de las mejoras introducidas.
El método siguiente recoge las actividades fundamentales que el administrador de un web debería realizar para analizar el posicionamiento de su web.
Análisis del los Visitantes de un Web
A lo largo de este capitulo se ha incidido en diversas ocasiones en la labor de difusión cultural que las instituciones culturales deben realizar como parte fundamental de su actividad diaria, Internet elimina barreras ofreciendo nuevos públicos a los dar a conocer nuestros contenidos. Es necesario poder cuantificar tanto la difusión en un periodo dado como su evolución y tendencia, esta cuantificación indicará entre otras cosas cuanta gente visita nuestro web así como cuales son los contenidos mas atractivos para ellos.
La realización de un análisis que ofrezca esta información es muy sencillo, hay diversas herramientas en el mercado, muchas de ellas gratuitas que ofrecen buenos análisis, algunas de ellas están incluidas en el apartado final de software útil. Cualquiera de estas herramientas lee los ficheros de log de un Web y genera un informe en formato Word, Excel, etc con datos en formato tabular y gráfico.
Un fichero de log es un fichero que se va generando en el servidor web y en el que se va incluyendo información anónima y detallada de las páginas que son visitadas. Inexplicablemente hay muchas instituciones que no disponen de estos ficheros por lo que no pueden realizar ningún tipo de análisis y en consecuencia no conocen el número de visitantes que tiene su web. ¿ Alguien puede imaginar esta situación en el mundo real?, un museo que no conozca a diario el número de personas que visitan sus exposiciones o un periódico que no conozca el número de lectores o una biblioteca que no conozca el número de libros prestados.
En consecuencia, lo primero que hay que hacer es disponer de los ficheros de log generados por el servidor por lo menos de forma mensual, además se debe mantener los ficheros antiguos para poder realizar análisis de periodos más amplios y comprobar la tendencia de las visitas.
Visitas
Respecto a las visitas es importante conocer el número de visitantes, la duración de la visita así como su origen geográfico aunque este último dato no es excesivamente útil al contabilizarse por ejemplo visitas desde países sudamericanos como visitas realizadas desde los EE.UU. La única forma de conocer realmente la distribución geográfica de nuestros visitantes es preguntándoselo en una encuesta, sin embargo, las encuestas en Internet tienen un bajo índice de respuesta.

Respecto a lo que visualizan los internautas será importante conocer las páginas o directorio más accedido así como los ficheros más descargados si es que se ofrece la posibilidad de descargar documentos como podría ser una guía en formato pdf para realizar la visita a una exposición temporal de un Museo. Esta información permitirá identificar recursos con pocos accesos por estás mal indicado su situación en el web o por que carecen de interés.
Buscadores
Analizar la actividad de los buscadores, es decir las visitas que han generado y las palabras que han sido utilizadas en las consultas es importante para:
-
Determinar los buscadores que son más importantes en términos de tráfico generado.
-
Identificar las palabras clave bien posicionadas, es decir las utilizadas por los usuarios de forma exitosa.
-
Identificar las palabras mal posicionadas, es decir las que no son utilizadas por los usuarios o no generan como resultado páginas del sitio analizado.
Al analizar la actividad de los buscadores en el sitio MuseoThyssen.org destaca la magnitud de la actividad de Google frente al resto de buscadores. La actividad de los buscadores está relacionada con el número de páginas indexadas recogidas en el gráfico de páginas indexadas del punto 3.6.1 de este documento.
Referentes
En cuanto a desde donde y como acceden los Internautas será importante conocer desde que página han accedido a nuestro web, por ejemplo desde un enlace de Terra o desde un buscador, es lo que se conoce como referentes. Los referentes nos indicarán los sitios web que nos enlazan así como los visitantes que remiten a nuestro web.

La identificación de los principales referentes es primordial a la hora de establecer estrategias de intercambio de contenidos o recomendaciones mediante enlaces. Obviamente los sitios que generen más tráfico deberían ser prioritarios en este tipo de estrategias.
Para el análisis de referentes se ha tomado como información de base los ficheros de log generados por el servidor web y se han analizado haciendo uso de una pequeña aplicación desarrollada en Visual Basic para extraer y transformar los registros de referentes excluyendo aquellos registros con referente interno o sin referente.
Al analizar los principales referentes destaca el buscador Google que genera un 15% entre Google.es, Google.com y Google.com.mx.
Para poder estimar la importancia de los buscadores y enlaces en base al tráfico que aportan a un sitio es necesario identificar cuantas visitas proceden de otros sitios a través de un enlace y cuales han llegado a través de una consulta en un buscador.
Al realizar este análisis destaca la importancia del tráfico recibido directamente desde otras páginas (46%) así como la importancia de Google frente a otros buscadores. Google es el buscador que aporta más visitas sin embargo estas cifras hace tan solo unos meses llegaban al 85% lo cual indica que cada vez más usuarios hacen uso de buscadores alternativas a Google.
Esta tendencia se debe entre otros motivos al incremento de las páginas indexadas por estos buscadores. Este esfuerzo de recolección e indexación de páginas se ve reflejado en la mayor actividad de los robots de Yahoo y MSN.
Robots
Tal y como se indicaba en el punto 2.2 de este documento, el primer proceso al que somete un buscador a los documentos web es el de recolección realizado por los robots.
Analizar la actividad de los robots permite:
-
Identificar los buscadores más interesados en un sitio web, sus periodos de visita, tiempo dedicado a la recolección, etc.
-
Identificar la actividad de robots no asociados a buscadores que pueden someter a un servidor web a cargas de trabajo excesivas.
Al analizar la actividad de los robots y compararla con la actividad de su buscador asociado se observa como los buscadores que más visitan un web no siempre es el que más actividad tiene. En el caso de MuseoThyssen.org el buscador Google acumula el 88% de la actividad de buscadores frente a tan sólo un 34% de la actividad de su robot GoogleBot.
Conocer la actividad de un buscador, su popularidad entre los buscadores, las páginas indexadas es importante a la hora de analizar el posicionamiento de un sitio web sin embargo, el dato más importante siempre será el tráfico real que un buscador genera en forma de visitas.
Patrones de Comportamiento
El conocimiento del usuario se ha constituido como uno de los puntos clave del éxito de un sitio web. Un conocimiento de calidad permite adaptar la oferta de servicios y contenidos a la demanda real de los usuarios estableciendo estrategias de adaptación de las páginas en función del perfil de usuario y sus características.
Tradicionalmente el conocimiento del usuario se ha basado en el simple análisis de los ficheros de log que son generados de forma automática por los servidores web. Sin embargo esta técnica que permite la generación de estadísticas sencillas, no permite la identificación de patrones de navegación. Para poder identificar este tipo de patrones tal y como se indica en , y es necesario aplicar técnicas de minería de datos en internet (webmining) que combinen información sobre la estructura del web y sus contenidos junto con bases de datos con información como las transacciones realizadas, productos adquiridos, etc.
A continuación se describen algunas técnicas para la identificación de patrones de uso, existen muchas más pero todas comparten un objetivo común: conocer el uso que los internautas hacen de un sitio para poder adaptar la oferta a la demanda real.
Análisis de Logs y Bases de Datos
El método más utilizado para conocer los hábitos de los usuarios de un sitio web es el análisis de los ficheros log que generan los servidores web. Estos ficheros han sido utilizados tradicionalmente por los web master para valorar el tráfico de un sitio y poder evitar posibles problemas de ancho de banda, identificar enlaces rotos, disponer de estadísticas de recursos más utilizados, origen del tráfico, etc.
Técnica de Marcajes
La técnica definida previamente permite la obtención de patrones a una vez estén disponibles los ficheros de log y la información de las bases de datos transaccionales haya sido depurada. Sin embargo, y debido entre otros motivos al carácter competitivo de Internet, algunos negocios necesitan información online de la actividad de los usuarios. Esta información debe transmitir de forma clara los hábitos de los usuarios por lo que estadísticas de uso por directorio o archivos y otras similares propias de los análisis de log son claramente insuficientes.
Actualmente diversas empresas relacionadas fundamentalmente con el mundo de marketing online están haciendo uso de estrategias de análisis basadas en el marcaje de las páginas.
Este tipo de técnica es desde un punto de vista tecnológico muy sencilla pero exige un gran esfuerzo en el diseño de las marcas de las páginas para que los patrones de uso generados sean realmente útiles. Básicamente la técnica consiste en marcar cada página que se quiera monitorizar con una etiqueta que la identifica. Varias páginas pueden tener la misma etiqueta. Conforme el usuario navega por el site, se van registrando en una base de datos las etiquetas de las páginas que visualiza.
Imaginemos un comercio electrónico que etiqueta todas las páginas con ofertas con la marca <OFRT> inmediatamente y mediante una página de consulta el administrador del comercio podría conocer lo atractivo que resultan las ofertas para un(os) usuario(s) como recuento de las páginas impresas con esta etiqueta.
Es definitiva esta técnica permite obtener información de los hábitos de navegación de forma más sencilla y rápida que los análisis de Log. Sin embargo, un uso excesivo de páginas etiquetas podría ralentizar la navegación al tener que registrar su visualización en una base de datos.
Obviamente, los problemas de identificación de usuarios también existen en esta técnica al disponer por norma general tan sólo de su dirección IP unos datos que en muchas ocasiones está asociado a muchos usuarios que acceden a Internet a través de un Proxy que enmascara la IP real.
Ficheros de Logs Creados con Metadatos
Una técnica que amplia la de marcajes es la propuesta en basada en la creación de ficheros de log con contenido semántico, paralelos a los generados por el servidor web. La técnica se basa en el análisis de las páginas generadas dinámicamente y sus parámetros de generación para la generación de un registro de Log.
Obviamente y como ocurría con la técnica de marcajes, la dificultad técnica es mínima debiendo dedicar un esfuerzo mayor en la identificación de la información que se desea incluir en los logs.
Imaginemos esta técnica aplicada a la página web de una biblioteca virtual en el que el acceso a las obras se realizara mediante un enlace de tipo: Fichaobra.asp?idobra=123&form=pdf

El fichero de Log generado sería siguiente:
Analizando este sencillo fichero y cruzándolo con la base de datos de libros, el administrador podrá conocer rápidamente los libros más consultados independientemente de la procedencia de la búsqueda y los formatos más demandados.

Aplicando esta técnica a la consulta de obras del web MuseoThyssen.org se han obtenido los siguientes datos de las 15 obras más visitadas el día 1 de diciembre de 2004. Obviamente para que este análisis sea verdaderamente útil debería realizarse sobre un periodo más amplio.
Análisis del Posicionamiento en Buscadores y Directorios
Respecto a los buscadores es básico conocer cuales son los mas importantes así como las frases de búsqueda que utilizan los internautas para localizar nuestro web, analizando esta información se pueden identificar la ausencia de frases clave lógicas que aparentemente no son utilizadas o si lo son, nunca dan como resultado páginas de nuestro web.
Como ya se indicó previamente los buscadores envían a los robots cada cierto tiempo para recolectar información de nuestro web a través del análisis de las visitas es posible identificar los robots que han visitado el web así como el número de visitas realizadas, pudiendo identificar robots que no nos visitan por que no conocen la existencia del web.
Además es importante conocer el número de páginas que los principales buscadores tienen indexadas de nuestro sitio por los menos en Google y Yahoo. Es posible conocer este datos realizando la consulta “allinurl:midominio”, por ejemplo, para conocer las páginas indexadas por Google del web de la National Gallery bastaría con buscar en google “allinurl:www.nga.org” dado el resultado a fecha 18 de julio de 2004 10.000 páginas indexadas.
Este dato de páginas indexadas es critico ya sobre todo si realizamos mejoras para que los robots lean mejor nuestro web o si incluimos secciones nuevas en el como puede se unas páginas web dedicadas a una exposición temporal o un nuevo canal dedicado a ofrecer contenidos a la comunidad educativa. No hay que olvidar que todas aquellas páginas que no sean conocidas (indexadas) por los buscadores nunca aparecerán como resultado de ninguna consulta.
Análisis de Competidores
Tal y como se indicaba en la introducción, Internet constituye un espacio de feroz competencia por lo que la identificación de los sitios con los que se compite es una de las tareas prioritarias desde un punto de vista del posicionamiento.
Dos sitios web son competidores si: sus contenidos y/o servicios pertenecen a un mismo área de conocimiento o negocio y se dirige a un público objetivo similar.
A la hora de identificar a los competidores, no hay que olvidar a aquellos competidores off line que aunque tengan una presencia testimonial en Internet esta podría pasar a ser estratégica y convertirse en nuevo competidor online.
Para identificar a los competidores se proponen los siguientes métodos basados en las relaciones directas o indirectas que se establecen entre diferentes páginas.
Competidores por Contenido
Los competidores por contenido son sitios web que aparecen en los resultados de una consulta en los buscadores. Obviamente este tipo de competidores son dependientes de la consulta por lo que es recomendable seleccionar consultas que reflejen claramente la actividad y contenidos de un sitio.
Por ejemplo, para seleccionar los competidores de MuseoThyssen.org se ha utilizado la consulta “museo arte” y “art Museum” además se ha incluido una restricción que consiste en seleccionar tan sólo los sitios web que con las palabras Museum o Museo en su URL. La consulta ha sido realizada sobre Google y sólo se han tenido en cuenta los primeros 500 resultados.
Para seleccionar los sitios web que cumplieran estas condiciones, se ha utilizado la herramienta WebQL que permite consulta la web haciendo uso de un lenguaje de consulta similar al SQL considerando todo Internet como una gran base de datos.
Este tipo de herramientas se comportan como un robot y tienen la capacidad de ir recorriendo enlaces en función de diferentes criterios
La consulta desarrollada es la incluida en (*) y ha dado como resultado 163 sitios web. Al haberse quedado fuera de esta lista sitios relevantes como el sitio de la National Gallery (nga.gov) al no tener la palabra museo en la URL se han incluido de forma manual algunas referencia de sitios de Museos relevantes. A continuación se incluye el listado de los 64 sitios web competidores más importantes en base a un ranking elaborado a partir de los siguientes datos obtenidos de cada sitio:
-
Ficheros ricos indexados por Google: los ficheros ricos son típicamente pdf, doc, ps, ppt o rtf. Estos ficheros contienen habitualmente trabajos elaborados en torno a obras de los Museos aunque al no analizarse su contenido, algunos podrían ser ficheros más relacionados con la burocracia de la institución.
El siguiente es el ranking elaborado a partir de la lista de competidores y los datos obtenidos de Google y Yahoo. En este ranking el MuseoThyssen.org ocupa la posición 21 principalmente por el número de páginas indexadas tanto por Google como por Yahoo.

El ranking generado será mejorado en próximas versiones al incluirse nuevos buscadores: MSN, Tehoma y el nuevo buscador francés Exalead.
Competidores Relacionados Temáticamente
Por competidores relacionados temáticamente se hace referencia a sitios web cuyos contenidos son semánticamente similares, es decir contienen las mismas palabras o similares.

Google ofrece la palabra clave related:URL que lista las páginas web que son similares a la página indicada. Googleguide.com ofrece en su web una lista completa de los comandos de búsqueda de Google .
El gráfico incluido ha sido elaborado con la herramienta TouchGraph y representa mediante un grafo los sitios relacionados con MuseoThyssen.org.
El resultado obtenido es coherente con el contenido del sitio MuseoThyssen.org al aparecer entre sus sitios relacionados principalmente Museos e instituciones culturales.
Si no fuera así, habría que analizar en detalle el contenido de las páginas de MuseoThyssen.org para determinar el por qué Google no considerase los sitios de Museos como relacionados.
Competidores por Preferencias
La identificación de competidores que interesan a internautas similares puede ser realizada tomando como referencia las referencias ofrecidas por Alexa. Este buscador ofrece para cada sitio web, un listado con otros sitios web que también son de interés para sus visitantes.

La identificación de estas recomendaciones, se realiza en base al registro de los hábitos de navegación de los usuarios que tienen instalada la barra de navegación de Alexa. Al tomar datos tan sólo de los usuarios de Alexa, los datos obtenidos de este buscador no deben ser considerados en valores absolutos. Los datos ofrecidos pueden utilizarse para evaluar la progresión del tráfico de un sitio.
Este buscador, Alexa, ofrece también un ranking de sitios web en base al tráfico real recibido por cada uno.
Competidores por Categoría en Directorios
El último método propuesto para la identificación de competidores se basa en los directorios como el DMOZ. Se consideran competidores a aquellos sitios web que aparezcan en una misma categoría.

El DMOZ también conocido por ODP (Open Directory Project - www.dmoz.org), es el directorio más importante hasta el día de hoy, cuenta con casi 60.000 editores voluntarios que clasifican los sitios web propuestos por cualquier Internauta. Aunque existen otros directorios como el de Yahoo, actualmente el DMOZ es considerado como el mejor directorio de páginas organizadas por categorías.
Haciendo uso del directorio dmoz.org se han identificado los competidores de museothyssen.org en la categoría World, Español, Referencia, Museos, Arte y Entretenimiento.
Análisis de la Invisibilidad
Una de las principales limitaciones para el correcto posicionamiento de un sitio web son las páginas dinámicas que muestran contenidos almacenados en bases de datos y cuya programación dificulta las labores de recolección de los buscadores El análisis de la invisibilidad pretende cuantificar el volumen de registros que están disponibles a través de los buscadores y el volumen de los que son invisibles.

Para realizar este análisis se han construido las url de las páginas activas para cada uno de los registros de dos de las tablas principales de MuseoThyssen.org: los autores y las obras.
Posteriormente y haciendo uso de un programa desarrollado en VisualBasic, se ha buscado cada una de las url en Google identificando las obras y autores correctamente indexados. El siguiente gráfico ilustra el análisis realizado y refleja una deficiente visibilidad en las obras en ingles que exige la revisión de estas páginas con objeto de identificar las barreras existentes para los robots.
Análisis de Frases de Búsqueda
Tal y como se indicaba en inicio de este capitulo las últimas estadísticas indican que el 85% de los usuarios de Internet hacen uso de los servicios de consulta de los buscadores. De estas últimas encuestas se puede también concluir que cuanto mas avezado es un internauta, mas intensivo es el uso que hace de los buscadores y más complejas sus búsquedas.
Obviamente, uno de los principales objetivos de un sitio web de una institución cultural es obtener una máxima difusión de sus obras y actividades. Por lo tanto el aparecer en una buena posición en el resultado de los buscadores para un número determinado de frases de búsqueda es clave en esta difusión.
Una vez nuestro sitio esté desarrollado y sus páginas indexadas por los buscadores, se podrá analizar como aparece en los resultados de los buscadores. Para realizar este análisis debemos en primer lugar determinar un número de frases de búsqueda en cuyo resultado consideramos que nuestro web debería aparecer.
Quizás la mejor manera de identificar estas frases de búsqueda es ponerse en la piel de los internautas de nuestro público objetivo: turistas, profesores, estudiantes, etc.
Algunos ejemplos:
Un estudiante de Historia del Arte de la Universidad de Standford que viajará a España el próximo verano para además de disfrutar del sol, visitar las principales pinacotecas. Para localizar información con la que preparar su viaje probablemente haga uso de Google de la siguiente forma:
| Objetivo | Frases de Búsqueda |
| Museos en España | Museo españa, museos españa, museum spain, museums spain |
| Museos en Madrid | Museo Madrid, museos Madrid, museums Madrid, museums madrid |
| Localizar un cuadro de Tiziano que tiene que ver con el desierto | Tiziano desierto, tiziano desert |
| Localizar autores del renacimiento en el Museo Thyssen-Bornemisza | autor renacimiento thyssen site:www.museothyssen.org |
Antonio es un profesor de arte de la ESO que busca información para elaborar nuevo material para el nuevo curso. Antonio probablemente haría uso de Yahoo con las siguientes frases de búsqueda:
| Objetivo | Frases de Búsqueda |
| Museos con Material didáctico | |
| Material didáctico del renacimiento | Recursos educación renacimiento, material educación renacimiento |
Alguien se preguntará por que hablamos de frases de búsqueda y no de palabra de búsqueda, la respuesta es que el gran volumen de páginas gestionadas por los buscadores hacen prácticamente imposible obtener un buen posicionamiento para una consulta de una única palabra esta situación es rápidamente detectada por los internautas que no encuentran en la primera página de resultados, la información que desean y pasan a realiza consultas de varias palabras.
Esto es probablemente lo que haría nuestro internauta, nuestro trabajo ahora es realizar un análisis que nos verifique que nuestras páginas aparecen en las dos primeras páginas de resultados con las frases de búsqueda indicadas en los buscadores más importantes, mi recomendación es estudiar por lo menos: Google, Yahoo y MSN. No sólo es importante analizar la posición de nuestro web, también es muy importante estudiar los web que aparecen en la primeras posiciones que en definitiva serán nuestros “competidores” en Internet.
Para realiza este análisis quedemos trabajar de forma “artesanal” realizando nosotros mismos las consultas en los buscadores y buscando en los resultados páginas de nuestro sitio o también podemos hacer uso de un software que automatice estos análisis.
La ventaja del primer método es el no tener que comprar el software pero si realmente se desea realizar un seguimiento periódico de la posición nuestro web en los buscadores la mejor opción es la segunda para la que existen diversos paquetes de software de diferentes costes entre los que destacan: Advanced Web Ranking, Agent Web Ranking, Web Position Gold. Cualquiera de estos programas nos permitirá realizar un seguimiento periódico de la evolución de la posición de nuestras páginas para las frases de búsqueda y los buscadores seleccionados ofreciendo información gráfica como la siguiente donde se muestra la evolución en Google de varios web de Museos para el termino de búsqueda “museo arte madrid”.


Este tipo de herramientas también ofrecen información tabular como la siguiente donde se recogen los 10 primeros resultados para la frase de búsqueda “exposición temporal Madrid”.


Análisis de la Popularidad
La popularidad de un web intenta cuantificar lo conocido que es un entre los internautas obviamente la mejor forma de realizar esta cuantificación sería en base a los visitantes que recibe sin embargo este es un dato del que no disponen los motores de búsqueda. Tan sólo Alexa dispone de una aproximación a partir de datos que obtiene de los internautas que tienen instalada su barra de navegación.
Popularidad por Referencias (Citación)
Al no poder obtener un dato real de los visitantes para cuantificar la popularidad se ha tomado como referencia el número de enlaces que recibe un web, un dato que considera que un web es mas importante cuantos mas páginas establezcan enlaces con el.
Este datos de popularidad es importante por un lado por ser utilizado en el calculo del Page Rank de Google y el equivalente de otros buscadores, dato que como se ha comentado previamente es utilizado como una de las variables para la ordenación de los resultados de las consultas de los buscadores. Por otro lado, es evidentemente también importante por tener un impacto directo en el número de visitantes, cuantos mas sitios web recomienden nuestro web mayor número de visitantes tendrá el web que se traducirán en visitantes reales en función de la calidad de los contenidos y servicios ofrecidos.
El análisis de los enlaces de un web puede realizarse de forma manual, todos los buscadores tienen un tipo de consulta que genera este dato, en el caso de Google, para conocer los enlaces que recibe el web del Museo del Louvre bastará con realizar la consulta “link:www.louvre.com” dando como resultado 3.340 páginas. Es decir 3.340 páginas conocidas por Google tienen enlaces a páginas de Louvre.com.

Al comparar los datos de enlaces en Google y MSN obtenidos en febrero de 2004 y junio de 2005 se obtienen las siguientes conclusiones:
-
El número de enlaces en MSN ha crecido exponencialmente entre otros motivos por haber entrado en explotación entre las fechas de las tomas de datos.
Popularidad por Tráfico
Una forma alternativa de evaluar la popularidad de un sitio web es en base al tráfico que recibe. La mejor forma de evaluar este tráfico es a través del análisis de los ficheros de log pero puesto que lo que se desea es valorar la popularidad comparativamente con los competidores, el sitio Alexa construye un índice en función de la navegación de los usuarios de su barra de navegación. Este ranking muestra el orden que ocupa un sitio entre los más visitados de forma que cuando menor sea este índice, mayor será la popularidad del sitio.
Haciendo uso del buscador Alexa se ha elaborado el siguiente ranking de popularidad de los competidores identificados en la elaboración del ranking mostrado en 4.3.1.
EL dato que más llama la atención de este ranking es la popularidad de los sitios museoprado.mcu.es y museoreinasofia.mcu.es. Tras analizar estos datos, se verifica que Alexa ofrece habitualmente el tráfico asociado a los dominios principales, es decir mcu.es. Por este motivo, la popularidad de estos sitios se debe al tráfico recibido por todos los sitios web alojados bajo dominio mcu.es.
MuseoThyssen.org se encuentra entre los 94.831 más visitados próximo al musee-orsay.fr.
Plan de Acción
Puesto que este análisis se realiza para conocer la posición de un web en Internet es recomendable elaborar un plan de acción en donde tras un análisis inicial se definan unos objetivos razonables cuyo cumplimiento se irán comprobando en cada análisis que se realice. Objetivos como incrementar el número de usuarios en un 10%, incrementar la duración de la visita a 10 minutos, que Google indexe todas las páginas de las obras de una nueva exposición.
Obviamente alcanzar ciertos objetivos exige mejorar las programación y el diseño de las páginas web, otros objetivos exigen trabajar en su entorno estableciendo políticas de intercambio de enlaces con otras instituciones, enviando noticias, aprovechando otras acciones de publicidad y marketing de la institución para dar a conocer el web y acciones similares orientadas dar a conocer nuestro web sus contenidos y servicios.
Estos objetivos deben ser razonables y coherentes con la importancia de la institución y los contenidos que ofrece en Internet, un objetivo poco razonable sería alcanzar buenas posiciones para frases de búsqueda relacionadas con el turismo cultural por el simple hecho de incorporar como palabra clave de nuestro web “turismo cultural”. Probablemente la única forma de alcanzar este objetivo sería incorporar un buen canal al web dedicado a este tema.
El proceso de análisis y mejora debe ser continuo, muchos web trabajan en la mejora de su posicionamiento por lo que una semana se puede lograr el objetivo de ver un sitio web en la primera posición de una búsqueda en Google y a la semana siguiente perder esta posición.
Puesto que este trabajo se ha centrado en conceptos relacionados con el posicionamiento, no se han recogido aspectos de clave para obtener una buena difusión en Internet. Aspectos como la calidad y variedad de los contenidos así como la adaptación de los mismos a los diferentes públicos objetivos. A medio y largo plazo todas las empresas e instituciones con presencia en Internet deberían analizar los diferentes perfiles de internautas que visitan su web y mediante el establecimiento de canales de comunicación con estos, definir los contenidos que demandan.
Conclusiones
Como se ha visto a lo largo del documento, el posicionamiento es en cierta forma una especie de ciencia experimental, donde los grandes buscadores protegen sus algoritmos de gestión de información con gran celo obligando a los sitios web a evolucionar en su posicionamiento mediante procesos de prueba y error. Procesos que aunque exigen un gran esfuerzo, tienen a su vez una gran recompensa en forma de nuevos visitantes a través de la red.
El posicionamiento depende y dependerá de la forma en la que los buscadores organicen la información por lo que es recomendable tomar esta guía como una introducción y mantenerse informado a través de la web de las nuevas tendencias: nuevos algoritmos de búsqueda, nuevos buscadores, etc.
El posicionamiento de un sitio debería centrarse en alcanzar un buen posicionamiento “orgánico”, no pagado, combinado con acciones puntuales de marketing online. Una buena estrategia debería contemplar las siguientes acciones clave:
-
Asegurar una correcta indexación.
-
Potenciar enlaces.
-
Puntualmente posicionamiento pagado.
-
Mejora continua en base a un plan de acción.
Los buscadores actualmente se encuentran envueltos en una batalla por captar mayor cuota de Internautas. Esta competencia redundará en beneficio de los usuarios al ofrecer los Buscadores como parte de su oferta nuevos y mejores servicios de búsqueda que reduzcan el problema de la sobrecarga de información a la que actualmente se somete al usuario.
Referencias







