En este trabajo recoge una introducción a los conceptos del de contenidos en la red, un de y una selección de métricas así como diversas recomendaciones dirigidas a optimizar el de un sitio en . Aunque el contenido de este trabajo es aplicable a cualquier sitio web, para ilustrarlo se han utilizado diversos ejemplos del ámbito de los Museos e Instituciones culturales en el que actualmente el autor desarrolla su actividad profesional.

Organización de

Al estudiar el de sitios web en se imprescindible tener claro cómo se organiza la información en la Red. El siguiente diagrama de clases UML representa de forma muy esquemática los elementos más importantes en los que se estructura la documentación en y sus relaciones.

Según este diagrama se organiza en millones de sitios web que publican documentos web.

Cada documento web puede ser:

  • Página Activa: Un documento activo que es generado bajo demanda a partir de datos almacenados en una base de datos. Son páginas Asp, JSP, u otras con código que se ejecuta en el servidor como paso previo al envío de la página al usuario.
  • Página Estática: Página que contiene en un único fichero toda la información necesaria típicamente en formato html. Este tipo de páginas son servidas directamente y no es necesario su procesamiento.
  • Fichero Rico: Ficheros
    en formatos: pdf, doc, ppt, etc. Este tipo de ficheros típicamente recogen información muy elaborada y suelen situarse en los últimos niveles del árbol de un sitio web.

Los documentos web están compuestos de:

  • Contenidos: Textos e imágenes que recogen la información que se desea publicar y accesible por parte de los Internautas. Estos contenidos son maquetados haciendo uso de etiquetas que también aportan un contenido ántico al identificarse por ejemplo los elementos más importantes mediante etiquetas como las de encabezado o las fuentes negritas.
  • Metadatos: Información etiquetada que describe el contenido y otros aspectos del documento web. Existen diversos proyectos orientados a la estandarización de los metadatos. Entre estos proyectos destaca el Dublín Core.
  • Enlaces: Los enlaces constituyen recomendaciones entre documentos web que es establecen típicamente a partir de un texto. Existen diversos estándares amplían la ántica de los enlaces permitiendo por ejemplo la definición de nuevas relaciones. Entre estas iniciativas destacan: HTML 4.0, Xlink y RDF.

    Workflow de la Información en

Los documentos web desde que son publicados en un servidor web hasta que aparecen como resultado de una consulta a través de un buscador pasa por una serie de procesos. Entre estos procesos destacan los siguientes descritos:

  • Recolección: La recolección de documentos web es realizada de forma automática por unos agentes web denominados robots o arañas. Estos robots van navegando por la web de forma autónoma saltando de una página a otra a través de los enlaces. Las páginas leídas son enviadas a un servidor para su posterior indexación. Estos agentes tienen programado un motor de recolección que limita el tiempo que dedican a un sitio web o la profundidad máxima de exploración. Estas limitaciones se fijan en función de la reputación de cada sitio. La buena reputación, tal y como se indica en , es primordial ya que los asignan sus recursos a los sitios web en función de esta reputación.
  • Indexación: La indexación consiste en la extracción de palabras y frases más importantes de cada documento. Posteriormente se genera un índice que relaciona estas palabras con la URL del documento. En el proceso de e indexación se contemplan también los enlaces dándose mucha importancia a las palabras incluidas en el texto del enlace de forma que las palabras de los textos de enlace pueden quedar asociadas al documento enlazado aunque este no contenga estas palabras.
  • Recuperación: El proceso de recuperación analiza la frase de búsqueda y selecciona las URL cuyo contenido es más relevante generándose un conjunto de URLs resultado. Este conjunto es ordenado finalmente haciendo uso de un índice que en el caso de es el Page Rank, un índice para cuya generación se utilizan múltiples variables entre las que destacan los enlaces recibidos.

    en

El termino de en se aplica a lo largo de este capitulo a la posición que ocupa las páginas de un web en los resultados proporcionados por como o .

El motivo de la importancia del y por lo tanto de la inclusión de un capitulo dedicado a este tema es que si una página no es conocida por un buscador, nunca podrá ser localizada haciendo uso de sus servicios de búsqueda.

Pongamos dos ejemplos, recientemente la biblioteca Virtual Miguel de Cervantes (cervantesvirtual.com) ha publicado “El divino cazador” una edición facsímile de la obra de Pedro Calderón de la Barca. Esta publicación realizada a partir de la publicada en 1981 por el Ministerio de Cultura ofrece, además, de la imagen del original, enlaces a varias transcripciones textuales. Si la página no está posicionada en los cuando alguien busque “divino cazador” en , la página que con tanto esfuerzo a elaborado esta institución quedaría oculta y sería accesible tan sólo por aquellos internautas que accedieran al web cervantesvirtual.com.

Para verificar que ha indexado esta página se realiza la consulta del titulo del libro y se restringe la búsqueda al dominio cervantesvirtual.com obteniéndose el siguiente resultado donde se verifica que la página ya ha sido recolectada por Googlebot, el robot de , e indexada por el buscador.



Actual de Sitios Españoles

En la actualidad son pocas las Instituciones culturales que han incorporado la mejora del en como parte fundamental de su estrategia en . Algunos Museos como el Thyssen-Bornemisza, el Nacional Centro de Arte Reina Sofía o la Fundación Lázaro Galdiano vienen desarrollando desde el primer trimestre del año 2004 trabajos de optimización de sus sitios web con objeto de optimizar su , trabajos cuyos resultados ya son visibles.

Destacan también las jornadas .es organizadas por el Instituto Cervantes, La Biblioteca Virtual Miguel de Cervantes, Casa de América y el Consejo Superior de Investigaciones Cientificas que tuvieron lugar en Alicante en Mayo de 2004 donde representantes de las principales instituciones culturales, científicas y educativas de habla hispana debatieron sobre el estudio del en .

Motores de Búsqueda y Directorios

Los son sitios web que tienen como objetivo organizar la información de de forma que pueda ser fácilmente encontrada por los internautas a los que ofrecen diversos servicios de búsqueda. Atendiendo a la forma en la que un buscador incorpora un web y su contenido, se pueden clasificar en: Motores de Búsqueda y en Directorios.

Un motor de búsqueda es un web que hace uso de unos programas denominados robots para recolectar la información este programa navega de forma autónoma a través de saltando de una página a otra haciendo uso de los hiperenlaces y recolectando información que después es tratada para la generación de un índice el que se realizan las búsquedas. Por lo tanto podemos identificar en dos procesos: un proceso de recolección de información y un posterior proceso de y automática de la información.

Una vez que un motor de buscador tiene conocimiento de un nuevo Web, sus robots realizan visitas periódicas para actualizar la información que tiene catalogada de cada página. Estos tendrán conocimiento de nuestro web si alguna de las páginas que ya conoce tiene enlaces a nuestro sitio, si se lo hemos indicado en dando de alta nuestra URL en el www.DMOZ.org (Open Directory Proyect) en el caso de o directamente en www.yahoo.es en el caso de . Obviamente si los no conocen la existencia de nuestro web, sus contenidos nunca aparecerán como resultado de ninguna búsqueda. El ejemplo más destacado y utilizado de motor de búsqueda es .

Un directorio es una de sitios web realizada por humanos que incluyen cada web en la categoría mas adecuada a su contenido generándose un gran índice temático. A diferencia de los Motores de Búsqueda que guardan información sobre cada página, los directorios realizan la a nivel de sitio web ofreciendo a los usuarios la posibilidad de localizarlos mediante la navegación por temas. El ejemplo mas destacado de directorio es o DMOZ.

Esta es una teórica puesto que los dos mas utilizados por los internautas y ofrecen tanto la posibilidad de navegar por temas como la posibilidad de buscar en el contenido de las páginas.


En existen miles de pero al analizar las encuestas de uso de los Internautas y las estadísticas de navegación de diversos web queda patente que sólo un pequeño número aportarán visitantes a nuestro web y es precisamente en la forma de funcionar de estos en la que se debe pensar a la hora de analizar y optimizar el de un web.

Actualmente mas de 55 millones de europeos utilizan para buscar información en lo que supone un 47% del universo total en enero de 2004 le siguen Search 27,1% y Search con un 12,6% , en España el uso de asciende al 61,55% seguidos de y Terra. Estas son cifras de uso de los pero si tenemos en cuenta que actualmente las búsqueda de son realizadas con tecnología nos encontramos con una situación en la que las búsquedas son realizadas bien por 44% o por 51%. Sin embargo esta situación podrá variar en los próximos meses con la aparición de nuevos como el A9 desarrollado por Amazon y el desarrollo de nuevos sistemas de recolección y búsqueda de información por parte de y .

Los Robots

Los robots o arañas, son programas que navegan de forma autónoma a través de saltando de una página a otra y de una página a otra haciendo uso de los hiperenlaces en un proceso de recolección de información.

Mediante este proceso de recolección el robot va recorriendo páginas que son enviadas a un servidor donde son almacenadas. Para asegurarse que una correcta recolección de información de un web habrá que tener en cuenta a la hora de su diseño y programación, la forma de navegar de los robots. Para saltar de una página a otra un robot tan sólo puede seguir un enlace y en muchas ocasiones no pueden seguir los típicos enlaces incluidos en menús dinámicos.

Un problema típico de los web de Museos es el disponer de una base de datos con toda la información de un conjunto de obras que permite al usuario realizar búsquedas por autor, título, etc. Cuando un robot llega a un web de este tipo, no puede alcanzar las páginas particulares de cada obra puesto que no sabe teclear el nombre de un autor o un título. Para solventar este problema conocido como “ Oculta” será necesario el desarrollo de páginas que permitan la navegación entre obras mediante un simple clic que es lo que en definitiva sabe hacer un robot.

El objetivo de cualquier institución debería ser el que los robots de los mas importantes leyeran el 100% de sus páginas, es decir si un dispone de información sobre 100 obras organizadas en tres páginas: autor, ficha e imagen, los robots deberían leer 300 páginas.

Posteriormente se realiza el proceso de indexación y optimización donde se analiza el número de palabras de cada página, la frecuencia con que aparecen, la relevancia de cada una como su posición en el texto, su fuente, tamaño y metatag asociado.

Finalmente cuando un internauta realiza una consulta, el buscador compara la frase de búsqueda con la información de palabras almacenadas y realiza una selección de páginas que son ordenadas en función del grado de ajuste a la frase de búsqueda y del Page Rank.

Es habitual que los sitios web evolucionen e incorporen nuevos contenidos quedando otros obsoletos que no deberían ser leídos por los robots. Para indicar a los robots que páginas no deseamos sean recolectadas, se deberá incluir un fichero robots.txt en la carpeta raíz de nuestro web. El formato que debe tener este fichero así como su utilidad, se describen en detalle en la página web oficial en la que se describe el formato de este fichero.

de Páginas

Recientemente casi todos los han incorporado el concepto de de página que asigna un valor numérico a cada página indexada en función de diversas variables. Este valor es utilizado por el buscador para ajustar la ordenación final del resultado de cada consulta así como para asignar la frecuencia de las visitas de los robots del buscador al sitio web así como la profundidad de la búsqueda.

asigna a cada página una puntuación entre 1 y 10 a la que llama Page Rank (PR) en función de los enlaces que reciba una página así como del PR de la página desde la que se enlaza. Para poder visualizar el Page Rank de una página es necesario tener instalada la barra de navegación de donde aparece un icono donde se indica el PR de cada página. Un error común es considerar que el page rank está asociado al dominio sin embargo está asociado a la página de forma que en un mismo sitio web existirá páginas con page rank 5 y otras con page rank 0.

Un PR a partir de 4 puede considerarse bueno, un page rank de 10 es una puntuación tan sólo al alcance de sitios como o . Normalmente las páginas con PR 0 son páginas que no han sido revisadas por por que hayan sido publicadas recientemente o por no ser accesible por los robots. Puede ocurrir que una página sea accesible desde un navegador pero los robots no puedan llegar a ella.

La importancia que últimamente los dan a la de enlaces hace recomendable que las instituciones culturales establezcan políticas razonables de intercambio de enlaces entre sus web orientadas a mejorar esta en todas ellas. Un objetivo razonable de cualquier institución debería ser el obtener una valoración en este tipo de índices superiores a 5.

Invisible

Tal y como se hacia referencia en la introducción de este trabajo, bajo el termino invisible se conoce a todos aquellos contenidos disponibles a través de pero que no son accesibles directamente desde los .

El punto crítico donde un contenido se convierte en invisible es el proceso de recolección que los robots realizan mediante una navegación automática de la Red. Los principales motivos que limitan esta recolección tal y como se indica en son:

  • Accesos Denegados: Aunque en teoría este problema se deriva del deseo del administrador de un sitio web de limitar el acceso a la información, lo cierto es que en muchas ocasiones se constata que muchos de estos accesos denegados son provocados por una deficiente administración así como un desconocimiento del impacto que tiene en la de la información a través de los . Las principales causas de esta denegación de acceso son: falta de permisos en los permisos asignados por el sistema operativo o el servicio web a los archivos, presencia de un cortafuegos que limita el acceso a contenidos tipo Intranet, restricciones incluidas en el fichero robots.txt.
  • Problemas de Interpretación: La dificultad de interpretación surge cuando los contenidos son publicados haciendo uso de protocolos inusuales, formatos de difícil indexación como flash y formatos gráficos o de impresión con texto difícilmente reconocible sin la utilización de software OCR.
  • Dificultades en el Descubrimiento: Los robots son agentes de recolección con unas capacidades de navegación entre páginas limitadas. Esta capacidad es similar a la que tendría un usuario con un ratón y sin teclado, es decir, todo aquello que no pueda ser accedido con un simple clic de ratón, queda fuera del alcance de los robots. Ejemplo de esta limitación son las bases de datos de consulta de autores u obras típicas de los Museos en la Red. Como el robot no sabe cumplimentar la palabra Picasso en el formulario del buscador de obras, será necesario elaborar un índice de autores que dé acceso con un simple clic a la lista de obras de este autor.
  • Dependencia Temporal: En hay mucha información con una vida temporal muy breve, información como las noticias, ofertas de comercios on line, información bursátil, etc. Esta dependencia hace que la dirección de la información indexada pueda no ser coherente al cabo del tiempo. Para solventar este problema, como han incorporado una copia en caché de la información indexada.

    Recomendaciones para un buen

Como es lógico, las instituciones culturales, especialmente los Museos prestan una gran atención y esfuerzo a los aspectos de diseño de todo el material impreso que se produce en torno a sus obras y servicios. Esta situación se ha trasladado al mundo donde se han elaborado muy buenas páginas desde el punto de vista del diseño pero cuyos contenidos son difíciles de localizar por los .

Muchas de las páginas desarrolladas en los últimos años, especialmente las que han hecho uso de tecnología flash o animaciones con tecnología java, no pueden ser leídas correctamente por los robots por lo tanto sus contenidos no son recolectados y en consecuencia nunca podrán formar parte del resultado de una consulta en un buscador.

Imaginemos un con 1.000 obras de diversos pintores como Picasso o Monet con una gran página web desde el punto de vista del diseño pero de la que los tan sólo conocen su página principal. Si un internauta realizara una búsqueda incluyendo la palabra Picasso, no aparecerían las páginas de las obras de Picasso de este . Esta situación es desgraciadamente mas habitual de lo deseable puesto que es completamente incompatible con la difusión cultural que debe ser uno de los objetivos principales de las instituciones culturales.

Para lograr un buen , algunos elementos que se deben evitar en una página web son los popups y los frames: los popups han sido un recurso utilizado masivamente para realizar campañas de marketing OnLine y cada vez mas usuarios disponen de navegadores que bloquean estos popups. El uso de frames puede provocar la indexación parcial de una página de forma que la página recuperada como resultado de una consulta en un buscador, sea incompleta. Hay que asegurarse que desde cualquier página de aparezca como resultado en un buscador, el internauta pueda continuar la navegación hacia el resto de canales del web.

La tecnología Flash permite realizar magníficos diseño pero actualmente tiene la limitación de que los robots no son capaces de leer el contenido completo de páginas desarrolladas con esta tecnología, parece ser que algunos como ya están trabajando para eliminar esta limitación. Tal y como índica Ricardo Baeza en su estudio de los sitios web de Chile, el 70% de estos sitios no son bien indexados por los robots al hacer uso de tecnología Flash. Si el es realmente una de las prioridades de un sitio web, debería de restringir el uso de esta tecnología a elementos muy puntuales estéticos o de contenidos multimedia.

Evitar Invisible

Los primeros web desarrollados se basaban en páginas estáticas HTML. En el mundo de las instituciones culturales estas primeras versiones de sus sitios web cumplían el objetivo principal de explicar quien era la institución y cuales eran sus objetivos. En el mejor de los casos incluían una breve muestra de los contenidos culturales que gestionaban, en ningún caso daban acceso a la totalidad de los mismos.

La evolución tecnológica junto con la demanda de contenidos culturales en por parte de la “sociedad de la información” hizo que estos primeros sitios web estáticos evolucionaran e incorporarán un gran número de contenidos (pinturas, esculturas, estudios,…) gestionados por las instituciones. Para poder ofrecer estos contenidos se desarrollaron nuevos sitios web donde las páginas estáticas fueron sustituidas por páginas dinámicas que gestionaban contenidos alojados en bases de datos. El principal motivo de almacenar los contenidos en base de datos fue el facilitar su mantenimiento por parte del personal de la institución (el departamento de conservación actualiza la descripción de las obras o el departamento de prensa da de alta nuevo material para los medios de comunicación).

Este nuevo modelo dio lugar a que los contenidos que se almacenaban en la base de datos no fuesen recolectados por los robots constituyendo los que se ha llamado “ Invisible”, páginas que aún estando publicadas no son conocidas por los (sus robots no las han recolectado) y por lo tanto no son accesibles desde ellos.

Reflexionemos unos segundos sobre el echo de que estamos hablando por ejemplo de un que ha realizado una inversión económica y humana, en introducir todas sus obras en una base de datos (descripción, biografías, imágenes) y sin embargo cuando alguien busque en por el nombre exacto de un título de una obra, esta no aparecerá en los resultados.

Sin duda, al igual que en otros sectores, en el mundo cultural la invisible es probablemente el mayor problema para la difusión de los bienes culturales gestionados por las instituciones. A la vez, en muchos casos es uno de los problemas de más fácil solución mediante la creación de páginas índice que den acceso a los contenidos mediante enlaces que puedan ser recorridos con un simple clic que es lo que saben hacer los robots.

En un proceso de optimización y haciendo uso entre otras de esta técnica de generación de índices, el web del Thyssen-Bornemisza alcanzó los siguientes objetivos:

  • Todas las obras de la colección fueron recolectadas por Googleboot en el plazo de 2 meses.
  • Pasó de tener 1.500 páginas por a tener más de 22.000.

Actualmente es posible acceder a la ficha de todas las obra realizando una consulta por su título directamente en .

El gráfico adjunto recoge el número de páginas por los tres principales de algunos de cuatro de los museos más europeos más importantes. Al analizar esta información destaca:

Los principales actualmente se encuentran compitiendo por ser los que más documentos web tienen indexados. Esta competencia se ha visto incrementada en el último año tal y como se ve en el gráfico adjunto donde se observa como sitios web como Museothyssen.org han casi triplicado sus páginas por .

El incremento del número de páginas indica una reducción de los contenidos invisibles debido principalmente al incremento de recursos dedicados por los a la recolección de datos y por otro a las mejoras realizadas en los sitios web dirigidas a mejorar su y por lo tanto su en la Red.

Estructura una página Web

De cara a obtener un buen en los , las páginas web deben de cumplir con una serie de requisitos que estructuren su información correctamente y faciliten el trabajo de los en los procesos de recolección e indexación de la información.

Las páginas web típicamente están programadas en un lenguaje llamado HTML que organiza la información haciendo uso de etiquetas que van entre los símbolos “<” y “>” y se estructuran en dos partes fundamentales: la cabecera de la página que contiene información que describe la página y su contenido y el cuerpo que recoge el contenido propiamente de la página. En HTML estos dos partes se identifican con las etiquetas <Head></Head> y <Body></Body>.

Las información contenida en ambas partes debe ser coherente, es decir si la página recoge en su cuerpo información sobre el turismo cultural en Madrid, la cabecera debe tener un contenido sintetice este contenido. Las páginas que no guardan esta coherencia no son bien valoradas por los y en consecuencia su se resiente.

Cabecera de la Página

La cabecera de la página debe contener una información que describe coherentemente el contenido del cuerpo de forma que ofrezca a los una buena información para una correcta indexación de la página. Esta información se estructurará mediante etiquetas HTML y debería recoger los siguientes datos:

  • Título <TITLE>título de la página</TITLE>: Breve descripción de no mas de 100 caracteres del contenido de la página y el web en general.
  • Descripción <META NAME=”description” CONTENT=”descripción del contenido”>: Breve descripción del contenido del cuerpo de la página.
  • Palabras Clave <META NAME=”keywords” CONTENT=”palabras clave”>: Conjunto de palabras principales, puesto que el la cabecera debe ser coherente con el cuerpo siendo una buena practica la extracción de parte de estas palabras del cuerpo de la página. Esta lista de palabras junto con la información del cuerpo, será utilizada por los a la hora de realizar la indexación de la página.

    Cuerpo de la página

El cuerpo de la página recoge el contenido propiamente dicho de la página, lo que el internauta podrá visualizar en un navegador y que incluye tanto texto como imágenes y otros materiales multimedia.

Todas las palabras incluidas en el cuerpo tendrán una frecuencia de repetición así como una posición relativa en el documento. Estas son dos de las variables que junto con la información de la cabecera, utilizan los a la hora de indexar una página y posteriormente a la hora de valorar el grado en el que la estructura de palabras de una página se ajusta a las palabras consultadas por un internauta.

No se debe abusar de la repetición de palabras en el contenido de la página, una página donde se incluyera 100 veces la palabra no sería valorada por los y es seguro que no aparecerá en primeras posiciones en el resultado de una búsqueda en por la palabra “”. Todos los disponen de sistemas para identificar y penalizar este tipo de prácticas.

Para organizar el cuerpo y destacar palabras se hará uso de las etiquetas de cabecera <H1></H1> así como de la negrita y diferentes tamaños de fuente de esta forma el buscador identificará los textos que el creador de la página considera mas relevantes y les dará prioridad en el proceso de indexación.

Las imágenes al igual que el resto de contenido de la página también es analizada por los robots e indexada por el buscador, de hecho, todos los incluyen la posibilidad de buscar sólo imágenes por lo que es recomendable ofrecer información sobre las mismas haciendo uso de los textos alternativos e incluso el nombre del fichero por ejemplo, el nombre de una imagen de una obra podría ser segadores.jpg o vangogh-01.jpg en vez de 10-98.jpg.

Otro de los elementos que mas se valoran en el cuerpo de una página son los enlaces, el texto de estos deberían describir la página a la que dan acceso, sustituyendo enlaces del tipo “ficha” por “biografía Gauguin”.

Como ya se indicaba previamente, el primer paso en el es facilitar la recolección de datos por los robots y puesto que estos son programas, les es mas fácil la lectura de páginas HTML bien estructuradas por lo que es muy recomendable seguir recomendaciones como las elaboradas por el W3C (World Wide Web Consortium) dirigidas a mejorar la accesibilidad de las páginas web.

Estrategia de Enlaces

Como ya se indicaba en el punto 2.1 de este estudio, puede ser observada como un gran repositorio de documentos que se relacionan entre si mediante los enlaces. Estos enlaces que de forma simple pudieran ser considerados como simples caminos entre archivos, encierran gran cantidad de Inteligencia humana al constituir una recomendación y relacionar dos documentos. Los actualmente dan mucha importancia a estas recomendaciones y a los textos asociados a las mismas, tanto en la página de origen como en la de destino.

como además incluyen un , el Page Rank de importancia de páginas que se basa entre otras variables en el número de enlaces que recibe y el de las mismas. Actualmente el estudio de los enlaces como medida de la importancia de una página constituye una de las principales líneas de trabajo de los que orientan sus algoritmos de recuperación hacia modelos como valoren la conectividad y la importancia de los enlaces en el ámbito de una consulta como el HITS.

El HITS clasifica las páginas en dos tipos Hubs y Autoridades:

  • Autoridades: Páginas que son muy relevantes para una búsqueda y reciben muchos enlaces de páginas que le reconocen esta autoridad.
  • Hubs: Páginas que apuntan a varias páginas con autoridad. Son típicamente páginas con poco contenido y muchos enlaces.

La importancia que tiene el número y calidad de los enlaces que recibe una página hace imprescindible el establecer una política clara de enlaces con sitios web de temática similar o complementaria.

Una buena estrategia de enlaces debería tener las siguientes características:

  • Primar la calidad sobre la cantidad.
  • Utilizar directorios, portales temáticos y agregadores como; DMOZ, , europeanmuseumguide.com o pricerunner.co.uk.
  • Posicionarse como experto en: escribir guías o artículos en y .
  • Diseñar contenidos de calidad para publicarlos en sitios relacionados.

    Inicial

De cara a obtener un buen la selección de un buen dominio es muy importante, este nombre debería incluir las palabras clave que consideremos mas importantes por ejemplo una biblioteca debería incluir la palabra “biblioteca” en su nombre de dominio.

-Arte-Thyssen.org probablemente sea un buen dominio desde el punto de vista del pero desde el punto de vista de los usuarios es mas fácil recordar Museothyssen.org.

Esta recomendación de incluir palabras clave en el nombre del dominio debe ser compatible con que esta sea fácil de recordar y que esté asociada a la imagen de marca que la institución tenga fuera de .

Una vez desarrollado el web y seleccionado el dominio asociado deberemos proceder a darlo a conocer a los y directorios para lo cual haremos uso de los servicios de inclusión que nos ofrecen. Como mínimo debería incluirse en y en DMZ que es el directorio que toma como referencia .

Es aconsejable apoyar el conocimiento de nuestro web con acciones de marketing tradicional como pueden ser incluir la dirección de nuestro web en todos los folletos publicitarios que se elaboren en la institución.

de del

La mejora del es un proceso continuo y en muchos aspectos experimental de forma que se necesario establecer un de que nos permita realizar un seguimiento eficiente del en así como del resultado de las mejoras introducidas.

El siguiente recoge las actividades fundamentales que el administrador de un web debería realizar para analizar el de su web.

del los Visitantes de un Web

A lo largo de este capitulo se ha incidido en diversas ocasiones en la labor de difusión cultural que las instituciones culturales deben realizar como parte fundamental de su actividad diaria, elimina barreras ofreciendo nuevos públicos a los dar a conocer nuestros contenidos. Es necesario poder cuantificar tanto la difusión en un periodo dado como su evolución y tendencia, esta cuantificación indicará entre otras cosas cuanta gente visita nuestro web así como cuales son los contenidos mas atractivos para ellos.

La realización de un que ofrezca esta información es muy sencillo, hay diversas herramientas en el mercado, muchas de ellas gratuitas que ofrecen buenos , algunas de ellas están incluidas en el apartado final de software útil. Cualquiera de estas herramientas lee los ficheros de log de un Web y genera un informe en formato Word, Excel, etc con datos en formato tabular y gráfico.

Un fichero de log es un fichero que se va generando en el servidor web y en el que se va incluyendo información anónima y detallada de las páginas que son visitadas. Inexplicablemente hay muchas instituciones que no disponen de estos ficheros por lo que no pueden realizar ningún tipo de y en consecuencia no conocen el número de visitantes que tiene su web. ¿ Alguien puede imaginar esta situación en el mundo real?, un que no conozca a diario el número de personas que visitan sus exposiciones o un periódico que no conozca el número de lectores o una biblioteca que no conozca el número de libros prestados.

En consecuencia, lo primero que hay que hacer es disponer de los ficheros de log generados por el servidor por lo menos de forma mensual, además se debe mantener los ficheros antiguos para poder realizar de periodos más amplios y comprobar la tendencia de las visitas.

Visitas

Respecto a las visitas es importante conocer el número de visitantes, la duración de la visita así como su origen geográfico aunque este último dato no es excesivamente útil al contabilizarse por ejemplo visitas desde países sudamericanos como visitas realizadas desde los EE.UU. La única forma de conocer realmente la distribución geográfica de nuestros visitantes es preguntándoselo en una encuesta, sin embargo, las encuestas en tienen un bajo índice de respuesta.


Respecto a lo que visualizan los internautas será importante conocer las páginas o directorio más accedido así como los ficheros más descargados si es que se ofrece la posibilidad de descargar documentos como podría ser una guía en formato pdf para realizar la visita a una exposición temporal de un . Esta información permitirá identificar recursos con pocos accesos por estás mal indicado su situación en el web o por que carecen de interés.


Analizar la actividad de los , es decir las visitas que han generado y las palabras que han sido utilizadas en las consultas es importante para:

  • Determinar los que son más importantes en términos de generado.
  • Identificar las palabras clave bien posicionadas, es decir las utilizadas por los usuarios de forma exitosa.
  • Identificar las palabras mal posicionadas, es decir las que no son utilizadas por los usuarios o no generan como resultado páginas del sitio analizado.

Al analizar la actividad de los en el sitio MuseoThyssen.org destaca la magnitud de la actividad de frente al resto de . La actividad de los está relacionada con el número de páginas recogidas en el gráfico de páginas del punto 3.6.1 de este documento.


En cuanto a desde donde y como acceden los Internautas será importante conocer desde que página han accedido a nuestro web, por ejemplo desde un enlace de Terra o desde un buscador, es lo que se conoce como . Los nos indicarán los sitios web que nos enlazan así como los visitantes que remiten a nuestro web.


La identificación de los principales es primordial a la hora de establecer estrategias de intercambio de contenidos o recomendaciones mediante enlaces. Obviamente los sitios que generen más deberían ser prioritarios en este tipo de estrategias.

Para el de se ha tomado como información de base los ficheros de log generados por el servidor web y se han analizado haciendo uso de una pequeña aplicación desarrollada en Visual Basic para extraer y transformar los registros de excluyendo aquellos registros con referente interno o sin referente.

Al analizar los principales destaca el buscador que genera un 15% entre .es, .com y .com.mx.

Para poder estimar la importancia de los y enlaces en base al que aportan a un sitio es necesario identificar cuantas visitas proceden de otros sitios a través de un enlace y cuales han llegado a través de una consulta en un buscador.

Al realizar este destaca la importancia del recibido directamente desde otras páginas (46%) así como la importancia de frente a otros . es el buscador que aporta más visitas sin embargo estas cifras hace tan solo unos meses llegaban al 85% lo cual indica que cada vez más usuarios hacen uso de alternativas a .

Esta tendencia se debe entre otros motivos al incremento de las páginas por estos . Este esfuerzo de recolección e indexación de páginas se ve reflejado en la mayor actividad de los robots de y .

Robots

Tal y como se indicaba en el punto 2.2 de este documento, el primer proceso al que somete un buscador a los documentos web es el de recolección realizado por los robots.

Analizar la actividad de los robots permite:

  • Identificar los más interesados en un sitio web, sus periodos de visita, tiempo dedicado a la recolección, etc.
  • Identificar la actividad de robots no asociados a que pueden someter a un servidor web a cargas de trabajo excesivas.

Al analizar la actividad de los robots y compararla con la actividad de su buscador asociado se observa como los que más visitan un web no siempre es el que más actividad tiene. En el caso de MuseoThyssen.org el buscador acumula el 88% de la actividad de frente a tan sólo un 34% de la actividad de su robot GoogleBot.

Conocer la actividad de un buscador, su entre los , las páginas es importante a la hora de analizar el de un sitio web sin embargo, el dato más importante siempre será el real que un buscador genera en forma de visitas.

Patrones de Comportamiento

El conocimiento del usuario se ha constituido como uno de los puntos clave del éxito de un sitio web. Un conocimiento de calidad permite adaptar la oferta de servicios y contenidos a la demanda real de los usuarios estableciendo estrategias de adaptación de las páginas en función del perfil de usuario y sus características.

Tradicionalmente el conocimiento del usuario se ha basado en el simple de los ficheros de log que son generados de forma automática por los servidores web. Sin embargo esta técnica que permite la generación de estadísticas sencillas, no permite la identificación de patrones de navegación. Para poder identificar este tipo de patrones tal y como se indica en , y es necesario aplicar técnicas de minería de datos en (webmining) que combinen información sobre la estructura del web y sus contenidos junto con bases de datos con información como las transacciones realizadas, productos adquiridos, etc.

A continuación se describen algunas técnicas para la identificación de patrones de uso, existen muchas más pero todas comparten un objetivo común: conocer el uso que los internautas hacen de un sitio para poder adaptar la oferta a la demanda real.

de Logs y Bases de Datos

El más utilizado para conocer los hábitos de los usuarios de un sitio web es el de los ficheros log que generan los servidores web. Estos ficheros han sido utilizados tradicionalmente por los web para valorar el de un sitio y poder evitar posibles problemas de ancho de banda, identificar enlaces rotos, disponer de estadísticas de recursos más utilizados, origen del , etc.

Técnica de Marcajes

La técnica definida previamente permite la obtención de patrones a una vez estén disponibles los ficheros de log y la información de las bases de datos transaccionales haya sido depurada. Sin embargo, y debido entre otros motivos al carácter competitivo de , algunos negocios necesitan información online de la actividad de los usuarios. Esta información debe transmitir de forma clara los hábitos de los usuarios por lo que estadísticas de uso por directorio o archivos y otras similares propias de los de log son claramente insuficientes.

Actualmente diversas empresas relacionadas fundamentalmente con el mundo de marketing online están haciendo uso de estrategias de basadas en el marcaje de las páginas.

Este tipo de técnica es desde un punto de vista tecnológico muy sencilla pero exige un gran esfuerzo en el diseño de las marcas de las páginas para que los patrones de uso generados sean realmente útiles. Básicamente la técnica consiste en marcar cada página que se quiera monitorizar con una etiqueta que la identifica. Varias páginas pueden tener la misma etiqueta. Conforme el usuario navega por el , se van registrando en una base de datos las etiquetas de las páginas que visualiza.

Imaginemos un comercio electrónico que etiqueta todas las páginas con ofertas con la marca <OFRT> inmediatamente y mediante una página de consulta el administrador del comercio podría conocer lo atractivo que resultan las ofertas para un(os) usuario(s) como recuento de las páginas impresas con esta etiqueta.

Es definitiva esta técnica permite obtener información de los hábitos de navegación de forma más sencilla y rápida que los de Log. Sin embargo, un uso excesivo de páginas etiquetas podría ralentizar la navegación al tener que registrar su visualización en una base de datos.

Obviamente, los problemas de identificación de usuarios también existen en esta técnica al disponer por norma general tan sólo de su dirección IP unos datos que en muchas ocasiones está asociado a muchos usuarios que acceden a a través de un Proxy que enmascara la IP real.

Ficheros de Logs Creados con Metadatos

Una técnica que amplia la de marcajes es la propuesta en basada en la creación de ficheros de log con contenido ántico, paralelos a los generados por el servidor web. La técnica se basa en el de las páginas generadas dinámicamente y sus parámetros de generación para la generación de un registro de Log.

Obviamente y como ocurría con la técnica de marcajes, la dificultad técnica es mínima debiendo dedicar un esfuerzo mayor en la identificación de la información que se desea incluir en los logs.

Imaginemos esta técnica aplicada a la página web de una biblioteca virtual en el que el acceso a las obras se realizara mediante un enlace de tipo: Fichaobra.asp?idobra=123&form=pdf


El fichero de Log generado sería siguiente:

Analizando este sencillo fichero y cruzándolo con la base de datos de libros, el administrador podrá conocer rápidamente los libros más consultados independientemente de la procedencia de la búsqueda y los formatos más demandados.


Aplicando esta técnica a la consulta de obras del web MuseoThyssen.org se han obtenido los siguientes datos de las 15 obras más visitadas el día 1 de diciembre de 2004. Obviamente para que este sea verdaderamente útil debería realizarse sobre un periodo más amplio.

del en y Directorios

Respecto a los es básico conocer cuales son los mas importantes así como las frases de búsqueda que utilizan los internautas para localizar nuestro web, analizando esta información se pueden identificar la ausencia de frases clave lógicas que aparentemente no son utilizadas o si lo son, nunca dan como resultado páginas de nuestro web.

Como ya se indicó previamente los envían a los robots cada cierto tiempo para recolectar información de nuestro web a través del de las visitas es posible identificar los robots que han visitado el web así como el número de visitas realizadas, pudiendo identificar robots que no nos visitan por que no conocen la existencia del web.

Además es importante conocer el número de páginas que los principales tienen de nuestro sitio por los menos en y . Es posible conocer este datos realizando la consulta “allinurl:midominio”, por ejemplo, para conocer las páginas por del web de la National Gallery bastaría con buscar en “allinurl:www.nga.org” dado el resultado a fecha 18 de julio de 2004 10.000 páginas .

Este dato de páginas es critico ya sobre todo si realizamos mejoras para que los robots lean mejor nuestro web o si incluimos secciones nuevas en el como puede se unas páginas web dedicadas a una exposición temporal o un nuevo canal dedicado a ofrecer contenidos a la comunidad educativa. No hay que olvidar que todas aquellas páginas que no sean conocidas () por los nunca aparecerán como resultado de ninguna consulta.

de Competidores

Tal y como se indicaba en la introducción, constituye un espacio de feroz competencia por lo que la identificación de los sitios con los que se compite es una de las tareas prioritarias desde un punto de vista del .

Dos sitios web son competidores si: sus contenidos y/o servicios pertenecen a un mismo área de conocimiento o negocio y se dirige a un público objetivo similar.

A la hora de identificar a los competidores, no hay que olvidar a aquellos competidores off line que aunque tengan una presencia testimonial en esta podría pasar a ser estratégica y convertirse en nuevo competidor online.

Para identificar a los competidores se proponen los siguientes métodos basados en las relaciones directas o indirectas que se establecen entre diferentes páginas.

Competidores por Contenido

Los competidores por contenido son sitios web que aparecen en los resultados de una consulta en los . Obviamente este tipo de competidores son dependientes de la consulta por lo que es recomendable seleccionar consultas que reflejen claramente la actividad y contenidos de un sitio.

Por ejemplo, para seleccionar los competidores de MuseoThyssen.org se ha utilizado la consulta “ arte” y “art Museum” además se ha incluido una restricción que consiste en seleccionar tan sólo los sitios web que con las palabras Museum o en su URL. La consulta ha sido realizada sobre y sólo se han tenido en cuenta los primeros 500 resultados.

Para seleccionar los sitios web que cumplieran estas condiciones, se ha utilizado la herramienta WebQL que permite consulta la web haciendo uso de un lenguaje de consulta similar al SQL considerando todo como una gran base de datos.

Este tipo de herramientas se comportan como un robot y tienen la capacidad de ir recorriendo enlaces en función de diferentes criterios

La consulta desarrollada es la incluida en (*) y ha dado como resultado 163 sitios web. Al haberse quedado fuera de esta lista sitios relevantes como el sitio de la National Gallery (nga.gov) al no tener la palabra en la URL se han incluido de forma manual algunas referencia de sitios de Museos relevantes. A continuación se incluye el listado de los 64 sitios web competidores más importantes en base a un elaborado a partir de los siguientes datos obtenidos de cada sitio:

  • Páginas por y .
  • Enlaces conocidos por y .
  • Imágenes por y : se han considerado el número de imágenes medianas y grandes de cada sitio web ya que al tratarse de sitios web de Museos este tipo de imágenes habitualmente son sobre obras de arte.
  • Ficheros ricos indexados por : los ficheros ricos son típicamente pdf, doc, ps, ppt o rtf. Estos ficheros contienen habitualmente trabajos elaborados en torno a obras de los Museos aunque al no analizarse su contenido, algunos podrían ser ficheros más relacionados con la burocracia de la institución.

El siguiente es el elaborado a partir de la lista de competidores y los datos obtenidos de y . En este el MuseoThyssen.org ocupa la posición 21 principalmente por el número de páginas tanto por como por .


El generado será mejorado en próximas versiones al incluirse nuevos : , Tehoma y el nuevo buscador francés Exalead.

Competidores Relacionados Temáticamente

Por competidores relacionados temáticamente se hace referencia a sitios web cuyos contenidos son ánticamente similares, es decir contienen las mismas palabras o similares.


ofrece la palabra clave related:URL que lista las páginas web que son similares a la página indicada. Googleguide.com ofrece en su web una lista completa de los comandos de búsqueda de .

El gráfico incluido ha sido elaborado con la herramienta TouchGraph y representa mediante un grafo los sitios relacionados con MuseoThyssen.org.

El resultado obtenido es coherente con el contenido del sitio MuseoThyssen.org al aparecer entre sus sitios relacionados principalmente Museos e instituciones culturales.

Si no fuera así, habría que analizar en detalle el contenido de las páginas de MuseoThyssen.org para determinar el por qué no considerase los sitios de Museos como relacionados.

Competidores por Preferencias

La identificación de competidores que interesan a internautas similares puede ser realizada tomando como referencia las referencias ofrecidas por Alexa. Este buscador ofrece para cada sitio web, un listado con otros sitios web que también son de interés para sus visitantes.


La identificación de estas recomendaciones, se realiza en base al registro de los hábitos de navegación de los usuarios que tienen instalada la barra de navegación de Alexa. Al tomar datos tan sólo de los usuarios de Alexa, los datos obtenidos de este buscador no deben ser considerados en valores absolutos. Los datos ofrecidos pueden utilizarse para evaluar la progresión del de un sitio.

Este buscador, Alexa, ofrece también un de sitios web en base al real recibido por cada uno.

Competidores por Categoría en Directorios

El último propuesto para la identificación de competidores se basa en los directorios como el DMOZ. Se consideran competidores a aquellos sitios web que aparezcan en una misma categoría.


El DMOZ también conocido por ODP (Open Directory Project - www.dmoz.org), es el directorio más importante hasta el día de hoy, cuenta con casi 60.000 editores voluntarios que clasifican los sitios web propuestos por cualquier Internauta. Aunque existen otros directorios como el de , actualmente el DMOZ es considerado como el mejor directorio de páginas organizadas por categorías.

Haciendo uso del directorio dmoz.org se han identificado los competidores de museothyssen.org en la categoría World, Español, Referencia, Museos, Arte y Entretenimiento.

de la Invisibilidad

Una de las principales limitaciones para el correcto de un sitio web son las páginas dinámicas que muestran contenidos almacenados en bases de datos y cuya programación dificulta las labores de recolección de los El de la invisibilidad pretende cuantificar el de registros que están disponibles a través de los y el de los que son invisibles.


Para realizar este se han construido las url de las páginas activas para cada uno de los registros de dos de las tablas principales de MuseoThyssen.org: los autores y las obras.

Posteriormente y haciendo uso de un programa desarrollado en VisualBasic, se ha buscado cada una de las url en identificando las obras y autores correctamente indexados. El siguiente gráfico ilustra el realizado y refleja una deficiente en las obras en ingles que exige la revisión de estas páginas con objeto de identificar las barreras existentes para los robots.

de Frases de Búsqueda

Tal y como se indicaba en inicio de este capitulo las últimas estadísticas indican que el 85% de los usuarios de hacen uso de los servicios de consulta de los . De estas últimas encuestas se puede también concluir que cuanto mas avezado es un internauta, mas intensivo es el uso que hace de los y más complejas sus búsquedas.

Obviamente, uno de los principales objetivos de un sitio web de una institución cultural es obtener una máxima difusión de sus obras y actividades. Por lo tanto el aparecer en una buena posición en el resultado de los para un número determinado de frases de búsqueda es clave en esta difusión.

Una vez nuestro sitio esté desarrollado y sus páginas por los , se podrá analizar como aparece en los resultados de los . Para realizar este debemos en primer lugar determinar un número de frases de búsqueda en cuyo resultado consideramos que nuestro web debería aparecer.

Quizás la mejor manera de identificar estas frases de búsqueda es ponerse en la piel de los internautas de nuestro público objetivo: turistas, profesores, estudiantes, etc.

Algunos ejemplos:

Un estudiante de Historia del Arte de la de Standford que viajará a España el próximo verano para además de disfrutar del sol, visitar las principales pinacotecas. Para localizar información con la que preparar su viaje probablemente haga uso de de la siguiente forma:

Objetivo Frases de Búsqueda
Museos en España españa, museos españa, museum spain, museums spain
Museos en Madrid Madrid, museos Madrid, museums Madrid, museums madrid
Localizar un cuadro de Tiziano que tiene que ver con el desierto Tiziano desierto, tiziano desert
Localizar autores del renacimiento en el Thyssen-Bornemisza autor renacimiento thyssen :www.museothyssen.org

Antonio es un profesor de arte de la ESO que busca información para elaborar nuevo material para el nuevo curso. Antonio probablemente haría uso de con las siguientes frases de búsqueda:

Objetivo Frases de Búsqueda
Museos con Material didáctico

Recursos eso , recursos educación

Material didáctico del renacimiento Recursos educación renacimiento, material educación renacimiento

Alguien se preguntará por que hablamos de frases de búsqueda y no de palabra de búsqueda, la respuesta es que el gran de páginas gestionadas por los hacen prácticamente imposible obtener un buen para una consulta de una única palabra esta situación es rápidamente detectada por los internautas que no encuentran en la primera página de resultados, la información que desean y pasan a realiza consultas de varias palabras.

Esto es probablemente lo que haría nuestro internauta, nuestro trabajo ahora es realizar un que nos verifique que nuestras páginas aparecen en las dos primeras páginas de resultados con las frases de búsqueda indicadas en los más importantes, mi recomendación es estudiar por lo menos: , y . No sólo es importante analizar la posición de nuestro web, también es muy importante estudiar los web que aparecen en la primeras posiciones que en definitiva serán nuestros “competidores” en .

Para realiza este quedemos trabajar de forma “artesanal” realizando nosotros mismos las consultas en los y buscando en los resultados páginas de nuestro sitio o también podemos hacer uso de un software que automatice estos .

La ventaja del primer es el no tener que comprar el software pero si realmente se desea realizar un seguimiento periódico de la posición nuestro web en los la mejor opción es la segunda para la que existen diversos paquetes de software de diferentes costes entre los que destacan: Advanced Web , Agent Web , Web Position Gold. Cualquiera de estos programas nos permitirá realizar un seguimiento periódico de la evolución de la posición de nuestras páginas para las frases de búsqueda y los seleccionados ofreciendo información gráfica como la siguiente donde se muestra la evolución en de varios web de Museos para el termino de búsqueda “ arte madrid”.


Este tipo de herramientas también ofrecen información tabular como la siguiente donde se recogen los 10 primeros resultados para la frase de búsqueda “exposición temporal Madrid”.



de la

La de un web intenta cuantificar lo conocido que es un entre los internautas obviamente la mejor forma de realizar esta cuantificación sería en base a los visitantes que recibe sin embargo este es un dato del que no disponen los motores de búsqueda. Tan sólo Alexa dispone de una aproximación a partir de datos que obtiene de los internautas que tienen instalada su barra de navegación.

por Referencias (Citación)

Al no poder obtener un dato real de los visitantes para cuantificar la se ha tomado como referencia el número de enlaces que recibe un web, un dato que considera que un web es mas importante cuantos mas páginas establezcan enlaces con el.

Este datos de es importante por un lado por ser utilizado en el calculo del Page Rank de y el equivalente de otros , dato que como se ha comentado previamente es utilizado como una de las variables para la ordenación de los resultados de las consultas de los . Por otro lado, es evidentemente también importante por tener un impacto directo en el número de visitantes, cuantos mas sitios web recomienden nuestro web mayor número de visitantes tendrá el web que se traducirán en visitantes reales en función de la calidad de los contenidos y servicios ofrecidos.

El de los enlaces de un web puede realizarse de forma manual, todos los tienen un tipo de consulta que genera este dato, en el caso de , para conocer los enlaces que recibe el web del del Louvre bastará con realizar la consulta “link:www.louvre.com” dando como resultado 3.340 páginas. Es decir 3.340 páginas conocidas por tienen enlaces a páginas de Louvre.com.


Al comparar los datos de enlaces en y obtenidos en febrero de 2004 y junio de 2005 se obtienen las siguientes conclusiones:

  • muestra para algunos sitios menos enlaces en junio de 2005. Esto es debido a que actualmente muestra tan sólo el número de enlaces recibidos desde páginas con Page Rank mayor que 4. Actualmente el comando “Link” de no ofrece datos fiables.
  • El número de enlaces en ha crecido exponencialmente entre otros motivos por haber entrado en explotación entre las fechas de las tomas de datos.

    por

Una forma alternativa de evaluar la de un sitio web es en base al que recibe. La mejor forma de evaluar este es a través del de los ficheros de log pero puesto que lo que se desea es valorar la comparativamente con los competidores, el sitio Alexa construye un índice en función de la navegación de los usuarios de su barra de navegación. Este muestra el orden que ocupa un sitio entre los más visitados de forma que cuando menor sea este índice, mayor será la del sitio.

Haciendo uso del buscador Alexa se ha elaborado el siguiente de de los competidores identificados en la elaboración del mostrado en 4.3.1.

EL dato que más llama la atención de este es la de los sitios museoprado.mcu.es y museoreinasofia.mcu.es. Tras analizar estos datos, se verifica que Alexa ofrece habitualmente el asociado a los dominios principales, es decir mcu.es. Por este motivo, la de estos sitios se debe al recibido por todos los sitios web alojados bajo dominio mcu.es.

MuseoThyssen.org se encuentra entre los 94.831 más visitados próximo al musee-orsay.fr.

Plan de Acción

Puesto que este se realiza para conocer la posición de un web en es recomendable elaborar un plan de acción en donde tras un inicial se definan unos objetivos razonables cuyo cumplimiento se irán comprobando en cada que se realice. Objetivos como incrementar el número de usuarios en un 10%, incrementar la duración de la visita a 10 minutos, que indexe todas las páginas de las obras de una nueva exposición.

Obviamente alcanzar ciertos objetivos exige mejorar las programación y el diseño de las páginas web, otros objetivos exigen trabajar en su entorno estableciendo políticas de intercambio de enlaces con otras instituciones, enviando noticias, aprovechando otras acciones de publicidad y marketing de la institución para dar a conocer el web y acciones similares orientadas dar a conocer nuestro web sus contenidos y servicios.

Estos objetivos deben ser razonables y coherentes con la importancia de la institución y los contenidos que ofrece en , un objetivo poco razonable sería alcanzar buenas posiciones para frases de búsqueda relacionadas con el turismo cultural por el simple hecho de incorporar como palabra clave de nuestro web “turismo cultural”. Probablemente la única forma de alcanzar este objetivo sería incorporar un buen canal al web dedicado a este tema.

El proceso de y mejora debe ser continuo, muchos web trabajan en la mejora de su por lo que una semana se puede lograr el objetivo de ver un sitio web en la primera posición de una búsqueda en y a la semana siguiente perder esta posición.

Puesto que este trabajo se ha centrado en conceptos relacionados con el , no se han recogido aspectos de clave para obtener una buena difusión en . Aspectos como la calidad y variedad de los contenidos así como la adaptación de los mismos a los diferentes públicos objetivos. A medio y largo plazo todas las empresas e instituciones con presencia en deberían analizar los diferentes perfiles de internautas que visitan su web y mediante el establecimiento de canales de comunicación con estos, definir los contenidos que demandan.

Conclusiones

Como se ha visto a lo largo del documento, el es en cierta forma una especie de ciencia experimental, donde los grandes protegen sus algoritmos de gestión de información con gran celo obligando a los sitios web a evolucionar en su mediante procesos de prueba y error. Procesos que aunque exigen un gran esfuerzo, tienen a su vez una gran recompensa en forma de nuevos visitantes a través de la red.

El depende y dependerá de la forma en la que los organicen la información por lo que es recomendable tomar esta guía como una introducción y mantenerse informado a través de la web de las nuevas tendencias: nuevos algoritmos de búsqueda, nuevos , etc.

El de un sitio debería centrarse en alcanzar un buen “orgánico”, no pagado, combinado con acciones puntuales de marketing online. Una buena estrategia debería contemplar las siguientes acciones clave:

  • Asegurar una correcta indexación.
  • Potenciar enlaces.
  • Puntualmente pagado.
  • Mejora continua en base a un plan de acción.

Los actualmente se encuentran envueltos en una batalla por captar mayor cuota de Internautas. Esta competencia redundará en beneficio de los usuarios al ofrecer los como parte de su oferta nuevos y mejores servicios de búsqueda que reduzcan el problema de la sobrecarga de información a la que actualmente se somete al usuario.

Referencias


Compartir:
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google
  • LinkedIn
Etiquetas: , , , , , , , , , , , , , , , , , , , , , , , , , , ,

Los comentarios están cerrados.

Acerca de jesba.com
Página personal de Javier Espadas Bardón. Publicación de trabajos de investigación sobre marketing, posicionamiento, difusión, diseño y desarrollo en Internet.
#javier_espadas
    follow me on Twitter
    Calendario
    Septiembre 2010
    L M X J V S D
    « Jun    
     12345
    6789101112
    13141516171819
    20212223242526
    27282930  
    3WRS
    Web Research Studio
    Proyectos de investigación en Internet
    3wrs Proyectos de investigación en Internet
    hit counters
    Data Recovery