Entradas con la etiqueta ‘análisis’

generado a partir de mi proyecto de investigación de de del en

 


http://www.wordle.net/

Etiquetas: , , , , , ,

La creciente necesidad de obtener información de la Red y su crecimiento exponencial ha suscitado en los últimos años un interés por la cibermetría (Shiri, 1998), disciplina cuyo objetivo es la descripción cuantitativa de los procesos de comunicación en , los contenidos de los sitios web, sus interrelaciones y el consumo que se hace de los mismos por los usuarios (Aguillo, 2000).

Aguillo distingue tres grandes grupos de indicadores:

  • Medidas descriptivas: Como su propio nombre indican miden fundamentalmente el tamaño o número de objetos encontrados en cada sede (riqueza de páginas, ficheros media o ricos, densidad de enlaces totales y únicos) y son utilizados para medir la penetración de desde el punto de vista de los contenidos en países, regiones, organizaciones o grupos de individuos.
  • Medidas de e impacto: Están basadas en el carácter hipertextual del Web y exploran los patrones de enlace entre páginas y sedes distintas. El numero y diversidad de enlaces externos recibidos, el de los mismos respecto los contenidos objeto de enlace (llamado apropiadamente factor de impacto Web) o índices que se construyen de acuerdo al peso relativo de las sedes de origen de los enlaces (el famoso PageRank de ) permiten establecer listados ordenados de acuerdo a la jerarquía numérica de estos indicadores.
  • Medidas de : El consumo de información medido en términos de número y características de las visitas de una desde Web resulta un atractivo, aunque extremadamente complejo de implementar, de evaluación. Es ciertamente interesante para estudios temporales, en los que la medida de la evolución resulta prioritaria para los correspondientes informes. Como queda indicado es complicado obtener valores absolutos, pero ciertos valores relativos con sesgos importantes pueden, no obstante, ser utilizados en comparativos.

Leer el resto de esta entrada »

Etiquetas: , , , , , , , , , , , ,

supone una gran fuente de información que tradicionalmente ha sido explotada haciendo de diversos métodos que obtienen información que se ajustaba a especificaciones explicitas de un usuario . Este tipo de permiten obtener información completamente inesperada al partir de un conocimiento previo del usuario.

Información Inesperada: Una información es inesperada si es relevante pero absolutamente desconocida por el usuario o contradice sus creencias o expectativas existentes.

Obtener esta información inesperada desconocida sobre la competencia como nuevos servicios, tarifas especiales o similares tiene un gran valor en la definición de las estrategias de negocio de las empresas.

Leer el resto de esta entrada »

Etiquetas: , , , ,

Conocer y modelar la topología de constituye una importante área de investigación en la minería de datos web. El conocimiento del modelo ajustado de la topología de permite optimizar sus protocolos de comunicación así como es desarrollo de modelos de inteligencia artificial que permitan extraer “inteligencia” de la Red. Este conocimiento de la Red es necesario entre otros motivos para :

  • Desarrollar estrategias eficientes de recolección de información (crawling)
  • Conocer los aspectos sociológicos de las generación de contenidos en la Red.
  • Diseñar y comprender algoritmos que hacen uso de los enlaces de la red para entre otros objetivos valorar la importancia de un documento como el Page Rank de .
  • Predecir la evolución de las comunidades constituidas por generadores de contenidos que establecen la comunidad mediante enlaces. Ravi Kumar et al. propone la identificación de estas comunidades mediante el descubrimiento de grafos del tipo bipartito. Un grafo bipartito es aquel con cuyos vértices pueden formarse dos conjuntos disjuntos de modo que no haya adyacencias entre vértices pertenecientes al mismo conjunto. Un ejemplo típico de este tipo de grafo son las estructuras de árbol.

    Otro de las estructuras sociales típicas en la Red son los anillos, grupos de sitios web relacionados temáticamente y enlazados entre sí de forma que el internauta puede ir recorriéndolos en orden.

  • Predecir nuevos fenómenos en la red que afecten tanto a su estructura topológica como a sus contenidos y el uso que se hace de los mismos.

Es una idea comúnmente aceptada el que sigue un modelo de crecimiento aleatorio. Hasta 1999, el modelo de grafos aleatorios fue el más utilizado para modelar la Red. Este modelo confería a su estabilidad ante la eliminación de alguno de sus nodos, es decir, si se elimina un nodo, aún es posible encontrar caminos entre cualquier par de nodos de la red .

Según indica el Dr. Alberto-Laslo Varabais, es realmente una red libre de escala. Este tipo de se caracteriza por estar compuesta por nodos y enlaces que se distribuyen de forma muy aleatoria al igual que ocurre con las sociales.

Ley de Potencias y Ley de Zipf

Georgos Siganos
et al. considera, tras un estudio de varios años, que la topología de se ajustan al modelo de la “ley de potencias”. Este modelo por el que algunos nodos acaparan la mayor parte de los enlaces de la red hace que actualmente sea muy arriesgado afirmar que tiene una topología a prueba de fallos ya que la caída de cualquiera de estos nodos podría significar desde la interrupción la capacidad de comunicación en parte de la Red.

Desde el punto de vista de los contenidos, es el producto de un trabajo colaborativo de millones de personas que redactan documentos web y los enlazan entre ellos mediante enlaces. En el resultado final se observa como la conocida ley de Zipf se cumple en diversos aspectos.

George Kipling Zipf fue un reputado lingüista de la de Harvard que investigó en torno a la riqueza del lenguaje utilizado en los textos escritos descubriendo que muchas palabras eran muy utilizadas frente a otras pocas que lo eran menos. Zipf considero que estos resultados sin duda constituían el reflejo de una cualidad humana como es la tendencia al mínimo esfuerzo .

El gráfico de las palabras refleja la ley de Zipf: pocas palabras son utilizadas muy frecuentemente mientas que muchas tienen a utilizarse en pocas ocasiones.

El gráfico del tamaño del texto refleja la llamada ley de Heaps: de forma empírica demuestra que conforme la riqueza del vocabulario, pasado un cierto umbral, no crece de forma proporcional al tamaña del texto.

Leer el resto de esta entrada »

Etiquetas: , , , , , , , , , , , , , , , , ,

En este trabajo recoge una introducción a los conceptos del de contenidos en la red, un de y una selección de métricas así como diversas recomendaciones dirigidas a optimizar el de un sitio en . Aunque el contenido de este trabajo es aplicable a cualquier sitio web, para ilustrarlo se han utilizado diversos ejemplos del ámbito de los Museos e Instituciones culturales en el que actualmente el autor desarrolla su actividad profesional.

Organización de

Al estudiar el de sitios web en se imprescindible tener claro cómo se organiza la información en la Red. El siguiente diagrama de clases UML representa de forma muy esquemática los elementos más importantes en los que se estructura la documentación en y sus relaciones.

Según este diagrama se organiza en millones de sitios web que publican documentos web.

Cada documento web puede ser:

  • Página Activa: Un documento activo que es generado bajo demanda a partir de datos almacenados en una base de datos. Son páginas Asp, JSP, u otras con código que se ejecuta en el servidor como paso previo al envío de la página al usuario.
  • Página Estática: Página que contiene en un único fichero toda la información necesaria típicamente en formato html. Este tipo de páginas son servidas directamente y no es necesario su procesamiento.
  • Fichero Rico: Ficheros
    en formatos: pdf, doc, ppt, etc. Este tipo de ficheros típicamente recogen información muy elaborada y suelen situarse en los últimos niveles del árbol de un sitio web.

Leer el resto de esta entrada »

Etiquetas: , , , , , , , , , , , , , , , , , , , , , , , , , , ,

La magnitud de la información ofrecida por hace que tener unos contenidos y unos servicios de calidad en un web de diseño atractivo sea necesario pero no suficiente para lograr una buena difusión.

Este estudio se considera que esta difusión está directamente relacionada con la de un sitio y aplica un para el de la misma.

3        CASO DE ESTUDIO

En los últimos años, un número creciente de ciudadanos de la unión europea han elegido a España como destino residencial [19]. En el año 2.004 el número de británicos que residieron  en España más de tres meses en 2.004 ascendió a  44.315 [20] configurándose la colonia como la más numerosa de las pertenecientes a la Unión Europea.

España fue en el año 2.003 como el destino vacacional preferido por los británicos [21]siendo el destino del 30% de los desplazamientos vacacionales.

El incremento de los ciudadanos británicos que  residen en España largos periodos y adquieren una segunda residencia en el país ha hecho que las entidades financieras, tanto del Reino Unido como de España, compitan activamente por este mercado emergente.

Por otro lado se consolida como el canal de información más utilizado por los británicos a la hora de buscar viviendas y productos financieros asociados [22] de forma que la Red constituye un espacio en el que las instituciones financieras compiten por situar su oferta de contenidos y servicios.

Leer el resto de esta entrada »

Etiquetas: , , , , , , , , , , , , , , , , , , , , , , ,

Los primeros sitios web surgieron en los años 90 principalmente en el ámbito universitario. El primer buscador fue creado por Alan Emtage en 1990 y su nombre era Archie. Hasta entonces la información era compartida haciendo uso del protocolo ftp y ofreciendo accesos anónimos. El principal problema de este primitivo sistema es que el usuario casi siempre ya conocía la información que deseaba consultar y no era posible realizar búsquedas libres.

En 1993 el sistema Verónica para el intercambio de ficheros vía Gopher En Octubre de 1993 Koster creó ALIWEB (Archie Like Indexing of the Web) que permitía a los usuarios dar de alta sus páginas junto con una descripción.

1993 supuso también el despegue de los primeros robots con Jumpstation y WWW Worm y Repository Based Software Engineering siendo este último sistema el primero en establece un sistema de de los contenidos.

También en 1993, surge Excite, un proyecto que evolucionó a partir de Architext. Architext y Excite constituyeron las primeras experiencias en aplicar estadísticos a las palabras con objeto de realizar búsquedas más inteligentes.

En 1994 aparece EINet Galaxy, el primer directorio con un uso generalizado, ofrecía no sólo referencias web si no también referencias ftp y Gopher. Este mismo año, David Filo y Jerry Yang crearon como un proyecto personal de direcciones favoritas con un sencillo elemento diferenciador, incluían una breve descripción de cada URL en el directorio. El mismo mes Brian Pinkerton de la de Washington desarrollaron WebCrawler, el primer rastreador capaz de analizar e indexar páginas completas.

Leer el resto de esta entrada »

Etiquetas: , , , , , , , , , , , , , , , , , , , , , , , ,

Auditando el en la Red. IV Congreso Internacional de Auditoria y Seguridad de la Información CIASI 2005.

El en intenta cuantificar la importancia de un sitio web desde diferentes perspectivas: la de los , la de otros sitios y la de los internautas. Un buen en cada una de estas perspectivas es, sin duda, uno de los pilares fundamentales para el éxito en ya que asegura la de los contenidos y servicios en la Red.

Leer el resto de esta entrada »

Etiquetas: , , , , , , , , , , , , , , , , , , , , , , ,
Acerca de jesba.com
Página personal de Javier Espadas Bardón. Publicación de trabajos de investigación sobre marketing, posicionamiento, difusión, diseño y desarrollo en Internet.
#javier_espadas
    follow me on Twitter
    Calendario
    Febrero 2012
    L M X J V S D
    « Jun    
     12345
    6789101112
    13141516171819
    20212223242526
    272829  
    3WRS
    Web Research Studio
    Proyectos de investigación en Internet
    3wrs Proyectos de investigación en Internet