Entradas con la etiqueta ‘redes’


Estoy realizando un estudio de la presencia en de las ciudades que son candidatas para celebrar las olimpiadas del año 2016. El estudio tiene como objetivo analizar cuantitativamente cada uno de los sitios web asociados a cada candidatura así como la actividad en entornos 2.0 que hacen referencia a los dominios de dichos sitios web.

Algunos de los indicadores:

de páginas: El sitio web de Rio de Janeiro es el que mayor de contenidos tiene ocupando el web de Madrid2016 la segunda posición.


Enlaces: El sitio web de Tokio es el que más enlaces recibe ocupando el web de Madrid2016 la segunda posición.

Leer el resto de esta entrada »

Etiquetas: , , , , , , ,

Conocer y modelar la topología de constituye una importante área de investigación en la minería de datos web. El conocimiento del modelo ajustado de la topología de permite optimizar sus protocolos de comunicación así como es desarrollo de modelos de inteligencia artificial que permitan extraer “inteligencia” de la Red. Este conocimiento de la Red es necesario entre otros motivos para :

  • Desarrollar estrategias eficientes de recolección de información (crawling)
  • Conocer los aspectos sociológicos de las generación de contenidos en la Red.
  • Diseñar y comprender algoritmos que hacen uso de los enlaces de la red para entre otros objetivos valorar la importancia de un documento como el Page Rank de .
  • Predecir la evolución de las comunidades constituidas por generadores de contenidos que establecen la comunidad mediante enlaces. Ravi Kumar et al. propone la identificación de estas comunidades mediante el descubrimiento de grafos del tipo bipartito. Un grafo bipartito es aquel con cuyos vértices pueden formarse dos conjuntos disjuntos de modo que no haya adyacencias entre vértices pertenecientes al mismo conjunto. Un ejemplo típico de este tipo de grafo son las estructuras de árbol.

    Otro de las estructuras sociales típicas en la Red son los anillos, grupos de sitios web relacionados temáticamente y enlazados entre sí de forma que el internauta puede ir recorriéndolos en orden.

  • Predecir nuevos fenómenos en la red que afecten tanto a su estructura topológica como a sus contenidos y el uso que se hace de los mismos.

Es una idea comúnmente aceptada el que sigue un modelo de crecimiento aleatorio. Hasta 1999, el modelo de grafos aleatorios fue el más utilizado para modelar la Red. Este modelo confería a su estabilidad ante la eliminación de alguno de sus nodos, es decir, si se elimina un nodo, aún es posible encontrar caminos entre cualquier par de nodos de la red .

Según indica el Dr. Alberto-Laslo Varabais, es realmente una red libre de escala. Este tipo de se caracteriza por estar compuesta por nodos y enlaces que se distribuyen de forma muy aleatoria al igual que ocurre con las sociales.

Ley de Potencias y Ley de Zipf

Georgos Siganos
et al. considera, tras un estudio de varios años, que la topología de se ajustan al modelo de la “ley de potencias”. Este modelo por el que algunos nodos acaparan la mayor parte de los enlaces de la red hace que actualmente sea muy arriesgado afirmar que tiene una topología a prueba de fallos ya que la caída de cualquiera de estos nodos podría significar desde la interrupción la capacidad de comunicación en parte de la Red.

Desde el punto de vista de los contenidos, es el producto de un trabajo colaborativo de millones de personas que redactan documentos web y los enlazan entre ellos mediante enlaces. En el resultado final se observa como la conocida ley de Zipf se cumple en diversos aspectos.

George Kipling Zipf fue un reputado lingüista de la de Harvard que investigó en torno a la riqueza del lenguaje utilizado en los textos escritos descubriendo que muchas palabras eran muy utilizadas frente a otras pocas que lo eran menos. Zipf considero que estos resultados sin duda constituían el reflejo de una cualidad humana como es la tendencia al mínimo esfuerzo .

El gráfico de las palabras refleja la ley de Zipf: pocas palabras son utilizadas muy frecuentemente mientas que muchas tienen a utilizarse en pocas ocasiones.

El gráfico del tamaño del texto refleja la llamada ley de Heaps: de forma empírica demuestra que conforme la riqueza del vocabulario, pasado un cierto umbral, no crece de forma proporcional al tamaña del texto.

Leer el resto de esta entrada »

Etiquetas: , , , , , , , , , , , , , , , , ,
Acerca de jesba.com
Página personal de Javier Espadas Bardón. Publicación de trabajos de investigación sobre marketing, posicionamiento, difusión, diseño y desarrollo en Internet.
#javier_espadas
    follow me on Twitter
    Calendario
    Febrero 2012
    L M X J V S D
    « Jun    
     12345
    6789101112
    13141516171819
    20212223242526
    272829  
    3WRS
    Web Research Studio
    Proyectos de investigación en Internet
    3wrs Proyectos de investigación en Internet