Entradas con la etiqueta ‘redes’

Estoy realizando un estudio de la presencia en Internet de las ciudades que son candidatas para celebrar las olimpiadas del año 2016. El estudio tiene como objetivo analizar cuantitativamente cada uno de los sitios web asociados a cada candidatura así como la actividad en entornos 2.0 que hacen referencia a los dominios de dichos sitios web.
Algunos de los indicadores:
Volumen de páginas: El sitio web de Rio de Janeiro es el que mayor volumen de contenidos tiene ocupando el web de Madrid2016 la segunda posición.

Enlaces: El sitio web de Tokio es el que más enlaces recibe ocupando el web de Madrid2016 la segunda posición.
Leer el resto de esta entrada »
Etiquetas: blog, blogs, internet, it, jesba, redes, redes sociales, volumenConocer y modelar la topología de Internet constituye una importante área de investigación en la minería de datos web. El conocimiento del modelo ajustado de la topología de Internet permite optimizar sus protocolos de comunicación así como es desarrollo de modelos de inteligencia artificial que permitan extraer “inteligencia” de la Red. Este conocimiento de la Red es necesario entre otros motivos para :
-
Desarrollar estrategias eficientes de recolección de información (crawling)
-
Conocer los aspectos sociológicos de las generación de contenidos en la Red.
-
Diseñar y comprender algoritmos que hacen uso de los enlaces de la red para entre otros objetivos valorar la importancia de un documento como el Page Rank de Google.
-
Predecir la evolución de las comunidades constituidas por generadores de contenidos que establecen la comunidad mediante enlaces. Ravi Kumar et al. propone la identificación de estas comunidades mediante el descubrimiento de grafos del tipo bipartito. Un grafo bipartito es aquel con cuyos vértices pueden formarse dos conjuntos disjuntos de modo que no haya adyacencias entre vértices pertenecientes al mismo conjunto. Un ejemplo típico de este tipo de grafo son las estructuras de árbol.
Otro de las estructuras sociales típicas en la Red son los anillos, grupos de sitios web relacionados temáticamente y enlazados entre sí de forma que el internauta puede ir recorriéndolos en orden.
-
Predecir nuevos fenómenos en la red que afecten tanto a su estructura topológica como a sus contenidos y el uso que se hace de los mismos.
Es una idea comúnmente aceptada el que Internet sigue un modelo de crecimiento aleatorio. Hasta 1999, el modelo de grafos aleatorios fue el más utilizado para modelar la Red. Este modelo confería a Internet su estabilidad ante la eliminación de alguno de sus nodos, es decir, si se elimina un nodo, aún es posible encontrar caminos entre cualquier par de nodos de la red .
Según indica el Dr. Alberto-Laslo Varabais, Internet es realmente una red libre de escala. Este tipo de redes se caracteriza por estar compuesta por nodos y enlaces que se distribuyen de forma muy aleatoria al igual que ocurre con las redes sociales.
Ley de Potencias y Ley de Zipf
Georgos Siganos
et al. considera, tras un estudio de varios años, que la topología de Internet se ajustan al modelo de la “ley de potencias”. Este modelo por el que algunos nodos acaparan la mayor parte de los enlaces de la red hace que actualmente sea muy arriesgado afirmar que Internet tiene una topología a prueba de fallos ya que la caída de cualquiera de estos nodos podría significar desde la interrupción la capacidad de comunicación en parte de la Red.
Desde el punto de vista de los contenidos, Internet es el producto de un trabajo colaborativo de millones de personas que redactan documentos web y los enlazan entre ellos mediante enlaces. En el resultado final se observa como la conocida ley de Zipf se cumple en diversos aspectos.
George Kipling Zipf fue un reputado lingüista de la Universidad de Harvard que investigó en torno a la riqueza del lenguaje utilizado en los textos escritos descubriendo que muchas palabras eran muy utilizadas frente a otras pocas que lo eran menos. Zipf considero que estos resultados sin duda constituían el reflejo de una cualidad humana como es la tendencia al mínimo esfuerzo .
El gráfico de las palabras refleja la ley de Zipf: pocas palabras son utilizadas muy frecuentemente mientas que muchas tienen a utilizarse en pocas ocasiones.
El gráfico del tamaño del texto refleja la llamada ley de Heaps: de forma empírica demuestra que conforme la riqueza del vocabulario, pasado un cierto umbral, no crece de forma proporcional al tamaña del texto.
Leer el resto de esta entrada »
Etiquetas: análisis, buscadores, clasificación, Google, indexadas, internet, it, jesba, museo, popularidad, ranking, redes, redes sociales, SEO, tráfico, universidad, volumen, Yahoo