Archivo de Mayo de 2009
Tienes un servidor web al que te conectas vía http para administrar con Plex u otro programa similar y tienes que reiniciar el servidor apache para que acepte unos cambios que has incluido en el httpd.include.
¿Cómo lo reinicio?
El plex no tiene esta opción. Entonces lo intentamos vía comando. Conectándonos por SSL con el programa putty al servidor con el usuario de administración y tecleando las siguientes instrucciones.
# /etc/init.d/apache2 stop
# /etc/init.d/apache2 start
Etiquetas: it, jesba
Wordclouds del discurso del presidente del gobierno de España, José Luis Rodriguez Zapatero y del líder de la oposición Mariano Rajoy en el Debate sobre el Estado de la Nación. Congreso de los Diputados, 12 de Mayo de 2009.
|
Wordcloud del discurso de José Luis Rodríguez Zapatero Rajoy en el Debate sobre Estado de la Nación. |
Wordcloud del discurso de Mariano Rajoy en el Debate sobre Estado de la Nación. |
Etiquetas: el debate, jesba, luis rodriguez, mariano rajoy, Nación, oposición, wordcloud, Wordclouds, Zapatero

Journal of the American Society for Information Science and Technology
Articulo publicado en JASIST(Journal of the American Society for Information Science and Technology) que presenta un modelo para el anállisis de la visibilidad de sitios web.
Journal of the American Society for Information Science
Volume 59 Issue 11, Pages 1727 - 1742
Published Online: 30 May 2008
Abstract
In recent years, the Internet has experienced a boom as an information source. The use of search engines is the most common way of finding this information. This means that less visible contents (for search engines) are increasingly difficult or even almost impossible to find. Thus, Web users are forced to accept alternative services or contents only because they are visible and offered to users by search engines. If a company’s Web site is not visible, that company is losing clients. Therefore, it is fundamental to assure that one’s Web site will be indexed and, consequently, visible to as many Web users as possible. To quantitatively evaluate the visibility of a Web site, this article introduces a method that Web administrators may use. The method consists of four activities and several tasks. Most of the tasks are accompanied by a set of defined measures that can help the Web administrator determine where the Web design is failing (from the positioning point of view). Some tools that can be used for the determination of the measure values also are referenced in the description of the method. The method is furthermore accompanied by examples to help in understanding how to apply it.

Tagcloud generado a partir de mi proyecto de investigación de doctorado “Metodología de Análisis del Posicionamiento en Internet”
Etiquetas: análisis, doctorado, internet, jesba, metodología, posicionamiento, tagcloud

Estoy realizando un estudio de la presencia en Internet de las ciudades que son candidatas para celebrar las olimpiadas del año 2016. El estudio tiene como objetivo analizar cuantitativamente cada uno de los sitios web asociados a cada candidatura así como la actividad en entornos 2.0 que hacen referencia a los dominios de dichos sitios web.
Algunos de los indicadores:
Volumen de páginas: El sitio web de Rio de Janeiro es el que mayor volumen de contenidos tiene ocupando el web de Madrid2016 la segunda posición.

Enlaces: El sitio web de Tokio es el que más enlaces recibe ocupando el web de Madrid2016 la segunda posición.
Leer el resto de esta entrada »
Etiquetas: blog, blogs, internet, it, jesba, redes, redes sociales, volumenDesde el punto de vista de los idiomas es importante destacar como las páginas en Ingles constituyen un 60,4% y las páginas en castellano un 3,1% sin embargo los internautas que hablan inglés como lengua materna constituyen un 35,2% y que hablan español, el 8,1%.

Idiomas en la Red
Leer el resto de esta entrada »
Etiquetas: blog, blogs, buscadores, Google, internet, it, jesba, posicionamiento, search engine, SEO, universidadLa creciente necesidad de obtener información de la Red y su crecimiento exponencial ha suscitado en los últimos años un interés por la cibermetría (Shiri, 1998), disciplina cuyo objetivo es la descripción cuantitativa de los procesos de comunicación en Internet, los contenidos de los sitios web, sus interrelaciones y el consumo que se hace de los mismos por los usuarios (Aguillo, 2000).
Aguillo distingue tres grandes grupos de indicadores:
-
Medidas descriptivas: Como su propio nombre indican miden fundamentalmente el tamaño o número de objetos encontrados en cada sede (riqueza de páginas, ficheros media o ricos, densidad de enlaces totales y únicos) y son utilizados para medir la penetración de Internet desde el punto de vista de los contenidos en países, regiones, organizaciones o grupos de individuos.
-
Medidas de visibilidad e impacto: Están basadas en el carácter hipertextual del Web y exploran los patrones de enlace entre páginas y sedes distintas. El numero y diversidad de enlaces externos recibidos, el volumen de los mismos respecto los contenidos objeto de enlace (llamado apropiadamente factor de impacto Web) o índices que se construyen de acuerdo al peso relativo de las sedes de origen de los enlaces (el famoso PageRank de Google) permiten establecer listados ordenados de acuerdo a la jerarquía numérica de estos indicadores.
-
Medidas de popularidad: El consumo de información medido en términos de número y características de las visitas de una desde Web resulta un atractivo, aunque extremadamente complejo de implementar, método de evaluación. Es ciertamente interesante para estudios temporales, en los que la medida de la evolución resulta prioritaria para los correspondientes informes. Como queda indicado es complicado obtener valores absolutos, pero ciertos valores relativos con sesgos importantes pueden, no obstante, ser utilizados en análisis comparativos.
Leer el resto de esta entrada »
Etiquetas: análisis, buscadores, Google, internet, it, jesba, método, popularidad, posicionamiento, ranking, visibilidad, volumen, wifInternet supone una gran fuente de información que tradicionalmente ha sido explotada haciendo de diversos métodos que obtienen información que se ajustaba a especificaciones explicitas de un usuario . Este tipo de método permiten obtener información completamente inesperada al partir de un conocimiento previo del usuario.
Información Inesperada: Una información es inesperada si es relevante pero absolutamente desconocida por el usuario o contradice sus creencias o expectativas existentes.
Obtener esta información inesperada desconocida sobre la competencia como nuevos servicios, tarifas especiales o similares tiene un gran valor en la definición de las estrategias de negocio de las empresas.
Leer el resto de esta entrada »
Etiquetas: análisis, internet, it, método, volumenConocer y modelar la topología de Internet constituye una importante área de investigación en la minería de datos web. El conocimiento del modelo ajustado de la topología de Internet permite optimizar sus protocolos de comunicación así como es desarrollo de modelos de inteligencia artificial que permitan extraer “inteligencia” de la Red. Este conocimiento de la Red es necesario entre otros motivos para :
-
Desarrollar estrategias eficientes de recolección de información (crawling)
-
Conocer los aspectos sociológicos de las generación de contenidos en la Red.
-
Diseñar y comprender algoritmos que hacen uso de los enlaces de la red para entre otros objetivos valorar la importancia de un documento como el Page Rank de Google.
-
Predecir la evolución de las comunidades constituidas por generadores de contenidos que establecen la comunidad mediante enlaces. Ravi Kumar et al. propone la identificación de estas comunidades mediante el descubrimiento de grafos del tipo bipartito. Un grafo bipartito es aquel con cuyos vértices pueden formarse dos conjuntos disjuntos de modo que no haya adyacencias entre vértices pertenecientes al mismo conjunto. Un ejemplo típico de este tipo de grafo son las estructuras de árbol.
Otro de las estructuras sociales típicas en la Red son los anillos, grupos de sitios web relacionados temáticamente y enlazados entre sí de forma que el internauta puede ir recorriéndolos en orden.
-
Predecir nuevos fenómenos en la red que afecten tanto a su estructura topológica como a sus contenidos y el uso que se hace de los mismos.
Es una idea comúnmente aceptada el que Internet sigue un modelo de crecimiento aleatorio. Hasta 1999, el modelo de grafos aleatorios fue el más utilizado para modelar la Red. Este modelo confería a Internet su estabilidad ante la eliminación de alguno de sus nodos, es decir, si se elimina un nodo, aún es posible encontrar caminos entre cualquier par de nodos de la red .
Según indica el Dr. Alberto-Laslo Varabais, Internet es realmente una red libre de escala. Este tipo de redes se caracteriza por estar compuesta por nodos y enlaces que se distribuyen de forma muy aleatoria al igual que ocurre con las redes sociales.
Ley de Potencias y Ley de Zipf
Georgos Siganos
et al. considera, tras un estudio de varios años, que la topología de Internet se ajustan al modelo de la “ley de potencias”. Este modelo por el que algunos nodos acaparan la mayor parte de los enlaces de la red hace que actualmente sea muy arriesgado afirmar que Internet tiene una topología a prueba de fallos ya que la caída de cualquiera de estos nodos podría significar desde la interrupción la capacidad de comunicación en parte de la Red.
Desde el punto de vista de los contenidos, Internet es el producto de un trabajo colaborativo de millones de personas que redactan documentos web y los enlazan entre ellos mediante enlaces. En el resultado final se observa como la conocida ley de Zipf se cumple en diversos aspectos.
George Kipling Zipf fue un reputado lingüista de la Universidad de Harvard que investigó en torno a la riqueza del lenguaje utilizado en los textos escritos descubriendo que muchas palabras eran muy utilizadas frente a otras pocas que lo eran menos. Zipf considero que estos resultados sin duda constituían el reflejo de una cualidad humana como es la tendencia al mínimo esfuerzo .
El gráfico de las palabras refleja la ley de Zipf: pocas palabras son utilizadas muy frecuentemente mientas que muchas tienen a utilizarse en pocas ocasiones.
El gráfico del tamaño del texto refleja la llamada ley de Heaps: de forma empírica demuestra que conforme la riqueza del vocabulario, pasado un cierto umbral, no crece de forma proporcional al tamaña del texto.
Leer el resto de esta entrada »
Etiquetas: análisis, buscadores, clasificación, Google, indexadas, internet, it, jesba, museo, popularidad, ranking, redes, redes sociales, SEO, tráfico, universidad, volumen, Yahoo






