Internet supone una gran fuente de información que tradicionalmente ha sido explotada haciendo de diversos métodos que obtienen información que se ajustaba a especificaciones explicitas de un usuario . Este tipo de método permiten obtener información completamente inesperada al partir de un conocimiento previo del usuario.
Información Inesperada: Una información es inesperada si es relevante pero absolutamente desconocida por el usuario o contradice sus creencias o expectativas existentes.
Obtener esta información inesperada desconocida sobre la competencia como nuevos servicios, tarifas especiales o similares tiene un gran valor en la definición de las estrategias de negocio de las empresas.
Puesto que no es viable la obtención de esta información de forma manual, por el gran volumen de páginas que tienen los sitios comerciales así como el gran número de competidores que habitualmente existen en Internet, será necesario establecer procedimientos automáticos que hagan uso de técnicas de minería de datos.
Bing Liu, et. Al proponen en los siguientes cinco métodos que comparan un sitio web U con el de un competidor C con objeto del obtener esta información inesperada:
-
Encontrar las páginas correspondientes de C a una dada de U: Este tipo de análisis es útil cuando se quiere obtener lo que la competencia tiene o ha publicado sobre un asunto especifico.
-
Encontrar términos inesperados en páginas de C con respecto a una página similar de U: La identificación de estos términos diferentes es útil a la hora de valorar el interés de una página para su incorporación en análisis más detallados.
-
Localizar páginas inesperadas en C con respecto a U: Este tipo de análisis es muy interesante al identificar páginas que el sitio U no tiene y en las que la competencia podría estar ofreciendo información o servicios diferenciales.
-
Identificar conceptos inesperados en C con respecto a U: El objeto de este análisis es la búsqueda de conceptos como combinación de palabras.
Analizando datos como las ocurrencias de cada palabra, la distancia entre las mismas, etc.
-
Identificar Enlaces Inesperados: La identificación de enlaces en C puede indicar el uso de recursos externos que podrían aportar un valor diferencial a sus clientes. Un ejemplo de este tipo de enlaces podría ser el acceso a una página de venta de guías de viaje en la página de una agencia de viajes.
Como ampliación de estos cinco métodos, se propone el siguiente:
-
Identificación de los enlaces inesperados recibidos por C: Este método analiza los enlaces que recibe un web competidor C y los compara con los que recibe U de forma que pueden identificarse enlaces no esperados que podrían estar generando nuevos clientes a C.







