Archivo de Enero de 2007

Google pone en marcha un antibombas

Viernes, 26 de Enero de 2007

Parece ser que el google bombing, como el frotar, se va acabar. En el blog oficial de Webmasters Central de Google aparece este post donde notifican la modificación del algoritmo. Afirman que el cambio tendrá poco impacto, así como que cubre diferentes idiomas.

Ya se comenta en varios lugares como en dirson, aunque creo que o mi inglés está peor de lo que creía o se han equivocado al poner que “han tomado la decisión de modificar a mano” o tiene un sentido que no pillo, o en seo profesional.

Baquia: Spam en los buscadores

Viernes, 26 de Enero de 2007

En Baquia ha publicado un artículo de Samuel Arenas (Director General de Ask España) titulado ‘El spam en los buscadores de Internet‘, donde da una idea de como se plantea Ask la lucha contra el spam.

Nueva versión del autochequeo de altas

Lunes, 22 de Enero de 2007

Ya está funcionando la nueva versión del autochequeo de altas en directorios. Las principales diferencias:

  1. Se realiza la comprobación a nivel de la ruta (path) del directorio en el dominio y no únicamente en el dominio, evitando falsos positivos. Por ejemplo, existe un directorio en www.dominio.com/dir si hay un enlace hacia la web que chequeamos en www.dominio.com/otra_cosa antes aparecía como una falsa inclusión, ahora el enlace debe aparecer dentro de www.dominio.com/dir
  2. Se muestran los siguientes datos del directorio: PageRank, páginas indexadas y enlaces entrantes (backlink) de Google y de Yahoo!
  3. Si se ha encontrado más de un enlace dentro del directorio se indica la cantidad y las diferentes URLs.

Actualización: el nuevo sistema se ha adaptado al autochequeo dentro del menú de los websites. Además se ha incluido la posibilidad de borrar los chequeos, por si a alguien se le ha colado alguno erroneo como a mí ;)

Haciendo pruebas con IBM Omnifind Yahoo! Edition

Lunes, 22 de Enero de 2007

IBM Omnifind Yahoo! Edition es un software gratuito basado en el motor Lucene que nos permite de forma fácil indexar y realizar búsquedas en hasta un total de 500000 (quinientos mil) documentos.

El funcionamiento no puede ser más fácil. La instalación es simple a más no poder. Una vez instalado únicamente hemos de indicarle, desde el panel de administación, que dirección web o carpeta de documentos deseamos que indexe. No hay cantidad de opciones, prácticamente el sistema se limita a añadir y eliminar lugares (carpetas o webs) que deseamos indexar, borrar el índice e información del estado del índice. Además nos da estadísticas de las consultas e incluso podemos personalizar la página de busqueda sin meternos en html.
Las consultas se hacen desde un navegador y existe posibilidad de comunicarse con el buscador mediante una API. La opciones para actuar sobre el ranking son pocas: fecha de modificación del documento, la profundidad del documento en el path o la url y web links o enlaces al documento.

Si desactivamos las tres opciones es sistema únicamente tendrá en cuenta las keywords dentro del documento. Así si disponemos de varias versiones de la misma página con diferentes tipos de optimización podremos cual considera el motor que es la más válida. Tendremos un sistema de comprobación de la optimización ‘in-page’ sin tener que esperar a que nos indexe un buscador y ver que resultados nos da.

Otra forma de darle uso es dentro de la empresa como buscador corporativo. En mi caso lo he probado de la forma indicada arriba y como buscador en el archivo de la empresa donde trabajo, sobre más de 75000 documentos. El sistema es bastante rápido en escanear, tardó unas 4 horas en escanear las carpetas con multitud de documentos de muchos tipos, word, html, msg (mensajes de correo de outlook), pdf, excel, power point, txt… accediendo desde la red ya que los datos estaban en uno de los servidores y Omnifind en un ordenador viejo utilizado para la ocasión.

Una de mis dudas era que si le conectaba las unidades de red al equipo con Omnifind, utilicé windows y conecté como unidades de red las carpetas del servidor a indexar, que ocurriría si buscaba en otro equipo donde esas unidades no existiesen, ya que la ruta al documento no sería la misma o incluso no existiría. Pues el mismo Omnifind es el que te devuelve el documento y no un enlace hacia la ruta real. Así que no importa que el equipo donde se hagan las búsquedas no tenga acceso real al documento. Un punto positivo.

La otra duda era la reacción hacia las imágenes. En mi empresa los documentos se escanean y se almacenan y mediante un software de gestión documental donde se realizan las búsquedas. Las imágenes resultantes del escaneo, tif multipáginas, llevan el nombre de cliente, número del expediente y un nombre significativo del documento. Lógicamente el contenido de las imágenes no era posible indexarlo, pero si el sistema fuese capaz de reconocer el nombre del archivo habría sido ideal, pero las imágnes son ignoradas, una pena.

Por otro lado comentar que el equipo donde lo instale para hacer pruebas tenía únicamente 256 MB de RAM, muy por debajo de lo recomendado (1 GB) y lo cierto es que no era capaz de indexar, aparecían errores de varios tipos. Tras ponerle otros 512 MB funcionó realmente bien pese a no llegar a la cantidad indicada. Tal y como indican en la documentación, no se debe instalar en un equipo normal de trabajo, le gusta coger RAM y micro hasta el punto que cualquier otra tarea se resiente.

Lo que no he tenido tiempo de comprobar es el reescaneado en busca de nuevos documentos. En teoría se vuelve a indexar los documentos cada 36 horas, aunque no he llegado a probarlo.
Sin duda un buen producto principalmente para las empresas con muchos documentos sin orden. Será necesario un equipo dedicado con una buena memoria y disco duro grande, a ser posible en RAID. Sin duda menos costoso que un buen software de gestión documental. ¡Ah, y es gratis!

Usando roboform para altas en directorios

Martes, 16 de Enero de 2007

En este hilo del foro de xeoweb Cazador100, por cierto que su directorio turistico está incluido en esta web, hablaba de roboform, un gestor de contraseñas que también permite el rellenado automático de formularios.

Debido a que muchos de los directorios están basados en unos pocos script puede resultar util. He estado pendiente de encontrar un rato para hacer una prueba con esta herramienta. Los resultados han sido satisfactorios hasta cierto punto.

Para empezar hay que crear una ‘identidad’ que es donde debemos crear los datos para completar el formulario. En concreto yo he completado en persona, el nombre y el apellido, en negocio la web y en personalizar los tres campos title, keywords y description. Por desgracia la versión gratuita no permite incluir más de tres valores personalizados.
En scripts como php Link Directory funciona relativamente bien, con el fallo de insertar la web en el enlace recíproco. Manualmente habrá que incluir categoría, el tipo de alta y el captcha. Eso sí mejor darle sólo al botón de rellenar formulario que al de rellenar y enviar por si las moscas…
En otros directorios de todo un poco, algunos han dado buen resultado, en otros nada de nada, especialmente en los que el alta requiere varios pasos.

No es la solución perfecta pero puede ser un buen inicio hasta que tenga oportunidad de crear la propia barra de Omnibius.