Archivo de la categoría "Buscadores"

Google y los links

Martes, 6 de Febrero de 2007

Parece ser que Google se ha puesto las pilas con el tema de los links, informan en Google Webmaster Central. Es frecuente leer en los foros a gente preguntando porque Google no le muestra todos los enlaces a su página con el comando link:. Es algo que Google viene haciendo desde que recuerdo. Ahora Google ha decidido darnos más datos, eso sí, a través de las herramientas para webmasters, donde hemos de acreditar la posesión del sitio, al igual que sucede con los sitemaps.

Es importante ver esa información, nos da posibilidades de encontrar donde se habla de nosotros. Pero sin duda una de las mayores utilidades sería controlar donde aparece la competencia, quien les enlaza, o estudiar un sitio donde tenemos posibilidad de incluir un link, como ocurre en Omnibius, donde se muestra entre los datos de los directorios los enlaces a la web.

Es un paso, pero hasta que no exista la posibilidad de acceder de forma pública a esa información, seguirá dando mejores datos Yahoo! Site Explorer.

Google pone en marcha un antibombas

Viernes, 26 de Enero de 2007

Parece ser que el google bombing, como el frotar, se va acabar. En el blog oficial de Webmasters Central de Google aparece este post donde notifican la modificación del algoritmo. Afirman que el cambio tendrá poco impacto, así como que cubre diferentes idiomas.

Ya se comenta en varios lugares como en dirson, aunque creo que o mi inglés está peor de lo que creía o se han equivocado al poner que “han tomado la decisión de modificar a mano” o tiene un sentido que no pillo, o en seo profesional.

Baquia: Spam en los buscadores

Viernes, 26 de Enero de 2007

En Baquia ha publicado un artículo de Samuel Arenas (Director General de Ask España) titulado ‘El spam en los buscadores de Internet‘, donde da una idea de como se plantea Ask la lucha contra el spam.

Haciendo pruebas con IBM Omnifind Yahoo! Edition

Lunes, 22 de Enero de 2007

IBM Omnifind Yahoo! Edition es un software gratuito basado en el motor Lucene que nos permite de forma fácil indexar y realizar búsquedas en hasta un total de 500000 (quinientos mil) documentos.

El funcionamiento no puede ser más fácil. La instalación es simple a más no poder. Una vez instalado únicamente hemos de indicarle, desde el panel de administación, que dirección web o carpeta de documentos deseamos que indexe. No hay cantidad de opciones, prácticamente el sistema se limita a añadir y eliminar lugares (carpetas o webs) que deseamos indexar, borrar el índice e información del estado del índice. Además nos da estadísticas de las consultas e incluso podemos personalizar la página de busqueda sin meternos en html.
Las consultas se hacen desde un navegador y existe posibilidad de comunicarse con el buscador mediante una API. La opciones para actuar sobre el ranking son pocas: fecha de modificación del documento, la profundidad del documento en el path o la url y web links o enlaces al documento.

Si desactivamos las tres opciones es sistema únicamente tendrá en cuenta las keywords dentro del documento. Así si disponemos de varias versiones de la misma página con diferentes tipos de optimización podremos cual considera el motor que es la más válida. Tendremos un sistema de comprobación de la optimización ‘in-page’ sin tener que esperar a que nos indexe un buscador y ver que resultados nos da.

Otra forma de darle uso es dentro de la empresa como buscador corporativo. En mi caso lo he probado de la forma indicada arriba y como buscador en el archivo de la empresa donde trabajo, sobre más de 75000 documentos. El sistema es bastante rápido en escanear, tardó unas 4 horas en escanear las carpetas con multitud de documentos de muchos tipos, word, html, msg (mensajes de correo de outlook), pdf, excel, power point, txt… accediendo desde la red ya que los datos estaban en uno de los servidores y Omnifind en un ordenador viejo utilizado para la ocasión.

Una de mis dudas era que si le conectaba las unidades de red al equipo con Omnifind, utilicé windows y conecté como unidades de red las carpetas del servidor a indexar, que ocurriría si buscaba en otro equipo donde esas unidades no existiesen, ya que la ruta al documento no sería la misma o incluso no existiría. Pues el mismo Omnifind es el que te devuelve el documento y no un enlace hacia la ruta real. Así que no importa que el equipo donde se hagan las búsquedas no tenga acceso real al documento. Un punto positivo.

La otra duda era la reacción hacia las imágenes. En mi empresa los documentos se escanean y se almacenan y mediante un software de gestión documental donde se realizan las búsquedas. Las imágenes resultantes del escaneo, tif multipáginas, llevan el nombre de cliente, número del expediente y un nombre significativo del documento. Lógicamente el contenido de las imágenes no era posible indexarlo, pero si el sistema fuese capaz de reconocer el nombre del archivo habría sido ideal, pero las imágnes son ignoradas, una pena.

Por otro lado comentar que el equipo donde lo instale para hacer pruebas tenía únicamente 256 MB de RAM, muy por debajo de lo recomendado (1 GB) y lo cierto es que no era capaz de indexar, aparecían errores de varios tipos. Tras ponerle otros 512 MB funcionó realmente bien pese a no llegar a la cantidad indicada. Tal y como indican en la documentación, no se debe instalar en un equipo normal de trabajo, le gusta coger RAM y micro hasta el punto que cualquier otra tarea se resiente.

Lo que no he tenido tiempo de comprobar es el reescaneado en busca de nuevos documentos. En teoría se vuelve a indexar los documentos cada 36 horas, aunque no he llegado a probarlo.
Sin duda un buen producto principalmente para las empresas con muchos documentos sin orden. Será necesario un equipo dedicado con una buena memoria y disco duro grande, a ser posible en RAID. Sin duda menos costoso que un buen software de gestión documental. ¡Ah, y es gratis!

Google sobreescribe

Jueves, 26 de Octubre de 2006

No es que haya sobreescrito páginas, sino que junto al logotipo, donde normalmente aparece el país, apareció ‘español’ con el resultado que se puede ver en las imágenes. Pasó esta mañana, me dio tiempo a capturar la pantalla, en esto momento todo está normal.

Google sobreescribe

Tras el temporal, más de Google y Youtube

Martes, 17 de Octubre de 2006

Interesantes 2 artículos sobre Google tras la compra de Youtube.
El primero de Enrique Dans de basa en un análisis anterior (en inglés) donde se estudia los posibles ingresos de Youtube a fecha de la compra. Por supuesto los datos son estimaciones y ZDNet no cree que los datos sean correctos (en inglés).
Lo realmente interesante es el hecho de que en el mejor de los casos, tal y como se indica en los comentearios del artículo, Google necesitaría, con la mejor estimación de ingresos actuales, 25 años para rentabilizar su inversión. Claro que si la mayoría del precio pagado va en acciones no se nota tanto.
En cualquier caso, pierda o gane dinero Youtube el movimiento de Google no creo que haya sido otro más que comerse a la competencia. Igual que en otros tiempos Microsoft deboraba aquello que podía hacerle sombra, Google tiene ahora la capacidad económica de hacerlo. Parece que se olvida el hecho de que Google ya tenía un producto igual. Me gustaría saber que habría pasado, las opiniones si hubiese sido Microsoft el actor principal. En su momento no entendí el odio visceral a Microsoft, y sigo sin entender la adoración a Apple, al Ipod o a Google.
El segundo artículo de dirson.com es una reflexión. El título lo dice todo: ¿Se está conviertiendo Google en un monopolio? Es algo que se venía venir desde hace tiempo, la voces críticas empiezan a sonar lentamente.
Pero la confianza en Google es fuerte. En el texto se dice ‘Las claves de esta confianza: su imagen juvenil, sencilla, con un logotipo multicolor, unido a una obsesión por parte de sus directivos de primar a los usuarios y su privacidad por delante de cualquier otro aspecto’. Hay una parte en la que puedo estar de acuerdo, la imagen, pero sobre lo de primar los usuarios y su privacidad no disiento. A la mayoría de los usuarios normales les trae al pairo los avisos legales, la mayoría de ellos ni saben que son las cookies o para que sirven, y mucho menos el tracking de sus búsquedas. Dile a cualquiera que su tráfico en internet queda registrado en su ordenador, en su proveedor, en el servidor al que se conecta, en Google, en su webmail y se pasará semanas mirando bajo la cama en busca de un micrófono. Bendita ignorancia.
El principal éxito de Google es que es un buscador. Para la mayoría de los usuarios normales Google es un buscador a secas. Entras, escribes lo que quieres encontrar y le das al botón. Buscas y punto.
En Yahoo! tenemos cantidad de opciones en su página principal, aunque exista el buscador en la parte superior queda confundida entre tanto icono, noticas y demás. Yahoo! no es un buscador es un portal. Si la página principal de Yahoo! fuese la del search la percepción de los usuarios cambiaría. Supongo que es el fin que se persigue con Live, dejando a MSN como portal.
Pero en el caso de Google su simpleza es su fuerza aunque también es una debilidad.
Existen muchos otros servicios, algunos como Google Maps o Google Earth son bastante conocidos (Nota: incluso en Crank Veneno en la sangre se puede ver el logotipo de Google en las imágenes aereas). Otros servicios como Analytics o Sitemaps son apreciados por los webmasters. Pero para mantener esa imágen de buscador y no de portal sus productos están sueltos, no hay una integración clara. Tenemos una ‘Google account’ pero existe un acceso para el gmail, otro para el Analytics, otro para Sitemaps, Adsense… Si Google llegase a integrar todos o gran parte de sus productos, se convertirá en un portal y tal vez llegue otro actor (¿Live?)a quitarle el apodo de ‘buscador’.
Se basan muchos en el “Don’t be evil” al dar una buena opinión de Google. En Ojo buscador leí esto, da que pensar.
Me llama la atención es el hecho que desde Yahoo! Site Explorer se puede acceder a la información precisa de enlaces y páginas indexadas, algo que Google no proporciona. Si lo hiciese, seguramente con una muestra grande se podría sacar una función aproximada para calcular el PageRank.
En el presente, y aún más en el futuro, la información es poder y Google la controla, si no estas en las 3 primeras páginas de busqueda no existes.
Ya puestos, imaginemos un 1984 donde el ministro de la Verdad se llama Google…