Originalmente a esta saga la iba a llamar ยซUn venenito muy sutil llamado libertadยซ, en honor a una infame frase de Marรญa Julia Alsogaray, y tambiรฉn por lo que dice la versiรณn en espaรฑola de prism-break.org en cuanto a los buscadores:
ยซStartpage es privativo, hospedado en los Estados Unidos y Holanda, y provee resultados anonimizados de Google (incluyendo imรกgenes). DuckDuckGo es parcialmente privativo, hospedado en los Estados Unidos, y provee resultados anonimizados de Bing.ยกElige tu veneno!ยป
Como funciona un motor de bรบsqueda? Bastante fรกcil.
1) Una araรฑa visita tu pรกgina web, entrando por el root, lee TODO el contenido y crea una lista de lo que ha encontrado.
(Si tenรฉs configurado un robots.txt podรฉs indicar quรฉ araรฑa puede mirar tal contenido y que araรฑa no.)
2) La informaciรณn es indexada segรบn los algoritmos internos usados por el buscador
3) Esta informaciรณn es llevada a una central donde se almacena.
4) Cuando alguien realiza una bรบsqueda, y el sistema muestra todas las webs que contienen la palabra o frase buscada.
Seeks y Yacy son motores de bรบsqueda tambiรฉn pero, ademรกs de ser alternativas libres, hacer bรบsquedas anรณnimas (via proxy), no incluir publicidad y ser menos propensos a la censura, son motores de bรบsqueda descentralizados. Sin embargo ambos muy distintos de enfoque.
Por un lado Yacy es un buscador descentralizado PURO, ya que tiene su propia araรฑa P2P la cual busca entre los nodos activos y recoge el contenido. En cambio Seeks es mรกs bienย un meta-buscador (como duckduckgo) que hace bรบsquedas anรณnimas en los buscadores centralizados (Google, Bing, Yahoo, etc.) pero tiene un filtro descentralizado, cada nodo muestra los resultados que quiere mostrar.
Hablando de otras cosas y en plan comparativo surgen tres cosas:
1) Muchos achacan los malos resultados de Yacy y es porque devuelve resultados sรณlo de lo que recolecte el crawler y dependiendo de los nodos activos. Seeks no tiene ese problema ya que busca en los servidores centrales y luego cada nodo filtra los resultados.
2) Yacy es mรกs fรกcil de instalar y configurar que Seeks (lo digo por experiencia, ya les digo como), ademรกs de que es multi plataforma.
3) La bรบsqueda P2P gasta banda ancha y es lenta. DuckDuckGo sale ganando frente a los dos.
Para instalar Yacy (requiere OpenJDK6): Descargar paquete fuente, descomprimirlo (no hay necesidad de compilarlo), en el directorio ejecutar sh StartYacy.sh, abrir un navegador, entrar en localhost:8090 (se puede cambiar) y ya estรก. Tambiรฉn hay paquetes para Gentoo, Debian, Opensuse y Arch.
Para instalar Seeks: Instalar libevent y elegir entre descargar los paquetes para Debian, Arch, Ubuntu y Gentoo, o descargar el cรณdigo fuente y compilarlo. Habilitar el plugin httpserv (para que la compu sea un nodo pรบblico mรกs), abrir un navegador, entrar en s.s/websearch-hp y ya estรก.
Para incluir las bรบsquedas de Yacy en Seeks: Tener Yacy Corriendo, modificar un archivo y reiniciar Seeks (hay que reiniciar seeks cada vez que se toque un archivo de configuraciรณn).
Tambiรฉn pueden probar usar los nodos pรบblicos, tanto en yacy como en seeks. Y con esto ya estรก este artรญculo. Yo por ahora me quedo con el patito y sus poderosos bangs