Pílulas vermelhas com cianeto, parte 3: busca e Yacy

yacy procura

Originalmente, eu chamaria essa saga de «Um veneno muito sutil chamado liberdade", Em homenagem a uma frase infame por María Julia Alsogaray, e também pelo que diz a versão espanhola do prism-break.org em termos de motores de busca:

“O Startpage é proprietário, hospedado nos Estados Unidos e na Holanda, e fornece resultados anônimos do Google (incluindo imagens). DuckDuckGo é parcialmente proprietário, hospedado nos Estados Unidos e fornece resultados anônimos do Bing. Escolha seu veneno! "

Como funciona um mecanismo de pesquisa? Muito fácil.

1) Um spider visita sua página da web, entrando por root, leia TUDO o conteúdo e cria uma lista do que foi encontrado.
(Se você configurou um robots.txt, pode indicar qual spider pode ver esse conteúdo e qual spider não pode.)
2) A informação é indexada de acordo com os algoritmos internos usados ​​pelo motor de busca
3) Essas informações são encaminhadas para uma central onde são armazenadas.
4) Quando alguém realiza uma pesquisa, o sistema mostra todos os sites que contêm a palavra ou frase pesquisada.

Procura y Yacy eles também são mecanismos de pesquisa, mas, além de serem alternativas gratuitas, fazem pesquisas anônimas (por procuração), não incluem publicidade e são menos suscetíveis à censura, são mecanismos de pesquisa descentralizado. No entanto, ambos são muito diferentes em foco.

Por um lado, o Yacy é um mecanismo de busca descentralizado PURO, agora que tem sua própria aranha P2P que pesquisa entre os nós ativos e coleta o conteúdo. Em vez disso, Seeks é bastante um meta-buscador (como pato vai) que faz pesquisas anônimas em mecanismos de pesquisa centralizados (Google, Bing, Yahoo, etc.), mas tem um filtro descentralizado, cada nó mostra os resultados que deseja mostrar.

Falando de outras coisas e em um plano comparativo surgem três coisas:

1) Muitos culpam os maus resultados de Yacy e é porque ele retorna resultados apenas do que o rastreador coleta e dependendo dos nós ativos. O Seeks não tem esse problema, pois procura servidores centrais e, em seguida, cada nó filtra os resultados.
2) Yacy é mais fácil de instalar e configurar do que Seeks (Digo por experiência própria, já te digo como), além de ser multiplataforma.
3) Pesquisa P2P usa banda larga e é lento. DuckDuckGo sai na frente dos dois.

Para instalar o Yacy (requer OpenJDK6): Baixe o pacote fonte, descompacte-o (não há necessidade de compilá-lo), no diretório execute sh StartYacy.sh, abra um navegador, digite localhost: 8090 (pode ser alterado) e pronto. Também existem pacotes para Gentoo, Debian, Opensuse e Arch.

Para instalar o Seeks: Instale libevent e escolha baixar os pacotes para Debian, Arch, Ubuntu e Gentoo, ou baixe o código fonte e compile-o. Habilite o plugin httpserv (para que o computador seja apenas mais um nó público), abra um navegador, digite ss / websearch-hp e pronto.

Para incluir as pesquisas de Yacy em Seeks: Ter Yacy Running, modificar um arquivo e reiniciar Seeks (você tem que reiniciar as buscas toda vez que um arquivo de configuração é tocado).

Eles também podem tentar usar nós públicos, tanto em yacy como em procura. E com isso há este artigo. Eu por enquanto fico com o patinho e sua franja poderosa


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: Miguel Ángel Gatón
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.

  1.   matizado dito

    Bons projetos, vocês dois. Essa busca descentralizada é muito boa.

  2.   Alberto Aru dito

    Boa contribuição! Como isso afeta nossa privacidade?
    A propósito, não sei em arch, mas em manjaro ainda não consigo instalar. (Eu tenho o libevent instalado).

    1.    diazepam dito

      Ele só faz pesquisas anônimas.

      1.    eliotime3000 dito

        Aqui deixo-vos o ! bangs

    2.    holístico dito

      Você pode fazer um perfil completo de sua pessoa apenas sabendo o que você pesquisa no google, e eles fazem. Você também pula a possível censura, embora não seja tão grande em países latinos. Duckduckgo explica melhor aqui.

      http://donttrack.us/
      http://dontbubble.us/

  3.   Sr. Linux dito

    O tema do post é tão didático (não conhecia esses engines) e informativo que fui incentivado a agradecer. Aliás, para quem quiser investigar e saber um pouco mais sobre o Yacy, deixo este link onde também podem fazer o download.
    http://yacy.net/es/

  4.   eliotime3000 dito

    Eu apoio o super sapato por causa de como isso é legal.

  5.   vamos usar linux dito

    Excelente contribuição! Parabéns!

  6.   Javier dito

    Obrigado pela informação. Eu não sabia que o DuckDuckgo usava os resultados do Bing, acho que é por isso que não pareceu tão eficaz.
    Além disso, o que se sabe sobre o ixquick? Em seu próprio site, eles anunciam que ele é "o mais anônimo", mas não aparece na lista de quebra do prisma. E gosto de sua eficiência e objetivo. Podemos descobrir mais sobre este serviço?
    Muito obrigado pelo blog. Saudações.

    1.    r3is3rsf dito

      O ixquick é praticamente o mesmo que a página inicial, que se aparecer na lista de quebra do prisma, é a mesma empresa, apenas essa página inicial mostra resultados anônimos do google e ixquick do bing, google, yahoo e outros. Eles próprios dizem que têm a mesma política de privacidade.

      1.    Javier dito

        Muito obrigado pela informação. Adicionado à caixa de pesquisa.

    2.    elav. dito

      Bem, ultimamente tenho usado o Bing de uma forma alternativa e sabe de uma coisa? Não parece tão ruim para mim. É muito rápido e também adoro a forma como mostra as imagens. 😉

  7.   jony127 dito

    E que diferença real existe entre usar duckduckgo, starpage ou google se todos os 3 forem proprietários ???? Até agora, sempre usei o Google por padrão, só estou testando o duckduckgo há alguns dias.

    Ainda me incentivo a deixar o google por outro mas ainda é mais paranóia do que qualquer outra coisa, não vejo que seja prejudicial usar o google para além da publicidade ou que armazene as minhas pesquisas, não sou um terrorista que se dedica à procura para informações "confidenciais" como essa, acho que não precisamos nos preocupar mais do que o necessário com esses problemas.

    1.    elav. dito

      A diferença é supostamente que o Duck²Go não controla suas preferências e assim por diante.

    2.    r3is3rsf dito

      A diferença entre google, yahoo, bing e duckduckgo e startpage é que embora os últimos sejam proprietários eles não armazenam suas buscas ou ip, além de não criarem nenhum perfil preferido como o google (que utiliza para dar resultados personalizados).

      Além disso, eles não salvam cookies em seu navegador a menos que você indique isso, e os cookies de preferência que salvam são as alterações de idioma ou cor que você faz no mecanismo de pesquisa, mesmo a página inicial permite que você gere um URL com as preferências de pesquisa alteradas caso você não queira salvar cookies no navegador.

  8.   MD dito

    Yacy Sempre me interessei, mas não entendo como funciona abaixo (um artigo popular seria legal 😉), por exemplo minha primeira pergunta é:
    - Onde os dados são extraídos de um rastreador de nó quando ele é desconectado da rede?
    - Você tem um algoritmo que prioriza esses dados para replicá-los para os outros nós?