Pilules rouges avec cyanure, partie 3: Cherche et Yacy

yacy cherche

À l'origine j'allais appeler cette saga «Un poison très subtil appelé liberté", En l'honneur de une phrase infâme par María Julia Alsogaray, et aussi par ce que dit la version espagnole de prism-break.org sur les moteurs de recherche:

«Startpage est propriétaire, hébergé aux États-Unis et aux Pays-Bas, et fournit des résultats Google anonymisés (y compris des images). DuckDuckGo est partiellement propriétaire, hébergé aux États-Unis et fournit des résultats anonymes de Bing. Choisissez votre poison! "

Comment fonctionne un moteur de recherche? Assez facile.

1) Une araignée visite votre page Web, entrant par root, lisez TOUT le contenu et crée une liste de ce qu'il a trouvé.
(Si vous avez configuré un fichier robots.txt, vous pouvez indiquer quelle araignée peut consulter un tel contenu et quelle araignée ne le peut pas.)
2) Les informations sont indexées en fonction des algorithmes internes utilisés par le moteur de recherche
3) Ces informations sont acheminées vers un central où elles sont stockées.
4) Quand quelqu'un effectue une recherche et que le système affiche tous les sites Web contenant le mot ou la phrase recherchée.

Cherche y yacy ce sont aussi des moteurs de recherche mais, en plus d'être des alternatives gratuites, effectuez des recherches anonymes (par procuration), n'incluez pas de publicité et soyez moins sujets à la censure, ce sont des moteurs de recherche décentralisé. Cependant, les deux objectifs sont très différents.

D'une part, Yacy est un moteur de recherche décentralisé PURO, maintenant qu'il a votre propre araignée P2P qui recherche entre les nœuds actifs et collecte le contenu. Cherche plutôt un méta-chercheur (comme duckduckgo) qui effectue des recherches anonymes sur les moteurs de recherche centralisés (Google, Bing, Yahoo, etc.) mais a un filtre décentralisé, chaque nœud affiche les résultats qu'il souhaite afficher.

En parlant d'autres choses et dans un plan comparatif, trois choses émergent:

1) Beaucoup blâment les mauvais résultats de Yacy et c'est parce qu'il renvoie des résultats uniquement à partir de ce que le robot collecte et en fonction des nœuds actifs. Seeks n'a pas ce problème car il recherche les serveurs centraux, puis chaque nœud filtre les résultats.
2) Yacy est plus facile à installer et à configurer que Seeks (Je le dis par expérience, je te dis déjà comment), en plus d'être multi-plateforme.
3) Recherche P2P il utilise le haut débit et est lent. DuckDuckGo est en avance sur les deux.

Pour installer Yacy (nécessite OpenJDK6): Téléchargez le paquet source, décompressez-le (il n'est pas nécessaire de le compiler), dans le répertoire exécutez sh StartYacy.sh, ouvrez un navigateur, entrez localhost: 8090 (il peut être modifié) et c'est tout. Il existe également des packages pour Gentoo, Debian, Opensuse et Arch.

Pour installer Seeks: Installez libevent et choisissez de télécharger les paquets pour Debian, Arch, Ubuntu et Gentoo, ou téléchargez le code source et compilez-le. Activez le plugin httpserv (pour que l'ordinateur ne soit qu'un autre nœud public), ouvrez un navigateur, entrez ss / websearch-hp et c'est tout.

Pour inclure les recherches de Yacy dans Seeks: Faites exécuter Yacy, modifiez un fichier et redémarrez Seeks (vous devez redémarrer les recherches à chaque fois qu'un fichier de configuration est touché).

Ils peuvent également essayer d'utiliser des nœuds publics, à la fois dans ouais comme dans cherche. Et avec cela, il y a cet article. Je pour l'instant je reste avec le canard et sa puissante frange


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données: Miguel Ángel Gatón
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.

  1.   nuancé dit

    Bons projets, tous les deux. Cette recherche décentralisée est très bonne.

  2.   Alberto Aru dit

    Bonne contribution! Comment cela affecte-t-il notre vie privée?
    Au fait, je ne sais pas dans arch, mais dans manjaro je ne peux pas encore l'installer. (J'ai installé libevent).

    1.    diazépan dit

      Il ne fait que des recherches anonymes.

      1.    éliotime3000 dit

        Ici je vous laisse le ! frange

    2.    Holique dit

      Vous pouvez créer un profil complet de votre personne simplement en sachant ce que vous recherchez avec Google, et ils le font. Vous évitez également la censure possible, même si ce n'est pas si génial dans les pays latins. Duckduckgo l'explique mieux ici.

      http://donttrack.us/
      http://dontbubble.us/

  3.   M. Linux dit

    Le sujet du post est tellement didactique (je ne connaissais pas ces moteurs) et instructif que j'ai été encouragé à remercier. Au fait, pour ceux qui veulent enquêter et en savoir un peu plus sur Yacy, je laisse ce lien où ils peuvent également le télécharger.
    http://yacy.net/es/

  4.   éliotime3000 dit

    Je soutiens le super chaussure à cause de la façon dont c'est cool.

  5.   utilisons Linux dit

    Excellente contribution! Toutes nos félicitations!

  6.   Xavier dit

    Merci pour l'information. Je ne savais pas que DuckDuckgo utilisait les résultats de Bing, je suppose que c'est pourquoi cela ne semblait pas si efficace.
    En dehors de cela, que sait-on d'ixquick? Sur leur propre site Web, ils annoncent qu'il est "le plus anonyme" mais qu'il n'apparaît pas sur la liste des bris de prisme. Et j'aime son efficacité et son objectif. Pouvons-nous en savoir plus sur ce service?
    Merci mille fois pour le blog. Cordialement.

    1.    r3is3rsf dit

      ixquick est pratiquement le même que startpage, qui, s'il apparaît dans la liste prism-break, est la même entreprise, seule cette page de démarrage affiche les résultats anonymisés de google et ixquick de bing, google, yahoo et autres. Ils disent eux-mêmes avoir la même politique de confidentialité.

      1.    Xavier dit

        Je vous remercie beaucoup pour l'info. Ajouté au champ de recherche.

    2.    animé dit

      Eh bien, ces jours-ci, j'utilise Bing d'une manière alternative et vous savez quoi? Cela ne me semble pas si mal. C'est très rapide et j'adore la façon dont il affiche les images. 😉

  7.   Jony127 dit

    Et quelle vraie différence y a-t-il entre l'utilisation de duckduckgo, starpage ou google si les 3 sont propriétaires ???? Jusqu'à présent, j'ai toujours utilisé google par défaut, je ne teste duckduckgo que depuis quelques jours.

    Je suis quand même encouragé à quitter google pour quelqu'un d'autre mais c'est quand même plus de paranoïa qu'autre chose, je ne vois pas que c'est nuisible d'utiliser google en dehors de la publicité ou que ça stocke mes recherches, allez je ne suis pas un terroriste qui est dédié à la recherche d'informations "sensibles" comme ça, je ne pense pas que nous ayons à nous soucier plus que nécessaire de ces questions.

    1.    animé dit

      On suppose que la différence est que Duck²Go ne garde pas trace de vos préférences et autres.

    2.    r3is3rsf dit

      La différence entre google, yahoo, bing et duckduckgo et startpage est que même si ces derniers sont propriétaires, ils ne stockent pas vos recherches ou votre ip, en plus de ne pas créer de profil préféré comme google (qu'il utilise pour donner des résultats personnalisés).

      De plus, ils n'enregistrent pas les cookies dans votre navigateur sauf si vous l'indiquez, et les cookies de préférence qu'ils enregistrent sont les changements de langue ou de couleur que vous apportez au moteur de recherche, même la page de démarrage vous permet de générer une URL avec les préférences de recherche modifiées dans le cas où vous ne souhaitez pas enregistrer de cookies dans le navigateur.

  8.   MD dit

    Yacy J'ai toujours été intéressé, mais je ne comprends pas comment ça marche ci-dessous (un article populaire serait cool 😉), par exemple ma première question est:
    - Où sont les données extraites d'un robot d'exploration de nœuds lorsqu'il est déconnecté du réseau?
    - Avez-vous un algorithme qui hiérarchise ces données pour les répliquer sur les autres nœuds?