Rode pillen met cyanide, deel 3: zoekt en yacy

yacy zoekt

Oorspronkelijk zou ik deze saga «Een heel subtiel gif dat vrijheid heet", Ter ere van een beruchte uitdrukking door María Julia Alsogaray, en ook door wat de Spaanse versie van prism-break.org zegt over zoekmachines:

"Startpage is eigendom van het bedrijf, wordt gehost in de Verenigde Staten en Nederland en biedt geanonimiseerde Google-resultaten (inclusief afbeeldingen). DuckDuckGo is gedeeltelijk eigendom van het bedrijf, wordt gehost in de Verenigde Staten en levert geanonimiseerde resultaten van Bing. Kies je gif! "

Hoe werkt een zoekmachine? Vrij gemakkelijk.

1) Een spin bezoekt uw webpagina, voert via root in, leest ALLES de inhoud en maakt een lijst van wat het heeft gevonden.
(Als u een robots.txt heeft geconfigureerd, kunt u aangeven welke spider naar dergelijke inhoud mag kijken en welke spider niet.)
2) De informatie wordt geïndexeerd volgens de interne algoritmen die door de zoekmachine worden gebruikt
3) Deze informatie wordt naar een centrale gebracht waar het wordt opgeslagen.
4) Wanneer iemand een zoekopdracht uitvoert, toont het systeem alle websites die het gezochte woord of de gezochte zin bevatten.

zoekt y jak het zijn ook zoekmachines, maar doen niet alleen gratis alternatieven, maar ook anonieme zoekopdrachten (via volmacht), geen advertenties bevatten en minder vatbaar zijn voor censuur, het zijn zoekmachines gedecentraliseerd. Beide zeer verschillend in focus.

Enerzijds is Yacy een gedecentraliseerde zoekmachine PURO, nu het heeft je eigen P2P-spider die zoekt tussen de actieve knooppunten en de inhoud verzamelt. In plaats daarvan zoekt is eerder een meta-zoeker (als duckduckgo) die anonieme zoekopdrachten uitvoert op gecentraliseerde zoekmachines (Google, Bing, Yahoo, enz.) maar heeft een gedecentraliseerd filter, toont elk knooppunt de resultaten die het wil laten zien.

Over andere dingen gesproken en in een vergelijkend plan komen drie dingen naar voren:

1) Velen geven de slechte resultaten van Yacy de schuld en het is omdat het alleen resultaten retourneert van wat de crawler verzamelt en afhankelijk van de actieve knooppunten. Seeks heeft dat probleem niet omdat het de centrale servers doorzoekt en vervolgens filtert elk knooppunt de resultaten.
2) Yacy is eenvoudiger te installeren en configureren dan Seeks (Ik zeg het uit ervaring, ik vertel je al hoe), naast dat het multi-platform is.
3) P2P zoeken het maakt gebruik van breedband en is traag. DuckDuckGo komt voor de twee uit.

Om Yacy te installeren (vereist OpenJDK6): Download het bronpakket, pak het uit (het is niet nodig om het te compileren), voer sh StartYacy.sh uit in de directory, open een browser, voer localhost: 8090 in (het kan worden gewijzigd) en dat is alles. Er zijn ook pakketten voor Gentoo, Debian, Opensuse en Arch.

Om Seeks te installeren: Installeer libevent en kies ervoor om de pakketten voor Debian, Arch, Ubuntu en Gentoo te downloaden, of download de broncode en compileer deze. Schakel de httpserv-plug-in in (zodat de computer gewoon een ander openbaar knooppunt is), open een browser, voer ss / websearch-hp in en dat is alles.

Yacy's zoekopdrachten opnemen in Seeks: Laat Yacy draaien, wijzig een bestand en start Seeks opnieuw (je moet zoekopdrachten herstarten telkens wanneer een configuratiebestand wordt aangeraakt).

Ze kunnen ook proberen openbare knooppunten te gebruiken, beide in jak zoals in zoekt. En hiermee is er dit artikel. Ik blijf voorlopig bij het eendje en zijn machtige pony


Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: Miguel Ángel Gatón
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.

  1.   genuanceerd zei

    Goede projecten, jullie allebei. Deze gedecentraliseerde zoekopdracht is erg goed.

  2.   Alberto Aru zei

    Goede bijdrage! Hoe beïnvloedt dit onze privacy?
    Ik weet het trouwens niet in arch, maar in manjaro kan ik het nog niet installeren. (Ik heb libevent geïnstalleerd).

    1.    diazepam zei

      Het voert alleen anonieme zoekopdrachten uit.

      1.    eliotime3000 zei

        Hier laat ik je de ! pony

    2.    Holic zei

      U kunt een volledig profiel van uw persoon maken door te weten wat u zoekt met Google, en dat doen zij ook. Ook sla je de mogelijke censuur over, al is dat in Latijns-Amerikaanse landen niet zo geweldig. Duckduckgo legt het hier beter uit.

      http://donttrack.us/
      http://dontbubble.us/

  3.   Meneer Linux zei

    Het onderwerp van de post is zo didactisch (ik kende deze engines niet) en informatief dat ik werd aangemoedigd om te bedanken. Trouwens, voor degenen die het willen onderzoeken en iets meer willen weten over Yacy, laat ik deze link achter waar ze het ook kunnen downloaden.
    http://yacy.net/es/

  4.   eliotime3000 zei

    Ik steun de super schoen vanwege hoe cool het is.

  5.   laten we linux gebruiken zei

    Uitstekende bijdrage! Gefeliciteerd!

  6.   Xavier zei

    Bedankt voor de info. Ik wist niet dat DuckDuckgo de resultaten van Bing gebruikte, ik denk dat het daarom niet zo effectief leek.
    Afgezien hiervan, wat is er bekend over ixquick? Op hun eigen website adverteren ze dat hij "de meest anonieme" is, maar hij komt niet voor op de lijst met prisma-onderbrekingen. En ik hou van zijn efficiëntie en doel. Kunnen we meer te weten komen over deze service?
    Duizendmaal bedankt voor de blog. Vriendelijke groeten.

    1.    r3is3rsf zei

      ixquick is praktisch hetzelfde als startpagina, die, als deze in de prism-break-lijst verschijnt, hetzelfde bedrijf is, alleen die startpagina toont geanonimiseerde resultaten van google en ixquick van bing, google, yahoo en anderen. Ze zeggen zelf dat ze hetzelfde privacybeleid hebben.

      1.    Xavier zei

        Heel erg bedankt voor de informatie. Toegevoegd aan zoekvak.

    2.    levendig zei

      Nou, tegenwoordig gebruik ik Bing op een alternatieve manier en weet je wat? Het lijkt me niet zo erg. Het is erg snel en ik hou ook van de manier waarop het de afbeeldingen weergeeft. 😉

  7.   jony127 zei

    En wat is er echt verschil tussen het gebruik van duckduckgo, starpage of google als ze alle 3 eigendom zijn ???? Tot nu toe heb ik Google altijd standaard gebruikt, ik heb duckduckgo maar een paar dagen getest.

    Ik moedig mezelf nog steeds aan om Google te verlaten voor een ander, maar het is nog steeds meer paranoia dan iets anders, ik zie niet in dat het schadelijk is om Google te gebruiken behalve advertenties of dat het mijn zoekopdrachten opslaat, ik ben geen terrorist die toegewijd is aan het zoeken voor dat soort "gevoelige" informatie denk ik niet dat we ons meer dan nodig zorgen hoeven te maken over deze kwesties.

    1.    levendig zei

      Het verschil zou zijn dat Duck²Go uw voorkeuren en dergelijke niet bijhoudt.

    2.    r3is3rsf zei

      Het verschil tussen google, yahoo, bing en duckduckgo en startpagina is dat, hoewel deze laatste eigendomsrechten zijn, ze uw zoekopdrachten of ip niet opslaan, en dat er geen voorkeursprofiel zoals Google wordt aangemaakt (die het gebruikt om gepersonaliseerde resultaten te geven).

      Bovendien slaan ze geen cookies op in uw browser tenzij u dat aangeeft, en de voorkeurscookies die ze opslaan zijn de taal- of kleurveranderingen die u aanbrengt in de zoekmachine, zelfs op de startpagina kunt u een URL genereren met de zoekvoorkeuren die zijn gewijzigd in het geval dat dat u geen cookies in de browser wilt opslaan.

  8.   MD zei

    Yacy Ik ben altijd geïnteresseerd geweest, maar ik begrijp niet hoe het hieronder werkt (een populair artikel zou cool zijn 😉), mijn eerste vraag is bijvoorbeeld:
    - Waar worden de gegevens uit een node-crawler gehaald wanneer deze de verbinding met het netwerk verbreekt?
    - Heeft u een algoritme dat prioriteit geeft aan die gegevens om deze naar de andere knooppunten te repliceren?