Pil Merah dengan Sianida, Bahagian 3: Mencari dan Yacy

yacy mencari

Pada asalnya saya akan menyebut kisah ini «Racun yang sangat halus yang disebut kebebasan", Sebagai penghormatan kepada frasa yang tidak dikenali oleh María Julia Alsogaray, dan juga dengan apa yang dikatakan oleh prism-break.org versi Sepanyol mengenai enjin carian:

"Startpage adalah hak milik, dihoskan di Amerika Syarikat dan Belanda, dan memberikan hasil Google tanpa nama (termasuk gambar). DuckDuckGo sebahagiannya dimiliki, dihoskan di Amerika Syarikat, dan memberikan hasil tanpa nama dari Bing. Pilih racun anda! "

Bagaimana enjin carian berfungsi? Cukup mudah.

1) Labah-labah mengunjungi laman web anda, memasukkannya melalui root, baca SEMUA kandungan dan membuat senarai apa yang telah dijumpainya.
(Sekiranya anda telah mengkonfigurasi robots.txt, anda dapat menunjukkan labah-labah mana yang dapat melihat kandungan tersebut dan labah-labah mana yang tidak.)
2) Maklumat diindeks mengikut algoritma dalaman yang digunakan oleh mesin pencari
3) Maklumat ini dibawa ke pusat di mana ia disimpan.
4) Ketika seseorang melakukan carian, dan sistem menunjukkan semua laman web yang mengandungi kata atau frasa yang dicari.

Mencari y yacy mereka juga enjin carian tetapi, selain sebagai alternatif percuma, lakukan carian tanpa nama (melalui proksi), jangan termasuk iklan dan kurang rentan terhadap penapisan, mereka adalah mesin pencari terdesentralisasi. Walau bagaimanapun kedua-duanya sangat berbeza.

Di satu pihak, Yacy adalah mesin carian yang terdesentralisasi PURO, sekarang labah-labah P2P anda sendiri yang mencari di antara nod aktif dan mengumpulkan kandungan. Sebaliknya Mencari agak seorang pencari meta (sebagai duckduckgo) yang melakukan carian tanpa nama pada enjin carian terpusat (Google, Bing, Yahoo, dll.) tetapi mempunyai penapis yang terdesentralisasi, setiap nod menunjukkan hasil yang ingin ditunjukkan.

Bercakap mengenai perkara lain dan dalam rancangan perbandingan tiga perkara muncul:

1) Banyak yang menyalahkan hasil buruk Yacy dan itu kerana ia memberikan hasil hanya dari apa yang dikumpulkan oleh crawler dan bergantung pada nod aktif. Mencari tidak mempunyai masalah itu kerana mencari pelayan pusat dan kemudian setiap nod menyaring hasilnya.
2) Yacy lebih mudah dipasang dan dikonfigurasi daripada Seeks (Saya mengatakannya dari pengalaman, saya sudah memberitahu anda bagaimana), selain menjadi pelbagai platform.
3) Pencarian P2P menggunakan jalur lebar dan lambat. DuckDuckGo keluar mendahului keduanya.

Untuk memasang Yacy (memerlukan OpenJDK6): Muat turun pakej sumber, unzipnya (tidak perlu menyusunnya), dalam direktori jalankan sh StartYacy.sh, buka penyemak imbas, masukkan localhost: 8090 (ia boleh diubah) dan itu saja. Terdapat juga pakej untuk Gentoo, Debian, Opensuse, dan Arch.

Untuk memasang Seeks: Pasang libevent dan pilih untuk memuat turun pakej untuk Debian, Arch, Ubuntu dan Gentoo, atau memuat turun kod sumber dan menyusunnya. Aktifkan plugin httpserv (supaya komputer hanyalah simpul awam lain), buka penyemak imbas, masukkan ss / websearch-hp dan itu sahaja.

Untuk memasukkan carian Yacy di Seeks: Minta Yacy Running, ubah suai fail dan mulakan semula Seeks (anda mesti memulakan semula carian setiap kali fail konfigurasi disentuh).

Mereka juga boleh mencuba menggunakan nod awam, baik di yacy seperti dalam mencari. Dan dengan ini terdapat artikel ini. Saya buat masa ini saya tinggal bersama itik dan poni yang kuat


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab atas data: Miguel Ángel Gatón
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.

  1.   bernuansa kata

    Projek yang baik, anda berdua. Pencarian terdesentralisasi ini sangat bagus.

  2.   Alberto Aru kata

    Sumbangan yang baik! Bagaimana ini mempengaruhi privasi kita?
    Omong-omong, saya tidak tahu di lengkungan, tetapi di manjaro saya belum dapat memasangnya. (Saya telah memasang libevent).

    1.    diazepam kata

      Ia hanya melakukan carian tanpa nama.

      1.    eliotime3000 kata

        Di sini saya meninggalkan anda ! poni

    2.    Holic kata

      Anda boleh membuat profil lengkap orang anda hanya dengan mengetahui apa yang anda cari dengan google, dan yang mereka lakukan. Anda juga melangkau penapisan yang mungkin berlaku, walaupun tidak begitu hebat di negara-negara Latin. Duckduckgo menerangkannya dengan lebih baik di sini.

      http://donttrack.us/
      http://dontbubble.us/

  3.   Tuan linux kata

    Topik jawatan ini sangat didaktik (saya tidak tahu enjin ini) dan bermaklumat sehingga saya terdorong untuk berterima kasih. By the way, bagi mereka yang ingin menyiasat dan mengetahui lebih banyak mengenai Yacy, saya meninggalkan pautan ini di mana mereka juga boleh memuat turunnya.
    http://yacy.net/es/

  4.   eliotime3000 kata

    Saya menyokong kasut super kerana betapa sejuknya.

  5.   mari gunakan linux kata

    Sumbangan yang sangat baik! Tahniah!

  6.   Xavier kata

    Terima kasih atas maklumat. Saya tidak tahu DuckDuckgo menggunakan keputusan Bing, saya rasa itulah mengapa ia tidak begitu berkesan.
    Selain daripada ini, apa yang diketahui mengenai ixquick? Di laman web mereka sendiri, mereka mengiklankan bahawa dia adalah "yang paling tidak dikenali" tetapi dia tidak muncul dalam senarai pemecah prisma. Dan saya suka kecekapan dan tujuannya. Bolehkah kita mengetahui lebih lanjut mengenai perkhidmatan ini?
    Terima kasih seribu untuk blog. Salam.

    1.    r3is3rsf kata

      ixquick hampir sama dengan startpage, yang jika ia muncul dalam senarai prism-break, adalah syarikat yang sama, hanya startpage yang menunjukkan hasil tanpa nama dari google dan ixquick dari bing, google, yahoo dan lain-lain. Mereka sendiri mengatakan bahawa mereka mempunyai dasar privasi yang sama.

      1.    Xavier kata

        Terima kasih banyak atas maklumatnya. Ditambah ke kotak carian.

    2.    meriah kata

      Nah, hari ini saya telah menggunakan Bing dengan cara alternatif dan anda tahu apa? Ia tidak begitu buruk bagi saya. Ia sangat pantas dan juga, saya suka cara memaparkan gambar. 😉

  7.   jony127 kata

    Dan apa perbezaan sebenar antara penggunaan duckduckgo, starpage atau google jika ketiga-tiganya adalah hak milik ???? Setakat ini saya selalu menggunakan google secara lalai, saya hanya menguji duckduckgo selama beberapa hari.

    Saya masih mendorong diri saya untuk meninggalkan google untuk yang lain tetapi masih lebih paranoia daripada yang lain, saya tidak melihat bahawa memudaratkan penggunaan google selain daripada iklan atau menyimpan carian saya, saya bukan pengganas yang berdedikasi untuk mencari untuk maklumat "sensitif" seperti itu, saya rasa kita tidak perlu lebih bimbang tentang perkara ini.

    1.    meriah kata

      Sepatutnya perbezaannya ialah Duck²Go tidak menjejaki pilihan anda dan seumpamanya.

    2.    r3is3rsf kata

      Perbezaan antara google, yahoo, bing dan duckduckgo dan halaman awal adalah bahawa walaupun yang terakhir adalah hak milik, mereka tidak menyimpan carian atau ip anda, selain tidak membuat profil pilihan seperti google (yang digunakannya untuk memberikan hasil yang diperibadikan).

      Di samping itu, mereka tidak menyimpan kuki di penyemak imbas anda melainkan jika anda menyatakannya, dan kuki pilihan yang mereka simpan adalah perubahan bahasa atau warna yang anda buat pada mesin pencari, bahkan halaman permulaan membolehkan anda membuat URL dengan pilihan carian berubah sekiranya anda tidak mahu menyimpan kuki di penyemak imbas.

  8.   MD kata

    Yacy saya selalu berminat, tetapi saya tidak faham cara kerjanya di bawah ini (artikel yang popular pasti menarik 😉), contohnya soalan pertama saya ialah:
    - Di manakah data yang diekstrak dari crawler node ketika terputus dari rangkaian?
    - Adakah anda mempunyai algoritma yang mengutamakan data tersebut untuk menirunya ke nod lain?