Thuốc đỏ với Xyanua, Phần 3: Tìm kiếm và Yacy

yacy tìm kiếm

Ban đầu tôi định gọi câu chuyện này là «Một chất độc rất tinh vi được gọi là tự do", Để vinh danh một cụm từ khét tiếng của María Julia alsogaray, và cũng bởi phiên bản tiếng Tây Ban Nha của prism-break.org nói gì về các công cụ tìm kiếm:

“Startpage là độc quyền, được lưu trữ ở Hoa Kỳ và Hà Lan và cung cấp kết quả ẩn danh của Google (bao gồm cả hình ảnh). DuckDuckGo là một phần độc quyền, được lưu trữ tại Hoa Kỳ và cung cấp các kết quả ẩn danh từ Bing. Hãy chọn chất độc của bạn! "

Công cụ tìm kiếm hoạt động như thế nào? Khá dễ.

1) Một con nhện truy cập trang web của bạn, nhập bằng thư mục gốc, đọc ALL nội dung và tạo danh sách những gì nó đã tìm thấy.
(Nếu bạn đã định cấu hình tệp robots.txt, bạn có thể chỉ ra con nhện nào có thể xem nội dung đó và con nhện nào không thể xem.)
2) Thông tin được lập chỉ mục theo các thuật toán nội bộ được sử dụng bởi công cụ tìm kiếm
3) Thông tin này được đưa đến trung tâm nơi nó được lưu trữ.
4) Khi ai đó thực hiện tìm kiếm và hệ thống sẽ hiển thị tất cả các trang web có chứa từ hoặc cụm từ được tìm kiếm.

Tìm kiếm y yacy chúng cũng là công cụ tìm kiếm nhưng ngoài việc là các lựa chọn thay thế miễn phí, chúng còn thực hiện các tìm kiếm ẩn danh (qua proxy), không bao gồm quảng cáo và ít bị kiểm duyệt hơn, chúng là công cụ tìm kiếm phân quyền. Tuy nhiên cả hai đều rất khác nhau về tiêu điểm.

Một mặt Yacy là một công cụ tìm kiếm phi tập trung PURO, bây giờ nó có con nhện P2P của riêng bạn tìm kiếm giữa các nút đang hoạt động và thu thập nội dung. Thay vào đó Tìm kiếm là một người tìm kiếm meta (như duckduckgo) thực hiện các tìm kiếm ẩn danh trên các công cụ tìm kiếm tập trung (Google, Bing, Yahoo, v.v.) nhưng có một bộ lọc phi tập trung, mỗi nút hiển thị kết quả mà nó muốn hiển thị.

Nói về những thứ khác và trong một kế hoạch so sánh, ba điều nổi lên:

1) Nhiều người đổ lỗi cho kết quả không tốt của Yacy và đó là vì nó chỉ trả về kết quả từ những gì trình thu thập thông tin thu thập và tùy thuộc vào các nút đang hoạt động. Tìm kiếm không có vấn đề đó vì nó tìm kiếm các máy chủ trung tâm và sau đó mỗi nút lọc kết quả.
2) Yacy dễ cài đặt và cấu hình hơn Seeks (Tôi nói điều đó từ kinh nghiệm, tôi đã cho bạn biết làm thế nào), ngoài tính năng đa nền tảng.
3) Tìm kiếm P2P nó sử dụng băng thông rộng và chậm. DuckDuckGo đi trước hai người.

Để cài đặt Yacy (yêu cầu OpenJDK6): Tải gói mã nguồn về, giải nén (không cần biên dịch), trong thư mục chạy sh StartYacy.sh, mở trình duyệt, nhập localhost: 8090 (có thể thay đổi) và thế là xong. Ngoài ra còn có các gói cho Gentoo, Debian, Opensuse và Arch.

Để cài đặt Seeks: Cài đặt libevent và chọn tải xuống các gói cho Debian, Arch, Ubuntu và Gentoo hoặc tải xuống mã nguồn và biên dịch nó. Bật plugin httpserv (để máy tính chỉ là một nút công khai khác), mở trình duyệt, nhập ss / websearch-hp và thế là xong.

Để đưa các tìm kiếm của Yacy vào Seeks: Chạy Yacy, sửa đổi tệp và khởi động lại Seeks (bạn phải khởi động lại tìm kiếm mỗi khi chạm vào tệp cấu hình).

Họ cũng có thể thử sử dụng các nút công khai, cả hai trong ôitìm kiếm. Và với điều này có bài báo này. Bây giờ tôi ở lại với vịt con và mái tóc xù


16 bình luận, để lại của bạn

Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

  1.   sắc thái dijo

    Dự án tốt, cả hai bạn. Tìm kiếm phi tập trung này rất tốt.

  2.   Alberto Aru dijo

    Đóng góp tốt! Điều này ảnh hưởng đến quyền riêng tư của chúng tôi như thế nào?
    Nhân tiện, tôi không biết trong vòm, nhưng trong manjaro tôi chưa thể cài đặt nó. (Tôi đã cài đặt libevent).

    1.    diazepam dijo

      Nó chỉ thực hiện các tìm kiếm ẩn danh.

      1.    eliotime3000 dijo

        Ở đây tôi để lại cho bạn ! tiếng nổ

    2.    Holic dijo

      Bạn có thể tạo một hồ sơ hoàn chỉnh về người của mình chỉ bằng cách biết những gì bạn tìm kiếm với google và họ làm. Bạn cũng bỏ qua kiểm duyệt có thể có, mặc dù nó không phải là quá tuyệt vời ở các nước Latinh. Duckduckgo giải thích rõ hơn ở đây.

      http://donttrack.us/
      http://dontbubble.us/

  3.   Anh Linux dijo

    Chủ đề của bài đăng rất giáo khoa (tôi không biết những động cơ này) và nhiều thông tin mà tôi được khuyến khích cảm ơn. Nhân tiện, đối với những người muốn điều tra và biết thêm một chút về Yacy, tôi để lại liên kết này, nơi họ cũng có thể tải xuống.
    http://yacy.net/es/

  4.   eliotime3000 dijo

    Tôi ủng hộ siêu giày bởi vì nó tuyệt làm sao.

  5.   hãy sử dụng linux dijo

    Đóng góp xuất sắc! Xin chúc mừng!

  6.   Xavier dijo

    Cảm ơn bạn về thông tin. Tôi không biết DuckDuckgo đã sử dụng kết quả của Bing, tôi đoán đó là lý do tại sao nó có vẻ không hiệu quả cho lắm.
    Ngoài điều này, những gì được biết về ixquick? Trên trang web riêng của họ, họ quảng cáo rằng anh ta là "người vô danh nhất" nhưng anh ta không xuất hiện trong danh sách phá vỡ lăng kính. Và tôi thích hiệu quả và mục tiêu của nó. Chúng ta có thể tìm hiểu thêm về dịch vụ này?
    Cảm ơn một nghìn cho blog. Trân trọng.

    1.    r3is3rsf dijo

      ixquick thực tế giống như trang bắt đầu, nếu nó xuất hiện trong danh sách phá vỡ lăng kính, là cùng một công ty, chỉ có trang đó mới hiển thị kết quả ẩn danh từ google và ixquick từ bing, google, yahoo và những người khác. Bản thân họ nói rằng họ có cùng một chính sách bảo mật.

      1.    Xavier dijo

        Cám ơn bạn rất nhiều về thông tin đó. Đã thêm vào hộp tìm kiếm.

    2.    sống động dijo

      Chà, những ngày này tôi đang sử dụng Bing theo một cách thay thế và bạn biết không? Nó dường như không quá tệ đối với tôi. Nó rất nhanh và tôi cũng thích cách nó hiển thị hình ảnh. 😉

  7.   jony127 dijo

    Và có sự khác biệt thực sự nào giữa việc sử dụng duckduckgo, starpage hoặc google nếu cả 3 đều là độc quyền ???? Từ trước đến nay, tôi luôn sử dụng google theo mặc định, tôi mới thử nghiệm duckduckgo được vài ngày.

    Dù sao thì mình cũng khuyến khích bỏ google đi làm cái khác nhưng nó còn hoang tưởng hơn cả, mình không thấy dùng google ngoài quảng cáo hay nó lưu trữ các tìm kiếm của mình có hại gì, mình không phải là kẻ khủng bố chuyên tìm kiếm những thông tin "nhạy cảm" như thế Tôi không nghĩ rằng chúng ta phải lo lắng nhiều hơn mức cần thiết về những vấn đề này.

    1.    sống động dijo

      Sự khác biệt được cho là Duck²Go không theo dõi các sở thích của bạn, v.v.

    2.    r3is3rsf dijo

      Sự khác biệt giữa google, yahoo, bing và duckduckgo và startpage là mặc dù cái sau là sở hữu độc quyền, chúng không lưu trữ các tìm kiếm hoặc ip của bạn, ngoài việc không tạo bất kỳ hồ sơ ưa thích nào như google (nó sử dụng để cung cấp kết quả được cá nhân hóa).

      Ngoài ra, họ không lưu cookie trong trình duyệt của bạn trừ khi bạn cho biết như vậy và cookie tùy chọn mà họ lưu là những thay đổi về ngôn ngữ hoặc màu sắc mà bạn thực hiện đối với công cụ tìm kiếm, thậm chí trang bắt đầu cho phép bạn tạo URL với các tùy chọn tìm kiếm đã thay đổi trong trường hợp bạn không muốn lưu cookie trong trình duyệt.

  8.   MD dijo

    Yacy Tôi đã luôn quan tâm, nhưng tôi không hiểu nó hoạt động như thế nào bên dưới (một bài báo phổ biến sẽ rất tuyệt 😉), ví dụ câu hỏi đầu tiên của tôi là:
    - Dữ liệu được trích xuất từ ​​trình thu thập thông tin nút khi nó bị ngắt kết nối khỏi mạng ở đâu?
    - Bạn có một thuật toán ưu tiên dữ liệu đó để sao chép nó đến các nút khác không?