シアン化物を含む赤い丸薬、パート3:シークとYacy

yacyは

もともと私はこの物語を呼ぶつもりでした«自由と呼ばれる非常に微妙な毒"、に敬意を表して 悪名高いフレーズ マリア・フリア・アルソガライ、およびスペイン語版のprism-break.orgが検索エンジンに関して言っていることによって:

「Startpageは独自仕様であり、米国とオランダでホストされており、匿名化されたGoogleの結果(画像を含む)を提供します。 DuckDuckGoは部分的に独占的であり、米国でホストされており、Bingから匿名化された結果を提供します。毒を選んでください!」

検索エンジンはどのように機能しますか? 結構簡単.

1)スパイダーがあなたのウェブページにアクセスし、ルートから入力して、 すべて コンテンツとそれが見つけたもののリストを作成します。
(robots.txtを構成している場合は、そのようなコンテンツを表示できるスパイダーと表示できないスパイダーを指定できます。)
2)情報は、検索エンジンで使用される内部アルゴリズムに従って索引付けされます
3)この情報は、中央に保管されます。
4)誰かが検索を実行し、システムが検索された単語またはフレーズを含むすべてのWebサイトを表示する場合。

求める y ヤシー それらも検索エンジンですが、無料の代替手段であることに加えて、匿名検索を行います(プロキシ経由)、広告を含まず、検閲の傾向が少ない、それらは検索エンジンです 分散型。 ただし、どちらも焦点が大きく異なります。

一方では、Yacyは分散型検索エンジンです プロ、今では あなた自身のP2Pスパイダー アクティブノード間を検索し、コンテンツを収集します。 代わりにシークはむしろ メタシーカー (duckduckgoとして)集中型検索エンジン(Google、Bing、Yahooなど)で匿名検索を行いますが 分散型フィルターがあります、各ノードには、表示したい結果が表示されます。

他のことについて言えば、比較計画ではXNUMXつのことが浮かび上がります。

1)多くの人がYacyの悪い結果を非難します。これは、クローラーが収集したものからのみ、アクティブノードに応じて結果を返すためです。 Seeksは中央サーバーを検索し、各ノードが結果をフィルタリングするため、この問題は発生しません。
2)Yacyは、Seeksよりもインストールと構成が簡単です(私は経験からそれを言います、私はすでにあなたに方法を話します)、マルチプラットフォームであることに加えて。
3)P2P検索 ブロードバンドを使用し、遅い。 DuckDuckGoはXNUMXつより先に出てきます。

Yacyをインストールするには (OpenJDK6が必要です):ソースパッケージをダウンロードして解凍し(コンパイルする必要はありません)、ディレクトリでsh StartYacy.shを実行し、ブラウザを開いてlocalhost:8090(変更可能)と入力します。これで完了です。 Gentoo、Debian、OpenSUSE、Archのパッケージもあります。

Seeksをインストールするには:libeventをインストールし、Debian、Arch、Ubuntu、Gentooのパッケージをダウンロードするか、ソースコードをダウンロードしてコンパイルするかを選択します。 httpservプラグインを有効にし(コンピューターが単なる別のパブリックノードになるように)、ブラウザーを開き、ss / websearch-hpと入力します。これで完了です。

Yacyの検索をSeeksに含めるには:Yacyを実行し、ファイルを変更してシークを再起動します(構成ファイルに触れるたびにシークを再起動する必要があります)。

また、パブリックノードの使用を試すこともできます。 ヤシー のように シーク。 そしてこれでこの記事があります。 私は今のところ一緒にいます アヒルの子と彼の強大な前髪


記事の内容は、次の原則に準拠しています。 編集倫理。 エラーを報告するには、 ここで.

16コメント、あなたのコメントを残してください

コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。

  1.   ニュアンス

    良いプロジェクト、あなたの両方。 この分散型検索は非常に優れています。

  2.   アルベルトアル

    良い貢献! これは私たちのプライバシーにどのように影響しますか?
    ちなみに、アーチではわかりませんが、マンジャロではまだインストールできません。 (libeventをインストールしています)。

    1.    ディアゼパン

      匿名検索のみを行います。

      1.    eliotime3000

        ここに私はあなたを残します !前髪

    2.    ホリコ

      あなたがグーグルで何を検索するかを知るだけであなたの人の完全なプロフィールを作ることができます、そして彼らはそうします。 ラテン諸国ではそれほど大きくはありませんが、検閲の可能性もスキップします。 Duckduckgoはここでそれをよりよく説明しています。

      http://donttrack.us/
      http://dontbubble.us/

  3.   Linuxさん

    投稿のトピックは非常に教訓的で(私はこれらのエンジンを知りませんでした)、有益であるため、感謝するように促されました。 ちなみに、Yacyについてもう少し詳しく知りたい方のために、このリンクを残してダウンロードすることもできます。
    http://yacy.net/es/

  4.   eliotime3000

    私はサポートします スーパーシューズ かっこいいから。

  5.   Linuxを使いましょう

    素晴らしい貢献! おめでとう!

  6.   ザビエル

    情報をありがとう。 DuckDuckgoがBingの結果を使用していることを知りませんでした。そのため、それほど効果的ではなかったと思います。
    これ以外に、ixquickについて何が知られていますか? 彼らは彼ら自身のウェブサイトで彼が「最も匿名」であると宣伝しているが、彼はプリズムブレイクリストに載っていない。 そして、私はその効率と目的が好きです。 このサービスについてもっと知ることができますか?
    ブログをありがとう。 よろしく。

    1.    r3is3rsf

      ixquickはstartpageと実質的に同じであり、プリズムブレークリストに表示されている場合は同じ会社ですが、startpageにはgoogleからの匿名化された結果と、bing、google、yahooなどからのixquickが表示されます。 彼ら自身も同じプライバシーポリシーを持っていると言っています。

      1.    ザビエル

        情報、ありがとうございます。 検索ボックスに追加されました。

    2.    エラヴ

      さて、最近私は代わりにBingを使用していますが、あなたは何を知っていますか? それは私にはそれほど悪くはないようです。 非常に高速で、画像の表示方法も気に入っています。 😉

  7.   ジョニー127

    そして、3つすべてがプロプライエタリである場合、duckduckgo、starpage、またはgoogleの使用にはどのような本当の違いがありますか???? これまでのところ、私は常にデフォルトでgoogleを使用してきましたが、duckduckgoをテストしているのは数日だけです。

    とにかく、私はグーグルを別のものに任せることをお勧めしますが、それでも他の何よりも妄想的です。広告以外にグーグルを使用することは有害であるとは思わず、検索を保存します。私はそのような「機密」情報を探しているので、これらの問題について必要以上に心配する必要はないと思います。

    1.    エラヴ

      おそらく違いは、Duck²Goがあなたの好みなどを追跡しないことです。

    2.    r3is3rsf

      google、yahoo、bing、duckduckgoとstartpageの違いは、後者は独自仕様ですが、google(パーソナライズされた結果を提供するために使用)のような優先プロファイルを作成しないことに加えて、検索やIPを保存しないことです。

      さらに、指定しない限り、ブラウザにCookieは保存されません。保存される設定Cookieは、検索エンジンに加えた言語または色の変更です。スタートページでも、検索設定を変更したURLを生成できます。ブラウザにCookieを保存したくない場合。

  8.   MD

    Yacy私はいつも興味を持っていましたが、以下でどのように機能するのかわかりません(人気のある記事はかっこいいです😉)。たとえば、私の最初の質問は次のとおりです。
    -ネットワークから切断されたときにノードクローラーから抽出されたデータはどこにありますか?
    -そのデータに優先順位を付けて他のノードに複製するアルゴリズムはありますか?