Recoll: công cụ tìm kiếm toàn văn với công cụ tìm kiếm Xapian.

Xin chào các bạn!. Tôi đã luôn thích "duyệt" kho lưu trữ. Và một thời gian trước, tôi đã tìm thấy một gói có thể giúp nhiều người trong công việc hàng ngày của họ. Cá nhân nó giúp tôi tìm các bài báo hoặc văn bản hoặc sách, trong mớ hỗn độn của tôi / Home.

Hồi phục là một công cụ để tìm kiếm toàn văn (từ một từ đến các biểu thức Boolean phức tạp) bằng giao diện đồ họa thân thiện, với tối thiểu kỹ thuật phức tạp và một số phụ thuộc bên ngoài bắt buộc. Nó có thể chạy trên nhiều hệ điều hành giống UNIX và khá độc lập với môi trường máy tính để bàn được sử dụng. Nó không yêu cầu daemon làm phụ trợ để tìm kiếm và lập chỉ mục. Khi sử dụng công cụ tìm kiếm Xapian.

Để cài đặt Recovery, chúng tôi chạy Synaptic và trong hộp văn bản “Bộ lọc nhanh”Chúng tôi gõ giật lại và ngay lập tức nó sẽ được hiển thị cho chúng tôi. Để sử dụng bình thường trong Debian, chỉ cần cài đặt gói đó.

Những người thích Ubuntu, cũng có thể cài đặt gói trăn trở lại, cung cấp một mô-đun để mở rộng các chức năng của Recoll và sử dụng nó như một Ống kính Unity của Ubuntu.

Tuy nhiên, chúng tôi thực sự khuyên những người ủng hộ Ubuntu đọc bài viết Tìm kiếm hầu hết các loại tệp trong Ubuntu với Recovery, được gửi cho tôi bởi bạn của tôi Yoandy Pérez Cáceres (Kceres de humanOS). Bài báo đó thân thiện hơn nhiều so với bài báo này.

Sau khi cài đặt, chúng tôi sẽ tìm thấy nó trong nhóm "Phụ kiện". Chúng tôi thực thi nó và điều đầu tiên chúng tôi phải làm là Định cấu hình lập chỉ mục thông qua tùy chọn menu Tùy chọn -> Cài đặt lập chỉ mục.

Để việc tìm kiếm không mất quá nhiều thời gian và đáp ứng sở thích của chúng tôi, chúng tôi xóa virgulilla ~ (nó có nghĩa là tất cả / Home) của các Thư mục chính và thêm các thư mục mà chúng tôi cho là cần thiết.

Giao diện đồ họa rất trực quan, mời mọi người khám phá những lợi ích của gói này. Tự kiểm tra mức tiêu thụ tài nguyên đã mua bằng các công cụ tìm kiếm được cài đặt theo mặc định với KDE4 hoặc với GNOME-Shell.

Ngoài ra, sự đơn giản của việc cài đặt và sử dụng, cũng như số lượng phụ thuộc rất thấp, khiến nó trở nên lý tưởng cho công việc cụ thể của bạn trên các máy công suất thấp.

giật lại-01

giật lại-02

Và cho đến cuộc phiêu lưu tiếp theo, Các bạn !!!.


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.

  1.   cooper15 dijo

    Vì vậy, đây là một cái gì đó giống như những gì Nepomuk làm? âm thanh tốt để sử dụng với hộp mở của tôi.

    1.    Federico A. Valdes Toujague dijo

      Cảm ơn vì đã bình luận!. Và vâng, nó là một công cụ tìm kiếm trên máy tính để bàn, nhưng với mức tiêu thụ tài nguyên thấp hơn nhiều

    2.    sống động dijo

      Tôi thực sự không nghĩ rằng mình sẽ so sánh được với Nepomuk. Tôi thấy rằng nó có khá nhiều tùy chọn, nhưng bạn phải xem liệu nó có thể lập chỉ mục từng phần tử cho nó là gì không. Nepomuk là một dự án lớn, và tôi không nghĩ rằng Recoll sẽ đạt đến cấp độ của nó, ít nhất là không phải bây giờ.

      1.    pandev92 dijo

        nepomuk chậm hơn và nhiều lỗi hơn trình lập chỉ mục cửa sổ, và điều đó đã nói XD

        1.    bao84 dijo

          Nepomuk không liên quan gì đến trình lập chỉ mục Windows, hoặc ít nhất đó là cách tôi ở lại Windows.

        2.    sống động dijo

          Nepomuk đã cải thiện rất nhiều trong KDE 4.10 và sẽ nhanh hơn nhiều trong KDE 4.11 😀

          1.    pandev92 dijo

            Họ đã nói điều tương tự với tôi kể từ ngày 4.6 ..., sẽ tốt hơn và blah blah blah, và không thấy tôi đã bị treo lên bao nhiêu lần khi đọc thư viện âm nhạc tiếng Nhật của tôi XD

          2.    vicky dijo

            Vâng, từ những gì tôi hiểu, họ đã hoàn toàn thay đổi nó và viết lại nó, nó không còn sử dụng Strigi nữa

    3.    Leo dijo

      Nepomuk không hiển thị một phần của văn bản, chưa nói đến đánh dấu nó, khi bạn tìm kiếm thứ gì đó. Đây là ưu việt !!!
      Tôi đã tự giết mình để tìm kiếm một thứ như thế !!!!!
      Bạn không biết bạn đã làm cho tôi hạnh phúc như thế nào !!!!!!!!

      Tôi thậm chí đã cố gắng cài đặt một Goonepuk nhất định (hoặc một cái gì đó tương tự) sử dụng Nepomuk để tìm kiếm văn bản kiểu Google nhưng nó không hoạt động.
      Nhưng điều này là lý tưởng (từ cảm xúc tôi vẫn chưa cài đặt nó 🙂)

      Tôi đã nghĩ rằng tôi sẽ không bao giờ tìm thấy một cái gì đó như thế này, và nó có vẻ nhẹ nhàng, lý tưởng cho XFCE của tôi (tiếc rằng nó phụ thuộc. Qt, nhưng bạn không thể làm mọi thứ trong cuộc sống, ha).
      Tôi không biết làm thế nào để cảm ơn bạn, bạn đã cho cuộc sống của tôi ý nghĩa một lần nữa (à, tôi đang phóng đại một chút)

      CẢM ƠN RẤT NHIỀU!!!!!!!!!!

      1.    Federico A. Valdes Toujague dijo

        Cảm ơn bình luận của bạn. Tôi rất vui vì nó đã được phục vụ bạn. Tôi nhớ từ những năm 90 các chương trình họ đã sử dụng để tìm kiếm. Tuyệt vời !!!. Bây giờ, với một chương trình đơn giản, nó đã được giải quyết.
        Xin chúc mừng!!!.

        1.    eliotime3000 dijo

          Nếu đó là từ những năm 90, thì nó được đảm bảo là tuyệt vời và do đó tốt hơn nhiều (theo tôi biết, hầu hết các phần mềm miễn phí được tạo ra vào những năm 90 đều tuyệt vời).

  2.   Federico A. Valdes Toujague dijo

    Cảm ơn tất cả các bạn đã bình luận !!! Hồi phục tự nhiên lập chỉ mục văn bản thuần túy, html, maildir, hộp thư (Mozilla, Thunderbird và thư Evolution), gaim, Scribus, trang người đàn ông và sơ đồ Dia. Với sự trợ giúp của các Plugin như iconv, xslproc, unzip, pdftotext, antiword và các plugin khác, bạn cũng có thể lập chỉ mục Abiword, Fb2, Kword, Microsoft Office Open XML, các tệp có phần mở rộng SVG, Gnumeric, Okular, pdf, MS Word, Wordperfect, File Lyx, Powerpoint, Excel, CHM. Nó cũng có thể đóng vai trò bổ sung cho Firefox để lập chỉ mục lịch sử của các trang web hoặc xử lý tệp đính kèm của email.
    Tôi không biết phạm vi của các công cụ tìm kiếm khác, nhưng đối với nhu cầu của tôi, có rất nhiều lợi ích. 🙂

    1.    talkartas dijo

      Trong Windows 7, nó có thể được tìm thấy trong các tệp docx nếu tôi không nhầm lẫn. Nhưng tôi chắc chắn sẽ bối rối. Nhưng nếu nó hỗ trợ odt, nó cần được chứng minh.

      1.    eliotime3000 dijo

        Tốt, nhưng kết quả khác nhau.

  3.   nhạc rock and roll dijo

    Tôi không thể nói tốt về chương trình này. Tôi sử dụng môi trường gtk và vì lý do tương tự, tôi có thể tìm giải pháp sử dụng các thư viện từ họ này, nhưng giải pháp thay thế gtk được cho là mạnh mẽ, trình theo dõi, thật khủng khiếp. Về Nepomuk, thật là điên rồ khi cài đặt nó nếu bạn không sử dụng KDE (thực sự thì không hợp lý khi làm như vậy), vì cài đặt của nó mang gần như tất cả KDE. Ngoài ra, tôi đã thử nghiệm nó nguyên bản trong môi trường KDE và sự thật là nó không thuyết phục tôi, cả về hiệu suất cũng như kết quả. Recoll chiếm ít tài nguyên, lập chỉ mục hoàn hảo và hiển thị kết quả một cách rất hữu ích. Hiện tại, tôi không thay đổi công cụ này cho bất cứ điều gì.
    Chúc mừng.

    1.    Federico A. Valdes Toujague dijo

      Cảm ơn vì đã bình luận!!!. Hồi phục phù hợp, và cho đến nay, nhu cầu của tôi. Công cụ Xapian - hoặc các thư viện của nó - được sử dụng trong các ứng dụng khác như Synaptic và người ta thậm chí không biết khi nào nó đang lập chỉ mục.

      1.    eliotime3000 dijo

        Một truy vấn: Bạn sử dụng môi trường máy tính để bàn nào và bạn đang sử dụng chủ đề nào? Bởi vì chủ đề mà bạn đã sử dụng trong GNOME 3 trong hướng dẫn QEMU-KVM thực sự rất tuyệt.

        1.    gato dijo

          nếu tôi không nhầm, tôi nghi ngờ đó là XFCE với chủ đề Albatross (hay nhất)

        2.    Federico A. Valdes Toujague dijo

          @ eliotime3000, @gato: Trước hết xin chào bạn. Sau khi sử dụng Cinnamon trong một vài tuần, tôi quay lại GNOME-Shell. Có đối với Shell bị chỉ trích. Và nó sẽ có vẻ kỳ lạ, nhưng như tôi đã nói trong phần 1 của QEMU-KVM, đối với tôi nó là một viên đạn. Bạn biết gì? Tôi đã thích nghi tốt nhất, và rằng tôi không còn trẻ chút nào. 🙂 Tôi đã nhận được phần mở rộng gnome-shell-classic-systray_0.1-0+20120306~webupd8~precise1_all.debgnome-shell-frippery-0.4.1.tar.gz và sự thật là tôi không bỏ sót hầu hết mọi thứ đối với GNOME 2. Tệp tar, gz, chứa 6 phần mở rộng phải được sao chép vào ~ / .local / share / gnome-shell / extensions /, khởi động lại GDM3, sau đó với gnome-Tweak-tool thiết lập môi trường. Và @gato, nếu tôi sử dụng Albatros, được cài đặt với gói shiki-con người-chủ đề và các phụ thuộc của nó.

          Dù sao thì, tôi đã quen với GNOME-Shell và tôi giới thiệu nó cho mọi người. Nó có thể khiến tôi hào hứng và đăng một bài, đặc biệt là đối với những người mới, về cách tạo cho chúng tôi một Máy tính để bàn Debian tùy chỉnh.

  4.   Joaquin dijo

    Công cụ tuyệt vời!
    Nó rất tốt. Phải mất một lúc để tạo cơ sở dữ liệu, nhưng việc tìm kiếm rất nhanh.
    Nó thậm chí còn tìm kiếm các từ trong các tệp LibreOffice và Inkscape (.svg). Nó rất hữu ích khi chúng ta không biết tên của một tệp nhưng chúng ta biết một phần nội dung. Cảm ơn bạn!

    1.    Federico A. Valdes Toujague dijo

      Cảm ơn đã bình luận, Joaquín !!!. Thời gian tiêu tốn trong việc tạo cơ sở dữ liệu phụ thuộc vào số lượng thư mục mà bạn đã khai báo trong cấu hình. Tuy nhiên, tôi không biết nếu bạn kiểm tra xem trong khi lập chỉ mục và tạo cơ sở dữ liệu, bạn có thể hoạt động bình thường hay không.

  5.   linuxito dijo

    người đàn ông grep

  6.   Andres Sanchez dijo

    Và nếu bạn sử dụng Ubuntu, có một ống kính giúp xử lý nó trở nên dễ dàng nhất trên thế giới.

    Nhân tiện, để cài đặt nó trong ubuntu, việc bạn phải làm là cài đặt các gói ống kính giật lùi (cho chương trình) và ống kính giật lại (cho ống kính).

  7.   Federico A. Valdes Toujague dijo

    Giải thích chi tiết về cách cài đặt Recoll trên Ubuntu được đưa ra trong bài viết tôi đã tham khảo ở trên, "Tìm kiếm hầu hết các loại tệp trong Ubuntu với Recoll". Cảm ơn vì đã bình luận!!!.

  8.   Angel Duran dijo

    Xin chào,

    Tôi là một nhà khoa học máy tính và tôi làm việc tại Hội đồng Thành phố Coria (Cáceres). Chúng tôi đang triển khai Ubuntu và trong số các tiện ích khác, chúng tôi đang sử dụng Recoll.

    Điều tôi muốn biết là làm thế nào bạn có được phiên bản tiếng Tây Ban Nha.

    Chúc mừng và cảm ơn.

  9.   thiên thần dijo

    Tôi nghĩ tôi đã tự trả lời.

    Trong kho Ubuntu có phiên bản 1.17.3 và bản dịch tiếng Tây Ban Nha đã được giới thiệu trong phiên bản 1.19.3

    Chúc mừng.

    1.    Federico A. Valdes Toujague dijo

      Xin chào Thiên thần !!!. Chà, trong Debian 7 "Wheezy", phiên bản là 1.17-3.2 và nó đã được dịch. Rõ ràng các debianeros đã đóng gói nó từ một phiên bản được dịch sang tiếng Tây Ban Nha để có thể sử dụng nếu cần. Tôi nghĩ bạn có thể tải xuống một cái từ trang web Debian.

      1.    Andres Sanchez dijo

        Tôi vừa khám phá ra một lựa chọn ngoạn mục. Recovery có thể được thực hiện để lập chỉ mục các tệp mà không cần đăng nhập hoặc có giao diện đồ họa hoạt động.

        Nó có thể được chạy tự động bằng lệnh recllindex -x -m. -X là để nó hoạt động mà không cần giao diện đồ họa hoạt động (không có Xs) và -m là để nó giám sát các tệp trong thời gian thực (khi một tệp được tạo hoặc sửa đổi). Ngoài ra, bạn có thể sửa đổi tệp cấu hình retll.conf, thường nằm bên trong thư mục .recoll home để cho bạn biết thư mục nào cần theo dõi, v.v.

        Tất cả những điều này là rất tốt cho việc lập chỉ mục các tệp trên máy chủ chẳng hạn.

        Sau đó, bên trong gui, bạn có thể làm cho nó sử dụng các chỉ mục bên ngoài khi tìm kiếm (trong tùy chọn -> cài đặt chỉ mục ngoài).

        Ngoài ra, tôi đã tạo một tập lệnh nhỏ cho init.d để làm cho trình chỉ mục khởi động tự động khi khởi động máy chủ.

        Và vì vậy từ máy tính để bàn, tôi có thể tìm kiếm các tệp được lập chỉ mục trên máy chủ.

        Người cuối cùng

        1.    Federico Antonio Valdes Toujague dijo

          Đóng góp to lớn, bạn Andrés Sánchez !!!. Tôi sẽ tính đến vấn đề này để áp dụng nó trên các máy chủ tệp của mình với Samba. Cảm ơn chi tiết chia sẻ khám phá của bạn.

          Lời chào từ Federico

          1.    Andres Sanchez dijo

            Không có gì đâu, thưa ngài. Đó là những gì điều này nói về, chia sẻ những khám phá của chúng tôi.

            Nhân tiện, hãy xem phần trợ giúp để định cấu hình tệp regll.conf. Bạn có thể thay đổi các đường dẫn lập chỉ mục (theo mặc định nó chỉ thực hiện trên trang chủ), bỏ qua các tệp và thư mục trong các đường dẫn đó, chỉ định xem có theo các liên kết tượng trưng hay không, chỉ định ngôn ngữ (ngôn ngữ) sẽ được sử dụng để lập chỉ mục, mã hóa của các tệp, nếu việc lập chỉ mục phân biệt chữ hoa chữ thường, đường dẫn nơi chỉ mục sẽ được lưu (điều này rất tốt cho việc truy cập chỉ mục sau này từ một máy tính khác, miễn là đường dẫn chỉ mục nằm trong một thư mục được chia sẻ) và nhiều tùy chọn khác mà tôi có chưa thử.

            Trong đường dẫn / usr / share / rell /amples (ít nhất là trên ubuntu) có các tệp ví dụ về cấu hình.

  10.   Hector dijo

    Xin chào, tôi là người dùng OpenSuse (phiên bản 13.1 ngày nay) và là một công cụ lập chỉ mục, tôi đã sử dụng Google Desktop trong nhiều năm! (Tôi đã đọc các vấn đề mà nó gặp phải và các lỗ hổng bảo mật, blablablabla,) nhưng cho đến bây giờ tôi vẫn chưa thấy hoặc không tìm thấy bất cứ điều gì ở mức cao nhất về kết quả.
    Tôi đã sử dụng Recoll được ít hơn 1 tháng và kể từ khi nó hoàn thành, nó không còn hoạt động với tôi nữa. Nó phức tạp để cấu hình, nó không dành cho người dùng phổ thông, những người không hiểu nhiều về các lệnh và nội dung.
    Nó trông rất hứa hẹn nhưng cho đến nay tôi vẫn chưa hoàn toàn bị thuyết phục.

    Nếu ai đó có thể giúp tôi một tay với một vấn đề nhỏ (tôi sẽ nói Flanders).
    Khi cài đặt nó, trước khi lập chỉ mục trang chủ đầu tiên, tôi quyết định thêm một số thư mục từ xa và hệ thống (/ usr / share, v.v., / mnt / internal network directory, / mnt / my disk lacie để sao lưu,)

    Vấn đề tôi nhận thấy là khi tôi nhập một văn bản để tìm kiếm đơn giản, nó sẽ trả về kết quả, đầu tiên là những văn bản nằm trong thư mục bên ngoài của tôi (“/ mnt /….”) Và cuối cùng là những văn bản có trong / home / my name.

    Một vấn đề khác là khi tôi nhập dưới dạng tìm kiếm "DNI tên của tôi" (không có dấu ngoặc kép), nó không trả về bất kỳ kết quả nào nếu tôi chọn bộ lọc "tên tệp" khi tệp chỉ được gọi là "DNI tên của tôi.jpg"
    Để tệp xuất hiện, tôi phải chọn "tất cả các điều khoản hoặc bất kỳ điều khoản nào"

    Cho đến nay vì lý do thực tế, tốc độ và sự đơn giản, máy tính để bàn của google vẫn là tốt nhất, trừ khi tôi tìm cách cấu hình Recoll và cách đặt nó ưu tiên các tệp trong nhà của tôi khi trả về kết quả.

    Nếu ai đó có thể giúp tôi hoặc cho tôi biết tôi có thể tìm thấy một số hướng dẫn đơn giản ở đâu (KHÔNG PHẢI LÀ HƯỚNG DẪN CỦA 50MIL trang và nó bằng tiếng Anh)
    Cảm ơn bạn rất nhiều cho bài viết. RẤT TỐT.

    Tái bút: Nepomuk chưa bao giờ phục vụ tôi !! Tôi chưa bao giờ thấy làm thế nào để lấy nước trái cây ra khỏi nó và nó hoạt động như thế nào. Họ nói khắp nơi về nó tốt như thế nào nhưng tôi chưa bao giờ thấy ai làm thế nào để tận dụng tối đa nó và làm thế nào để áp dụng nó vào thực tế.