Recoll: повнотекстова пошукова машина з пошуковою системою Xapian.

Привіт, друзі!. Я завжди любив "переглядати" сховище. А деякий час тому я знайшов пакет, який може допомогти багатьом у їхній щоденній роботі. Це особисто допомагає мені знаходити статті, тексти чи книги у моєму безладному порядку / Головна.

Відновити - це інструмент для пошуку повного тексту (від одного слова до складних булевих виразів) за допомогою дружнього графічного інтерфейсу, з мінімумом витонченої техніки та деяких обов’язкових зовнішніх залежностей. Він може працювати на багатьох UNIX-подібних операційних системах і є абсолютно незалежним від використовуваного робочого середовища. Для пошуку та індексування не потрібен демон як бекенд. Як пошукову систему використовують Xapian.

Щоб встановити Recoll, ми запускаємо Synaptic, і в текстовому полі “Швидкий фільтр”Набираємо відступ і негайно це буде показано нам. Для нормального використання в Debian вам потрібно лише встановити цей пакет.

Ті, хто віддає перевагу Ubuntu, також можуть встановити пакет python-recoll, який надає модуль для розширення функціональних можливостей Recoll та використання його як об'єктива Ubuntu Unity.

Тим не менше, ми настійно рекомендуємо прихильникам Ubuntu прочитати статтю Пошук майже всіх типів файлів в Ubuntu за допомогою Recoll, яку мені надіслав мій друг Йоанді Перес Касерес (Kceres de humanOS). Ця стаття набагато дружніша за цю.

Після встановлення ми знайдемо його у групі "Аксесуари". Ми виконуємо його, і перше, що нам потрібно зробити, це налаштувати індексування за допомогою пункту меню Налаштування -> Налаштування індексування.

Щоб пошук не тривав так довго і відповідав нашим інтересам, ми вилучаємо віргулію ~ (це означає всі наші / Головна) основних каталогів та додайте ті, які ми вважаємо необхідними.

Графічний інтерфейс дуже інтуїтивно зрозумілий, і ми запрошуємо всіх вивчити переваги цього пакету. Перевірте самі споживання ресурсів, придбаних у пошукових системах, встановлених за замовчуванням у KDE4, або в оболонці GNOME.

Крім того, простота його встановлення та використання, а також дуже коротка кількість залежностей робить його ідеальним для вашої конкретної роботи на малопотужних машинах.

відкат-01

відкат-02

І до наступної пригоди, Друзі !!!.


Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: Мігель Анхель Гатон
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.

  1.   cooper15 - сказав він

    Отже, це щось на зразок того, що робить Непомук? звучить добре для використання з моїм openbox.

    1.    Федеріко А. Вальдес Туягу - сказав він

      Дякую за коментар! Так, це пошукова система для настільних ПК, але з набагато меншим споживанням ресурсів

    2.    елав - сказав він

      Я справді не думаю, що зрівняюся з Непомуком. Я бачу, що у нього є досить багато варіантів, але ви повинні подивитися, чи зможе він проіндексувати кожен елемент за тим, що він є. Nepomuk - це величезний проект, і я не думаю, що Recoll досягне свого рівня, принаймні поки що.

      1.    pandev92 - сказав він

        nepomuk повільніший і помилковіший, ніж індексатор Windows, і це вже говорить XD

        1.    sieg84 - сказав він

          Nepomuk не має нічого спільного з індексатором Windows, або, принаймні, це було настільки, наскільки я був у Windows.

        2.    елав - сказав він

          Nepomuk значно покращився в KDE 4.10 і буде набагато швидшим у KDE 4.11 😀

          1.    pandev92 - сказав він

            Вони говорять мені те саме з 4.6 ..., буде краще, і бла-бла-бла, і не бачите, скільки разів я кидав слухавку, читаючи свою японську музичну бібліотеку XD

          2.    Вікі - сказав він

            Так, наскільки я розумію, вони повністю змінили це і переписали, воно більше не використовує strigi

    3.    Лев - сказав він

      Непомук не показує частину тексту, не кажучи вже про виділення, коли ви щось шукаєте. Це чудово !!!
      Я вбив себе, шукаючи щось подібне !!!!!
      Ви не знаєте, як ти мене порадував !!!!!!!!

      Я навіть намагався встановити певного Goonepuk (або щось подібне), який використовував Nepomuk для пошуку тексту в стилі Google, але це не спрацювало.
      Але це ідеально (з емоцій я все ще не встановлюю 🙂)

      Я думав, що ніколи не знайду щось подібне, і воно здається легким, ідеальним для мого XFCE (шкода, що це залежить. Qt, але в житті ти не можеш зробити все, ха).
      Я не знаю, як вам подякувати, ви знову ввели моє життя в сенс (ну, я трохи перебільшую)

      ДУЖЕ ДЯКУЮ!!!!!!!!!!

      1.    Федеріко А. Вальдес Туягу - сказав він

        Дякуємо за ваш коментар. Я щасливий, що це послужило вам. Я пам’ятаю з 90-х років програми, які вони використовували для пошуку. Неймовірно !!!. Тепер за допомогою простої програми це вирішено.
        Вітаю !!!.

        1.    eliotime3000 - сказав він

          Якщо це з 90-х, то це гарантовано буде чудово, а отже і набагато краще (наскільки мені відомо, більшість вільного програмного забезпечення, зробленого в 90-х, було чудовим).

  2.   Федеріко А. Вальдес Туягу - сказав він

    Дякую всім за коментарі !!! Відновити власноруч індексує звичайний текст, html, maildir, поштову скриньку (пошта Mozilla, Thunderbird та Evolution), gaim, Scribus, сторінки сторінок та діаграми Dia. За допомогою плагінів, таких як iconv, xslproc, unzip, pdftotext, antiword та інші, ви також можете проіндексувати Abiword, Fb2, Kword, Microsoft Office Open XML, файли з розширенням SVG, Gnumeric, Okular, pdf, MS Word, Wordperfect , Lyx, Powerpoint, Excel, CHM. Він також може слугувати доповненням Firefox для індексації історії веб-сторінок або обробки вкладень електронних листів.
    Я не знаю сферу застосування інших пошукових систем, але для моїх потреб є багато переваг. 🙂

    1.    Талкартас - сказав він

      Ну, в Windows 7 його можна знайти у файлах docx, якщо я не плутаюся. Але я точно заплутаюся. Але якщо він підтримує odt, це слід довести.

      1.    eliotime3000 - сказав він

        Добре, але результати різні.

  3.   рокандролео - сказав він

    Я не можу насититися, щоб добре говорити про цю програму. Я використовую середовище gtk, і з тієї ж причини я міг би шукати рішення, яке використовує бібліотеки з цього сімейства, але нібито потужна альтернатива gtk, трекер, страшна. Що стосується Nepomuk, то божевільно встановлювати його, якщо ви не використовуєте KDE (насправді це не має сенсу робити), оскільки його установка містить майже весь KDE. Крім того, я тестував це власним чином у середовищі KDE, і правда полягає в тому, що це не переконує мене ні за продуктивністю, ні за результатами. Recoll займає небагато ресурсів, ідеально індексує та дуже корисно показує результати. Поки що я нічого не міняю цей інструмент.
    Привіт.

    1.    Федеріко А. Вальдес Туягу - сказав він

      Дякуємо за коментар !!!. Recoll на сьогоднішній день відповідає моїм потребам. Механізм Xapian - або його бібліотеки - використовується в інших програмах, таких як Synaptic, і навіть невідомо, коли він здійснює індексацію.

      1.    eliotime3000 - сказав він

        Запит: яке середовище робочого столу ви використовуєте і яку тему використовуєте? Оскільки тема, яку ви використовували в GNOME 3 у підручнику QEMU-KVM, була справді крутою.

        1.    гато - сказав він

          якщо я не помиляюся, я підозрюю, що це XFCE з темою Альбатрос (найкраще з усіх)

        2.    Федеріко А. Вальдес Туягу - сказав він

          @ eliotime3000, @gato: Привіт перш за все. Після використання Кориці протягом декількох тижнів, я повернувся до оболонки GNOME. Так критикованій Shell. І це буде здаватися дивним, але, як я вже говорив у 1-й частині QEMU-KVM, для мене це куля. Знаєш, що? Я адаптувався найкраще, і що я зовсім не молодий. 🙂 Я отримав розширення gnome-shell-classic-systray_0.1-0+20120306~webupd8~precise1_all.deb і gnome-shell-frippery-0.4.1.tar.gz і правда полягає в тому, що я майже ВСЕ нічого не пропускаю GNOME 2. Файл tar, gz, містить 6 розширень, які потрібно скопіювати до ~ / .local / share / gnome-shell / extensions /, перезапустіть GDM3, а потім за допомогою gnome-tweak-tool встановити середовище. І @gato, якщо я використовую Albatros, який встановлюється разом із пакетом тема шикі-людина та його залежності.

          У будь-якому випадку, я звик до GNOME-Shell і рекомендую її всім. Це може мене збудити та зробити допис, особливо для новачків, про те, як зробити нам власний робочий стіл Debian.

  4.   Хоакін - сказав він

    Відмінний інструмент!
    Це дуже добре. Створення бази даних займає певний час, але пошук дуже швидкий.
    Він навіть шукає слова у файлах LibreOffice та Inkscape (.svg). Це дуже корисно, коли ми не знаємо назви файлу, але знаємо частину вмісту. Дякую!

    1.    Федеріко А. Вальдес Туягу - сказав він

      Дякуємо за коментар, Хоакін !!!. Час, витрачений на створення бази даних, залежить від кількості папок, які ви оголосили в конфігурації. Однак я не знаю, чи перевіряли ви, що під час індексації та створення бази даних ви можете працювати нормально.

  5.   Linuxit - сказав він

    людина grep

  6.   Андрес Санчес - сказав він

    І якщо ви використовуєте Ubuntu, є лінза, яка робить роботу з нею найпростішою у світі.

    До речі, щоб встановити його в Ubuntu, вам потрібно встановити пакети Recoll (для програми) та recoll-lens (для лінзи).

  7.   Федеріко А. Вальдес Туягу - сказав він

    У статті, на яку я посилався вище, "Пошук майже всіх видів файлів в Ubuntu за допомогою Recoll", дається детальне пояснення того, як встановити Recoll в Ubuntu. Дякуємо за коментар !!!.

  8.   Ангел Дюран - сказав він

    Здрастуйте,

    Я інформатик і працюю в міській раді Корії (Касерес). Ми впроваджуємо Ubuntu, і, серед інших утиліт, ми використовуємо Recoll.

    Я хочу знати, як ви отримали іспанську версію.

    Поздоровлення і подяки.

  9.   ангел - сказав він

    Здається, я відповів сам.

    У сховищах Ubuntu є версія 1.17.3, а переклад з іспанської мови представлений у версії 1.19.3

    Привіт.

    1.    Федеріко А. Вальдес Туягу - сказав він

      Привіт Ангел !!!. Ну, у Debian 7 "Wheezy" версія 1.17-3.2, і вона перекладена. Очевидно, дебіанерос упакував його з версії, перекладеної на іспанську, щоб її можна було використовувати у разі потреби. Думаю, ви можете завантажити його з веб-сайту Debian.

      1.    Андрес Санчес - сказав він

        Я щойно відкрив вражаючий варіант. Recoll можна зробити для індексації файлів без необхідності входу або мати активний графічний інтерфейс.

        Його можна запустити автоматично за допомогою команди recollindex -x -m. -X - це для того, щоб він працював без активного графічного інтерфейсу (без X), а -m - для моніторингу файлів у реальному часі (коли він створюється або модифікується). Крім того, ви можете змінити файл конфігурації recoll.conf, який зазвичай знаходиться всередині домашньої папки .recoll, щоб вказати, які папки слід контролювати тощо.

        Все це чудово підходить для індексації файлів на сервері, наприклад.

        Тоді всередині графічного інтерфейсу ви можете змусити його використовувати зовнішні індекси під час пошуку (у налаштуваннях -> налаштування зовнішнього індексу).

        Крім того, я створив невеликий скрипт для init.d, щоб індексатор запускався автоматично при запуску сервера.

        І тому з робочих столів я можу шукати файли, проіндексовані на сервері.

        Останнє

        1.    Федеріко Антоніо Вальдес Туягу - сказав він

          Величезний внесок, друже Андрес Санчес !!!. Я візьму це до уваги, застосовуючи це на своїх файлових серверах із Samba. Дякуємо за подробиці надсилання вашого відкриття.

          Привіт від Федеріко

          1.    Андрес Санчес - сказав він

            Ласкаво просимо, сер. Саме про це йдеться, ділимось своїми відкриттями.

            До речі, погляньте на довідку з налаштування файлу recoll.conf. Ви можете змінити маршрути індексування (за замовчуванням це робить лише вдома), опустити файли та папки в цих маршрутах, вказати, чи слід переходити за символічними посиланнями, вказати мови (мови), які будуть використовуватися для індексації, кодування файлів, якщо індексація чутлива до регістру, шлях, куди буде збережено індекс (це чудово підходить для подальшого доступу до індексу з іншого комп'ютера, якщо шлях до індексу знаходиться у спільній папці) та багато інших опцій, яких у мене ще немає пробували.

            У шляху / usr / share / recoll / examples (принаймні в ubuntu) є приклади файлів конфігурації.

  10.   Гектор - сказав він

    Привіт, я користувач OpenSuse (сьогодні версія 13.1), і як інструмент індексації я роками використовую Google Desktop! (Я читав проблеми, які у нього є, і діри в безпеці, blablablabla,), але до цього часу я не бачив і не знаходив нічого, що знаходиться на висоті щодо результатів.
    Я використовую Recoll менше 1 місяця, і оскільки він настільки повний, він більше не працює для мене. Це складно налаштовувати, воно не призначене для звичайного користувача, який не дуже розуміється на командах і речах.
    Це виглядає дуже багатообіцяючим, але поки що я не зовсім переконаний.

    Якщо хтось може допомогти мені з невеликою проблемою (я б сказав, Фландрія).
    Встановлюючи його, перед першим домашнім індексуванням я вирішив додати кілька віддалених та системних каталогів (/ usr / share та ін., / Mnt / внутрішня мережева директорія, / mnt / my disk lacie для резервного копіювання)

    Проблема, яку я виявив, полягає в тому, що коли я вводжу текст для простого пошуку, він повертається в результаті, спочатку ті, що знаходяться в моїх зовнішніх каталогах ("/ mnt / ....") І нарешті, ті, що знаходяться в / home / my name.

    Інша проблема полягає в тому, що коли я ввожу як пошук "DNI my name" (без лапок), він не повертає жодних результатів, якщо я вибираю фільтр "name name", коли файл просто називається "DNI my name.jpg"
    Щоб файл з'явився, я повинен вибрати "всі терміни або будь-який термін"

    Поки що з практичних міркувань, швидкості та простоти робочий стіл google все ще є найкращим, якщо я не знаходжу, як налаштувати Recoll і як зробити так, щоб пріоритетні файли в моєму будинку при поверненні результатів.

    Якщо хтось може мені допомогти або сказати, де я можу знайти якийсь простий путівник (НЕ РУКОВОДИТЕЛЬ на 50 МІЛ, а це англійською мовою)
    Щиро дякую за допис. ДУЖЕ ДОБРЕ.

    PS: Непомук мене взагалі ніколи не обслуговував! Я ніколи не бачив, як дістати з нього сік і як це працює. Вони скрізь говорять про те, наскільки це добре, але я ніколи не бачив, як хтось із цього максимально витяг і як це застосовувати на практиці.