Recoll: fulltekst søkemotor med Xapian søkemotor.

Hei venner!. Jeg har alltid likt å "bla" i depotet. Og for en tid siden fant jeg en pakke som kan hjelpe mange i deres daglige arbeid. Det hjelper meg personlig å finne artikler eller tekster eller bøker, i det rotete / Hjem.

Husk er et verktøy for å søke i fulltekst (fra et ord til komplekse boolske uttrykk) ved hjelp av et vennlig grafisk grensesnitt, med et minimum av sofistikert teknikk og noen obligatoriske eksterne avhengigheter. Den kan kjøres på mange UNIX-lignende operativsystemer, og er ganske uavhengig av skrivebordsmiljøet som brukes. Det krever ikke en demon som en backend for søk og indeksering. Som søkemotor bruk xapian.

For å installere Recoll, kjører vi Synaptic, og i tekstboksen "Rask filter”Vi skriver huske og umiddelbart vil det bli vist for oss. For normal bruk i Debian er det bare nødvendig å installere den pakken.

De som foretrekker Ubuntu, kan også installere pakken python-husker, som gir en modul for å utvide Recolls funksjonalitet og bruke den som en Ubuntu Unity Lens.

Ikke desto mindre anbefaler vi Ubuntu-støttespillere å lese artikkelen Søker etter nesten alle slags filer i Ubuntu med Recoll, som ble sendt til meg av min venn Yoandy Pérez Cáceres (Kceres de humanOS). Den artikkelen er mye vennligere enn denne.

Når den er installert, finner vi den i gruppen "Tilbehør". Vi utfører det, og det første vi må gjøre er å konfigurere indekseringen gjennom menyalternativet Innstillinger -> Indekseringsinnstillinger.

For at søket ikke tar så lang tid og svarer på våre interesser, fjerner vi virgulilla ~ (det betyr alle våre / Hjem) i hovedkatalogene og legg til de vi anser som nødvendige.

Det grafiske grensesnittet er veldig intuitivt, og vi inviterer alle til å utforske fordelene med denne pakken. Sjekk selv forbruket av ressurser som er kjøpt med søkemotorene som er installert som standard med KDE4, eller med GNOME-Shell.

I tillegg gjør enkelheten med installasjon og bruk, så vel som det svært korte antallet avhengigheter, det ideelt for ditt spesifikke arbeid på maskiner med lav effekt.

huske-01

huske-02

Og til neste eventyr, Venner !!!.


Legg igjen kommentaren

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Kontroller SPAM, kommentaradministrasjon.
  3. Legitimering: Ditt samtykke
  4. Kommunikasjon av dataene: Dataene vil ikke bli kommunisert til tredjeparter bortsett fra ved juridisk forpliktelse.
  5. Datalagring: Database vert for Occentus Networks (EU)
  6. Rettigheter: Når som helst kan du begrense, gjenopprette og slette informasjonen din.

  1.   cooper15 sa

    Så dette er noe sånt som det Nepomuk gjør? høres bra ut å bruke med openboxen min.

    1.    Federico A. Valdes Toujague sa

      Takk for kommentaren !. Og ja, det er en stasjonær søkemotor, men med mye lavere ressursforbruk

    2.    livlig sa

      Jeg tror egentlig ikke det vil måle seg med Nepomuk. Jeg ser at det har ganske mange alternativer, men du må se om det er i stand til å indeksere hvert element for hva det er. Nepomuk er et stort prosjekt, og jeg tror ikke Recoll vil nå sitt nivå, i hvert fall ikke for nå.

      1.    pandev92 sa

        nepomuk er tregere og mer buggy enn windows indexer, og det sier allerede XD

        1.    sieg84 sa

          Nepomuk har ingenting å gjøre med Windows-indeksøren, eller i det minste ble jeg i Windows.

        2.    livlig sa

          Nepomuk forbedret seg mye i KDE 4.10 og vil være mye raskere i KDE 4.11 😀

          1.    pandev92 sa

            De har fortalt meg det samme siden 4.6 ..., det vil være bedre og bla bla bla, og ser ikke hvor mange ganger jeg har lagt på å lese mitt japanske musikkbibliotek XD

          2.    vicky sa

            Ja, fra det jeg forstår endret de det helt og skrev det om, det bruker ikke lenger strigi

    3.    Leo sa

      Nepomuk viser ikke delen av teksten, enn si fremhever den når du søker etter noe. Dette er overlegen !!!
      Jeg drepte meg selv på jakt etter noe sånt !!!!!
      Du vet ikke hvor glad du har gjort meg !!!!!!!!

      Jeg prøvde til og med å installere en viss Goonepuk (eller noe sånt) som brukte Nepomuk for å søke etter tekst i Google-stil, men det fungerte ikke.
      Men dette er ideelt (fra følelsen installerer jeg det fortsatt ikke 🙂)

      Jeg trodde jeg aldri ville finne noe slikt, og det virker lett, ideelt for min XFCE (synd at det avhenger. Qt, men du kan ikke gjøre alt i livet, ha).
      Jeg vet ikke hvordan jeg skal takke deg, du ga livet mitt mening igjen (vel, jeg overdriver litt)

      TAKK SÅ MYE!!!!!!!!!!

      1.    Federico A. Valdes Toujague sa

        Takk for kommentaren din. Jeg er glad for at den har tjent deg. Jeg husker programmene de brukte til søk på 90-tallet. Fantastisk !!!. Nå, med et enkelt program, er det løst.
        Gratulerer!!!.

        1.    eliotime3000. sa

          Hvis det er fra 90-tallet, er det garantert flott og derfor mye bedre (så vidt jeg vet var det meste av gratis programvare laget på 90-tallet flott).

  2.   Federico A. Valdes Toujague sa

    Takk alle for kommentarene !!! Husk indekserer naturlig tekst, html, maildir, postboks (Mozilla, Thunderbird og Evolution mail), gaim, Scribus, man sider og Dia diagrammer. Ved hjelp av plugins som iconv, xslproc, unzip, pdftotext, antiword og andre, kan du også indeksere Abiword, Fb2, Kword, Microsoft Office Open XML, filer med utvidelsen SVG, Gnumeric, Okular, pdf, MS Word, Wordperfect , Lyx, Powerpoint, Excel, CHM filer. Det kan også tjene som et supplement til Firefox for å indeksere historikken til nettsider, eller behandlingen av vedleggene til e-post.
    Jeg vet ikke omfanget av andre søkemotorer, men for mine behov er det mange fordeler. 🙂

    1.    talkartas sa

      Vel i Windows 7 kan den bli funnet i docx-filer hvis jeg ikke er forvirret. Men jeg blir sikkert forvirret. Men hvis det støtter odt, bør det bevises.

      1.    eliotime3000. sa

        Bra, men resultatene er forskjellige.

  3.   rock and roll sa

    Jeg kan ikke få nok av å snakke godt om dette programmet. Jeg bruker et gtk-miljø og av samme grunn kunne jeg se etter en løsning som bruker biblioteker fra denne familien, men det antatt kraftige gtk-alternativet, tracker, er forferdelig. Når det gjelder Nepomuk, er det sprøtt å installere det hvis du ikke bruker KDE (det er faktisk ikke fornuftig å gjøre det), siden installasjonen har nesten all KDE. I tillegg har jeg testet det innfødt i et KDE-miljø, og sannheten er at den ikke overbeviser meg, verken av ytelse eller av resultater. Recoll tar opp få ressurser, indekserer perfekt og viser resultatene på en veldig nyttig måte. For nå endrer jeg ikke dette verktøyet for noe.
    Hilsener.

    1.    Federico A. Valdes Toujague sa

      Takk for kommentaren !!!. Recoll passer, og langt, mine behov. Xapian-motoren - eller dens biblioteker - brukes i andre applikasjoner som Synaptic, og du vet ikke engang når du indekserer.

      1.    eliotime3000. sa

        Et spørsmål: Hvilket skrivebordsmiljø bruker du og hvilket tema bruker du? Fordi temaet du brukte i GNOME 3 i QEMU-KVM-opplæringen, var veldig kult.

        1.    gato sa

          hvis jeg ikke tar feil, mistenker jeg at det er XFCE med Albatross-temaet (det beste av alt)

        2.    Federico A. Valdes Toujague sa

          @ eliotime3000, @gato: Hilsen først og fremst. Etter å ha brukt kanel i et par uker, kom jeg tilbake til GNOME-Shell. Ja til den kritiserte Shell. Og det vil virke rart, men som sagt i 1. del av QEMU-KVM, for meg er det en kule. Vet du hva? Jeg har tilpasset meg det beste, og at jeg ikke er ung i det hele tatt. 🙂 Jeg har utvidelsene gnome-shell-classic-systray_0.1-0+20120306~webupd8~precise1_all.deb og gnome-shell-frippery-0.4.1.tar.gz og sannheten er at jeg ikke savner GNOME 2 i NESTEN noe. Tarfilen, gz, inneholder 6 utvidelser som må kopieres til ~ / .local / share / gnome-shell / extensions /, start GDM3 på nytt, og deretter med gnome-tweak-verktøy sett miljøet. Og @gato, hvis jeg bruker Albatros, som er installert med pakken shiki-menneske-tema og dens avhengigheter.

          Uansett har jeg blitt vant til GNOME-Shell, og jeg anbefaler det til alle. Det kan få meg til å bli begeistret og lage et innlegg, spesielt for nykommere, om hvordan vi kan lage oss et tilpasset Debian Desktop.

  4.   Joaquin sa

    Utmerket verktøy!
    Det er veldig bra. Det tar litt tid å opprette databasen, men det er veldig raskt å søke.
    Den søker til og med etter ord i LibreOffice- og Inkscape-filer (.svg). Det er veldig nyttig når vi ikke vet navnet på en fil, men vi kjenner deler av innholdet. Takk skal du ha!

    1.    Federico A. Valdes Toujague sa

      Takk for kommentaren, Joaquín !!!. Tiden det tar å lage databasen, avhenger av antall mapper du har angitt i konfigurasjonen. Jeg vet imidlertid ikke om du har sjekket at du kan jobbe normalt mens du indekserer og oppretter databasen.

  5.   linuxito sa

    mann grep

  6.   Andres Sanchez sa

    Og hvis du bruker Ubuntu, er det en linse som gjør håndtering av den til den enkleste tingen i verden.

    For å installere det i Ubuntu, trenger du for øvrig å installere pakkerne recoll (for programmet) og recoll-lens (for objektivet).

  7.   Federico A. Valdes Toujague sa

    En detaljert forklaring på hvordan du installerer Recoll på Ubuntu er gitt i artikkelen jeg refererte til ovenfor, "Søker etter nesten alle slags filer i Ubuntu med Recoll". Takk for kommentaren !!!.

  8.   Angel Duran sa

    Hallo,

    Jeg er informatiker og jobber i byrådet i Coria (Cáceres). Vi implementerer Ubuntu, og blant andre verktøy bruker vi Recoll.

    Det jeg vil vite er hvordan du fikk den spanske versjonen.

    Hilsener og takk.

  9.   Engel sa

    Jeg tror jeg svarte meg selv.

    I Ubuntu-arkivene er det versjon 1.17.3 og den spanske oversettelsen ble introdusert i versjon 1.19.3

    Hilsener.

    1.    Federico A. Valdes Toujague sa

      Hilsen Angel !!!. Vel, i Debian 7 "Wheezy" er versjonen 1.17-3.2, og den er oversatt. Tilsynelatende pakket debianeros den fra en versjon oversatt til spansk slik at den kunne brukes om nødvendig. Jeg tror du kan laste ned en fra Debians nettsted.

      1.    Andres Sanchez sa

        Jeg oppdaget nettopp et spektakulært alternativ. Recoll kan gjøres for å indeksere filer uten å måtte logge på eller ha et aktivt grafisk grensesnitt.

        Den kan kjøres automatisk med kommandoen recollindex -x -m. -X er for at den skal fungere uten et aktivt grafisk grensesnitt (uten Xs) og -m er for at den skal overvåke filene i sanntid (når en blir opprettet eller endret). I tillegg kan du endre konfigurasjonsfilen recoll.conf, som vanligvis er inne i .recoll-mappen for å fortelle deg hvilke mapper du skal overvåke osv.

        Alt dette er bra for indeksering av filer på en server for eksempel.

        Så i gui kan du få den til å bruke eksterne indekser når du søker (i preferanser -> eksterne indeksinnstillinger).

        I tillegg har jeg laget et lite skript for init.d for å få indeksøren til å starte automatisk med serveroppstart.

        Og så fra skrivebordene kan jeg søke i filene som er indeksert på serveren.

        En siste

        1.    Federico Antonio Valdes Toujague sa

          Fantastisk bidrag, venn Andrés Sánchez !!!. Jeg tar det i betraktning for å bruke det på filserverne mine med Samba. Takk for detaljene i delingen av oppdagelsen din.

          Hilsen fra Federico

          1.    Andres Sanchez sa

            Du er velkommen, sir. Det er dette dette handler om å dele våre funn.

            Ta forresten en titt på hjelpen til å konfigurere filen recoll.conf. Du kan endre indekseringsbanene (som standard gjør det bare hjemme), hoppe over filer og mapper i disse banene, spesifisere om du vil følge symbolske lenker, spesifisere språk (språk) som skal brukes til indeksering, koding av filene, hvis indekseringen er mellom store og små bokstaver, stien der indeksen skal lagres (dette er flott for senere tilgang til indeksen fra en annen datamaskin, så lenge indeksbanen er i en delt mappe) og mange andre alternativer som jeg har ennå ikke prøvd.

            I banen / usr / share / recoll / eksempler (i det minste på ubuntu) er det eksempelfiler av konfigurasjonen.

  10.   Hector sa

    Hei, jeg er en OpenSuse-bruker (i dag versjon 13.1), og som et indekseringsverktøy har jeg brukt Google Desktop i mange år! (Jeg har lest problemene den har og sikkerhetshullene, blablablabla,) men inntil nå hadde jeg ikke sett eller funnet noe som er på topp når det gjelder resultatene.
    Jeg har brukt Recoll i mindre enn 1 måned, og siden det er så komplett, fungerer det ikke lenger for meg. Det er komplisert å konfigurere, det er ikke ment for den vanlige brukeren som ikke forstår mye om kommandoer og sånt.
    Det ser veldig lovende ut, men så langt er jeg ikke helt overbevist.

    Hvis noen kan gi meg en hånd med et lite problem (jeg vil si Flandern).
    Da jeg installerte den, før den første hjemmeindekseringen, bestemte jeg meg for å legge til flere fjern- og systemkataloger (/ usr / share, etc, / mnt / intern nettverkskatalog, / mnt / min disk lacie for sikkerhetskopiering,)

    Problemet jeg fant er at når jeg skriver inn en tekst for enkelt søk, returnerer den som et resultat, først de som er i de eksterne katalogene mine ("/ mnt /….") Og til slutt de som er i / home / mitt navn.

    Et annet problem er at når jeg skriver inn som søk "DNI mitt navn" (uten anførselstegn), vil det ikke gi noen resultater hvis jeg velger filteret "filnavn" når filen bare heter "DNI mitt navn.jpg"
    For at filen skal vises må jeg velge "alle vilkår eller ethvert begrep"

    Så langt av praktiske årsaker, hastighet og enkelhet, er Google-skrivebordet fremdeles det beste, med mindre jeg finner hvordan jeg konfigurerer Recoll og hvordan jeg får det til å prioritere filene i mitt hjem når jeg returnerer resultatene.

    Hvis noen kan hjelpe meg eller fortelle meg hvor jeg kan finne en enkel guide (IKKE HÅNDBOKEN FOR 50MIL sider, og den er på engelsk)
    Tusen takk for innlegget. VELDIG BRA.

    PS: Nepomuk serverte meg aldri i det hele tatt !! Jeg så aldri hvordan jeg skulle få saften ut av den og hvordan den fungerer. De snakker overalt om hvor bra det er, men jeg så aldri noen hvordan man skulle få mest mulig ut av det og hvordan man kunne praktisere det.