Pašalinkite pasikartojančias eilutes iš failo

Kuriu dažniausiai naudojamų ar dažniausiai naudotojų naudojamų slaptažodžių žodyną (... Neklauskite, kodėl ... HAHAHA), tam imu tekstą iš kitų žodynų ir pan., bet man atrodo, kad yra daug pasikartojančių slaptažodžių ir man reikia pašalinti pasikartojančias eilutes.

Tai yra, pavyzdžiui ... mes turime šį failą: pass.txt

Ir jo turinys yra:

asdas
Lola
meilė
asdas
langai
VYTEGA
Linux
asdas
meilė

 Kaip matome, mes pakartojome «meilė"Y"asdas«, Pastarasis 3 kartus. Kaip pašalinti pasikartojančias eilutes?

Tai padaryti paprasta, atlikdami šią komandą:

cat pass.txt | sort | uniq > pass-listos.txt

Tai sugeneruos failą, vadinamą paruoštas perduoti.txt kuriame bus:

VYTEGA
asdas
Linux
Lola
meilė
langai

Tai, ką daro komanda, yra LABAI paprasta ...

  1. katės leidimas.txt - »Išvardykite failo turinį.
  2. sort - »Rūšiuoti turinį abėcėlės tvarka.
  3. unikalus - »Pašalinkite pasikartojančias eilutes.
  4. > paruoštas perduoti.txt - »Ankstesnių komandų rezultatas, įdėkite jį į failą pass-ready.txt (kuris, kaip jo nėra, jį sukurs)

Tai taip paprasta ... Aš ką tik atradau tą komandą sort taip, tai labai gerai ... bet kartu su unikalus, jie yra meno brangenybė 😀

Tikiuosi, kad buvote paslaugus.

saludos

tapetai: Jei norite atsisiųsti ekrano foną «Aš myliu #! / Bin / bash»Čia yra nuoroda:

Atsisiųsti foną

Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas. Privalomi laukai yra pažymėti *

*

*

  1. Atsakingas už duomenis: Miguel Ángel Gatón
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.

  1.   Carlos sakė

    Taip pat galite naudoti rūšiuoti -u.

    Sveikiname tinklaraštį, man tai patinka!

    1.    KZKG ^ Gaara sakė

      Kurgi ne.
      Nieko, labai ačiū už komentarus 😀

      Sveiki atvykę 😉
      saludos

  2.   Diegas sakė

    Problema yra ta, kad ji keičia žodžių tvarką, veikia ... bet galų gale rezultatas labai skiriasi nuo originalo tokia tvarka (kuri galbūt tam tikru atveju yra svarbi)

    1.    KZKG ^ Gaara sakė

      Taip, taip, žodžiai išdėstomi abėcėlės tvarka, taigi, jei turinys buvo reikalingas BE variantų, šis sprendimas nėra idealus.

    2.    Carlos sakė

      Nesukite aplinkui, o jei jums kiltų mintis nedėti rūšiavimo komandos? prašau pagalvoti dar šiek tiek ir ne viską sukramtyti.

      katės leidimas.txt | uniq> pass-ready.txt

      1.    Eliuberis sakė

        neveikia, bandžiau

      2.    Bobas sakė

        neveikia, nes „pakartotos“ eilutės turi būti ištisinės

  3.   bevardis sakė

    Gracias

    tai gana naudinga

  4.   Giskardas sakė

    Labai gerai! Paprastas ir aiškus sprendimas. Man patinka tokie dalykai 🙂
    Turiu pripažinti, kad būčiau ką nors padariusi „Python“, tačiau šis sprendimas yra puikus.

    1.    KZKG ^ Gaara sakė

      Ačiū ^ - ^

  5.   Tino sakė

    Sveiki! labai gerai!
    Prašau prašymo
    man tai būtų tinkamas pavyzdys:
    ABCD 1111
    DEFG 2222 45455
    ABCD 1111
    DEFG 2222

    Eilutės yra tos pačios, bet juose yra tarpai ir dar keli simboliai ... ar tai tikrina tą patį žodį? ar linija? Aš paaiškinu?
    nuo šiol aš jums labai dėkoju.
    Apkabinimas

    1.    KZKG ^ Gaara sakė

      Sveiki, kaip tai vyksta
      Kaip mačiau, tai lygina eilutes, o ne stulpelius, todėl pavyzdyje, kurį pateikiate, tai pašalintų 1-ąją arba 3-ą, 2-ą ir 4-ą eilutes, nors jos yra beveik identiškos, jos nėra 100% tapačios, nes turėti skirtumo stulpelį. 😉

      Ačiū už komentarą ^ - ^

      1.    TINE sakė

        Ačiū tau!! anksčiau užtruko valandą, kol orakulas pašalino dublikatus ... dabar reikia 30 sekundžių su kačių rūšiavimu !!

  6.   „MegaBedder“ sakė

    Aš to reikalauju PHP: S

    1.    KZKG ^ Gaara sakė

      Uff ... man labai labai trūksta PHP, aš iš tikrųjų nesu programuotojas 🙁

      Atsiprašau

    2.    brunokascio sakė

      PHP oficialiame PHP dokumente yra array_unique (…), kuriame rasite daug svarbių ir efektyvių funkcijų.

      Kalbant apie rūšiavimą, nebent jums to reikia, nebūtina ... Vykdymo laikas ir atmintis yra sugaišti. (už tai, kas daroma įraše)

      Sveiki atvykę!

  7.   Moksiukas sakė

    Oho !! žodynas, naudojamas kaip žiauri jėga !! XD

  8.   Gustavo sakė

    Labai geras rūšiavimo derinys su uniq! Man labai padėjo pašalinti pasikartojančias eilutes.

    Ačiū

  9.   Gustavo sakė

    Nepaisant jo arogancijos, Carloso komentaras nėra teisingas. Jis sako naudoti:

    katės leidimas.txt | uniq> pass-ready.txt

    tačiau būtina uniq sąlyga yra failo užsakymas. Turėjo prieš tai šiek tiek daugiau pagalvoti ar pasiteirauti

  10.   Eliuberis sakė

    labai gerai, jūs sutaupėte man daug laiko paleisti mano bashą

  11.   Titnaginiai akmenys sakė

    awk '! array_temp [$ 0] ++' pass.txt> pass-ready.txt
    su tuo linijos pašalinamos nereikalaujant.

  12.   minimaliai sakė

    Labai ačiū už indėlį!

    Nors būtų šaunu, jei pavyktų paversti jį nepakartojamu, nekeičiant tvarkos, bet ei, lengva ir naudinga komanda!

  13.   Felipe Gutierrez sakė

    Ačiū, tai man labai padėjo 😉

  14.   ernesto sakė

    aš turiu tai
    C000006158880201502051056088364 C00-06158880
    C000007601673201503051056088364 C00-07601673
    C000008659304201504051056088364 C00-08659304
    T 0809074070562015120818144287185 REAÑO RUBIÑOS EMILIA DORIS
    T 0809092979972016010818144287185 REAÑO RUBIÑOS EMILIA DORIS
    C000005398451201501231044214375 C00-05398451
    C000007674996201503051000000286 C00-07674996
    C000008514288201504051000000463 C00-08514288
    C000011613498201506051056088070 C00-11613498

    Kaip man nuspalvinti mane faile tik abonento dublikatus ir palikti ne dublikatus kitame?

    abonentas yra 23 pozicijoje (10 pozicijų)

  15.   Fernando sakė

    rūšiuoti -u -k 1,1 File.txt> result.txt

    Tai rūšiuoja failą pagal pirmąjį lauką

  16.   Aš esu diego sakė

    2020 m. Ir vis dar tarnauju, labai ačiū!

  17.   sarah sakė

    Bạn co thể hướng dẫn cách loại bỏ các dòng trùng lặp của nhiều failo teksto trong „Linux“ ar „Windows được không“? Cũng như trường hợp của bạn, khi tôi tạo file từ điển vì tôi chia nội dung ra nên Có khá nhiều file và chắc chắn con nhiều dòng trùng lặp giữa Các file. Vaizdas: 1 failas „côa tôi co 5 dòng“, 2 failas - 15 dòng („co 2 dòng trùng lặp với File 1. Tôi muốn co kết quả, File 1 vẫn giữ nguyên 5 dòng, File 2 only only“ 2 dòng giống file 1 .
    Như bạn biết co nhiều li do chúng ta ko thể gộp các file txt đó lại với nhau, vì những file text ừ điển rất ư là nhiều ký, chẳng hạn như Rockyou. Thực tếi muốn thực hiện điều này bên Windows hơn, và chắc chắn ko thể gộp chúng ở bên Windows được. 🙂 Hy vọng nhận được phản hồi từ bạn!