Odstrani podvojene vrstice iz datoteke

Iz datoteke odstranite podvojene vrstice

Ustvarjam slovar najpogosteje uporabljenih gesel, priljubljenih ali najpogosteje uporabljenih uporabnikov (... Ne sprašuj, zakaj ... HAHAHA), za to jemljem besedilo iz drugih slovarjev itd., vendar se znajdem v položaju, da obstaja veliko podvojenih gesel in moram podvojene vrstice odstraniti.

To je na primer ... imamo naslednjo datoteko: pass.txt

In njegova vsebina je:

asdas
lola
ljubezen
asdas
okna
admin
linux
asdas
ljubezen

Kot vidimo, smo ponovili «ljubezen"Y"asdas«, Slednji 3-krat. Kako odstraniti podvojene vrstice?

To storite preprosto s tem ukazom:

cat pass.txt | sort | uniq > pass-listos.txt

To bo ustvarilo datoteko z imenom pass-ready.txt ki bo vseboval:

admin
asdas
linux
lola
ljubezen
okna

Kaj naredi ukaz ZELO preprosto ...

mačka pass.txt - »Navedite vsebino datoteke.
sortiranje - »Razvrsti vsebino po abecedi.
edinstven - »Odstranite podvojene vrstice.
> pass-ready.txt - »Rezultat prejšnjih ukazov vnesite v datoteko pass-ready.txt (ki ga bo, ker ne obstaja, ustvarilo)

Tako preprosto je ... Pravkar sem odkril, da je ukaz sortiranje ja, zelo dobro je ... toda skupaj z edinstven, so dragulj umetnosti 😀

Upam, da ste bili v pomoč.

pozdrav

Tapeta: Če želite prenesti ozadje «Obožujem #! / Bin / bash»Tu je povezava:

Prenesite ozadje

Pustite svoj komentar Prekliči odgovor

Carlos je dejal
nazaj 12 let

Uporabite lahko tudi razvrščanje -u.

Čestitke za blog, všeč mi je!

Odgovor Carlosu
1. KZKG ^ Gaara je dejal
  nazaj 12 let
  
  Ja seveda.
  Nič, najlepša hvala za komentar 😀
  
  Dobrodošli 😉
  pozdrav
  
  Odgovorite na KZKG ^ Gaara
Diego je dejal
nazaj 12 let

Težava pri tem je, da spremeni vrstni red besed, deluje ... ampak rezultat se na koncu močno razlikuje od prvotnega v vrstnem redu (kar je morda v nekaterih primerih pomembno)

Odgovorite Diegu
1. KZKG ^ Gaara je dejal
  nazaj 12 let
  
  Ja, res, to ureja besede po abecedi, zato, če je bila vsebina potrebna BREZ različic, ta rešitev ni idealna.
  
  Odgovorite na KZKG ^ Gaara
2. Carlos je dejal
  nazaj 11 let
  
  Ne zajebavajte se, kaj če ne boste dali ukaza za razvrščanje? prosim, premislite še malo in naj vam ne bo vse prežvečeno.
  
  mačka pass.txt | uniq> pass-ready.txt
  
  Odgovor Carlosu
  1. Eliuber je dejal
    nazaj 9 let
    
    ne deluje, poskusil sem
    
    Odgovorite Eliuberju
  2. zrna je dejal
    nazaj 6 let
    
    ne deluje, ker morajo biti "ponavljajoče se" vrstice neprekinjene
    
    Odgovorite na bob
neimenovani je dejal
nazaj 12 let

hvala

je zelo koristno

Odgovorite brez imena
giskard je dejal
nazaj 12 let

Zelo dobro! Preprosta in jasna rešitev. Všeč so mi take stvari 🙂
Moram priznati, da bi nekaj naredil v Pythonu, vendar je ta rešitev v redu.

Odgovorite Giskardu
1. KZKG ^ Gaara je dejal
  nazaj 12 let
  
  hvala ^ - ^
  
  Odgovorite na KZKG ^ Gaara
tino je dejal
nazaj 11 let

Zdravo! zelo dobro!
Imam vprašanje, prosim
zame bi šlo za naslednji primer:
ABCD 1111
DEFG 2222 45455
ABCD 1111
DEFG 2222

Vrstice so enake, vendar imajo presledke in nekaj več znakov ... ali to preverja isto besedo? ali po liniji? Razložim?
od zdaj naprej se vam najlepše zahvaljujem.
Objem

Odgovorite tino
1. KZKG ^ Gaara je dejal
  nazaj 11 let
  
  Živijo, kako gre
  Kot sem videl, to primerja vrstice in ne stolpce, zato bi v primeru, ki mi ga navedete, to odstranilo bodisi 1. vrstico bodisi 3., 2. in 4. vrstico, čeprav so skoraj enake, vendar niso 100% enake, ker imajo stolpec razlike. 😉
  
  Hvala za komentar ^ - ^
  
  Odgovorite na KZKG ^ Gaara
  1. TINE je dejal
    nazaj 11 let
    
    Hvala tebi!! prej je trajalo eno uro, da je Oracle odstranil dvojnike ... zdaj traja 30 sekund pri razvrščanju mačk !!
    
    Odgovorite na TINO
MegaBedder je dejal
nazaj 11 let

Zahtevam v PHP: S.

Odgovorite na MegaBedder
1. KZKG ^ Gaara je dejal
  nazaj 11 let
  
  Uff ... Sem PHP, zelo, zelo kratek sem, v resnici nisem programer 🙁
  
  Žal mi je.
  
  Odgovorite na KZKG ^ Gaara
2. brunocascio je dejal
  nazaj 11 let
  
  Za php je v uradni dokumentaciji PHP array_unique (…), kjer boste našli veliko pomembnih in učinkovitih funkcij.
  
  Glede razvrščanja ni potrebno, razen če ga potrebujete ... Čas izvedbe in pomnilnik sta zapravljena. (za to, kar je storjeno v prispevku)
  
  Lep pozdrav!
  
  Odgovor na brunocascio
čudak je dejal
nazaj 11 let

Vau !! slovar za uporabo kot surova sila! XD

Odgovorite na frikilui
Gustavo je dejal
nazaj 11 let

Zelo dobra kombinacija sort z uniq! Zelo mi je pomagalo odstraniti podvojene vrstice.

hvala

Odgovorite Gustavu
Gustavo je dejal
nazaj 11 let

Carlosov komentar kljub svoji aroganci ni veljaven. Pravi, da uporabite:

mačka pass.txt | uniq> pass-ready.txt

vendar je predpogoj za uniq, da je datoteka urejena. Bi moral o tem malo več razmisliti ali se pozanimati.

Odgovorite Gustavu
Eliuber je dejal
nazaj 9 let

zelo dobro, prihranili ste mi veliko časa pri mojem bashu

Odgovorite Eliuberju
Kremenčevi kamni je dejal
nazaj 9 let

awk '! array_temp [$ 0] ++' pass.txt> pass-ready.txt
s tem se črte odpravijo, ne da bi jih bilo treba naročiti.

Odgovor Pedru Flintstoneu
mininiyo je dejal
nazaj 8 let

Najlepša hvala za prispevek!

Čeprav bi bilo v redu, če bi ga lahko naredili edinstvenega, ne da bi spremenili vrstni red, ampak hej, enostaven in uporaben ukaz!

Odgovorite na miniminiyo
Felipe Gutierrez je dejal
nazaj 8 let

Hvala, zelo mi je pomagalo 😉

Odgovor Felipeju Gutiérrezu
Ernesto je dejal
nazaj 8 let

Jaz imam to
C000006158880201502051056088364 C00-06158880
C000007601673201503051056088364 C00-07601673
C000008659304201504051056088364 C00-08659304
T 0809074070562015120818144287185REAÑO RUBINOS EMILIA DORIS
T 0809092979972016010818144287185REAÑO RUBINOS EMILIA DORIS
C000005398451201501231044214375 C00-05398451
C000007674996201503051000000286 C00-07674996
C000008514288201504051000000463 C00-08514288
C000011613498201506051056088070 C00-11613498

Kako naj v datoteki poslikam samo dvojnike na naročnika, tiste, ki niso dvojniki, pa pustim v drugi?

naročnik je v položaju 23 (10 položajev)

Odgovorite na Ernesto
Fernando je dejal
nazaj 8 let

razvrsti -u -k 1,1 File.txt> result.txt

S tem datoteko razvrstite po prvem polju

Odgovorite Fernandu
Jaz sem diego je dejal
nazaj 4 let

2020 in še vedno služim, najlepša hvala!

Odgovorite na SoyDiego
sarah je dejal
nazaj 3 let

B con co thể hướng dẫn cách loại bỏ các dòng trùng lặp của nhiều besedilo datoteke v Linuxu ali Windowsu được không? Cũng như trường hợp của bạn, khi tôi tạo datoteka từ điển vì tôi chia nội dung ra nên Có khá nhiều datoteka và chắc chắn con nhiều dòng trùng lặp giữa Các datoteka. Ví dụ: Datoteka 1 của tôi co 5 dòng, datoteka 2 co 15 dòng (co 2 dòng trùng lặp với File 1. Tôi muốn co kết quả, File 1 vẫn giữ nguyên 5 dòng, File 2 th only only bỏ 2 dòng giống file 1 .
Như bạn biết co nhiều li do chúng ta ko thể gộp các datoteka txt đó lại với nhau, vì những besedilo datoteke từ điển rất ư là nhiều ký, chẳng hạn như Rockyou. Thực tế tôi muốn thực hiện điều này bên Windows hơn, và chắc chắn ko thể gộp chúng ở bên Windows được. 🙂 Hy vọng nhận được phản hồi từ bạn!

Odgovorite na sarah