Ukloni duple linije iz datoteke

Uklonite duplikate linija iz datoteke

Izrađujem rječnik najčešće korištenih lozinki, popularnih ili najčešće korišćenih od korisnika (... Ne pitajte zašto ... HAHAHA), za ovo preuzimam tekst iz drugih rječnika itd., ali, nalazim se u situaciji da postoji mnogo dupliciranih lozinki i moram ukloniti duplicirane retke.

Drugim riječima, na primjer ... imamo sljedeću datoteku: pass.txt

A njegov sadržaj je:

asdas
lola
ljubav
asdas
prozori
admin
linux
asdas
ljubav

Kao što vidimo, ponovili smo «ljubav"Y"asdas«, Posljednji 3 puta. Kako ukloniti duplikate linija?

Pomoću ove naredbe to je jednostavno učiniti:

cat pass.txt | sort | uniq > pass-listos.txt

Ovo će generirati datoteku koja se zove pass-ready.txt koji će sadržati:

admin
asdas
linux
lola
ljubav
prozori

Naredba je VRLO jednostavna ...

mačka pass.txt - »Navedite sadržaj datoteke.
sudbina - »Razvrstajte sadržaj po abecedi.
jedinstven - »Uklonite duplikate linija.
> pass-ready.txt - »Rezultat prethodnih naredbi, stavite ga u datoteku pass-ready.txt (koja će ga, kako ne postoji, stvoriti)

To je tako jednostavno ... Upravo sam otkrio tu naredbu sudbina da, vrlo je dobro ... ali, zajedno sa jedinstven, oni su dragulj umjetnosti 😀

Nadam se da ste bili od pomoći.

Saludos

tapeta: Ako želite preuzeti pozadinu «Volim #! / Bin / bash»Evo veze:

Download pozadina

Ostavite komentar Otkaži odgovor

Carlos rekao je
čini 12 godina

Takođe možete koristiti sort -u.

Čestitam na blogu, sviđa mi se!

Odgovor Carlosu
1. KZKG ^ Gaara rekao je
  čini 12 godina
  
  Da, tačno.
  Ništa, puno vam hvala na komentaru 😀
  
  Dobrodošli 😉
  Saludos
  
  Odgovorite na KZKG ^ Gaara
Diego rekao je
čini 12 godina

Problem s tim je što mijenja redoslijed riječi, djeluje ... ali na kraju se rezultat puno razlikuje od originala po redoslijedu (što je možda u nekom slučaju važno)

Odgovorite Diegu
1. KZKG ^ Gaara rekao je
  čini 12 godina
  
  Da, zaista, ovo uređuje riječi po abecedi, pa ako je sadržaj potreban BEZ varijacija, ovo rješenje nije idealno.
  
  Odgovorite na KZKG ^ Gaara
2. Carlos rekao je
  čini 11 godina
  
  Ne zajebavajte se, šta ako vam padne na pamet da ne date naredbu za sortiranje? molim te razmisli malo više i nemoj da se sve prežvaka.
  
  cat pass.txt | uniq> pass-ready.txt
  
  Odgovor Carlosu
  1. Eliuber rekao je
    čini 9 godina
    
    ne radi, probao sam
    
    Odgovorite Eliuberu
  2. bob rekao je
    čini 6 godina
    
    ne radi jer "ponovljeni" redovi moraju biti kontinuirani
    
    Odgovori bobu
neimenovan rekao je
čini 12 godina

hvala

vrlo je korisno

Odgovorite na neimenovani
giskard rekao je
čini 12 godina

Veoma dobro! Jednostavno i jasno rješenje. Sviđaju mi se takve stvari 🙂
Moram priznati da bih učinio nešto u Pythonu, ali ovo rješenje je u redu.

Odgovorite Giskardu
1. KZKG ^ Gaara rekao je
  čini 12 godina
  
  hvala ^ - ^
  
  Odgovorite na KZKG ^ Gaara
stvarno rekao je
čini 11 godina

Zdravo! veoma dobro!
Imam upit, molim
to bi mi odgovaralo za sljedeći primjer:
ABCD 1111
DEFG 2222 45455
ABCD 1111
DEFG 2222

Redovi su isti, ali imaju razmake i još nekoliko znakova ... provjerava li to istu riječ? ili linijom? Objašnjavam?
od sada, puno vam hvala.
Zagrljaj

Odgovori tinu
1. KZKG ^ Gaara rekao je
  čini 11 godina
  
  Zdravo, kako ide
  Kao što sam vidio, ovo uspoređuje linije, a ne stupce, pa bi u primjeru koji mi date ovo uklonilo ili 1. redak ili 3., 2. i 4. redak, iako su gotovo identični, nisu 100% identični jer imaju stupac razlike. 😉
  
  Hvala na komentaru ^ - ^
  
  Odgovorite na KZKG ^ Gaara
  1. Tino rekao je
    čini 11 godina
    
    Zahvaljujući tebi!! prije nego što je satu trebalo da Oracle ukloni duplikate ... sada je potrebno 30 sekundi za sortiranje mačaka !!
    
    Odgovorite TINO
MegaBedder rekao je
čini 11 godina

Potreban mi je u PHP: S

Odgovorite MegaBedderu
1. KZKG ^ Gaara rekao je
  čini 11 godina
  
  Uff ... Ja sam PHP, jako sam, jako nizak, nisam baš programer 🙁
  
  Žao mi je
  
  Odgovorite na KZKG ^ Gaara
2. brunocascio rekao je
  čini 11 godina
  
  Za php postoji array_unique (...) u službenoj PHP dokumentaciji pronaći ćete mnoge važne i efikasne funkcije.
  
  Što se tiče sortiranja, osim ako vam je potrebna, nije potrebno ... Vrijeme izvršenja i memorija se troše. (za ono što je urađeno u postu)
  
  Pozdrav!
  
  Odgovoriti na brunocascio
štreber rekao je
čini 11 godina

Wow !! rječnik za upotrebu kao grubu silu !! XD

Odgovoriti frikilui
Gustavo rekao je
čini 11 godina

Vrlo dobra kombinacija sort sa uniq! Puno mi je pomoglo da uklonim duplikate linija.

hvala

Odgovorite Gustavu
Gustavo rekao je
čini 11 godina

Carlosov komentar, uprkos svojoj aroganciji, nije valjan. Kaže da se koristi:

cat pass.txt | uniq> pass-ready.txt

međutim preduvjet uniq-a je da je datoteka naručena. Trebali ste malo više razmisliti o tome ili se informirati prije.

Odgovorite Gustavu
Eliuber rekao je
čini 9 godina

vrlo dobro, uštedjeli ste mi puno vremena radeći moj bash

Odgovorite Eliuberu
Kremenci rekao je
čini 9 godina

awk '! array_temp [$ 0] ++' pass.txt> pass-ready.txt
ovim se linije uklanjaju bez naručivanja.

Odgovor Pedru Flintstoneu
miniminime rekao je
čini 8 godina

Hvala vam puno na doprinosu!

Iako bi bilo super kad bismo to mogli učiniti jedinstvenim bez promjene redoslijeda, ali hej, lagana i korisna naredba!

Odgovoriti na miniminiyo
Felipe Gutierrez rekao je
čini 8 godina

Hvala, puno mi je pomoglo 😉

Odgovor Felipeu Gutiérrezu
ernesto rekao je
čini 8 godina

Imam ovo
C000006158880201502051056088364 C00-06158880
C000007601673201503051056088364 C00-07601673
C000008659304201504051056088364 C00-08659304
T 0809074070562015120818144287185REAÑO RUBIÑOS EMILIA DORIS
T 0809092979972016010818144287185REAÑO RUBIÑOS EMILIA DORIS
C000005398451201501231044214375 C00-05398451
C000007674996201503051000000286 C00-07674996
C000008514288201504051000000463 C00-08514288
C000011613498201506051056088070 C00-11613498

Kako mogu postići da u datoteci obojim samo duplikate po pretplatniku, a one koji nisu duplikati ostavim u drugoj?

pretplatnik je na poz 23 (10 pozicija)

Odgovori na ernesto
fernando rekao je
čini 8 godina

sort -u -k 1,1 File.txt> result.txt

Ovo sortira datoteku po prvom polju

Odgovorite Fernandu
Ja sam diego rekao je
čini 4 godina

2020. i još uvijek služim, puno vam hvala!

Odgovorite na SoyDiego
Sarah rekao je
čini 3 godina

Da li ste u mogućnosti da sačuvate loš račun, da li želite da otvorite tekst datoteke u Linuxu ili Windowsu? Cũng như trường hợp của bạn, khi tôi tạo file từ điển vì tôi chia nội dung ra nên Có khá nhiều file và chắc chắn con nhiều dòng trùng lặp giữa Các file. Ví dụ: Datoteka 1 của tôi co 5 dòng, datoteka 2 co 15 dòng (co 2 dòng trùng lặp với File 1. Tôi muốn co kết quả, Datoteka 1 vẫn giữ nguyên 5 dòng, Datoteka 2 samo bỏ 2 dòng giống datoteka 1 .
Như bạn biết co nhiều li do chúng ta ko thể gộp các file txt đó lại với nhau, vì những text file từ điển rất ư là nhiều ký, chẳng hạn như Rockyou. Ovo je najprikladnije za Windows operativni sistem, čak i za rad sa Windowsom. Hy vọng nhận được phản hồi từ bạn!

Odgovoriti sarah