Bir dosyadan yinelenen satırları kaldırın

Dosyadan yinelenen satırları kaldırın

En çok kullanılan, popüler veya kullanıcılar tarafından en sık kullanılan şifrelerin bir sözlüğünü yapıyorum (… Neden diye sorma… HAHAHA), bunun için diğer sözlüklerden vb. metin alıyorum, ancak kendimi birçok yinelenen parolanın olduğu durumda buluyorum ve yinelenen satırları ortadan kaldırmam gerekiyor.

Yani, örneğin ... aşağıdaki dosyamız var: pass.txt

Ve içeriği:

asdasd
Lola
Aşk
asdasd
pencereler
Gizem
linux
asdasd
Aşk

Gördüğümüz gibi, tekrarladık «Aşk»Y«asdasd«, Son 3 kez. Yinelenen satırlar nasıl kaldırılır?

Bunu yapmak, bu komutla basittir:

cat pass.txt | sort | uniq > pass-listos.txt

Bu adında bir dosya oluşturacak pass-ready.txt içerecek:

Gizem
asdasd
linux
Lola
Aşk
pencereler

Komutun yaptığı şey ÇOK basit ...

kedi geçişi.txt - »Dosyanın içeriğini listeleyin.
tür - »İçeriği alfabetik olarak sıralayın.
tek - »Yinelenen satırları ortadan kaldırın.
> pass-ready.txt - »Önceki komutların sonucu, bunu pass-ready.txt (var olmadığı için onu yaratacak)

Bu kadar basit ... Ben sadece komutun tür evet, çok güzel ... ama birlikte tekonlar bir sanat mücevheri 😀

Umarım yardımcı olmuşsundur.

selamlar

Duvar kağıdı: Duvar kağıdını indirmek istiyorsanız «#! / Bin / bash seviyorum"Bağlantı burada:

Duvar Kağıdını İndir

Yorumunuzu bırakın Cevabı iptal et

Carlos dijo
önce 12 yıl

Sort -u da kullanabilirsiniz.

Blog için tebrikler, onu seviyorum!

Carlos için yanıt
1. KZKG ^ Gaara dijo
  önce 12 yıl
  
  Evet doğru.
  Hiçbir şey, yorum yaptığınız için çok teşekkür ederim 😀
  
  Hoş geldiniz 😉
  selamlar
  
  KZKG ^ Gaara için yanıtla
Diego dijo
önce 12 yıl

Bununla ilgili sorun, kelimelerin sırasını değiştirmesidir, işe yarar ... ama sonuçta, sonuç sırasına göre orijinalinden çok farklıdır (belki de bazı durumlarda önemlidir)

Diego'ya yanıt ver
1. KZKG ^ Gaara dijo
  önce 12 yıl
  
  Evet, gerçekten, bu sözcükleri alfabetik olarak sıralar, bu nedenle içeriğe varyasyonlar OLMADAN ihtiyaç duyulursa, bu çözüm ideal çözüm değildir.
  
  KZKG ^ Gaara için yanıtla
2. Carlos dijo
  önce 11 yıl
  
  Etrafta dolaşmayın, ya sıralama komutunu koymamanız aklınıza gelirse? lütfen biraz daha düşünün ve her şeyi çiğnemeyin.
  
  kedi pass.txt | uniq> pass-ready.txt
  
  Carlos için yanıt
  1. Eliuber dijo
    önce 9 yıl
    
    işe yaramıyor, denedim
    
    Eliuber için yanıt
  2. tahıl dijo
    önce 6 yıl
    
    çalışmıyor çünkü "tekrarlanan" satırların sürekli olması gerekiyor
    
    Bob'a yanıt ver
isimsiz dijo
önce 12 yıl

teşekkürler

oldukça kullanışlı

İsimsiz yanıtla
Giskard dijo
önce 12 yıl

Çok iyi! Basit ve net bir çözüm. Böyle şeyleri severim 🙂
Python'da bir şeyler yapacağımı itiraf etmeliyim ama bu çözüm iyi.

Giskard'ı yanıtla
1. KZKG ^ Gaara dijo
  önce 12 yıl
  
  teşekkürler ^ - ^
  
  KZKG ^ Gaara için yanıtla
tino dijo
önce 11 yıl

Merhaba! çok iyi!
Bir sorum var lütfen
benim için aşağıdaki örnek için işe yarar:
ABCD1111
DEFG 2222 45455
ABCD1111
DEFG2222

Satırlar aynı ama boşluklar ve daha fazla karakter var ... Bu aynı kelimeyi kontrol ediyor mu? veya satırla? Açıklarım?
şu andan itibaren çok teşekkür ederim.
Sarılmak

Tino için yanıtla
1. KZKG ^ Gaara dijo
  önce 11 yıl
  
  Merhaba böyle,
  Gördüğüm gibi, bu sütunları değil satırları karşılaştırıyor, bu yüzden bana verdiğiniz örnekte bu, hemen hemen aynı olmalarına rağmen 1. satırı veya 3., 2. ve 4. satırı kaldıracaktır,% 100 özdeş değildirler bir fark sütununa sahip. 😉
  
  ^ - ^ yorumunuz için teşekkürler
  
  KZKG ^ Gaara için yanıtla
  1. TINE dijo
    önce 11 yıl
    
    Sayende!! daha önce oracle'ın kopyaları ortadan kaldırması bir saat sürdü ... şimdi kedi sıralaması 30 saniye sürüyor !!
    
    TINO'ya yanıtla
Mega Bedder dijo
önce 11 yıl

PHP: S'de gerekli

MegaBedder için yanıt
1. KZKG ^ Gaara dijo
  önce 11 yıl
  
  Uff ... Ben PHP'im, çok kısayım, gerçekten programcı değilim 🙁
  
  Özür dilerim.
  
  KZKG ^ Gaara için yanıtla
2. Brunocascio dijo
  önce 11 yıl
  
  Php için, resmi PHP belgelerinde array_unique (…) vardır, birçok önemli ve verimli işlev bulacaksınız.
  
  Sıralama ile ilgili olarak, ihtiyacınız olmadıkça gerekli değildir ... Yürütme süresi ve bellek boşa harcanır. (gönderide ne yapıldığı için)
  
  Selamlar!
  
  Brunocascio için yanıt
Geek dijo
önce 11 yıl

Vay !! kaba kuvvet olarak kullanılacak bir sözlük !! XD

Frikilui için yanıt
Gustavo dijo
önce 11 yıl

Uniq ile sıralama kombinasyonu çok iyi! Yinelenen satırları kaldırmam çok yardımcı oldu.

teşekkürler

Gustavo'ya yanıt ver
Gustavo dijo
önce 11 yıl

Carlos'un yorumu, küstahlığına rağmen geçerli değil. Kullanmak için diyor:

kedi pass.txt | uniq> pass-ready.txt

ancak uniq'in ön koşulu, dosyanın sıralanmasıdır. Bunu biraz daha düşünmeli veya önceden bilgilendirmeliydin.

Gustavo'ya yanıt ver
Eliuber dijo
önce 9 yıl

çok iyi, bash'ımı çalıştırırken bana çok zaman kazandırdın

Eliuber için yanıt
Çakmaktaşı dijo
önce 9 yıl

awk '! array_temp [$ 0] ++' pass.txt> pass-ready.txt
bu sayede siparişe gerek kalmadan hatlar ortadan kalkar.

Pedro Flintstone için yanıt
Miniminiyo dijo
önce 8 yıl

Katkı için çok teşekkür ederim!

Sırasını değiştirmeden onu benzersiz kılmak harika olsa da, ama hey, kolay ve kullanışlı bir komut!

Miniminiyo için yanıt
Felipe Gutierrez dijo
önce 8 yıl

Teşekkür ederim, bana çok yardımcı oldu 😉

Felipe Gutiérrez için yanıt
ernesto dijo
önce 8 yıl

bu bende var
C000006158880201502051056088364 C00-06158880
C000007601673201503051056088364 C00-07601673
C000008659304201504051056088364 C00-08659304
T 0809074070562015120818144287185REAÑO RUBIÑOS EMILIA DORIS
T 0809092979972016010818144287185REAÑO RUBIÑOS EMILIA DORIS
C000005398451201501231044214375 C00-05398451
C000007674996201503051000000286 C00-07674996
C000008514288201504051000000463 C00-08514288
C000011613498201506051056088070 C00-11613498

Bir dosyada yalnızca abone başına yinelenenleri boyayıp yinelenmeyenleri başka bir dosyada bırakmasını nasıl sağlayabilirim?

abone pozisyon 23'te (10 pozisyon)

Ernesto için yanıt
Fernando dijo
önce 8 yıl

sort -u -k 1,1 Dosya.txt> sonuç.txt

Bu, dosyayı ilk alana göre sıralar

Fernando'ya yanıt ver
Ben diego dijo
önce 4 yıl

2020 ve hala hizmet veriyor, çok teşekkür ederim!

SoyDiego için yanıt
sarah dijo
önce 3 yıl

Dosya metnini Linux veya Windows'a mı bağladınız? Cũng như trường hợp của bạn, khi tôi tạo file từ điển vì tôi chia nội dung ra nên Có khá nhiều dosyası và chắc chắn con nhiều dòng Cữp trgi dosyası. Ví dụ: Dosya 1 của tôi co 5 dòng, file 2 co 15 dòng (co 2 dòng trùng lặp với Dosya 1. Tôi muốn co kết quả, Dosya 1 vẫn giữ nguyên 5 dòng, Dosya 2 thì sadece 2 dòng dosya .
Dosya metninizi giriniz. Daha fazla bilgi için, Windows'tan, Windows'tan, Windows'tan, Windows'tan. 🙂 Hy vọng nhận được phản hồi từ bạn!

Sarah için yanıt