Unë jam duke bërë një fjalor të fjalëkalimeve më të përdorura, të njohura ose shpesh më të përdorurat nga përdoruesit (… Mos pyet pse… HAHAHA), për këtë po marr tekste nga fjalorë të tjerë, etj.
Kjo është, për shembull ... ne kemi skedarin e mëposhtëm: kaloj.txt
Dhe përmbajtja e tij është:
asda
lola
dashuri
asda
dritaret
admin
linux
asda
dashuri
Siç e shohim, ne kemi përsëritur «dashuri»Y«asda«, Kjo e fundit 3 herë. Si të hiqni linjat e kopjuara?
Për ta bërë atë është e thjeshtë, me këtë komandë:
cat pass.txt | sort | uniq > pass-listos.txt
Kjo do të gjenerojë një skedar të quajtur të kalojë gati.txt e cila do të përmbajë:
admin
asda
linux
lola
dashuri
dritaret
Ajo që bën komanda është SHUM e thjeshtë ...
- leje mace.txt - »Renditni përmbajtjen e skedarit.
- lloj - »Renditni përmbajtjen sipas alfabetit.
- unike - »Eliminoni linjat e kopjuara.
- > kaloni gati.txt - »Rezultati i komandave të mëparshme, vendoseni në skedarin pass-ready.txt (e cila, pasi nuk ekziston, do ta krijojë atë)
Thatshtë kaq e thjeshtë ... Sapo zbulova se komanda lloj po, është shumë mirë ... por, së bashku me unike, ato janë një xhevahir i artit
Shpresoj se keni qenë i dobishëm.
të fala
Ju gjithashtu mund të përdorni sort -u.
Urime për blogun, e dua!
Po mirë
Asgjë, faleminderit shumë për komentin
Mirësevini
të fala
Problemi me këtë është se ndryshon renditjen e fjalëve, funksionon ... por në fund rezultati ndryshon shumë nga origjinali në renditje (i cili mbase në ndonjë rast ka rëndësi)
Po me të vërtetë, kjo i rendit fjalët sipas alfabetit, kështu që nëse përmbajtja ishte e nevojshme PA variacione, atëherë kjo zgjidhje nuk është zgjidhja ideale.
Mos vidhos, po sikur të mos vendosësh komandën e renditjes? ju lutem mendoni pak më shumë dhe mos i përtypni gjithçka.
leje mace.txt | uniq> kaloj-gati.txt
nuk funksionon, e provova
nuk funksionon sepse linjat "e përsëritura" duhet të jenë të vazhdueshme
falënderim
është mjaft e dobishme
Shume mire! Një zgjidhje e thjeshtë dhe e qartë. Më pëlqejnë gjëra të tilla
Më duhet të pranoj se do të kisha bërë diçka në Python por kjo zgjidhje është e mirë.
Falënderim ^ - ^
Përshëndetje! shume mire!
Unë kam një pyetje ju lutem
do të funksiononte për mua për shembullin vijues:
ABCD 1111
DEFG 2222 45455
ABCD 1111
DEFG 2222
Rreshtat janë të njëjtë, por ato kanë hapësira dhe disa karaktere më shumë ... a kontrollon kjo për të njëjtën fjalë? apo me rresht? Une e shpjegoj?
tani e tutje, ju falënderoj shumë.
Një përqafim
Hi si po shkon
Siç pashë, kjo krahason linjat dhe jo kolonat, kështu që në shembullin që më jepni kjo do të hiqte ose vijën e parë ose të 1-të, rreshtin e 3-të dhe të 2-të edhe pse janë pothuajse identike, ato nuk janë 4% identike sepse ato kanë një kolonë ndryshimi. 😉
Faleminderit për komentin ^ - ^
Fale teje!! para se të duhej një orë që orakulli të eleminonte kopjimet ... tani duhen 30 sekonda me llojin e maces !!
Unë e kërkoj atë në PHP: S
Uff ... Unë jam PHP, jam shumë, shumë i shkurtër, në të vërtetë nuk jam programues
Më vjen keq.
Për php ekziston array_unique (…) në dokumentacionin zyrtar PHP do të gjeni shumë funksione të rëndësishme dhe efikase.
Lidhur me llojin, nëse nuk ju nevojitet, nuk është e nevojshme ... Koha e ekzekutimit dhe kujtesa janë humbur. (për atë që është bërë në postim)
Përshëndetje!
Uau !! një fjalor për t’u përdorur si forcë brutale !! XD
Shumë i mirë kombinimi i llojit me uniq! Më ndihmoi shumë për të hequr linjat e kopjuara.
Falënderim
Komenti i Carlos, megjithë arrogancën e tij, nuk është i vlefshëm. Ai thotë të përdorni:
leje mace.txt | uniq> kaloj-gati.txt
megjithatë një parakusht i uniq është që skedari të renditet. Duhet ta kishit menduar pak më shumë ose të informonit më parë.
shumë mirë, më ke kursyer shumë kohë duke drejtuar bashin tim
awk '! array_temp [$ 0] ++' pass.txt> kalimi i gatshëm.txt
me këtë linjat eliminohen pa pasur nevojë të porosisni.
Faleminderit shumë për kontributin!
Edhe pse do të ishte mirë të ishe në gjendje ta bëje unike pa ndryshuar rendin, por hej, një komandë e lehtë dhe e dobishme!
Faleminderit, më ndihmoi shumë
Unë e kam këtë
C000006158880201502051056088364 C00-06158880
C000007601673201503051056088364 C00-07601673
C000008659304201504051056088364 C00-08659304
T 0809074070562015120818144287185REAÑO RUBIÑOS EMILIA DORIS
T 0809092979972016010818144287185REAÑO RUBIÑOS EMILIA DORIS
C000005398451201501231044214375 C00-05398451
C000007674996201503051000000286 C00-07674996
C000008514288201504051000000463 C00-08514288
C000011613498201506051056088070 C00-11613498
Si mund ta marr atë për të pikturuar vetëm kopjimet për pajtimtar në një skedar dhe për të lënë ato që nuk janë kopje në një tjetër?
pajtimtari është në pozicionin 23 (10 pozicione)
rendit -u -k 1,1 Skedar.txt> rezultat.txt
Kjo rendit skedarin sipas fushës së parë
2020 dhe akoma duke shërbyer, faleminderit shumë!
Bëni bashkëpunimin tuaj ndërkombëtar të cỏc bỏ các dòng trùng lặp của nhiều teksti i skedarit trong Linux ose Windows ôc không? Cũng như trường hợp của bạn, khi tôi tạo skedar từ điển vì tôi chia nội dung ra nên Có khá nhiều skedar và chắc chắn con nhiều dòng trùng lặp giữa Dosja Các. Në fotografi: Dosja 1, 5 skedarë, skedari 2 15 fotografi (bashkë 2 skedarë në skedarin 1. Dosja tjetër, Skedari 1, poshtë 5 skedarët, Skedari 2 vetëm 2 skedari i parë 1 .
Như bạn biết co nhiều li do chúng ta ko thể gộp các skedar txt đó lại với nhau, vì những teksti i skedarit në điển rất ư là nhiều ký, chẳng hạn như Rockyou. Thực tế tôi muốn thực hiện điều này bên Windows hơn, và chắc chắn ko thể gộp chúng ở bên Windows .c. Ọ Hy vọng nhận được phản hồi từ bạn!