ફાઇલમાંથી ડુપ્લિકેટ લાઇનો દૂર કરો

હું સૌથી વધુ વપરાયેલા પાસવર્ડ્સની ડિક્શનરી બનાવું છું, વપરાશકર્તાઓ દ્વારા લોકપ્રિય અથવા વારંવાર ઉપયોગમાં લેવાતા (… કેમ પૂછશો નહીં… હાહાહા), આ માટે હું અન્ય શબ્દકોશો વગેરેનો ટેક્સ્ટ લઈ રહ્યો છું, પરંતુ, હું મારી જાતને એવી પરિસ્થિતિમાં શોધી શકું છું કે ઘણાં ડુપ્લિકેટ પાસવર્ડો છે, અને મારે ડુપ્લિકેટ લાઇનોને દૂર કરવાની જરૂર છે.

બીજા શબ્દોમાં કહીએ તો, ઉદાહરણ તરીકે ... અમારી પાસે નીચેની ફાઇલ છે: પાસ.txt

અને તેની સામગ્રી છે:

આસદાસ્ડ
લોલા
પ્રેમ
આસદાસ્ડ
વિન્ડોઝ
સંચાલક
Linux
આસદાસ્ડ
પ્રેમ

 જેમ આપણે જોઈએ છીએ, અમે પુનરાવર્તિત કર્યું છે «પ્રેમ»અને«આસદાસ્ડઅને, બાદમાં 3 વખત. ડુપ્લિકેટ લાઇનોને કેવી રીતે દૂર કરવી?

આ આદેશ સાથે, તે કરવાનું સરળ છે:

cat pass.txt | sort | uniq > pass-listos.txt

આ કહેવાતી એક ફાઇલ જનરેટ કરશે પાસ-રેડી.ટી.ટી.એસ.ટી. જેમાં સમાવશે:

સંચાલક
આસદાસ્ડ
Linux
લોલા
પ્રેમ
વિન્ડોઝ

આદેશ શું કરે છે તે ખૂબ સરળ છે ...

  1. બિલાડી Pass.txt - of ફાઇલની સામગ્રીની સૂચિ.
  2. સૉર્ટ કરો - al સામગ્રીને મૂળાક્ષરો મુજબ સortર્ટ કરો.
  3. યુનિક - uplic ડુપ્લિકેટ લાઇનો દૂર કરો.
  4. > પાસ-રેડી.ટી.ટી.એસ.ટી. - the પહેલાનાં આદેશોનું પરિણામ, તેને પાસ-રેડી.ટેક્સ્ટ ફાઇલમાં મૂકો (જે તે અસ્તિત્વમાં નથી, તે બનાવશે)

તે સરળ છે ... મને હમણાં જ તે આદેશ મળ્યું સૉર્ટ કરો હા, તે ખૂબ સારું છે ... પણ, સાથે યુનિક, તેઓ કલાના રત્ન છે 😀

હું આશા રાખું છું કે તમે મદદરૂપ થયા છો.

સાદર

વોલપેપર: જો તમે વ wallpલપેપર ડાઉનલોડ કરવા માંગો છો «આઈ લવ #! / બિન / બેશ»અહીં કડી છે:

વ Wallpaperલપેપર ડાઉનલોડ કરો

તમારી ટિપ્પણી મૂકો

તમારું ઇમેઇલ સરનામું પ્રકાશિત કરવામાં આવશે નહીં. આવશ્યક ક્ષેત્રો સાથે ચિહ્નિત થયેલ છે *

*

*

  1. ડેટા માટે જવાબદાર: મિગ્યુએલ gelંજેલ ગેટóન
  2. ડેટાનો હેતુ: નિયંત્રણ સ્પામ, ટિપ્પણી સંચાલન.
  3. કાયદો: તમારી સંમતિ
  4. ડેટાની વાતચીત: કાયદાકીય જવાબદારી સિવાય ડેટા તૃતીય પક્ષને આપવામાં આવશે નહીં.
  5. ડેટા સ્ટોરેજ: cસેન્ટસ નેટવર્ક્સ (ઇયુ) દ્વારા હોસ્ટ કરેલો ડેટાબેઝ
  6. અધિકાર: કોઈપણ સમયે તમે તમારી માહિતીને મર્યાદિત, પુન recoverપ્રાપ્ત અને કા deleteી શકો છો.

  1.   કાર્લોસ જણાવ્યું હતું કે

    તમે સ sortર્ટ -u નો પણ ઉપયોગ કરી શકો છો.

    બ્લોગ પર અભિનંદન, મને તે ગમે છે!

    1.    કેઝેડકેજી ^ ગારા જણાવ્યું હતું કે

      અરે વાહ.
      કંઈ નથી, ટિપ્પણી કરવા બદલ ખૂબ ખૂબ આભાર 😀

      સ્વાગત 😉
      સાદર

  2.   ડિએગો જણાવ્યું હતું કે

    તેની સાથેની સમસ્યા એ છે કે તે શબ્દોના ક્રમમાં ફેરફાર કરે છે, તે કાર્ય કરે છે ... પરંતુ અંતે પરિણામ એ મૂળમાં ઘણાં અલગ પડે છે ક્રમમાં (જે કદાચ કેટલાક કિસ્સામાં તે મહત્વનું છે)

    1.    કેઝેડકેજી ^ ગારા જણાવ્યું હતું કે

      હા ખરેખર, આ શબ્દોને મૂળાક્ષરોથી ઓર્ડર આપે છે, તેથી જો ભિન્નતા વિના સામગ્રીની જરૂર હોય, તો આ સોલ્યુશન આદર્શ નથી.

    2.    કાર્લોસ જણાવ્યું હતું કે

      આસપાસ સ્ક્રૂ ન કરો, જો તમે સ commandર્ટ કમાન્ડ ન મૂકશો તો? કૃપા કરીને થોડો વધુ વિચારો અને બધું ચાવવું નહીં.

      બિલાડી Pass.txt | uniq> પાસ-તૈયાર.txt

      1.    એલ્યુબેર જણાવ્યું હતું કે

        તે કામ કરતું નથી, મેં પ્રયત્ન કર્યો

      2.    બોબ જણાવ્યું હતું કે

        કામ કરતું નથી કારણ કે "પુનરાવર્તિત" લાઇન્સ સતત હોવી જ જોઇએ

  3.   નામ વગરનું જણાવ્યું હતું કે

    ગ્રાસિઅસ

    તે એકદમ ઉપયોગી છે

  4.   ગિસકાર્ડ જણાવ્યું હતું કે

    ખૂબ સરસ! એક સરળ અને સ્પષ્ટ ઉપાય. મને તે જેવી વસ્તુઓ ગમે છે 🙂
    મારે સ્વીકારવું પડશે કે મેં અજગરમાં કંઈક કર્યું હોત, પરંતુ આ ઉકેલો બરાબર છે.

    1.    કેઝેડકેજી ^ ગારા જણાવ્યું હતું કે

      ગ્રાસિઅસ ^ - ^

  5.   ટીનો જણાવ્યું હતું કે

    નમસ્તે! ખૂબ સારું!
    કૃપા કરી મારી પાસે ક્વેરી છે
    તે નીચેના ઉદાહરણ માટે મારા માટે કામ કરશે:
    એબીસીડી 1111
    ડીઇએફજી 2222 45455
    એબીસીડી 1111
    ડીઇએફજી 2222

    પંક્તિઓ સમાન છે પરંતુ તેમની પાસે જગ્યાઓ અને થોડા વધુ અક્ષરો છે ... શું આ જ શબ્દની તપાસ કરે છે? અથવા લાઇન દ્વારા? હું સમજાવું?
    હવેથી, હું તમારો ઘણો આભાર માનું છું.
    આલિંગન

    1.    કેઝેડકેજી ^ ગારા જણાવ્યું હતું કે

      હેલો, જેમ
      મેં જોયું તેમ, આ ક linesલમ્સ નહીં પણ લાઇનોની તુલના કરે છે, તેથી તમે મને જે ઉદાહરણ આપો તે આ પહેલી લાઇન અથવા 1 જી, 3 જી અને 2 મી લાઇનને કા removeી નાખશે, જોકે તે લગભગ સમાન છે, તેઓ 4% સરખા નથી કારણ કે તેમની પાસે છે તફાવત સ્તંભ. 😉

      ટિપ્પણી Thanks - for માટે આભાર

      1.    ટીનો જણાવ્યું હતું કે

        તમારો આભાર!! ડુપ્લિકેટ્સને દૂર કરવામાં ઓરેકલ માટે એક કલાક લાગ્યો તે પહેલાં ... હવે તે બિલાડીના સ withર્ટ સાથે 30 સેકન્ડ લે છે !!

  6.   મેગાબેડર જણાવ્યું હતું કે

    મને તે PHP માં આવશ્યક છે: એસ

    1.    કેઝેડકેજી ^ ગારા જણાવ્યું હતું કે

      અફ… હું PHP નો ઉપયોગ કરું છું કારણ કે હું ખૂબ, ખૂબ ટૂંકું છું, હું ખરેખર પ્રોગ્રામર નથી

      માફ કરશો

    2.    બ્રુનોકાસિઓ જણાવ્યું હતું કે

      પીએચપી માટે PHફિશિયલ પીએચપી દસ્તાવેજીકરણમાં એરે_યુનિક (…) છે તમને ઘણા મહત્વપૂર્ણ અને કાર્યક્ષમ કાર્યો મળશે.

      સ theર્ટ સંબંધિત, જ્યાં સુધી તમને તેની જરૂર ન હોય ત્યાં સુધી, તે જરૂરી નથી ... એક્ઝેક્યુશનનો સમય અને મેમરી બગાડવામાં આવે છે. (પોસ્ટમાં જે થાય છે તે માટે)

      આભાર!

  7.   geek જણાવ્યું હતું કે

    વાહ !! જડ બળ તરીકે વાપરવા માટેનો એક શબ્દકોષ! XD

  8.   ગુસ્તાવો જણાવ્યું હતું કે

    યુનિક સાથે સ sortર્ટનું સંયોજન ખૂબ સારું છે! ડુપ્લિકેટ લાઇનોને દૂર કરવામાં તે મને ખૂબ મદદ કરી.

    ગ્રાસિઅસ

  9.   ગુસ્તાવો જણાવ્યું હતું કે

    તેના ઘમંડી હોવા છતાં, કાર્લોસની ટિપ્પણી માન્ય નથી. તેમણે વાપરવા માટે કહે છે:

    બિલાડી Pass.txt | uniq> પાસ-તૈયાર.txt

    જો કે યુનિકની પૂર્વશરત એ છે કે ફાઇલ મંગાવી છે. તમારે તેના વિશે થોડું વધારે વિચારવું અથવા પોતાને જાણ કરવી જોઈએ.

  10.   એલ્યુબેર જણાવ્યું હતું કે

    ખૂબ સારું, તમે મારા બ bશ ચલાવવાનો ઘણો સમય બચાવ્યો

  11.   ફ્લિન્સ્ટોન્સ જણાવ્યું હતું કે

    awk '! એરે_ટેમ્પ [$ 0] ++' pass.txt> પાસ-તૈયાર.txt
    આ સાથે લાઇન ઓર્ડર કર્યા વિના દૂર થઈ જાય છે.

  12.   મિનિમિનીયો જણાવ્યું હતું કે

    ફાળો બદલ ખૂબ ખૂબ આભાર!

    તેમ છતાં તે orderર્ડર બદલ્યા વિના તેને અનન્ય બનાવવા માટે સમર્થ હશે તે ઠંડી હશે, પણ હે, એક સરળ અને ઉપયોગી આદેશ!

  13.   ફેલિપ ગુટીરેઝ જણાવ્યું હતું કે

    આભાર, તે મને ખૂબ મદદ કરી 😉

  14.   ernesto જણાવ્યું હતું કે

    મારી પાસે આ છે
    સી 000006158880201502051056088364 સી 00-06158880
    સી 000007601673201503051056088364 સી 00-07601673
    સી 000008659304201504051056088364 સી 00-08659304
    ટી 0809074070562015120818144287185REAÑO રુબિઓસ એમિલિયા ડોરિસ
    ટી 0809092979972016010818144287185REAÑO રુબિઓસ એમિલિયા ડોરિસ
    સી 000005398451201501231044214375 સી 00-05398451
    સી 000007674996201503051000000286 સી 00-07674996
    સી 000008514288201504051000000463 સી 00-08514288
    સી 000011613498201506051056088070 સી 00-11613498

    ફાઇલમાંના સબ્સ્ક્રાઇબર્સ દીઠ ડુપ્લિકેટ્સને કેવી રીતે પેઇન્ટ કરું અને બિન-ડુપ્લિકેટ્સને બીજામાં છોડી શકું તે હું કેવી રીતે મેળવી શકું?

    ગ્રાહક પોઝ 23 માં છે (10 હોદ્દા)

  15.   ફર્નાન્ડો જણાવ્યું હતું કે

    સ -ર્ટ કરો -u -k 1,1 File.txt> પરિણામ.txt

    આ પ્રથમ ક્ષેત્ર દ્વારા ફાઇલને સortsર્ટ કરે છે

  16.   હું ડિએગો છું જણાવ્યું હતું કે

    2020 અને હજી પણ સેવા આપી રહ્યો છે, ખૂબ ખૂબ આભાર!

  17.   સારાહ જણાવ્યું હતું કે

    લિનક્સ અથવા વિન્ડોઝ kc không ફાઇલ લખાણ લખવા માટે કોઈ ફાઇલ લખાણ લખાણમાં લગાવી શકાય છે? C nng như trường hợp của bạn, khi tôi tạo từ .iển vì tôi chia nội dung ra nên có khá nhiều file và chắc chắn con nhiều dòng trùng lặp giữa các file. ફાઇલ ફાઇલ: ફાઇલ 1 ફાઇલ સાથે 5 દિવસ, ફાઇલ 2 સાથે 15 દિવસ (સહ 2 ફાઇલ ફાઇલની ફાઇલ 1. તેની ફાઇલ, ફાઇલ ફાઇલ 1 ફાઇલ 5 ફાઇલ, ફાઇલ 2 ફક્ત 2 ફાઇલ ફાઇલ ફાઇલ 1 છે) .
    Như bến biết co nhiều li do chúng ta ko thộ gáp các file txt ạ lại với nhau, vì những file text từ ểiển rất ư l. Nhiều ký, chạng hạn nh. Rockyou. વિન્ડોઝ હơન દ્વારા તમે તેના પર સહેલાઇથી કામ કરી શકો છો, પરંતુ વિન્ડોઝ úc દ્વારા ચúપ ચắન કોપ છે. 🙂 Hy vọng nhận được phản hồi từ bạn!