ஒரு கோப்பிலிருந்து நகல் வரிகளை அகற்று

பயனர்களால் பிரபலமான அல்லது அடிக்கடி பயன்படுத்தப்படும் கடவுச்சொற்களின் அகராதியை நான் உருவாக்குகிறேன் (… ஏன் என்று கேட்க வேண்டாம்… ஹாஹா), இதற்காக நான் மற்ற அகராதிகள் போன்றவற்றிலிருந்து உரையை எடுத்துக்கொள்கிறேன், ஆனால், பல போலி கடவுச்சொற்கள் உள்ளன என்ற சூழ்நிலையில் என்னைக் காண்கிறேன், மேலும் நான் நகல் வரிகளை அகற்ற வேண்டும்.

வேறுவிதமாகக் கூறினால், எடுத்துக்காட்டாக ... எங்களிடம் பின்வரும் கோப்பு உள்ளது: pass.txt

அதன் உள்ளடக்கம்:

asdasd
லோலா
அன்பு
asdasd
விண்டோஸ்
நிர்வாகம்
லினக்ஸ்
asdasd
அன்பு

 நாம் பார்க்கும்போது, ​​நாங்கள் மீண்டும் மீண்டும் செய்துள்ளோம் «அன்பு"மேலும்"asdasd«, பிந்தைய 3 முறை. நகல் வரிகளை எவ்வாறு அகற்றுவது?

இதைச் செய்வது எளிது, இந்த கட்டளையுடன்:

cat pass.txt | sort | uniq > pass-listos.txt

இது ஒரு கோப்பை உருவாக்கும் pass-ready.txt இதில் இருக்கும்:

நிர்வாகம்
asdasd
லினக்ஸ்
லோலா
அன்பு
விண்டோஸ்

கட்டளை என்ன செய்கிறது என்பது மிகவும் எளிது ...

  1. பூனை pass.txt - the கோப்பின் உள்ளடக்கத்தை பட்டியலிடுங்கள்.
  2. வகையான - the உள்ளடக்கத்தை அகர வரிசைப்படி வரிசைப்படுத்துங்கள்.
  3. unq - d நகல் வரிகளை அகற்றவும்.
  4. > pass-ready.txt - command முந்தைய கட்டளைகளின் விளைவாக, அதை pass-ready.txt கோப்பில் வைக்கவும் (இது இல்லாததால், அதை உருவாக்கும்)

இது மிகவும் எளிது ... நான் கட்டளையை கண்டுபிடித்தேன் வகையான ஆம், இது மிகவும் நல்லது ... ஆனால், உடன் unq, அவை கலையின் நகை

நீங்கள் உதவியாக இருந்தீர்கள் என்று நம்புகிறேன்.

மேற்கோளிடு

வால்பேப்பர்: நீங்கள் வால்பேப்பரை பதிவிறக்க விரும்பினால் «ஐ லவ் #! / பின் / பாஷ்»இங்கே இணைப்பு:

வால்பேப்பரைப் பதிவிறக்கவும்

உங்கள் கருத்தை தெரிவிக்கவும்

உங்கள் மின்னஞ்சல் முகவரி வெளியிடப்பட்ட முடியாது. தேவையான புலங்கள் குறிக்கப்பட்டிருக்கும் *

*

*

  1. தரவுக்கு பொறுப்பு: மிகுவல் ஏஞ்சல் கேடன்
  2. தரவின் நோக்கம்: கட்டுப்பாட்டு ஸ்பேம், கருத்து மேலாண்மை.
  3. சட்டபூர்வமாக்கல்: உங்கள் ஒப்புதல்
  4. தரவின் தொடர்பு: சட்டபூர்வமான கடமையால் தவிர மூன்றாம் தரப்பினருக்கு தரவு தெரிவிக்கப்படாது.
  5. தரவு சேமிப்பு: ஆக்சென்டஸ் நெட்வொர்க்குகள் (EU) வழங்கிய தரவுத்தளம்
  6. உரிமைகள்: எந்த நேரத்திலும் உங்கள் தகவல்களை நீங்கள் கட்டுப்படுத்தலாம், மீட்டெடுக்கலாம் மற்றும் நீக்கலாம்.

  1.   கார்லோஸ் அவர் கூறினார்

    நீங்கள் sort -u ஐப் பயன்படுத்தலாம்.

    வலைப்பதிவில் வாழ்த்துக்கள், நான் அதை விரும்புகிறேன்!

    1.    KZKG ^ காரா அவர் கூறினார்

      ஆம் சரியே.
      ஒன்றுமில்லை, கருத்து தெரிவித்தமைக்கு மிக்க நன்றி

      வருக 😉
      மேற்கோளிடு

  2.   டியாகோ அவர் கூறினார்

    அதில் உள்ள சிக்கல் என்னவென்றால், இது சொற்களின் வரிசையை மாற்றுகிறது, அது செயல்படுகிறது ... ஆனால் முடிவில் இதன் விளைவாக அசலில் இருந்து வரிசையில் நிறைய வேறுபடுகிறது (இது சில சந்தர்ப்பங்களில் இது முக்கியமானது)

    1.    KZKG ^ காரா அவர் கூறினார்

      ஆம், இது சொற்களை அகர வரிசைப்படி ஆர்டர் செய்கிறது, எனவே வேறுபாடுகள் இல்லாமல் உள்ளடக்கம் தேவைப்பட்டால், இந்த தீர்வு சிறந்ததல்ல.

    2.    கார்லோஸ் அவர் கூறினார்

      சுற்றி திருக வேண்டாம், வரிசை கட்டளையை வைக்காதது உங்களுக்கு ஏற்பட்டால் என்ன செய்வது? தயவுசெய்து இன்னும் கொஞ்சம் யோசித்துப் பாருங்கள், எல்லாவற்றையும் மெல்ல வேண்டாம்.

      பூனை pass.txt | uniq> pass-ready.txt

      1.    எலியுபர் அவர் கூறினார்

        அது வேலை செய்யாது, நான் முயற்சித்தேன்

      2.    பாப் அவர் கூறினார்

        வேலை செய்யாது, ஏனெனில் "மீண்டும் மீண்டும்" கோடுகள் தொடர்ச்சியாக இருக்க வேண்டும்

  3.   பெயரிடப்படாதது அவர் கூறினார்

    நன்றி

    இது மிகவும் பயனுள்ளதாக இருக்கும்

  4.   கிஸ்கார்ட் அவர் கூறினார்

    மிகவும் நல்லது! ஒரு எளிய மற்றும் தெளிவான தீர்வு. அது போன்ற விஷயங்களை நான் விரும்புகிறேன்
    நான் பைத்தானில் ஏதாவது செய்திருப்பேன் என்பதை ஒப்புக் கொள்ள வேண்டும், ஆனால் இந்த தீர்வு நன்றாக உள்ளது.

    1.    KZKG ^ காரா அவர் கூறினார்

      நன்றி ^ - ^

  5.   Tino அவர் கூறினார்

    வணக்கம்! மிகவும் நல்லது!
    தயவுசெய்து எனக்கு ஒரு கேள்வி உள்ளது
    பின்வரும் எடுத்துக்காட்டுக்கு இது எனக்கு வேலை செய்யும்:
    ஏபிசிடி 1111
    DEFG 2222 45455
    ஏபிசிடி 1111
    DEFG 2222

    வரிசைகள் ஒன்றுதான் ஆனால் அவற்றில் இடைவெளிகளும் இன்னும் சில எழுத்துக்களும் உள்ளன ... இது ஒரே வார்த்தையை சரிபார்க்கிறதா? அல்லது வரி மூலம்? நான் விளக்குகிறேன்?
    இனிமேல், நான் உங்களுக்கு மிகவும் நன்றி.
    ஒரு கட்டி

    1.    KZKG ^ காரா அவர் கூறினார்

      ஹாய் எப்படி போகிறது
      நான் பார்த்தபடி, இது வரிகளை ஒப்பிடுகிறது, ஆனால் நெடுவரிசைகள் அல்ல, எனவே நீங்கள் எனக்கு வழங்கிய எடுத்துக்காட்டில், இது 1 வது வரி அல்லது 3 வது, 2 வது மற்றும் 4 வது வரிகளை அகற்றும், அவை கிட்டத்தட்ட ஒரே மாதிரியாக இருந்தாலும், அவை 100% ஒத்ததாக இல்லை, ஏனெனில் அவை வேறுபாடு நெடுவரிசை உள்ளது. 😉

      கருத்துக்கு நன்றி ^ - ^

      1.    டினோ அவர் கூறினார்

        உங்களுக்கு நன்றி!! ஆரக்கிள் நகல்களை அகற்ற ஒரு மணி நேரம் ஆகும் முன் ... இப்போது பூனை வரிசையுடன் 30 வினாடிகள் ஆகும் !!

  6.   மெகாபெடர் அவர் கூறினார்

    எனக்கு இது PHP இல் தேவைப்படுகிறது: எஸ்

    1.    KZKG ^ காரா அவர் கூறினார்

      Uff ... நான் PHP ஐப் பயன்படுத்துகிறேன், ஏனென்றால் நான் மிகவும் குறுகியவன், நான் உண்மையில் ஒரு புரோகிராமர் இல்லை

      மன்னிக்கவும்.

    2.    புருனோகாசியோ அவர் கூறினார்

      PHP க்கு அதிகாரப்பூர்வ PHP ஆவணத்தில் array_unique (…) உள்ளது, நீங்கள் பல முக்கியமான மற்றும் திறமையான செயல்பாடுகளைக் காண்பீர்கள்.

      வரிசையைப் பொறுத்தவரை, உங்களுக்குத் தேவைப்படாவிட்டால், அது தேவையில்லை ... மரணதண்டனை நேரமும் நினைவகமும் வீணாகின்றன. (இடுகையில் என்ன செய்யப்படுகிறது)

      நன்றி!

  7.   கீக் அவர் கூறினார்

    ஆஹா !! முரட்டு சக்தியாக பயன்படுத்த ஒரு அகராதி !! XD

  8.   கஸ்டாவொ அவர் கூறினார்

    யுனிக் உடன் வரிசையின் சேர்க்கை மிகவும் நல்லது! நகல் வரிகளை அகற்ற இது எனக்கு நிறைய உதவியது.

    நன்றி

  9.   கஸ்டாவொ அவர் கூறினார்

    கார்லோஸின் கருத்து, அவரது ஆணவம் இருந்தபோதிலும், செல்லுபடியாகாது. அவர் பயன்படுத்த கூறுகிறார்:

    பூனை pass.txt | uniq> pass-ready.txt

    இருப்பினும் யுனிக் முன்நிபந்தனை கோப்பு உத்தரவிடப்பட்டுள்ளது. நீங்கள் இதைப் பற்றி இன்னும் கொஞ்சம் யோசித்திருக்க வேண்டும் அல்லது முன்பே உங்களுக்குத் தெரிவித்திருக்க வேண்டும்.

  10.   எலியுபர் அவர் கூறினார்

    மிகவும் நல்லது, நீங்கள் என் பாஷை இயக்க நிறைய நேரம் சேமித்தீர்கள்

  11.   பிளின்ட்ஸ்டோன்ஸ் அவர் கூறினார்

    awk '! array_temp [$ 0] ++' pass.txt> pass-ready.txt
    இதன் மூலம் கோடுகள் ஆர்டர் செய்யப்படாமல் அகற்றப்படும்.

  12.   மினிமினியோ அவர் கூறினார்

    பங்களிப்புக்கு மிக்க நன்றி!

    வரிசையை மாற்றாமல் தனித்துவமாக்க முடியும் என்பது குளிர்ச்சியாக இருந்தாலும், ஏய், எளிதான மற்றும் பயனுள்ள கட்டளை!

  13.   பெலிப்பெ குட்டரெஸ் அவர் கூறினார்

    நன்றி, இது எனக்கு நிறைய உதவியது

  14.   எர்னஸ்டோ அவர் கூறினார்

    என்னிடம் இது உள்ளது
    சி 000006158880201502051056088364 சி 00-06158880
    சி 000007601673201503051056088364 சி 00-07601673
    சி 000008659304201504051056088364 சி 00-08659304
    டி 0809074070562015120818144287185REAÑO RUBIÑOS EMILIA DORIS
    டி 0809092979972016010818144287185REAÑO RUBIÑOS EMILIA DORIS
    சி 000005398451201501231044214375 சி 00-05398451
    சி 000007674996201503051000000286 சி 00-07674996
    சி 000008514288201504051000000463 சி 00-08514288
    சி 000011613498201506051056088070 சி 00-11613498

    ஒரு கோப்பில் ஒரு சந்தாதாரருக்கு நகல்களை மட்டுமே வரைவதற்கும், நகல் இல்லாதவற்றை மற்றொன்றில் விட்டுவிடுவதற்கும் நான் அதை எவ்வாறு பெறுவது?

    சந்தாதாரர் 23 (10 நிலைகள்) இல் உள்ளார்

  15.   பெர்னாண்டோ அவர் கூறினார்

    sort -u -k 1,1 File.txt> result.txt

    இது முதல் புலத்தால் கோப்பை வரிசைப்படுத்துகிறது

  16.   நான் டியாகோ அவர் கூறினார்

    2020 மற்றும் இன்னும் சேவை செய்கிறீர்கள், மிக்க நன்றி!

  17.   சாரா அவர் கூறினார்

    கோ கோ உரை ட்ராங் லினக்ஸ் அல்லது விண்டோஸ் kc காங் உடன் கோப்பு உரை செய்ய வேண்டுமா? Cung như Trường ஹாப் CUA தடை KHI TOI தாவோ கோப்பு tu điển vi TOI சியா Nội சாணம் RA nen CO Kha nhiều கோப்பு VA chắc சான் கான் nhiều டாங் Trung மடியில் giữa CAC கோப்பு. Vi du: கோப்பு 1 CUA TOI இணை 5 டாங், கோப்பு 2 இணை 15 டாங் (இணை 2 டாங் Trung மடியில் Voi கோப்பு 1. TOI ket குவா, கோப்பு 1 VAN giữ Nguyen 5 டாங், கோப்பு 2 தி மட்டுமே BO 2 டாங் Giong கோப்பு 1 இணை மியோன் .
    biết இணை nhiều லி பான் Như தா கோ The GOP CAC கோப்பு சுங் செய்ய txt ஐ டிஜேஓ லாய் Voi nhau, VI நுங் கோப்பு உரை tu điển எலி u LA nhiều KY, சாங் ஹான் như rockyou. விண்டோஸ் ên இல், விண்டோஸ் Windowsc இல், நீங்கள் விண்டோஸ் Windowsc ஐப் பார்க்கும்போது, 🙂 Hy vọng nhận được phản hồi từ bạn!