பயனர்களால் பிரபலமான அல்லது அடிக்கடி பயன்படுத்தப்படும் கடவுச்சொற்களின் அகராதியை நான் உருவாக்குகிறேன் (… ஏன் என்று கேட்க வேண்டாம்… ஹாஹா), இதற்காக நான் மற்ற அகராதிகள் போன்றவற்றிலிருந்து உரையை எடுத்துக்கொள்கிறேன், ஆனால், பல போலி கடவுச்சொற்கள் உள்ளன என்ற சூழ்நிலையில் என்னைக் காண்கிறேன், மேலும் நான் நகல் வரிகளை அகற்ற வேண்டும்.
வேறுவிதமாகக் கூறினால், எடுத்துக்காட்டாக ... எங்களிடம் பின்வரும் கோப்பு உள்ளது: pass.txt
அதன் உள்ளடக்கம்:
asdasd
லோலா
அன்பு
asdasd
விண்டோஸ்
நிர்வாகம்
லினக்ஸ்
asdasd
அன்பு
நாம் பார்க்கும்போது, நாங்கள் மீண்டும் மீண்டும் செய்துள்ளோம் «அன்பு"மேலும்"asdasd«, பிந்தைய 3 முறை. நகல் வரிகளை எவ்வாறு அகற்றுவது?
இதைச் செய்வது எளிது, இந்த கட்டளையுடன்:
cat pass.txt | sort | uniq > pass-listos.txt
இது ஒரு கோப்பை உருவாக்கும் pass-ready.txt இதில் இருக்கும்:
நிர்வாகம்
asdasd
லினக்ஸ்
லோலா
அன்பு
விண்டோஸ்
கட்டளை என்ன செய்கிறது என்பது மிகவும் எளிது ...
- பூனை pass.txt - the கோப்பின் உள்ளடக்கத்தை பட்டியலிடுங்கள்.
- வகையான - the உள்ளடக்கத்தை அகர வரிசைப்படி வரிசைப்படுத்துங்கள்.
- unq - d நகல் வரிகளை அகற்றவும்.
- > pass-ready.txt - command முந்தைய கட்டளைகளின் விளைவாக, அதை pass-ready.txt கோப்பில் வைக்கவும் (இது இல்லாததால், அதை உருவாக்கும்)
இது மிகவும் எளிது ... நான் கட்டளையை கண்டுபிடித்தேன் வகையான ஆம், இது மிகவும் நல்லது ... ஆனால், உடன் unq, அவை கலையின் நகை
நீங்கள் உதவியாக இருந்தீர்கள் என்று நம்புகிறேன்.
மேற்கோளிடு
நீங்கள் sort -u ஐப் பயன்படுத்தலாம்.
வலைப்பதிவில் வாழ்த்துக்கள், நான் அதை விரும்புகிறேன்!
ஆம் சரியே.
ஒன்றுமில்லை, கருத்து தெரிவித்தமைக்கு மிக்க நன்றி
வருக 😉
மேற்கோளிடு
அதில் உள்ள சிக்கல் என்னவென்றால், இது சொற்களின் வரிசையை மாற்றுகிறது, அது செயல்படுகிறது ... ஆனால் முடிவில் இதன் விளைவாக அசலில் இருந்து வரிசையில் நிறைய வேறுபடுகிறது (இது சில சந்தர்ப்பங்களில் இது முக்கியமானது)
ஆம், இது சொற்களை அகர வரிசைப்படி ஆர்டர் செய்கிறது, எனவே வேறுபாடுகள் இல்லாமல் உள்ளடக்கம் தேவைப்பட்டால், இந்த தீர்வு சிறந்ததல்ல.
சுற்றி திருக வேண்டாம், வரிசை கட்டளையை வைக்காதது உங்களுக்கு ஏற்பட்டால் என்ன செய்வது? தயவுசெய்து இன்னும் கொஞ்சம் யோசித்துப் பாருங்கள், எல்லாவற்றையும் மெல்ல வேண்டாம்.
பூனை pass.txt | uniq> pass-ready.txt
அது வேலை செய்யாது, நான் முயற்சித்தேன்
வேலை செய்யாது, ஏனெனில் "மீண்டும் மீண்டும்" கோடுகள் தொடர்ச்சியாக இருக்க வேண்டும்
நன்றி
இது மிகவும் பயனுள்ளதாக இருக்கும்
மிகவும் நல்லது! ஒரு எளிய மற்றும் தெளிவான தீர்வு. அது போன்ற விஷயங்களை நான் விரும்புகிறேன்
நான் பைத்தானில் ஏதாவது செய்திருப்பேன் என்பதை ஒப்புக் கொள்ள வேண்டும், ஆனால் இந்த தீர்வு நன்றாக உள்ளது.
நன்றி ^ - ^
வணக்கம்! மிகவும் நல்லது!
தயவுசெய்து எனக்கு ஒரு கேள்வி உள்ளது
பின்வரும் எடுத்துக்காட்டுக்கு இது எனக்கு வேலை செய்யும்:
ஏபிசிடி 1111
DEFG 2222 45455
ஏபிசிடி 1111
DEFG 2222
வரிசைகள் ஒன்றுதான் ஆனால் அவற்றில் இடைவெளிகளும் இன்னும் சில எழுத்துக்களும் உள்ளன ... இது ஒரே வார்த்தையை சரிபார்க்கிறதா? அல்லது வரி மூலம்? நான் விளக்குகிறேன்?
இனிமேல், நான் உங்களுக்கு மிகவும் நன்றி.
ஒரு கட்டி
ஹாய் எப்படி போகிறது
நான் பார்த்தபடி, இது வரிகளை ஒப்பிடுகிறது, ஆனால் நெடுவரிசைகள் அல்ல, எனவே நீங்கள் எனக்கு வழங்கிய எடுத்துக்காட்டில், இது 1 வது வரி அல்லது 3 வது, 2 வது மற்றும் 4 வது வரிகளை அகற்றும், அவை கிட்டத்தட்ட ஒரே மாதிரியாக இருந்தாலும், அவை 100% ஒத்ததாக இல்லை, ஏனெனில் அவை வேறுபாடு நெடுவரிசை உள்ளது. 😉
கருத்துக்கு நன்றி ^ - ^
உங்களுக்கு நன்றி!! ஆரக்கிள் நகல்களை அகற்ற ஒரு மணி நேரம் ஆகும் முன் ... இப்போது பூனை வரிசையுடன் 30 வினாடிகள் ஆகும் !!
எனக்கு இது PHP இல் தேவைப்படுகிறது: எஸ்
Uff ... நான் PHP ஐப் பயன்படுத்துகிறேன், ஏனென்றால் நான் மிகவும் குறுகியவன், நான் உண்மையில் ஒரு புரோகிராமர் இல்லை
மன்னிக்கவும்.
PHP க்கு அதிகாரப்பூர்வ PHP ஆவணத்தில் array_unique (…) உள்ளது, நீங்கள் பல முக்கியமான மற்றும் திறமையான செயல்பாடுகளைக் காண்பீர்கள்.
வரிசையைப் பொறுத்தவரை, உங்களுக்குத் தேவைப்படாவிட்டால், அது தேவையில்லை ... மரணதண்டனை நேரமும் நினைவகமும் வீணாகின்றன. (இடுகையில் என்ன செய்யப்படுகிறது)
நன்றி!
ஆஹா !! முரட்டு சக்தியாக பயன்படுத்த ஒரு அகராதி !! XD
யுனிக் உடன் வரிசையின் சேர்க்கை மிகவும் நல்லது! நகல் வரிகளை அகற்ற இது எனக்கு நிறைய உதவியது.
நன்றி
கார்லோஸின் கருத்து, அவரது ஆணவம் இருந்தபோதிலும், செல்லுபடியாகாது. அவர் பயன்படுத்த கூறுகிறார்:
பூனை pass.txt | uniq> pass-ready.txt
இருப்பினும் யுனிக் முன்நிபந்தனை கோப்பு உத்தரவிடப்பட்டுள்ளது. நீங்கள் இதைப் பற்றி இன்னும் கொஞ்சம் யோசித்திருக்க வேண்டும் அல்லது முன்பே உங்களுக்குத் தெரிவித்திருக்க வேண்டும்.
மிகவும் நல்லது, நீங்கள் என் பாஷை இயக்க நிறைய நேரம் சேமித்தீர்கள்
awk '! array_temp [$ 0] ++' pass.txt> pass-ready.txt
இதன் மூலம் கோடுகள் ஆர்டர் செய்யப்படாமல் அகற்றப்படும்.
பங்களிப்புக்கு மிக்க நன்றி!
வரிசையை மாற்றாமல் தனித்துவமாக்க முடியும் என்பது குளிர்ச்சியாக இருந்தாலும், ஏய், எளிதான மற்றும் பயனுள்ள கட்டளை!
நன்றி, இது எனக்கு நிறைய உதவியது
என்னிடம் இது உள்ளது
சி 000006158880201502051056088364 சி 00-06158880
சி 000007601673201503051056088364 சி 00-07601673
சி 000008659304201504051056088364 சி 00-08659304
டி 0809074070562015120818144287185REAÑO RUBIÑOS EMILIA DORIS
டி 0809092979972016010818144287185REAÑO RUBIÑOS EMILIA DORIS
சி 000005398451201501231044214375 சி 00-05398451
சி 000007674996201503051000000286 சி 00-07674996
சி 000008514288201504051000000463 சி 00-08514288
சி 000011613498201506051056088070 சி 00-11613498
ஒரு கோப்பில் ஒரு சந்தாதாரருக்கு நகல்களை மட்டுமே வரைவதற்கும், நகல் இல்லாதவற்றை மற்றொன்றில் விட்டுவிடுவதற்கும் நான் அதை எவ்வாறு பெறுவது?
சந்தாதாரர் 23 (10 நிலைகள்) இல் உள்ளார்
sort -u -k 1,1 File.txt> result.txt
இது முதல் புலத்தால் கோப்பை வரிசைப்படுத்துகிறது
2020 மற்றும் இன்னும் சேவை செய்கிறீர்கள், மிக்க நன்றி!
கோ கோ உரை ட்ராங் லினக்ஸ் அல்லது விண்டோஸ் kc காங் உடன் கோப்பு உரை செய்ய வேண்டுமா? Cung như Trường ஹாப் CUA தடை KHI TOI தாவோ கோப்பு tu điển vi TOI சியா Nội சாணம் RA nen CO Kha nhiều கோப்பு VA chắc சான் கான் nhiều டாங் Trung மடியில் giữa CAC கோப்பு. Vi du: கோப்பு 1 CUA TOI இணை 5 டாங், கோப்பு 2 இணை 15 டாங் (இணை 2 டாங் Trung மடியில் Voi கோப்பு 1. TOI ket குவா, கோப்பு 1 VAN giữ Nguyen 5 டாங், கோப்பு 2 தி மட்டுமே BO 2 டாங் Giong கோப்பு 1 இணை மியோன் .
biết இணை nhiều லி பான் Như தா கோ The GOP CAC கோப்பு சுங் செய்ய txt ஐ டிஜேஓ லாய் Voi nhau, VI நுங் கோப்பு உரை tu điển எலி u LA nhiều KY, சாங் ஹான் như rockyou. விண்டோஸ் ên இல், விண்டோஸ் Windowsc இல், நீங்கள் விண்டோஸ் Windowsc ஐப் பார்க்கும்போது, 🙂 Hy vọng nhận được phản hồi từ bạn!