Правим речник најчешће коришћених лозинки, популарних или најчешће коришћених од корисника (... Не питајте зашто ... ХАХАХА), за ово преузимам текст из других речника итд., али, налазим се у ситуацији да постоји много дуплираних лозинки и морам да елиминишем дупликате редова.
Другим речима, на пример ... имамо следећу датотеку: пасс.ткт
А његов садржај је:
асдасд
Лола
љубав
асдасд
прозори
Администратор
linux
асдасд
љубав
Као што видимо, поновили смо «љубав"И"асдасд«, Последња 3 пута. Како уклонити дупликате линија?
Помоћу ове команде то је једноставно учинити:
cat pass.txt | sort | uniq > pass-listos.txt
Ово ће генерисати датотеку која се зове пасс-реади.ткт који ће садржати:
Администратор
асдасд
linux
Лола
љубав
прозори
Наредба је ВРЛО једноставна ...
- цат пасс.ткт - »Наведите садржај датотеке.
- врста - »Сортирај садржај по абецеди.
- уник - »Уклоните дупликате линија.
- > пасс-реади.ткт - »Резултат претходних наредби, ставите га у датотеку пасс-реади.ткт (која ће је, како не постоји, створити)
То је тако једноставно ... Управо сам открио ту команду врста да, врло је добро ... али, заједно са уник, они су драгуљ уметности 😀
Надам се да сте били од помоћи.
поздрави
Такође можете користити сорт -у.
Честитам на блогу, свиђа ми се!
Како да не.
Ништа, пуно вам хвала на коментару 😀
Добродошли 😉
поздрави
Проблем с тим је што мења редослед речи, делује ... али на крају се резултат много разликује од оригинала по редоследу (што је можда у неком случају и битно)
Да, заиста, ово уређује речи по абецеди, па ако је садржај потребан БЕЗ варијација, онда ово решење није идеално.
Не зајебавајте се, шта ако вам падне на памет да не дате команду за сортирање? молим те размисли мало више и не дај да се све прожваче.
цат пасс.ткт | уник> пасс-реади.ткт
не иде, пробао сам
не ради јер „поновљени“ редови морају бити непрекидни
хвала
прилично је корисно
Врло добар! Једноставно и јасно решење. Свиђају ми се такве ствари 🙂
Морам да признам да бих нешто урадио у Питхону, али ово решење је у реду.
хвала ^ - ^
Здраво! врло добар!
Имам упит, молим вас
то би ми одговарало за следећи пример:
АБЦД 1111
ДЕФГ 2222 45455
АБЦД 1111
ДЕФГ 2222
Редови су исти, али имају размаке и још неколико знакова ... да ли се ово проверава за исту реч? или линијом? Објаснићу?
од сада вам пуно хвала.
Загрљај
Здраво, како иде
Као што сам видео, ово упоређује редове, а не колоне, па би у примеру који ми дате ово уклонило или 1. или 3., 2. и 4. ред иако су готово идентични, они нису 100% идентични јер имају колону разлике. 😉
Хвала на коментару ^ - ^
Захваљујући теби!! пре него што је сату требало да Орацле уклони дупликате ... сада је потребно 30 секунди за сортирање мачака !!
Потребан ми је у ПХП: С.
Уфф ... Ја сам ПХП, врло сам, врло низак, нисам баш програмер 🙁
Жао ми је
За пхп постоји арраи_уникуе (...) у званичној ПХП документацији наћи ћете многе важне и ефикасне функције.
Што се тиче сортирања, осим ако вам није потребно, то није потребно ... Време извршења и меморија се троше. (за оно што је урађено у посту)
Поздрав!
Вов !! речник за употребу као груба сила !! КСД
Врло добра комбинација сорт са уник! Много ми је помогло да уклоним дупликате линија.
хвала
Царлос-ов коментар, упркос својој ароганцији, није ваљан. Каже да се користи:
цат пасс.ткт | уник> пасс-реади.ткт
међутим предуслов уник-а је да је датотека наручена. Требало је мало више размислити о томе или се распитати раније.
врло добро, уштедели сте ми пуно времена док сам водио мој басх
авк '! арраи_темп [$ 0] ++' пасс.ткт> пасс-реади.ткт
овим се линије уклањају без потребе за наручивањем.
Пуно вам хвала на доприносу!
Иако би било кул да то можете учинити јединственим без промене редоследа, али хеј, лака и корисна команда!
Хвала вам, пуно ми је помогло 😉
имам ово
Ц 000006158880201502051056088364 Ц00-06158880
Ц 000007601673201503051056088364 Ц00-07601673
Ц 000008659304201504051056088364 Ц00-08659304
Т 0809074070562015120818144287185РЕАНО РУБИНОС ЕМИЛИА ДОРИС
Т 0809092979972016010818144287185РЕАНО РУБИНОС ЕМИЛИА ДОРИС
Ц 000005398451201501231044214375 Ц00-05398451
Ц 000007674996201503051000000286 Ц00-07674996
Ц 000008514288201504051000000463 Ц00-08514288
Ц 000011613498201506051056088070 Ц00-11613498
Како да постигнем да у датотеци обојим само дупликате по претплатнику, а оне који нису дупликати оставим у другој?
претплатник је на позицији 23 (10 позиција)
сорт -у -к 1,1 Филе.ткт> ресулт.ткт
Ово сортира датотеку по првом пољу
2020. и даље служим, пуно вам хвала!
Да ли желите да се повежете са рачунаром, да бисте видели текст датотеке у Линуку или Виндовс-у? Цунг нху труонг хоп цуа бан, кхи тои тао филе ту ђиен ви тои цхиа нои дунг ра нен Цо кха нхиеу филе ва цхац цхан цон нхиеу донг трунг лап гиуа Цац филе. Ви ду: Датотека 1 се налази у кооперацији 5 датотека, датотека 2 у конгресу 15 (кооперација 2 у току Датотека 1. Тои муон цо кет куа, Датотека 1 је додељена 5 дана, Датотека 2 је само бо 2 донг гионг датотека 1 .
Нху бан биет цо нхиеу ли до цхунг та ко тхе гоп цац филе ткт ђо лаи вои нхау, ви нхунг тект филе ту ђиен рат у ла нхиеу кы, цханг хан нху Роцкиоу. То је најважније за најновије Виндовс оперативне системе, чак и за оне који раде у Виндовсима. Хи вонг нхан ђуоц пхан хои ту бан!