फाईलमधून डुप्लिकेट लाइन काढा

मी सर्वाधिक वापरलेल्या संकेतशब्दांचा शब्दकोष तयार करीत आहे, वापरकर्त्यांद्वारे लोकप्रिय किंवा वारंवार वापरला जाणारा (… का विचारू नका… हाहाहा), याकरिता मी इतर शब्दकोष इ. पासून मजकूर घेत आहे, परंतु, मी स्वत: ला अशी डुप्लिकेट संकेतशब्द असल्याचे परिस्थितीत आढळले आहे आणि मला डुप्लिकेट ओळी दूर करण्याची आवश्यकता आहे.

दुसर्‍या शब्दांत, उदाहरणार्थ ... आमच्याकडे पुढील फाईल आहे: pass.txt

आणि त्याची सामग्री अशीः

asdasd
लोला
प्रेम
asdasd
विंडो
प्रशासन
linux
asdasd
प्रेम

 जसे आपण पहातो, आम्ही पुन्हा पुनरावृत्ती केली आहे «प्रेम»आणि«asdasd«, नंतरचे 3 वेळा. डुप्लिकेट ओळी कशा काढायच्या?

या कमांडसह हे करणे सोपे आहे:

cat pass.txt | sort | uniq > pass-listos.txt

हे नावाची फाईल जनरेट करेल पास-रेडी.टी.एस.टी. ज्यामध्ये असेल:

प्रशासन
asdasd
linux
लोला
प्रेम
विंडो

कमांड काय करते हे अगदी सोपे आहे ...

  1. मांजर पास.टेक्स्ट - of फाईलमधील सामग्रीची यादी करा.
  2. क्रमवारी - al आद्याक्षरांना क्रमवारी लावा.
  3. युनिक - uplic डुप्लिकेट ओळी काढून टाका.
  4. > पास-रेडी.टी.एस.टी. - commands मागील आदेशांचा परिणाम, ते पास-रेडी.टी.एस.टी. फाइलमध्ये टाका (जे अस्तित्वात नाही, ते तयार करेल)

हे इतके सोपे आहे ... मला आज्ञेच सापडली क्रमवारी होय, हे खूप चांगले आहे ... परंतु, एकत्र युनिक, ते कलेचे दागिने आहेत 😀

मला आशा आहे की आपण मदत केली आहे.

कोट सह उत्तर द्या

वॉलपेपर: आपण वॉलपेपर डाउनलोड करू इच्छित असल्यास «मला आवडते #! / बिन / बॅशThe येथे दुवा आहे:

वॉलपेपर डाउनलोड करा

आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटा जबाबदार: मिगुएल Áन्गल गॅटन
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.

  1.   कार्लोस म्हणाले

    आपण सॉर्ट -u देखील वापरू शकता.

    ब्लॉगवर अभिनंदन, मला ते आवडते!

    1.    केझेडकेजी ^ गारा म्हणाले

      हो बरोबर.
      काहीही नाही, टिप्पणी दिल्याबद्दल तुमचे आभारी आहे 😀

      स्वागत आहे 😉
      कोट सह उत्तर द्या

  2.   दिएगो म्हणाले

    त्यासह अडचण अशी आहे की हे शब्दांच्या क्रमाने बदलते, ते कार्य करते ... परंतु शेवटी परिणाम क्रमाने मूळपेक्षा बरेच वेगळे आहे (जे काही बाबतीत ते महत्त्वाचे आहे)

    1.    केझेडकेजी ^ गारा म्हणाले

      होय खरंच, हे शब्दांना वर्णानुक्रमे ऑर्डर करते, म्हणून जर सामग्रीशिवाय भिन्नता आवश्यक असतील तर हे समाधान योग्य नाही.

    2.    कार्लोस म्हणाले

      सुमारे स्क्रू करू नका, आपण सॉर्ट आज्ञा न केल्यास काय करावे? कृपया थोडासा विचार करा आणि सर्व काही चघळवू नका.

      मांजर पास.txt | यूनिक> पास-रेडी.टीएसटी

      1.    एलीयुबर म्हणाले

        हे चालत नाही, मी प्रयत्न केला

      2.    बॉब म्हणाले

        कार्य करत नाही कारण "पुनरावृत्ती" ओळी सतत असणे आवश्यक आहे

  3.   नाममात्र म्हणाले

    Gracias

    तो जोरदार उपयुक्त आहे

  4.   गिसकार्ड म्हणाले

    खुप छान! एक सोपा आणि स्पष्ट उपाय. मला त्यासारख्या गोष्टी आवडतात 🙂
    मी अजिबात कबूल केले पाहिजे की मी अजगरात काहीतरी केले असते पण हा उपाय ठीक आहे.

    1.    केझेडकेजी ^ गारा म्हणाले

      धन्यवाद ^ - ^

  5.   टिनो म्हणाले

    नमस्कार! खुप छान!
    कृपया माझ्याकडे क्वेरी आहे
    हे माझ्यासाठी खालील उदाहरणासाठी कार्य करेल:
    एबीसीडी 1111
    डीईएफजी 2222 45455
    एबीसीडी 1111
    डीईएफजी 2222

    पंक्ती समान आहेत परंतु त्यांच्याकडे रिक्त स्थान आणि आणखी काही वर्ण आहेत ... हे समान शब्दासाठी तपासते का? किंवा ओळीने? मी समजावतो?
    आतापासून, मी तुमचे आभारी आहे
    एक मिठी

    1.    केझेडकेजी ^ गारा म्हणाले

      हॅलो, आपण कसे आहात?
      जसे मी पाहिले, हे ओळींची तुलना करते आणि स्तंभांशी नाही, तर उदाहरणार्थ आपण मला दिले की ही पहिली ओळ किंवा 1 रा, दुसरी आणि चौथी रेषा काढेल, जरी ती जवळजवळ एकसारखीच आहेत, परंतु ती 3% एकसारखे नाहीत कारण त्यांच्याकडे आहे एक फरक स्तंभ. 😉

      टिप्पणीसाठी धन्यवाद - ^

      1.    टिनो म्हणाले

        तुझा आभारी आहे!! डुप्लिकेट्स काढून टाकण्यासाठी ओरॅकलला ​​एक तास लागण्यापूर्वी ... आता मांजरीच्या क्रमवारीत 30 सेकंद लागतात !!

  6.   मेगाबेडर म्हणाले

    मला ते पीएचपीमध्ये आवश्यक आहेः एस

    1.    केझेडकेजी ^ गारा म्हणाले

      अफ ... मी पीएचपी आहे, मी खूप, खूप लहान आहे, मी खरोखर प्रोग्रामर नाही 🙁

      माफ करा

    2.    ब्रुनोकासिओ म्हणाले

      पीएचपीसाठी अधिकृत पीएचपी दस्तऐवजीकरणात अ‍ॅरे_ युनिक (…) आहे ज्यामध्ये आपल्याला बर्‍याच महत्त्वपूर्ण आणि कार्यक्षम कार्ये आढळतील.

      क्रमवारीबद्दल, आपल्याला त्याची आवश्यकता असल्याशिवाय हे आवश्यक नाही ... अंमलबजावणीचा वेळ आणि मेमरी वाया जातात. (पोस्टमध्ये काय केले आहे यासाठी)

      धन्यवाद!

  7.   geek म्हणाले

    व्वा !! क्रूर शक्ती म्हणून वापरण्यासाठी एक शब्दकोश !! एक्सडी

  8.   गुस्ताव म्हणाले

    यूनिकसह क्रमवारीचे संयोजन खूप चांगले! डुप्लिकेट ओळी काढून टाकण्यास मला खूप मदत केली.

    धन्यवाद

  9.   गुस्ताव म्हणाले

    कार्लोसची अभिमान असूनही, ती टिप्पणी मान्य नाही. तो वापरण्यासाठी म्हणतो:

    मांजर पास.txt | यूनिक> पास-रेडी.टीएसटी

    तथापि, युनिकची एक पूर्वनिर्धारित फाइल म्हणजे ऑर्डर केली गेली आहे. त्याबद्दल थोडा अधिक विचार केला असता किंवा चौकशी केली असावी

  10.   एलीयुबर म्हणाले

    खूप चांगले, तुम्ही माझा बचाव करण्याचा बराच वेळ वाचवला

  11.   फ्लिंटस्टोन म्हणाले

    awk '! अ‍ॅरे_टेम्प [$ 0] ++' pass.txt> पास-रेडी.टी.टी.
    यासह ओळी ऑर्डर न करता दूर केल्या जातात.

  12.   मिनिमिनिओ म्हणाले

    योगदानाबद्दल मनापासून धन्यवाद!

    ऑर्डर न बदलता ते अद्वितीय बनविण्यात सक्षम असण्यास जरी छान आहे, परंतु अहो, एक सोपी आणि उपयुक्त आज्ञा!

  13.   फेलिप गुटेरेझ म्हणाले

    धन्यवाद, याने मला खूप मदत केली 😉

  14.   अर्नेस्टो म्हणाले

    हे माझ्याकडे आहे
    सी 000006158880201502051056088364 C00-06158880
    सी 000007601673201503051056088364 C00-07601673
    सी 000008659304201504051056088364 C00-08659304
    टी 0809074070562015120818144287185REAÑO रुबीसोस एमिलिया डोरिस
    टी 0809092979972016010818144287185REAÑO रुबीसोस एमिलिया डोरिस
    सी 000005398451201501231044214375 C00-05398451
    सी 000007674996201503051000000286 C00-07674996
    सी 000008514288201504051000000463 C00-08514288
    सी 000011613498201506051056088070 C00-11613498

    मी एका फाईलमध्ये प्रति ग्राहक फक्त डुप्लीकेट रंगविण्यासाठी आणि दुसर्‍यात डुप्लिकेट नसलेलेच कसे सोडू शकतो?

    ग्राहक पोझ 23 मध्ये आहे (10 पोझिशन्स)

  15.   फर्नांडो म्हणाले

    क्रमवारी लावा -u -k 1,1 File.txt> परिणाम.txt

    हे पहिल्या फिल्डद्वारे फाईलची क्रमवारी लावते

  16.   मी डिएगो आहे म्हणाले

    2020 आणि अजूनही सेवा देत आहे, खूप खूप धन्यवाद!

  17.   सारा म्हणाले

    लिनक्स किंवा विंडोज kc kh fileng फाइल मजकूर मजकूर पाठवावा? अधिक माहितीसाठी, आपल्या फाईलवर चिआनचे नाव न घेता, परंतु आपण या गोष्टी करु शकत नाही. नोंद: फाइल 1 आकार 5 सह 2 फाइल्स, फाइल 15 सह 2 दिवस (सह 1 फाईल फाइल मध्ये दाखल करा 1. आपल्या फाइलची फाइल, फाइल 5 फाइल, फाइल 2 ते फक्त 2 फाइलद्वारे फाइल 1 .
    आमच्याशी संपर्क साधा नाही, आपण सीसी फाईल मजकूर पाठवा, मजकूर पाठवू नका, परंतु त्याऐवजी रॉकीयू आहे. आपण विंडोजमध्येच आपणास आपल्या मायक्रोसॉफ्टवर आधारित बनवू शकता, परंतु आपण विंडोज úc वर चॅप इन करा. Ọ Hy vọng nhận được phản hồi từ bạn!