Analizë cilësore e tekstit dhe krijimi i indekseve të lëndëve me AntConc dhe LibreOffice

Përshëndetje miq dhe miq, jam shumë i lumtur të bashkohem dhe të marr pjesë në atë që mund të arrij tani e tutje në <° Nga Linux. Emri im është jathan dhe ndaj këtë hyrje të parë me ju bazuar në një dokumentacion që kam bërë në shërbimin social të koordinimit të shkencës kompjuterike të fakultetit tim. Unë shpresoj se ju duket interesante, e dobishme dhe të bëni të gjitha llojet e komenteve.

Kur në një skedar teksti duam të gjejmë fjalë kyçe për krijimin e një indeksi tematik, të analizojmë idetë kryesore të një vepre ose ndonjë qëllim tjetër të ngjashëm, duhet të bëjmë kërkime me anë të të cilave mund të bëjmë dallimin midis karaktereve të mëdha dhe të vogla brenda fjalët, si dhe një listë e këtyre duke theksuar personazhet e dëshiruar si një letër në mënyrë që të mund të gjejmë fjalë kyçe në një mënyrë më të shpejtë dhe më praktike.

Dokumentacioni aktual synon të paraqesë dhe shpjegojë përdorimin e një aplikacioni cilësor të analizës tekstuale dhe një redaktuesi teksti për të lehtësuar krijimin e një indeksi tematik me Softuerin e Lirë.

Pjesa e parë do të shpjegojë procedurën për instalim LibreOffice dhe ekzekutimin e AntConc brenda sistemit operativ GNU / Linux dhe më vonë si ta bësh atë brenda sistemeve Windows dhe Mac OS, ndërsa në pjesët vijuese pavarësisht nga sistemi operativ, do të shpjegohet se si të përdoret AntConc y LibreOffice Përdorimi i shembujve për krijimin e një indeksi të lëndës.

LibreOffice dhe AntConc në GNU / Linux

Gjëja e parë që duhet të bëjmë është të verifikojmë që kemi të instaluar LibreOffice në shpërndarjen tonë GNU / Linux. LibreOffice është një paketë zyre multiplatforme falas e licencuar me GPL dhe që na ndihmon të modifikojmë dokumente teksti, diapozitivë, fletë spreadsheet, baza të dhënash, vizatime dhe formula matematikore në një mënyrë të thjeshtë dhe efikase.

Nëse jemi duke përdorur Debian, LinuxMint, Trisquel, Ubuntu ose ndonjë shpërndarje tjetër bazuar në Debian, Ne nuk do të duhet të merremi më me instalimin e tij pasi që në shumicën e këtyre shpërndarjeve në versionet e tyre më të fundit si dhe të tjera si Mageia, Fedora dhe OpenSUSE, LibreOffice është instaluar tashmë paraprakisht dhe thjesht duhet ta gjeni dhe ta ekzekutoni nga paneli i aplikacioneve ose nga rreshti i komandës.

Nëse po përdorim Debian Squeeze 6.0 duhet të azhurnojmë OpenOffice në LibreOffice duke ndjekur këto udhëzime: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Pasi të sigurohemi që kemi të instaluar LibreOffice në sistemin tonë, tani do të vazhdojmë të vizitojmë faqen e internetit AntLab ku mund të gjejmë disa aplikacione të dobishme të zhvilluara nga Laurence Anthony për analiza cilësore të tekstit dhe përputhjen e fjalëve me skedarë të ekzekutueshëm ndër-platformë për GNU / Linux, Mac OS dhe Windows.

AntConc është një aplikacion i shkruar në gjuhën programuese Perl që na ndihmon të renditim fjalët sipas rendit alfabetik ose sipas frekuencës së paraqitjes, fjalëve kyçe, të bëjmë ndeshje dhe grupe fjalësh nga një skedar në format teksti të thjeshtë, duke bërë dallimin midis karaktereve të vogla dhe të mëdha. Për ta shkarkuar, shkoni te kjo lidhje: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html dhe zgjidhni në kolonën e pestë ku Tux pinguin shfaq opsionin për të shkarkuar AntConc 3.2.4u:

Kur të përfundojë shkarkimi i skedarit të zgjedhur, ne hapim shfletuesin tonë të preferuar të skedarit (Pcmanfm, Nautilus, Thunar, Dolphin ose ndonjë tjetër) duke e hapur atë përmes panelit të mjedisit grafik që ne përdorim ose duke shtypur alt + f2, duke shkruar emrin e tij në shkronja të vogla dhe goditja enter në fund për të krijuar më vonë dy direktori (dosje) brenda direktorisë sonë të përdoruesve, duke emëruar një Applications_extras dhe një tjetër AntConc si nëndrejtori të së parës:

Tani ne shkojmë në direktorinë ku është shkarkuar skedari antconc3.2.4u.tar.gz (në këtë shembull duke qenë Shkarkime) dhe ne hapim skedarin me Xarchiver ose Fileroller për të zbërthyer përmbajtjen e tij në direktorinë Antconc duke zgjedhur opsionin ekstrakt në menaxherin tonë të skedarëve dhe duke treguar shtegun e direktorisë / shtëpinë / përdoruesin / Zbatime shtesë / AntConc:

Sapo përmbajtja e paketës antconc3.2.4u.tar.gz të jetë nxjerrë në drejtorinë AntConc brenda Applications_extras, ne identifikojmë skedarin antconc3.2.4u për t'i dhënë asaj lejet e ekzekutimit duke klikuar me butonin e djathtë të miut, futni vetitë dhe lejoni ekzekutimin e skedoni si program:

Dhe me këtë ne duhet të jemi në gjendje të hapim AntConc duke klikuar dy herë me miun në skedarin antconc3.2.4u.

Nëse preferojmë, ne mund të bëjmë të gjithë procedurën e mëparshme përmes terminalit duke ekzekutuar komandat e mëposhtme dhe duke ndryshuar "përdoruesin" me emrin që përdorim në sesionin tonë:

Për të krijuar drejtoritë:

$ mkdir / home / user / Applications_extras (shtypni enter)
$ mkdir / home / user / Applications_extras / AntConc (shtypni enter)

Ndryshoni në drejtorinë AntConc dhe nxirrni përmbajtjen e antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (shtypni enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz( shtyp hyrjen)

Lejoni të ekzekutoni skedarin antconc3.2.4u si një program:

$ chmod + x antconc3.2.4u (goditi hyrjen)

Dhe drejto AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u( shtyp hyrjen)

Pavarësisht nga procedura që zgjedhim, nëse dëshirojmë, mund të kopjojmë skedarin antconc3.2.4u në direktorinë / usr / bin dhe t'i japim lejet e nevojshme për të qenë në gjendje të ekzekutojmë AntConc nga terminali ose me alt + f2 duke shkruar vetëm antconc3.2.4u. Për këtë ne ekzekutojmë komandat e mëposhtme si superpërdorues me su ose sudo:

$ tuaj
(ne shkruajmë fjalëkalimin tonë rrënjësor dhe godasim enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# dalje

Dhe tani, vetëm duke ekzekutuar antconc3.2.4u me përdoruesin tonë nga çdo emulator i terminalit, AntConc do të hapet siç tregohet në imazhin e mëparshëm.

$antconc3.2.4u

Përdorimi i AntConc për të renditur fjalët nga një karakter specifik

Pasi të kemi identifikuar se si të shkarkoni dhe ekzekutoni AntConc, tani do të japim rrugën për të ilustruar përdorimin e tij për gjetjen e disa fjalëve me anë të një kërkimi në rend alfabetik të karaktereve në të vogla dhe të mëdha. Nëse dëshironi të futeni më thellë në funksionimin e AntConc dhe të gjitha mundësitë e tij të përdorimit, mund të konsultoheni me dokumentin README_AntConc3.2.4.pdf në direktorinë / shtëpinë / përdoruesin / Aplicaciones_extras / AntConc tonë ose ta shkarkoni nga http: //www.antlab .sci.waseda.ac.jp / softuer / antconc335 / AntConc_readme.pdf, si dhe këshillohuni me ndihmën në internet ose shikoni udhëzimet video të AntConc të disponueshme në faqen e saj të internetit http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc mund të punojë vetëm me skedarë të thjeshtë teksti (".txt"), ".html", ".hml" ".xml" dhe formatin e tij ".ant", kështu që përmbajtja e dokumentit nga i cili do të bëjmë identifikimin e fjalës, ne do ta ndryshojmë atë nga formati i saj origjinal në ".odt", ".rtf", ".pdf" ose ndonjë tjetër në ".txt" duke bërë një përzgjedhje të të gjithë përmbajtjes, duke e kopjuar dhe ngjitur në një dokument të ri teksti aeroplan që drejton editorin tonë të preferuar të tekstit (Leafpad, Gedit, Vim, Emacs, ndër të tjera). Në këtë shembull do të kërkojmë të krijojmë një indeks tematik nga libri «Ndërtimi bashkëpunues i dijes» nga i cili mund të vizitojmë faqen e tij në internet: http://seminario.edusol.info/seco3/ dhe të cilin mund ta shkarkojmë lirisht nga kjo lidhje: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Pasi skedari të shkarkohet, ne e lokalizojmë atë në direktorinë tonë të shkarkimeve, ne e hapim atë me shikuesin tonë të dokumentit pdf (në këtë shembull Evince), ne zgjedhim të gjithë përmbajtjen e saj duke shtypur ctrl + a, ne e kopjojmë dhe ngjisim atë në një fushë të re dokumenti i tekstit:

Dhe ne e ruajmë dokumentin tonë të ri në tekst të thjeshtë me emrin e «Construccion_colaborativa_del_conocimiento.txt» në drejtorinë e Dokumenteve:

Tani ekzekutojmë AntConc dhe nga skeda e parë në të majtën e sipërme të quajtur "Skedar" hapim skedarin "Construccion_colaborativa_del_conocimiento.txt":

Në kolonën e majtë të quajtur "Corpus Files" tani do të shfaqet emri i skedarit tonë të tekstit, duke treguar se do të punojmë në këtë skedar, pasi që në AntConc mund të ngarkojmë më shumë se një skedar teksti dhe t'i punojmë së bashku ose veçmas:

Tani ajo që do të bëjmë është të rendisim të gjitha fjalët që përmbajnë karakterin "A", për të identifikuar një fjalë kyçe me këtë shkronjë të madhe, pasi që AntConc na ofron mundësinë e dallimit të shkronjave të vogla dhe të mëdha, kjo është shumë e dobishme për të identifikuar emrat e duhur ose shkurtesa në formën e një liste. Për këtë vendosim skedën e parë të quajtur «Concordance» në anën e djathtë të «Corpus Files», heqim kutinë «Words» për të shënuar kutinë «Case», të dyja në anën e djathtë të «Termit të Kërkimit», shkruajmë në fushë Kërkoni poshtë shkronjës A dhe klikoni në drejtkëndëshin vjollcë që thotë "Fillo":

Dhe do të rendisë rezultatet e mëposhtme. forma:

Siç mund ta shohim, disa karaktere të shkruara me theks paraqiten të ngjashëm me fjalën "Autónoma" në vend të "Autónoma". Kjo është për shkak se ne duhet t'i tregojmë AntConc gjuhën e përshtatshme të kodimit për gjuhën tonë, pasi që AntConc nuk zbulon që ne po përdorim Spanjisht në mënyrë të paracaktuar. Për këtë hapim skedën «Cilësimet Globlal» në krye pranë «Skedari», shkojmë te opsioni i fundit «Cilësimet e Kodimit të Gjuhës» në anën e djathtë klikojmë te «Redakto» zgjedhim opsionin e parë «Kodifikime Standarde» Ne klikoni mbi të, zgjidhni opsionin e tretë nga lista që shfaqet në të djathtën "Unicode (utf8)" dhe klikoni në kutinë "Zbato" në pjesën e poshtme të djathtë të dritares:

Pas aplikimit të ndryshimeve, klikoni përsëri në drejtkëndëshin vjollcë të «Start» dhe personazhet e theksuar tani do të shfaqen të lexueshëm:

Tani po rishikojmë fjalët me shkronjën A të theksuara në blu për identifikim të lehtë dhe bazuar në konsideratat tona, ne po zgjedhim ato që duam të përfshijmë në indeksin tematik, për shembull "Analfabetizmi kompjuterik" në rreshtin numër 17 duke qenë më i zakonshmi fjalë e gjetur menjëherë se është e para që do të referohet në indeksin tonë tematik nga përmbajtja e tekstit të «Ndërtimit bashkëpunues të njohurive».

Ne kthehemi në dokumentin pdf «Ndërtimi bashkëpunues i njohurive» për të gjetur se në cilat faqe shfaqet «analfabetizmi kompjuterik» duke shtypur «ctrl + f», duke shkruar fjalën «Analfabetizëm» në fushën e kërkimit dhe shtypur «enter» në fund dhe numrin e herëve që është e nevojshme për të gjetur fjalën e kërkuar në të gjitha faqet. Ne hapim një dokument të ri në LibreOffice Writer për të krijuar indeksin tonë të subjektit ose nëse jemi duke punuar në përmbajtjen e një dokumenti që është fillimisht në .odt, ne e hapim atë dokument me LibreOffice dhe do të krijojmë dhe redaktojmë vetëm indeksin e tij të temës në çdo faqe:

Nëse duam gjithashtu të identifikohemi me AntConc në të cilat fjalitë "Analfabetizmi kompjuterik" shfaqet në të gjithë përmbajtjen e dokumentit "Construccion_colaborativa_del_conocimiento.txt", ne shkruajmë "analfabetizëm kompjuterik" në fushën e kërkimit, zgjidh "Rasti", shëno "Fjalët" dhe klikoni tek "Start":

Nëse klikojmë në ndonjë nga rreshtat e theksuar në «Analfabetizëm kompjuterik» me ngjyrë blu, për shembull në rreshtin 4, në skedën «File View» do të na tregojë fragmentin e tekstit ku kjo përzgjedhje shfaqet e theksuar me të zezë nga sfondi:

Në këtë mënyrë, AntConc është shumë i dobishëm për ne kur kemi shkruar një libër, ese ose përmbledhje dhe nuk po bënim një indeks tematik paralelisht ose për të analizuar sistematikisht idetë kryesore të një vepre për të lehtësuar leximin e saj.


Përmbajtja e artikullit i përmbahet parimeve tona të etika editoriale. Për të raportuar një gabim klikoni këtu.

6 komente, lini tuajën

Lini komentin tuaj

Adresa juaj e emailit nuk do të publikohet. Fusha e kërkuar janë shënuar me *

*

*

  1. Përgjegjës për të dhënat: Miguel Ángel Gatón
  2. Qëllimi i të dhënave: Kontrolloni SPAM, menaxhimin e komenteve.
  3. Legjitimimi: Pëlqimi juaj
  4. Komunikimi i të dhënave: Të dhënat nuk do t'u komunikohen palëve të treta përveç me detyrim ligjor.
  5. Ruajtja e të dhënave: Baza e të dhënave e organizuar nga Occentus Networks (BE)
  6. Të drejtat: Në çdo kohë mund të kufizoni, rikuperoni dhe fshini informacionin tuaj.

  1.   RAW-Bazë dijo

    Mjet shumë interesant .. .. Nuk dija për të .. dhe është shumë i dobishëm për mua ..

    Faleminderit..

  2.   Cristianhcd dijo

    artikull shume i mire, interesant

  3.   Njeri i vjeter dijo

    Faleminderit shumë për ndarjen

  4.   Si të instaloni Linux dijo

    Kontribut i madh, shumë i dobishëm. Të dish që mund të kesh këtë lloj mjeti në Linux gjithmonë bën një ndryshim. Të fala.

  5.   Fitoskido dijo

    Hyrje e shkëlqyeshme. Më pëlqen që ata publikojnë këtë lloj përmbajtje!

  6.   jathan dijo

    Pershendetje te gjitheve. Faleminderit për komentet tuaja dhe një falje që keni qenë në gjendje të komentoni deri më tani. Shpresoj që ata që e kanë bërë tutorin në praktikë të mos kenë pasur ndonjë problem.