Kvalitatiivne tekstianalüüs ja teemaindeksite loomine AntConci ja LibreOffice'i abil

Tere sõbrad, mul on väga hea meel liituda ja osaleda kõiges, mis on nüüdsest minu käeulatuses <° Desde Linux. Minu nimi on Jathan ja jagan teiega seda esimest sissekannet, mis põhineb dokumentatsioonil, mille tegin oma teaduskonna IT koordineerimise sotsiaalteenistuses. Loodan, et leiate selle huvitava, kasuliku ja saate kõikvõimalikke kommentaare.

Kui soovime tekstifailist leida märksõnu temaatilise indeksi loomiseks, analüüsida teose põhiideid või mõnda muud sarnast eesmärki, peame tegema otsinguid, mille abil saaksime eristada sõnades suuri ja väikesi tähti, samuti nende loetelu, mis tõstab esile soovitud tähemärgid, näiteks tähe, et saaksime märksõnu leida kiiremini ja praktilisemalt.

Käesoleva dokumentatsiooni eesmärk on tutvustada ja selgitada kvalitatiivse tekstianalüüsi rakenduse ja tekstiredaktori kasutamist, et hõlbustada temaatilise indeksi loomist vabatarkvaraga.

Esimeses osas installimise kord LibreOffice ja hukkamine Antikontsept operatsioonisüsteemis GNU / Linux ja hiljem, kuidas seda teha Windowsi ja Mac OS-i süsteemides, samas kui järgmistes osades, olenemata opsüsteemist, selgitatakse, kuidas seda kasutada Antikontsept y LibreOffice Näidiste kasutamine teemaindeksi loomiseks.

LibreOffice ja AntConc GNU / Linuxis

Esimene asi, mida peame tegema, on kontrollida, kas meie GNU / Linuxi jaotusse on installitud LibreOffice. LibreOffice on GPL-litsentsitud tasuta mitmeplatvormiline kontoripakett, mis aitab meil lihtsal ja tõhusal viisil redigeerida tekstidokumente, slaide, arvutustabeleid, andmebaase, jooniseid ja matemaatilisi valemeid.

Kui me kasutame Debian, Linux Mint, Trisquel, Ubuntu või mis tahes muu põhine jaotamine Debian, Me ei pea selle installimisega enam tegelema, kuna enamikus neist levitustest nii nende uusimates versioonides kui ka teistes, näiteks Mageia, Fedora ja OpenSUSE, on LibreOffice juba eelinstallitud ja peate selle lihtsalt leidma ja käivitama rakenduste paneelilt või käsurealt.

Kui kasutame Debiani Squeeze 6.0, peame OpenOffice'i värskendama LibreOffice'ile, järgides neid juhiseid: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Kui oleme veendunud, et LibreOffice on meie süsteemi installitud, külastame nüüd AntLabi veebisaiti, kust leiate mõned kasulikud rakendused, mille Laurence Anthony on välja töötanud kvalitatiivseks tekstianalüüsiks ja sõnade sobitamiseks platvormidevaheliste käivitatavate failidega GNU / Linuxi, Maci jaoks OS ja Windows.

AntConc on Perli programmeerimiskeeles kirjutatud rakendus, mis võimaldab meil loetleda sõnu tähestikulises järjekorras või väljanägemise sageduse, märksõnade järgi, teha lihtteksti formaadis failist vasteid ja sõnarühmi, eristades väiketähti ja suuri. Selle allalaadimiseks minge sellele lingile: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html ja valige viiendast veerust, kus Tuxi pingviin kuvatakse AntConci 3.2.4u allalaadimise võimalus:

Kui valitud faili allalaadimine on lõppenud, avame eelistatud failibrauseri (Pcmanfm, Nautilus, Thunar, Dolphin või mis tahes muu), avades selle läbi meie kasutatava graafilise keskkonnapaneeli või vajutades alt + f2, kirjutades selle nime väiketäht ja tabas lõpus sisestusklahvi ning seejärel looge meie kataloogis kaks kataloogi (kausta), nimetades ühe alamkataloogiks ühe Applications_extras ja teise AntConc:

Nüüd läheme kataloogi, kust fail antconc3.2.4u.tar.gz alla laaditi (olles selles näites Allalaadimised) ja avame faili Xarchiveri või Filerolleriga, et pakkida selle sisu Antconc kataloogi lahti, valides meie failihaldur ja märkides kataloogi tee / kodu / kasutaja / Extra_Applications / AntConc:

Kui paketi antconc3.2.4u.tar.gz sisu on rakenduste_ekstras kataloogis AntConc välja tõmmatud, tuvastame hiire parema nupuga klõpsates faili antconc3.2.4u, et anda sellele täitmisõigused, sisestada atribuudid ja lubada käivitamine faili kui programmi:

Ja sellega peaksime saama AntConci avada, topeltklõpsates hiirega failil antconc3.2.4u.

Soovi korral saame terminali kaudu teha kõik eelmised protseduurid, käivitades järgmised käsud ja muutes "kasutaja" seansi ajal kasutatava nime järgi:

Kataloogide loomiseks toimige järgmiselt.

$ mkdir / home / user / Applications_extras (vajutage sisestusklahvi)
$ mkdir / home / user / Applications_extras / AntConc (vajutage sisestusklahvi)

Valige kataloog AntConc ja eraldage antconc3.2.4u.tar.gz sisu:

$ cd / home / user / Applications_extras / AntConc / (vajutage sisestusklahvi)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(press Enter)

Lubage faili antconc3.2.4u käivitada programmina:

$ chmod + x antconc3.2.4u (vajutage sisestusklahvi)

Ja käivitage AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(presspress)

Sõltumata valitud protseduurist võime soovi korral kopeerida faili antconc3.2.4u kataloogi / usr / bin ja anda talle vajalikud õigused, et oleks võimalik AntConc-i käivitada terminalist või alt + f2-ga lihtsalt kirjutades antconc3.2.4u. Selleks täidame su või sudo abil superkasutajana järgmised käsud:

$ teie
(kirjutame oma juurparooli ja vajutame sisestusklahvi)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# väljumine

Ja nüüd, lihtsalt käivitades antconc3.2.4u koos meie kasutajaga mis tahes terminali emulaatorist, avaneb AntConc, nagu eelmises pildis näidatud.

$antconc3.2.4u

AntConci kasutamine sõnade loendamiseks konkreetse märgi järgi

Olles juba tuvastanud, kuidas AntConci alla laadida ja käivitada, anname nüüd näite selle kasutamisest mõne sõna leidmisel, otsides tähti tähestikulises järjekorras nii väikeste kui ka väikeste tähtedega. Kui soovite põhjalikumalt uurida AntConci tööd ja kõiki selle kasutusvõimalusi, võite vaadata meie kataloogis / home / user / Aplicaciones_extras / AntConc olevat dokumenti README_AntConc3.2.4.pdf või alla laadida saidilt http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, samuti vaadake veebiabi või vaadake oma veebisaidil http://www.antlab.sci.waseda.ac. jp / saadaval olevaid AntConci videoõpetusi. antconc_index.html

AntConc saab töötada ainult lihttekstifailidega (".txt"), ".html", ".hml", "" .xml "ja oma vormingus" .ant ", nii et dokumendi sisu, millest teeme sõna identifitseerimine, muudame selle algsest vormingust ".odt", ".rtf", ".pdf" või mõnes muus vormingus ".txt" kogu sisu valimiseks, selle kopeerimiseks ja kleepimiseks uude tekstidokumentide lennuk, kus töötab meie eelistatud tekstiredaktor (Leafpad, Gedit, Vim, Emacs, teiste hulgas). Selles näites püüame luua raamatust «Teadmiste koostööl põhinev koostamine» temaatilise registri, kust saaksime külastada selle veebisaiti: http://seminario.edusol.info/seco3/ ja mille saaksime sellelt lingilt vabalt alla laadida: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Kui fail on alla laaditud, leiame selle oma allalaadimiste kataloogist, avame selle oma pdf-dokumendivaaturiga (selles näites Evince), valime kogu selle sisu, vajutades klahvikombinatsiooni ctrl + a, kopeerime selle ja kleepime selle uuele tasandile tekstidokument:

Ja me salvestame uue dokumendi lihttekstina nimega "Construccion_colaborativa_del_conocimiento.txt" kataloogi Dokumendid:

Nüüd käivitame AntConci ja avame vasakus ülanurgas asuvast esimesest vahekaardist "Fail" faili "Construccion_colaborativa_del_conocimiento.txt":

Vasakus veerus nimega "Corpus Files" kuvatakse nüüd meie tekstifaili nimi, mis näitab, et töötame selle failiga, kuna AntConcis saame laadida rohkem kui ühte tekstifaili ja töötada koos või eraldi:

Nüüd on loetletud kõik sõnad, mis sisaldavad tähte "A", et tuvastada selle suurtähega märksõna, kuna AntConc pakub meile võimalust eristada väikseid ja suuri tähti, mis on väga kasulik pärisnimede või akronüümide tuvastamiseks nimekirja kujul. Selleks paigutame esimese vahekaardi nimega «Konkordants» «Corpus Files» paremale küljele, tühjendage kastike «Sõnad», et märkida kast «Juhtum», mõlemad otsingutermini alumises paremas servas, kirjutame sisse väli Otsi A-tähe all ja klõpsake lillakujulisel ristkülikul, mis ütleb "Start":

Ja see loetleb järgmise tulemuse. kuju:

Nagu näeme, tunduvad mõned rõhumärkidega kirjutatud tähemärgid sõnade "Autónoma" asemel sarnased sõnaga "Autónoma". Seda seetõttu, et peame AntConcile ütlema oma keelele sobiva kodeerimiskeele, kuna AntConc ei tuvasta, et vaikimisi kasutame hispaania keelt. Selleks avame vahekaardi «Globlal Settings» ülaservas «File» kõrval, läheme paremale poole viimasele võimalusele «Language Encoding Settings» klõpsame nupul «Edit» valime esimese valiku «Standard Encodings» We kui klõpsate, valime loendist kolmanda valiku, mis kuvatakse paremal «Unicode (utf8)» ja klõpsame akna paremas alanurgas asuvat kastikest «Rakenda»:

Pärast muudatuste rakendamist klõpsame uuesti «Start» lillakujulisel ristkülikul ja täpitähed ilmuvad nüüd loetavalt:

Vaatame nüüd hõlpsalt tuvastamiseks läbi sinisega esile tõstetud A-tähega sõnu ja valime oma kaalutlustele tuginedes need, mis soovime temaatilisse indeksisse lisada, näiteks on reas number 17 "Arvutihaldamatus" kõige tavalisem sõna, mis leiti esimesena, millele meie temaatilises indeksis viidatakse «Teadmiste koostöötamine» teksti sisult.

Naaseme pdf-dokumendi «Teadmiste koostööl põhinev koostamine» juurde, et leida, millistel lehtedel ilmub kiri «Arvuti kirjaoskamatus», tippides teksti «ctrl + f», kirjutades otsinguväljale sõna «Kirjaoskamatus» ja vajutades lõpus sisestusklahvi «Enter». mitu korda on vaja otsitud sõna leidmiseks kõikidel lehtedel. Avame LibreOffice Writeris uue dokumendi oma teemaindeksi loomiseks või kui töötame algselt .odt-vormingus oleva dokumendi sisuga, avame selle dokumendi LibreOffice'iga ning loome ja muudame selle teemaindeksit ainult mis tahes lehel :

Kui tahame samastada ka AntConc-iga, millistes lausetes esineb dokumendi "Construccion_colaborativa_del_conocimiento.txt" kogu sisu "arvutikirjaoskamatus", kirjutame otsinguväljale "arvutikirjaoskamatuse", tühjendage ruut "Juhtum", märkige "Sõnad" ja klõpsake nuppu "Start":

Kui klõpsame mõnel sinise värviga «arvutikirjaoskamatuse» jaoks esile tõstetud real, näiteks 4. real, kuvab see vahekaardil «Failivaade» meile tekstilõigu, kus see valik ilmub esiletõstetuna mustast taustast:

Nii on AntConc meile väga kasulik, kui oleme kirjutanud raamatu, essee või kokkuvõtte ja me ei teinud paralleelselt temaatilist indeksit ega analüüsinud töö lugemise hõlbustamiseks süstemaatiliselt teose põhiideid.


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutab: Miguel Ángel Gatón
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.

  1.   RAW-Basic DIJO

    Väga huvitav tööriist .. ..ma ei teadnud sellest ... ja see on mulle väga kasulik ..

    Aitäh..

  2.   Cristianhcd DIJO

    väga hea artikkel, huvitav

  3.   Vana mees DIJO

    Suur aitäh jagamise eest

  4.   Kuidas Linuxi installida DIJO

    Suur panus, väga kasulik. Teadmine, et Linuxis saate seda tüüpi tööriistu kasutada, muudab alati midagi. Tervitused.

  5.   Fütoschido DIJO

    Suurepärane sissepääs. Mulle meeldib, et nad avaldavad seda tüüpi sisu!

  6.   jathan DIJO

    Tere kõigile. Täname kommentaaride eest ja vabandust seni kommenteerimise eest. Loodan, et juhendamise juurutajatel pole probleeme olnud.