Kvalitativna analiza besedila in izdelava predmetnih indeksov z AntConc in LibreOffice

Saludos amigas y amigos, me da mucho gusto unirme y participar en lo que este a mi alcance de ahora en adelante en <° Desde Linux. Me llamo jathan y les comparto esta primera entrada a partir de una documentación que hice en el servicio social de la coordinación de informática de mi facultad. Espero que la encuentren interesante, les sea útil, así como hagan todo tipo de comentarios.

Ko želimo v besedilni datoteki najti ključne besede za ustvarjanje tematskega kazala, analizirati glavne ideje dela ali kakšen drug podoben namen, moramo iskati, s pomočjo katerih lahko ločimo velike in male črke znotraj besed, pa tudi seznam le-teh, ki poudarjajo želene znake, na primer črko, da lahko hitreje in bolj praktično poiščemo ključne besede.

Cilj te dokumentacije je predstaviti in razložiti uporabo aplikacije za kvalitativno analizo besedila in urejevalnika besedil za lažjo realizacijo tematskega kazala z brezplačno programsko opremo.

V prvem delu je opisan postopek namestitve LibreOffice in izvršitev AntConc v operacijskem sistemu GNU / Linux in kasneje, kako to storiti v sistemih Windows in Mac OS, v naslednjih delih pa bo razloženo, kako uporabljati AntConc y LibreOffice Uporaba primerov za ustvarjanje predmetnega indeksa.

LibreOffice in AntConc na GNU / Linux

Najprej moramo preveriti, ali imamo LibreOffice nameščen na naši distribuciji GNU / Linux. LibreOffice je brezplačna večplatformna pisarniška zbirka z licenco GPL, ki nam pomaga na preprost in učinkovit način urejati besedilne dokumente, diapozitive, preglednice, zbirke podatkov, risbe in matematične formule.

Če uporabljamo Debian, Linux Mint, Trisquel, Ubuntu ali katero koli drugo distribucijo na podlagi Debian, Ne bomo se več ukvarjali z njegovo namestitvijo, saj je LibreOffice v večini teh distribucij v najnovejših različicah, pa tudi v drugih, kot so Mageia, Fedora in OpenSUSE, že vnaprej nameščen in ga preprosto morate najti in zagnati s podokna z aplikacijami ali z ukazno vrstico.

Če uporabljamo Debian Squeeze 6.0, moramo OpenOffice posodobiti na LibreOffice po teh navodilih: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Potem ko se prepričamo, da imamo v našem sistemu nameščen LibreOffice, bomo zdaj nadaljevali z obiskom spletnega mesta AntLab, kjer bomo našli nekaj uporabnih aplikacij, ki jih je razvil Laurence Anthony za kvalitativno analizo besedila in ujemanje besed z medstraniškimi izvršljivimi datotekami za GNU / Linux, Mac OS in Windows.

AntConc je aplikacija, napisana v programskem jeziku Perl, ki nam omogoča, da besede po abecednem vrstnem redu ali po pogostosti pojavljanja, ključne besede, naredimo skladnosti in skupine besed iz datoteke v obliki navadnega besedila, pri čemer ločimo male in velike črke. Če ga želite prenesti, pojdite na to povezavo: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html in v petem stolpcu izberite, kje se pojavlja pingvin Tux, možnost prenosa AntConc 3.2.4u:

Ko je prenos izbrane datoteke končan, odpremo naš najljubši brskalnik datotek (Pcmanfm, Nautilus, Thunar, Dolphin ali kateri koli drug) tako, da ga odpremo skozi podokno grafičnega okolja, ki ga uporabljamo, ali s pritiskom na alt + f2, vpišemo njegovo ime v z malimi črkami in pritisnite Enter na koncu in nato v našem uporabniškem imeniku ustvarite dva imenika (mape), pri čemer enega Applications_extras in drugega AntConc poimenujete kot podimenik prvega:

Zdaj gremo v imenik, kamor je bila prenesena datoteka antconc3.2.4u.tar.gz (v tem primeru je Prenosi), datoteko pa odpremo s programom Xarchiver ali Fileroller, da razpakiramo njeno vsebino v imenik Antconc, tako da v upravitelju datotek izberemo možnost izvlečka in kar označuje pot do imenika / home / user / Extra_Applications / AntConc:

Ko je vsebina paketa antconc3.2.4u.tar.gz ekstrahirana v imenik AntConc znotraj Applications_extras, identificiramo datoteko antconc3.2.4u, da ji omogočimo izvedbo s klikom na desni gumb miške, vnesemo lastnosti in omogočimo izvajanje datoteka kot program:

In s tem bi morali odpreti AntConc z dvojnim klikom z miško na datoteko antconc3.2.4u.

Če želimo, lahko naredimo ves prejšnji postopek prek terminala tako, da izvedemo naslednje ukaze in spremenimo "uporabnika" za ime, ki ga uporabljamo v naši seji:

Če želite ustvariti imenike:

$ mkdir / home / user / Applications_extras (pritisnite enter)
$ mkdir / home / user / Applications_extras / AntConc (pritisnite enter)

Preklopite v imenik AntConc in izvlecite vsebino antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (pritisnite enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(press enter)

Dovolite zagon datoteke antconc3.2.4u kot programa:

$ chmod + x antconc3.2.4u (pritisnite Enter)

In zaženite AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(press enter)

Ne glede na izbrani postopek lahko datoteko antconc3.2.4u prekopiramo v imenik / usr / bin in ji damo potrebna dovoljenja, da lahko AntConc zaženemo s terminala ali z alt + f2, tako da samo napišemo antconc3.2.4u. Za to izvajamo naslednje ukaze kot superuser s su ali sudo:

$ vaš
(napišemo root geslo in pritisnemo enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# izhod

Zdaj, samo z zagonom antconc3.2.4u z našim uporabnikom iz katerega koli emulatorja terminala, se bo AntConc odprl, kot je prikazano na prejšnji sliki.

$antconc3.2.4u

Uporaba AntConc za naštevanje besed po določenem znaku

Potem ko smo ugotovili, kako prenesti in zagnati AntConc, bomo zdaj dali način, da ponazorimo njegovo uporabo za iskanje nekaterih besed z iskanjem po abecednem vrstnem redu znakov tako v malih kot v velikih črkah. Če se želite poglobiti v delovanje AntConca in vseh možnosti uporabe, si lahko ogledate dokument README_AntConc3.2.4.pdf v našem imeniku / home / user / Aplicaciones_extras / AntConc ali ga prenesete s http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, pa tudi poglejte v spletno pomoč ali si oglejte video vadnice AntConc, ki so na voljo na njeni spletni strani http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc lahko deluje samo z navadnimi besedilnimi datotekami (".txt"), ".html", ".hml," .xml "in lastnim formatom" .ant ", zato je vsebina dokumenta, iz katerega bomo naredili besedno identifikacijo, jo bomo spremenili iz prvotne oblike v ".odt", ".rtf", ".pdf" ali kateri koli drugi v ".txt", pri čemer bomo izbrali vso vsebino, jo kopirali in prilepili v nov besedilni dokument letalo, v katerem je naš najljubši urejevalnik besedil (Leafpad, Gedit, Vim, Emacs, med drugim). V tem primeru bomo skušali ustvariti tematski indeks iz knjige «Kolaborativna konstrukcija znanja», iz katere bomo lahko obiskali njeno spletno stran: http://seminario.edusol.info/seco3/ in ki jo bomo lahko prosto prenesli s te povezave: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Ko datoteko prenesemo, jo poiščemo v našem imeniku za prenose, odpremo jo s pregledovalnikom dokumentov pdf (v tem primeru Evince), s pritiskom na ctrl + a izberemo vso njeno vsebino, jo kopiramo in prilepimo v novo navadno polje besedilni dokument:

In novi dokument shranimo v navadnem besedilu z imenom «Construccion_colaborativa_del_conocimiento.txt» v imenik dokumentov:

Zdaj zaženemo AntConc in s prvega zavihka zgoraj levo, imenovanega "Datoteka", odpremo datoteko "Construccion_colaborativa_del_conocimiento.txt":

V levem stolpcu, imenovanem "Corpus Files", bo zdaj prikazano ime naše besedilne datoteke, kar pomeni, da bomo delali s to datoteko, saj lahko v AntConc naložimo več besedilnih datotek in delamo skupaj ali ločeno:

Zdaj bomo našteli vse besede, ki vsebujejo znak "A", da ključno besedo označimo s to veliko začetnico, saj nam AntConc ponuja možnost razlikovanja med malimi in velikimi črkami, kar je zelo koristno za prepoznavanje lastnih imen ali kratice v obliki seznama. Za to postavimo prvi zavihek, imenovan »Concordance«, na desni strani «Corpus Files», počistite polje «Words», da označite polje «Case», tako v spodnji desni strani «Iskalnega izraza», pišemo v polje Iščite pod črko A in kliknite na vijolični pravokotnik, na katerem piše "Start":

V njem bodo navedeni rezultati naslednjega. oblika:

Kot lahko vidimo, se nekateri znaki, napisani z naglasi, zdijo podobni besedi "Autónoma" namesto "Autónoma". To je zato, ker moramo AntConcu povedati ustrezen jezik kodiranja za naš jezik, saj AntConc ne zazna, da privzeto uporabljamo španščino. Za to odpremo zavihek «Globlal Settings» na vrhu poleg «File», gremo do zadnje možnosti «Language Encoding Settings» na desni strani kliknemo na «Edit» izberemo prvo možnost «Standard Encodings »Kliknemo ga, izberemo tretjo možnost s seznama, ki se prikaže na desni" Unicode (utf8) ", in kliknemo na polje" Uporabi "v spodnjem desnem delu okna:

Po uveljavitvi sprememb znova kliknite na vijolični pravokotnik «Start» in poudarjeni znaki bodo zdaj čitljivo prikazani:

Zdaj pregledujemo besede z modro označeno črko A za lažjo prepoznavo in na podlagi naših premislekov izbiramo tiste, ki jih želimo vključiti v tematski indeks, na primer "Računalniška nepismenost" v vrstici številka 17 je najpogostejša beseda takoj je bila ugotovljena kot prva, na katero se v tematskem indeksu sklicuje iz vsebine besedila »Sodelovalna konstrukcija znanja«.

Vrnemo se v pdf dokument »Sodelovalna konstrukcija znanja«, da ugotovimo, na katerih straneh se pojavi »Računalniška nepismenost«, tako da vtipkamo »ctrl + f«, v iskalno polje vpišemo besedo »Nepismenost« in na koncu pritisnemo »enter« in kolikokrat je potrebno iskati besedo poiskati na vseh straneh. Odpremo nov dokument v programu LibreOffice Writer, da ustvarimo predmetni indeks, ali če delamo na vsebini dokumenta, ki je prvotno v .odt, ga odpremo z LibreOffice in indeks njegove vsebine bomo ustvarili in uredili samo na kateri koli strani. :

Če se tudi z AntConcom želimo identificirati, kateri stavki "Računalniška nepismenost" se pojavljajo v vsej vsebini dokumenta "Construccion_colaborativa_del_conocimiento.txt", v iskalno polje zapišemo "Računalniška nepismenost", počistite polje "Primer", označite "Words" in kliknite nanj začeti":

Če kliknemo katero od vrstic, označenih z «Računalniška nepismenost» z modro barvo, na primer v vrstici 4, nam bo na zavihku «Pogled datoteke» prikazan fragment besedila, kjer je ta izbor označen s črno ozadje:

Na ta način nam je AntConc zelo koristen, ko smo napisali knjigo, esej ali povzetek in nismo vzporedno delali tematskega kazala ali sistematično analizirali glavne ideje dela, da bi olajšali njegovo branje.


Pustite svoj komentar

Vaš e-naslov ne bo objavljen. Obvezna polja so označena z *

*

*

  1. Za podatke odgovoren: Miguel Ángel Gatón
  2. Namen podatkov: Nadzor neželene pošte, upravljanje komentarjev.
  3. Legitimacija: Vaše soglasje
  4. Sporočanje podatkov: Podatki se ne bodo posredovali tretjim osebam, razen po zakonski obveznosti.
  5. Shranjevanje podatkov: Zbirka podatkov, ki jo gosti Occentus Networks (EU)
  6. Pravice: Kadar koli lahko omejite, obnovite in izbrišete svoje podatke.

  1.   RAW-osnovno je dejal

    Zelo zanimivo orodje .. .. Nisem vedel zanj .. in zelo koristno mi je ..

    Hvala vam..

  2.   Cristianhcd je dejal

    zelo dober članek, zanimiv

  3.   Starec je dejal

    Najlepša hvala za delitev

  4.   Kako namestiti Linux je dejal

    Velik prispevek, zelo koristen. Vedenje, da lahko imate te vrste orodij v Linuxu, je vedno pomembno. S spoštovanjem.

  5.   Fitosido je dejal

    Odličen vstop. Všeč mi je, da objavljajo tovrstne vsebine!

  6.   Jathan. je dejal

    Pozdravljeni vsi skupaj. Hvala za vaše komentarje in opravičilo, ker ste do zdaj lahko komentirali. Upam, da tisti, ki so tutorstvo uveljavili v praksi, niso imeli težav.