Laadullinen tekstianalyysi ja aihehakemistojen luominen AntConcin ja LibreOfficen avulla

Tervehdys ystävät, olen erittäin iloinen saadessani liittyä ja osallistua kaikkeen, mikä on ulottuvillani tästä lähtien <° Desde Linux. Nimeni on Jathan ja jaan kanssasi tämän ensimmäisen merkinnän, joka perustuu tiedekuntani IT-koordinaattorin sosiaalipalvelussa tekemiini dokumentaatioihin. Toivon, että se on kiinnostava, hyödyllinen ja annat kaikenlaisia ​​kommentteja.

Kun haluamme tekstitiedostosta löytää avainsanoja temaattisen hakemiston luomista varten, analysoida teoksen pääideoita tai muuta vastaavaa tarkoitusta, meidän on tehtävä hakuja, joiden avulla voimme erottaa isot ja pienet kirjaimet sanat sekä luettelo näistä korostaen halutut merkit, kuten kirje, jotta löydämme avainsanat nopeammin ja käytännöllisemmin.

Tämän dokumentaation tarkoituksena on esitellä ja selittää kvalitatiivisen tekstianalyysisovelluksen ja tekstieditorin käyttö temaattisen hakemiston toteuttamisen helpottamiseksi vapaalla ohjelmistolla.

Ensimmäisessä osassa, asennusohjelma LibreOffice ja AntConc käyttöjärjestelmän sisällä GNU / Linux ja myöhemmin, miten se tehdään Windows- ja Mac OS -järjestelmissä, kun taas seuraavissa osissa käyttöjärjestelmästä riippumatta selitetään, miten AntConc y LibreOffice Aihehakemiston luominen esimerkkien avulla.

LibreOffice ja AntConc GNU / Linuxissa

Ensimmäinen asia, joka meidän on tehtävä, on varmistaa, että meillä on LibreOffice asennettuna GNU / Linux-jakelumme. LibreOffice on ilmainen monitasoinen toimistopaketti, jolla on GPL: n lisenssi ja joka auttaa meitä muokkaamaan tekstidokumentteja, dioja, laskentataulukoita, tietokantoja, piirroksia ja matemaattisia kaavoja yksinkertaisella ja tehokkaalla tavalla.

Jos käytämme Debian, Linux Mint, Trisquel, Ubuntu tai mikä tahansa muu jakelu, joka perustuu Debian, Meidän ei enää tarvitse käsitellä sen asennusta, koska useimmissa näistä jakeluista uusimmissa versioissaan sekä muissa kuten Mageia, Fedora ja OpenSUSE, LibreOffice on jo esiasennettu, ja sinun täytyy vain löytää se ja suorittaa se sovelluspaneelista tai komentoriviltä.

Jos käytämme Debian Squeeze 6.0 -ohjelmaa, meidän on päivitettävä OpenOffice LibreOffice -palveluun näiden ohjeiden mukaan: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Kun olemme varmistaneet, että LibreOffice on asennettu järjestelmäämme, vierailemme nyt AntLab-verkkosivustolla, josta voimme löytää hyödyllisiä sovelluksia, jotka Laurence Anthony on kehittänyt laadulliseen tekstianalyysiin ja sanojen sovittamiseen alustojen välisten suoritettavien tiedostojen kanssa GNU / Linuxille, Macille Käyttöjärjestelmä ja Windows.

AntConc on Perlin ohjelmointikielellä kirjoitettu sovellus, jonka avulla voimme listata sanat aakkosjärjestyksessä tai ulkonäkötiheyden, avainsanojen mukaan, tehdä vastaavuuksia ja sanaryhmiä tiedostosta pelkkänä tekstinä, erottamalla pienet ja isot kirjaimet. Voit ladata sen siirtymällä tähän linkkiin: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html ja valitsemalla viidennessä sarakkeessa, jossa Tux-pingviini näyttää vaihtoehdon ladata AntConc 3.2.4u:

Kun valitun tiedoston lataus on valmis, avataan haluamasi tiedostoselain (Pcmanfm, Nautilus, Thunar, Dolphin tai mikä tahansa muu) avaamalla se käytetyn graafisen ympäristöpaneelin läpi tai painamalla alt + f2, kirjoittamalla sen nimi pientä kirjainta ja lyödä lopussa Enter ja luo sitten kaksi hakemistoa (kansiota) käyttäjähakemistoon, nimeämällä yksi Applications_extras ja toinen AntConc ensimmäisen alihakemistoksi:

Nyt siirrymme hakemistoon, johon antconc3.2.4u.tar.gz-tiedosto ladattiin (tässä esimerkissä Lataukset) ja avaamme tiedoston Xarchiverilla tai Filerollerilla purkamaan sen sisällön Antconc-hakemistoon valitsemalla ote-vaihtoehdon tiedostojen hallinta ja hakemistopolun / koti / käyttäjä / Extra_Applications / AntConc ilmoittaminen:

Kun antconc3.2.4u.tar.gz-paketin sisältö on purettu AntConc-hakemistoon Applications_extras-kansiossa, tunnistamme antconc3.2.4u-tiedoston antamaan sille suoritusoikeudet napsauttamalla hiiren oikealla painikkeella, kirjoittamalla ominaisuudet ja sallimalla suorituksen tiedoston tiedostona ohjelmana:

Ja tämän avulla meidän pitäisi pystyä avaamaan AntConc kaksoisnapsauttamalla hiirtä antconc3.2.4u-tiedostoa.

Halutessamme voimme tehdä kaikki edelliset toimenpiteet päätelaitteen kautta suorittamalla seuraavat komennot ja vaihtamalla "käyttäjän" istunnossa käytetyllä nimellä:

Hakemistojen luominen:

$ mkdir / home / user / Applications_extras (paina Enter)
$ mkdir / home / user / Applications_extras / AntConc (paina Enter)

Vaihda AntConc-hakemistoon ja pura antconc3.2.4u.tar.gz-sisältö:

$ cd / home / user / Applications_extras / AntConc / (paina Enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(press enter)

Anna suorittaa antconc3.2.4u-tiedosto ohjelmana:

$ chmod + x antconc3.2.4u (osuma Enter)

Ja suorita AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(press enter)

Valitusta menettelystä riippumatta voimme haluttaessa kopioida antconc3.2.4u-tiedoston hakemistoon / usr / bin ja antaa sille tarvittavat oikeudet, jotta AntConc voidaan suorittaa päätelaitteesta tai Alt + f2: lla vain kirjoittamalla antconc3.2.4u. Tätä varten suoritamme seuraavat komennot superkäyttäjinä su- tai sudo-näppäimillä:

$ sinun
(kirjoitamme juurisalasanamme ja painamme Enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# poistu

Ja nyt, vain suorittamalla antconc3.2.4u käyttäjän kanssa mistä tahansa pääteemulaattorista, AntConc avautuu edellisessä kuvassa esitetyllä tavalla.

$antconc3.2.4u

AntConcin käyttäminen sanojen luetteloon tietyn merkin mukaan

Kun olemme jo tunnistaneet, kuinka AntConc ladataan ja suoritetaan, annamme nyt esimerkin siitä, miten se etsii joitain sanoja hakemalla aakkosjärjestyksessä merkkejä sekä pienillä että isoilla kirjaimilla. Jos haluat syventää AntConcin toimintaa ja kaikkia sen käyttömahdollisuuksia, voit tutustua asiakirjaan README_AntConc3.2.4.pdf hakemistostamme / koti / käyttäjä / Aplicaciones_extras / AntConc tai ladata osoitteesta http: //www.antlab. sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf sekä tutustu online-ohjeeseen tai katso sen verkkosivustolla http://www.antlab.sci.waseda.ac. jp / antconc_index olevia video-oppaita. .html

AntConc voi toimia vain pelkkien tekstitiedostojen (".txt"), ".html", ".hml", "" .xml "ja sen oman muodon" .ant "kanssa, joten sen asiakirjan sisältö, josta teemme sanatunniste, vaihdamme sen alkuperäisestä muodostaan ​​".odt", ".rtf", ".pdf" tai jossakin muussa ".txt": ksi tekemällä valinta kaikesta sisällöstä, kopioimalla se ja liittämällä se uuteen tekstidokumenttitaso, joka käyttää ensisijaista tekstieditoria (mm. Leafpad, Gedit, Vim, Emacs). Tässä esimerkissä pyrimme luomaan temaattisen hakemiston kirjasta "Collaborative Construction of Knowledge", josta voimme vierailla sen verkkosivuilla: http://seminario.edusol.info/seco3/ ja jonka voimme ladata vapaasti tältä linkiltä: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Kun tiedosto on ladattu, löydämme sen lataushakemistostamme, avaamme sen pdf-dokumenttien katseluohjelmallamme (tässä esimerkissä Evince), valitsemme kaiken sen sisällön painamalla ctrl + a, kopioimme sen ja liitämme sen uuteen tavalliseen tiedostoon tekstiasiakirja:

Ja tallennamme uuden asiakirjan tekstimuodossa nimellä "Construccion_colaborativa_del_conocimiento.txt" Asiakirjat-hakemistoon:

Suoritetaan nyt AntConc ja avataan vasemman yläkulman ensimmäisestä välilehdestä "Tiedosto" tiedosto "Construccion_colaborativa_del_conocimiento.txt":

Vasemmassa sarakkeessa "Corpus Files" näkyy nyt tekstitiedostomme nimi, mikä osoittaa, että työskentelemme tämän tiedoston kanssa, koska AntConcissa voimme ladata useita tekstitiedostoja ja työskennellä niiden kanssa yhdessä tai erikseen:

Nyt tehdään luettelo kaikista sanoista, jotka sisältävät merkin "A", tunnistaakseen avainsanan tällä isolla kirjaimella, koska AntConc tarjoaa meille mahdollisuuden erottaa pienet ja isot kirjaimet, mikä on erittäin hyödyllistä tunnistaa oikeat nimet tai lyhenteet luettelomuodossa. Tätä varten sijoitamme ensimmäisen välilehden nimeltä "Concordance" "Corpus Files" -laitteen oikealle puolelle, poista "Words" -ruudun valinta merkitsemään "Case" -ruutu, molemmat "Hakutermin" oikeassa alakulmassa, kirjoitamme kenttä Hae A-kirjaimen alapuolelta ja napsauta violettia suorakulmiota, jossa lukee "Käynnistä":

Ja siinä luetellaan seuraavien tulokset. muoto:

Kuten voimme nähdä, jotkut aksentilla kirjoitetut merkit näyttävät samanlaisilta kuin sana "Autónoma" eikä "Autónoma". Tämä johtuu siitä, että meidän on kerrottava AntConcille oikea koodauskieli kielellemme, koska AntConc ei havaitse, että käytämme oletuksena espanjaa. Tätä varten avataan välilehti «Globlal Settings» yläreunassa «File» -kohdan vieressä, siirrymme viimeiseen vaihtoehtoon «Language Encoding Settings» oikealla puolella napsautamme «Edit» valitsemme ensimmäisen vaihtoehdon «Standard Encodings» We Napsauta sitä, valitse kolmas vaihtoehto oikealla olevasta "Unicode (utf8)" -luettelosta ja napsauta "Käytä" -ruutua ikkunan oikeassa alakulmassa:

Muutosten soveltamisen jälkeen napsautamme jälleen violettia suorakulmiota «Käynnistä» ja korostetut merkit näkyvät nyt luettavasti:

Tarkastelemme nyt sinisellä korostettuja A-kirjaimen sanoja helpottamiseksi ja valitsemme huomioiden perusteella sanat, jotka haluamme sisällyttää temaattiseen hakemistoon, esimerkiksi rivillä 17 "Yleinen lukutaidottomuus". sana, jonka todettiin olevan ensimmäinen, johon viitataan temaattisessa hakemistossamme «Tietojen yhteisrakentaminen» -tekstin sisällöstä.

Palataan pdf-asiakirjaan «Tietojen yhteisrakentaminen» selvittääksemme, millä sivuilla esiintyy «Tietokonetaidottomuus» kirjoittamalla «ctrl + f», kirjoittamalla sana «lukutaidottomuus» hakukenttään ja painamalla «Enter» lopussa ja kuinka monta kertaa tarvitset etsimäsi sana kaikilta sivuilta. Avaamme uuden asiakirjan LibreOffice Writer -sovelluksessa aihehakemistomme luomiseksi tai jos työskentelemme alun perin .odt-tiedostossa olevan sisällön parissa, avaamme kyseisen asiakirjan LibreOffice-palvelussa ja luomme ja muokkaamme sen aihehakemistoa vain millä tahansa sivulla :

Jos haluamme myös tunnistaa AntConc: n, missä lauseissa "Tietokonetaidottomuus" esiintyy asiakirjan "Construccion_colaborativa_del_conocimiento.txt" koko sisällössä, kirjoitamme hakukenttään "Tietokonetaidottomuus", poista valinta "Tapaus" -merkinnästä, merkitse "Sanat" ja napsauta sitä "Käynnistä":

Jos napsautamme mitä tahansa riveistä, jotka on korostettu sinisellä värillä «Tietokonetaidottomuus», esimerkiksi rivillä 4, «Tiedostonäkymä» -välilehdessä se näyttää meille tekstin osan, jossa tämä valinta näkyy korostettuna mustalla taustalla:

Tällä tavalla AntConc on meille erittäin hyödyllinen, kun olemme kirjoittaneet kirjan, esseen tai yhteenvedon emmekä tehneet aihekohtaista hakemistoa rinnakkain tai analysoimme systemaattisesti työn pääideoita lukemisen helpottamiseksi.


6 kommenttia, jätä omasi

Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastuussa tiedoista: Miguel Ángel Gatón
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.

  1.   RAW-Basic dijo

    Erittäin mielenkiintoinen työkalu .. ..en tiennyt siitä .. ja se on minulle erittäin hyödyllinen ..

    Kiitos..

  2.   Cristianhcd dijo

    erittäin hyvä artikkeli, mielenkiintoinen

  3.   Vanha mies dijo

    Paljon kiitoksia jakamisesta

  4.   Kuinka asentaa Linux dijo

    Suuri panos, erittäin hyödyllinen. Tietäen, että sinulla voi olla tämäntyyppisiä työkaluja Linuxissa, on aina merkitystä. Terveiset.

  5.   Phytoschido dijo

    Erinomainen pääsy. Pidän siitä, että he julkaisevat tämän tyyppistä sisältöä!

  6.   jathan dijo

    Hei kaikki. Kiitos kommenteistasi ja anteeksipyynnöstäsi, että voit kommentoida toistaiseksi. Toivon, että tutoroinnin toteuttaneilla ei ole ollut ongelmia.