Anàlisi qualitativa de text i creació d'índexs temàtics amb AntConc i LibreOffice

Salutacions amigues i amics, em dóna molt de gust unir-me i participar en el que estigui al meu abast d'ara endavant en <° Desde Linux. Em dic jathan i els comparteixo aquesta primera entrada a partir d'una documentació que vaig fer al servei social de la coordinació d'informàtica de la meva facultat. Espero que la trobin interessant, els sigui útil, així com facin tota mena de comentaris.

Quan en algun arxiu de text volem trobar paraules clau per a la creació d'un índex temàtic, analitzar les idees principals d'una obra o algun altre propòsit semblant, necessitem fer cerques mitjançant les quals puguem distingir entre caràcters amb majúscules i minúscules dins de les paraules, així com un llistat d'aquestes ressaltant els caràcters desitjats com alguna lletra perquè aconseguim de manera més ràpida i pràctica la localització de paraules clau.

La present documentació té com a objectiu presentar i explicar l'ús d'una aplicació d'anàlisi textual qualitatiu i un editor de text per facilitar la realització d'un índex temàtic amb Programari Lliure.

A la primera part s'explicarà el procediment per a la instal·lació de LibreOffice i l'execució de AntConc dins el sistema operatiu GNU / Linux i posteriorment com fer-ho dins dels sistemes Windows i Mac OS, mentre que en les següents parts independentment de sistema operatiu, s'explicarà com utilitzar AntConc y LibreOffice mitjançant exemples per crear un índex temàtic.

LibreOffice i AntConc en GNU / Linux

El primer que necessitem fer és verificar que tinguem instal·lat LibreOffice en la nostra distribució GNU / Linux. LibreOffice és una suite ofimàtica lliure multiplataforma llicenciada amb GPL i que ens serveix per editar documents de text, diapositives, fulls de càlcul, bases de dades, dibuixos i fórmules matemàtiques de forma senzilla i eficaç.

Si estem fent servir Debian, Linux Mint, Trisquel, Ubuntu o qualsevol altra distribució basada en Debian, Ja no ens haurem d'ocupar de la seva instal·lació ja que en la majoria d'aquestes distribucions en les seves versions més recents així com en altres com Mageia, Fedora i OpenSUSE, LibreOffice ja ve preinstal·lat i només cal buscar-lo i executar-lo des del panell d'aplicacions o per línia de comandes.

Si estem fent servir Debian Squeeze 6.0 hem de actualitzar OpenOffice a LibreOffice seguint aquestes indicacions: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Després d'assegurar-nos tenir LibreOffice instal·lat en el nostre sistema, ara donarem pas a visitar la pàgina web d'AntLab on podem trobar algunes aplicacions útils desenvolupades per Laurence Anthony per anàlisi qualitativa de text i concordança de paraules amb arxius executables multiplataforma per a GNU / Linux, Mac OS i Windows.

AntConc és una aplicació escrita en el llenguatge de programació Perl que ens serveix per llistar paraules per ordre alfabètic o per freqüència d'aparició, paraules clau, fer concordances i grups de paraules des d'un arxiu en format de text pla distingint caràcters en minúscules i majúscules. Per descarregar-entrem a aquest enllaç: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html i seleccionem en la cinquena columna on apareix el pingüí Tux l'opció per descarregar AntConc 3.2.4u:

Quan finalitzi la descàrrega de l'arxiu seleccionat, vam obrir el nostre navegador d'arxius preferit (gestor de fitxers pcman, Nautilus, Thunar, Dolphin o qualsevol altre) obrint-lo a través del panell de l'entorn gràfic que usem o pressionant alt + f2, escrivint el seu nom en minúscules i donant enter a al final per després crear dos directoris (carpetes) dins del nostre directori d'usuari, anomenant un Aplicaciones_extras i un altre AntConc com subdirectori de el primer:

Ara ens anem a directori on es va descarregar l'arxiu antconc3.2.4u.tar.gz (sent en aquest exemple Descàrregues) i obrim l'arxiu amb Xarchiver o File Roller per descomprimir el seu contingut a directori Antconc seleccionant l'opció extreure en el nostre gestor de fitxers i indicant-li la ruta de directoris / home / usuari / Aplicaciones_extras / AntConc:

Un cop extret el contingut de l'paquet antconc3.2.4u.tar.gz a directori AntConc dins Aplicaciones_extras, identifiquem l'arxiu antconc3.2.4u per donar-li permisos d'execució donant-li clic amb el botó dret de el ratolí, entrar a propietats i permetre executar el arxiu com un programa:

I amb això ja hauríem de poder obrir AntConc donant doble clic amb el ratolí sobre l'arxiu antconc3.2.4u.

Si ho preferim, podem fer tot el procediment anterior a través de la terminal executant les següents ordres i canviant «usuari» pel nom que fem servir a la nostra sessió:

Per crear els directoris:

$ Mkdir / home / usuari / Aplicaciones_extras (prémer enter)
$ Mkdir / home / usuari / Aplicaciones_extras / AntConc (prémer enter)

Canviar-nos a directori AntConc i realitzar l'extracció de l'contingut d'antconc3.2.4u.tar.gz:

$ Cd / home / usuari / Aplicaciones_extras / AntConc / (prémer enter)
$ Tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(pulsar enter)

Permetre executar l'arxiu antconc3.2.4u com un programa:

$ Chmod + x antconc3.2.4u (prémer enter)

I executar AntConc:

$ /Home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(pulsar enter)

Independentment de l'procediment que triem, si ho desitgem podem copiar el fitxer antconc3.2.4u a directori / usr / bin i donar-li els permisos necessaris per poder executar AntConc des de la terminal o amb alt + f2 escrivint únicament antconc3.2.4u. Per això executem les següents ordres com a root amb su o el sudo:

$ la seva
(Escrivim la nostra contrasenya de root i donem enter)
# Cp /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u / usr / bin
# Chmod a + rwx /usr/bin/antconc3.2.4u
# exit

I ara tan sols amb executar antconc3.2.4u amb el nostre usuari des de qualsevol emulador de terminal, s'obrirà AntConc com es mostra a la imatge anterior.

$ antconc3.2.4u

Utilització de AntConc per llistar paraules a través d'un caràcter específic

Ja tenint identificat com descarregar i executar AntConc, ara donarem pas a exemplificar el seu ús per a la localització d'algunes paraules mitjançant una recerca per ordre alfabètic de caràcters tant en minúscules com en majúscules. Si es vol aprofundir més detalladament en el funcionament de AntConc i totes les seves possibilitats d'ús, es pot consultar el document README_AntConc3.2.4.pdf dins del nostre directori / home / usuari / Aplicaciones_extras / AntConc o descarregar-se des http: //www.antlab .sci.waseda.ac.jp / programari / antconc335 / AntConc_readme.pdf, així com consultar l'ajuda en línia o veure els video tutorials de AntConc disponibles al seu lloc web http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc només pot treballar amb arxius de text pla ( «.txt»), «.html», «.hml,» «.xml» i el seu format propi «.ant», de manera que el contingut de el document de el qual realitzarem la identificació de paraules, el passarem del seu format original en «.odt», «.rtf», «.pdf» o algun altre a «.txt» fent una selecció de tot el contingut, copiant-lo i enganxant a un nou document de text pla executant nostre editor de text preferit (Leafpad, Gedit, Vim, Emacs, entre d'altres). En aquest exemple buscarem crear un índex temàtic a partir d'el llibre «Construcció col·laborativa de el coneixement» de el qual podem visitar el seu lloc web: http://seminario.edusol.info/seco3/ i que podem descarregar lliurement des d'aquest enllaç: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Un cop descarregat l'arxiu, el localitzem en el nostre directori de descàrregues, l'obrim amb el nostre visor de documents pdf (en aquest exemple Evince), vam seleccionar tot el seu contingut pressionant ctrl + a, el copiem i l'enganxem en un nou document de text pla :

I guardem el nostre nou document en text pla amb el nom de «Construccion_colaborativa_del_conocimiento.txt» en el directori Documents:

Ara executem AntConc i des de la primera pestanya superior esquerra anomenada «File» obrim el fitxer "Construccion_colaborativa_del_conocimiento.txt»:

A la columna esquerra anomenada «Corpus Files» ara ens apareixerà el nom del nostre arxiu de text indicant-nos que sobre aquest arxiu estarem treballant, ja que en AntConc podem carregar més d'un arxiu de text i treballar sobre ells conjuntament o per separat:

Ara el que farem serà llistar totes les paraules que continguin el caràcter «A», per identificar alguna paraula clau amb aquesta lletra en majúscula, ja que AntConc ens ofereix la possibilitat de distingir lletres minúscules i majúscules, sent això molt útil per identificar noms propis o sigles en forma de llista. Per això situem la primera pestanya anomenada «Concordance» a la banda dreta de «Corpus Files» desmarquem la casella «Words» per marcar la de «Casi» totes dues a la part de baix a la dreta de «motor Term», escrivim en el camp de recerca sota la lletra a i li donem clic a l'rectangle morat que diu «Start»:

I ens llistarà els resultats de la sig. forma:

Com podem veure alguns caràcters escrits amb accent apareixen semblant a la paraula «Autònoma» en lloc de «autònoma». Això es deu al fet que hem de indicar-li a AntConc el llenguatge de codificació adequat per al nostre idioma, ja que AntConc no detecta que estem fent servir l'espanyol per defecte. Per això obrim la pestañana «globlal Settings» a la part de dalt a costat de «File», ens anem a l'última opció «Language Encoding Settings» en el costat dret li donem clic a «Edit» seleccionem la primera opció «Standard Encodings »li donem un clic, seleccionem la tercera opció de la llista que se'ns desplega a la dreta« Unicode (utf8) »i li donem clic a la casella de« Apply »a la part inferior dreta de la finestra:

Després d'aplicar els canvis, novament li donem clic a l'rectangle morat de «Start» i els caràcters amb accent ja ens apareixeran de forma llegible:

Ara anem revisant les paraules amb la lletra A ressaltada en color blau per a la seva fàcil identificació i amb base a les nostres consideracions, anem seleccionant les que desitgem incloure en l'índex temàtic, sent per exemple «analfabetització informàtica» a la fila número 17 la paraula més immediata trobada per a ser la primera a referir-se en el nostre índex temàtic a partir d'el contingut de el text de «Construcció col·laborativa de el coneixement».

Tornem a el document pdf «Construcció col·laborativa de el coneixement» per localitzar en què pàgines apareix «analfabetització informàtica» teclejant «ctrl + f», escrivint la paraula «analfabetització» en el camp de recerca i prement «enter» a al final i el nombre de vegades que sigui necessari per localitzar en totes les pàgines la paraula buscada. Obrim un document nou a LibreOffice Writer per anar creant el nostre índex temàtic o si estiguéssim treballant sobre el contingut d'un document que originalment està en .odt, vam obrir aquest document amb LibreOffice i només anirem creant i editant en alguna pàgina el seu índex temàtic:

Si a més volem identificar amb AntConc en què oracions apareix «analfabetització informàtica» a tot el contingut de el document «Construccion_colaborativa_del_conocimiento.txt», escrivim «analfabetització informàtica» en el camp de recerca, desmarquem «Casi», marquem «Words» i li donem clic a «Start»:

Si li donem clic en alguna de les files ressaltades a «analfabetització informàtica» amb color blau, per exemple a la fila 4, a la pestanya de «File View» ens mostrarà el fragment de text on apareix aquesta selecció ressaltada amb color negre de fons:

D'aquesta manera, AntConc ens és molt útil quan hem escrit algun llibre, assaig o resum i no vam anar fent paral·lelament un índex temàtic o per analitzar de manera sistemàtica les idees principals d'alguna obra per facilitar-ne la lectura.


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.

  1.   RAW-Basic va dir

    Molt interessant eina .. ..la desconocía..y em ve molt útil ..

    Gràcies ..

  2.   cristianhcd va dir

    molt bon article, interessant

  3.   vellet va dir

    Moltes gràcies per compartir

  4.   Com Instal·lar Linux va dir

    Grandiós aportació, molt útil. Saber que en linux pots tenir aquest tipus d'eines sempre fa la diferència. Salutacions.

  5.   Fitosxid va dir

    Excel·lent entrada. M'agrada que publiquin aquest tipus de continguts!

  6.   jathan va dir

    Hola a tots. Gràcies pels seus comentaris i una disculpa per poder fer comentaris fins ara. Espero que els que hagin posat en pràctica el tut no hagin tingut cap problema.