Analisi qualitativa del testo e creazione di indici di soggetto con AntConc e LibreOffice

Saluti amici, sono molto felice di unirmi e partecipare a tutto ciò che è alla mia portata da ora in poi in <° Desde Linux. Mi chiamo Jathan e condivido con voi questo primo articolo basato sulla documentazione che ho realizzato nel servizio sociale del coordinamento informatico della mia facoltà. Spero che lo troverete interessante, utile e che farete tutti i tipi di commenti.

Quando in un file di testo vogliamo trovare parole chiave per la creazione di un indice tematico, analizzare le idee principali di un'opera o qualche altro scopo simile, dobbiamo fare delle ricerche attraverso le quali possiamo distinguere tra caratteri maiuscoli e minuscoli all'interno delle parole, così come un elenco di questi evidenziando i caratteri desiderati come una lettera in modo da poter trovare le parole chiave in modo più veloce e pratico.

L'obiettivo di questa documentazione è presentare e spiegare l'uso di un'applicazione di analisi testuale qualitativa e di un editor di testo per facilitare la realizzazione di un indice tematico con Software Libero.

Nella prima parte, la procedura per l'installazione di LibreOffice e l'esecuzione di AntConc all'interno del sistema operativo GNU / Linux e successivamente come farlo all'interno dei sistemi Windows e Mac OS, mentre nelle parti seguenti indipendentemente dal sistema operativo, verrà spiegato come utilizzare AntConc y LibreOffice Utilizzo di esempi per creare un indice di soggetto.

LibreOffice e AntConc su GNU / Linux

La prima cosa che dobbiamo fare è verificare di avere LibreOffice installato sulla nostra distribuzione GNU / Linux. LibreOffice è una suite per ufficio multipiattaforma gratuita con licenza GPL e che ci aiuta a modificare documenti di testo, diapositive, fogli di calcolo, database, disegni e formule matematiche in modo semplice ed efficiente.

Se stiamo usando Debian, Linux Mint, Trisquel, Ubuntu o qualsiasi altra distribuzione basata su Debian, Non dovremo più occuparci della sua installazione poiché nella maggior parte di queste distribuzioni nelle loro versioni più recenti e in altre come Mageia, Fedora e OpenSUSE, LibreOffice è già preinstallato e devi solo trovarlo ed eseguirlo dal pannello delle applicazioni o dalla riga di comando.

Se stiamo usando Debian Squeeze 6.0 dobbiamo aggiornare OpenOffice a LibreOffice seguendo queste istruzioni: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Dopo esserci assicurati di avere LibreOffice installato sul nostro sistema, andremo ora a visitare il sito web di AntLab dove possiamo trovare alcune utili applicazioni sviluppate da Laurence Anthony per l'analisi qualitativa del testo e la corrispondenza delle parole con file eseguibili multipiattaforma per GNU / Linux, Mac OS e Windows.

AntConc è un'applicazione scritta nel linguaggio di programmazione Perl che ci permette di elencare parole in ordine alfabetico o per frequenza di apparizione, parole chiave, creare corrispondenze e gruppi di parole da un file in formato testo, distinguendo tra caratteri minuscoli e maiuscoli. Per scaricarlo andate a questo link: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html e selezionate nella quinta colonna dove compare il pinguino di Tux l'opzione per scaricare AntConc 3.2.4u:

Quando il download del file selezionato è terminato, apriamo il nostro browser di file preferito (Pcmanfm, Nautilus, Thunar, Dolphin o qualsiasi altro) aprendolo tramite il pannello dell'ambiente grafico che utilizziamo o premendo alt + f2, scrivendo il suo nome in minuscolo e premendo invio alla fine e quindi creare due directory (cartelle) all'interno della nostra directory utente, nominando un Applications_extras e un altro AntConc come sottodirectory del primo:

Ora andiamo nella directory in cui è stato scaricato il file antconc3.2.4u.tar.gz (in questo esempio Download) e apriamo il file con Xarchiver o Fileroller per decomprimere il suo contenuto nella directory Antconc selezionando l'opzione di estrazione nel nostro file manager e indicando il percorso della directory / home / user / Extra_Applications / AntConc:

Una volta che il contenuto del pacchetto antconc3.2.4u.tar.gz è stato estratto nella directory AntConc all'interno di Applications_extras, identifichiamo il file antconc3.2.4u per dargli i permessi di esecuzione facendo clic con il tasto destro del mouse, inserire proprietà e consentire l'esecuzione del file come programma:

E con questo dovremmo essere in grado di aprire AntConc facendo doppio clic con il mouse sul file antconc3.2.4u.

Se preferiamo, possiamo fare tutta la procedura precedente tramite terminale eseguendo i seguenti comandi e cambiando "utente" con il nome che usiamo nella nostra sessione:

Per creare le directory:

$ mkdir / home / user / Applications_extras (premi invio)
$ mkdir / home / user / Applications_extras / AntConc (premi invio)

Passa alla directory AntConc ed estrai il contenuto di antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (premi invio)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz( premere invio)

Consenti di eseguire il file antconc3.2.4u come programma:

$ chmod + x antconc3.2.4u (premi invio)

Ed esegui AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u (premere invio)

Indipendentemente dalla procedura che scegliamo, se lo desideriamo, possiamo copiare il file antconc3.2.4u nella directory / usr / bin e dargli i permessi necessari per poter eseguire AntConc da terminale o con alt + f2 scrivendo solo antconc3.2.4 .XNUMXu. Per questo eseguiamo i seguenti comandi come superutente con su o sudo:

$ su
(scriviamo la nostra password di root e premiamo invio)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# Uscita

E ora, semplicemente eseguendo antconc3.2.4u con il nostro utente da qualsiasi emulatore di terminale, AntConc si aprirà come mostrato nell'immagine precedente.

$antconc3.2.4u

Utilizzo di AntConc per elencare le parole in base a un carattere specifico

Avendo già individuato come scaricare ed eseguire AntConc, daremo ora modo di esemplificarne l'utilizzo per la localizzazione di alcune parole mediante una ricerca in ordine alfabetico di caratteri sia in minuscolo che in maiuscolo. Se vuoi approfondire il funzionamento di AntConc e tutte le sue possibilità di utilizzo, puoi consultare il documento README_AntConc3.2.4.pdf nella nostra directory / home / user / Aplicaciones_extras / AntConc o scaricarlo da http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, nonché consultare la guida in linea o guardare i tutorial video di AntConc disponibili sul suo sito web http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc può funzionare solo con file di testo normale (".txt"), ".html", ".hml", ".xml" e il suo formato ".ant", quindi il contenuto del documento da cui faremo il identificazione delle parole, la cambieremo dal suo formato originale in ".odt", ".rtf", ".pdf" o qualche altro in ".txt" facendo una selezione di tutto il contenuto, copiandolo e incollandolo in un nuovo piano del documento di testo che esegue il nostro editor di testo preferito (Leafpad, Gedit, Vim, Emacs, tra gli altri). In questo esempio cercheremo di creare un indice tematico dal libro «Collaborative Construction of Knowledge» da cui possiamo visitare il suo sito web: http://seminario.edusol.info/seco3/ e che possiamo scaricare gratuitamente da questo link: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Una volta scaricato il file, lo individuiamo nella nostra directory dei download, lo apriamo con il nostro visualizzatore di documenti pdf (in questo esempio Evince), selezioniamo tutto il suo contenuto premendo ctrl + a, lo copiamo e lo incolliamo in un nuovo documento di testo semplice :

E salviamo il nostro nuovo documento in testo semplice con il nome di «Construccion_colaborativa_del_conocimiento.txt» nella directory Documents:

Adesso lanciamo AntConc e dalla prima scheda in alto a sinistra chiamata "File" apriamo il file "Construccion_colaborativa_del_knowledge.txt":

Nella colonna di sinistra denominata "Corpus Files" apparirà ora il nome del nostro file di testo, indicando che lavoreremo su questo file, poiché in AntConc possiamo caricare più di un file di testo e lavorarci insieme o separatamente:

Ora quello che faremo è elencare tutte le parole che contengono il carattere "A", per identificare una parola chiave con questa lettera maiuscola, poiché AntConc ci offre la possibilità di distinguere lettere minuscole e maiuscole, questo essendo molto utile per identificare nomi propri o acronimi sotto forma di elenco. Per questo mettiamo la prima scheda chiamata «Concordanza» sul lato destro di «Corpus Files», deselezioniamo la casella «Parole» per contrassegnare la casella «Caso», entrambi in basso a destra di «Termine di ricerca», scriviamo nel campo Cerca sotto la lettera A e fai clic sul rettangolo viola che dice "Avvia":

Ed elencherà i risultati di quanto segue. forma:

Come possiamo vedere, alcuni caratteri scritti con accenti sembrano simili alla parola "Autónoma" invece di "Autónoma". Questo perché dobbiamo indicare ad AntConc la lingua di codifica appropriata per la nostra lingua, poiché AntConc non rileva che stiamo utilizzando lo spagnolo per impostazione predefinita. Per questo apriamo la scheda «Impostazioni globali» in alto accanto a «File», andiamo all'ultima opzione «Impostazioni di codifica lingua» sul lato destro clicchiamo su «Modifica» selezioniamo la prima opzione «Codifiche standard» Noi cliccaci sopra, seleziona la terza opzione dalla lista che compare a destra "Unicode (utf8)" e clicca sulla casella "Applica" nella parte inferiore destra della finestra:

Dopo aver applicato le modifiche, facciamo di nuovo clic sul rettangolo viola di «Start» e i caratteri accentati appariranno ora in modo leggibile:

Ora stiamo rivedendo le parole con la lettera A evidenziata in blu per una facile identificazione e in base alle nostre considerazioni, stiamo selezionando quelle che vogliamo includere nell'indice tematico, ad esempio "Analfabetismo informatico" nella riga numero 17 è la parola più comune immediato trovato il primo a cui si fa riferimento nel nostro indice tematico dal contenuto del testo di «Costruzione collaborativa della conoscenza».

Torniamo al documento pdf «Costruzione collaborativa della conoscenza» per scoprire in quali pagine compare «Analfabetismo informatico» digitando «ctrl + f», scrivendo la parola «Analfabetismo» nel campo di ricerca e premendo «invio» alla fine e il numero di volte necessario per individuare la parola cercata su tutte le pagine. Apriamo un nuovo documento in LibreOffice Writer per creare il nostro indice soggetto o se stiamo lavorando sul contenuto di un documento che è originariamente in .odt, apriamo quel documento con LibreOffice e creeremo e modificheremo solo il suo indice soggetto su qualsiasi pagina:

Se vogliamo identificarci anche con AntConc in quali frasi "Analfabetismo informatico" compaiono in tutto il contenuto del documento "Construccion_colaborativa_del_conocimiento.txt", scriviamo "Analfabetismo informatico" nel campo di ricerca, deselezioniamo "Case", contrassegniamo "Parole" e cliccatelo iniziare":

Se facciamo clic su una delle righe evidenziate in «Analfabetismo informatico» con colore blu, ad esempio nella riga 4, nella scheda «Visualizzazione file» ci mostrerà il frammento del testo in cui questa selezione appare evidenziata in nero da sfondo:

In questo modo, AntConc ci è molto utile quando abbiamo scritto un libro, un saggio o un sommario e non stavamo facendo un indice tematico in parallelo o per analizzare sistematicamente le idee principali di un'opera per facilitarne la lettura.


Lascia un tuo commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *

*

*

  1. Responsabile dei dati: Miguel Ángel Gatón
  2. Scopo dei dati: controllo SPAM, gestione commenti.
  3. Legittimazione: il tuo consenso
  4. Comunicazione dei dati: I dati non saranno oggetto di comunicazione a terzi se non per obbligo di legge.
  5. Archiviazione dati: database ospitato da Occentus Networks (UE)
  6. Diritti: in qualsiasi momento puoi limitare, recuperare ed eliminare le tue informazioni.

  1.   RAW-Base suddetto

    Strumento molto interessante .. ..non lo sapevo .. ed è molto utile per me ..

    Grazie ..

  2.   Cristianhcd suddetto

    articolo molto buono, interessante

  3.   Vecchio uomo suddetto

    Grazie mille per la condivisione

  4.   Come installare Linux suddetto

    Ottimo contributo, molto utile. Sapere che puoi avere questi tipi di strumenti in Linux fa sempre la differenza. Saluti.

  5.   Phytoschido suddetto

    Ingresso eccellente. Mi piace che pubblichino questo tipo di contenuti!

  6.   jathan suddetto

    Ciao a tutti. Grazie per i tuoi commenti e le scuse per aver potuto commentare finora. Mi auguro che chi ha implementato il tutoraggio non abbia avuto problemi.