Analyse de texte qualitative et création d'index thématiques avec AntConc et LibreOffice

Salutations les amis, je suis très heureux de me joindre et de participer à tout ce qui est désormais à ma portée dans <° Desde Linux. Je m'appelle Jathan et je partage avec vous cette première entrée basée sur une documentation que j'ai réalisée au service social de la coordination informatique de ma faculté. J'espère que vous le trouverez intéressant, utile et que vous ferez toutes sortes de commentaires.

Lorsque, dans un fichier texte, nous voulons trouver des mots-clés pour la création d'un index thématique, analyser les idées principales d'une œuvre ou un autre objectif similaire, nous devons effectuer des recherches au moyen desquelles nous pouvons distinguer entre les majuscules et les minuscules dans le mots, ainsi qu'une liste de ceux-ci mettant en évidence les caractères souhaités comme une lettre afin que nous puissions trouver des mots-clés de manière plus rapide et plus pratique.

La présente documentation vise à présenter et à expliquer l'utilisation d'une application d'analyse textuelle qualitative et d'un éditeur de texte pour faciliter la création d'un index thématique avec le Logiciel Libre.

La première partie expliquera la procédure d'installation LibreOffice et l'exécution de AntConc dans le système d'exploitation GNU / Linux et plus tard comment le faire dans les systèmes Windows et Mac OS, tandis que dans les parties suivantes quel que soit le système d'exploitation, il sera expliqué comment utiliser AntConc y LibreOffice Utilisation d'exemples pour créer un index des sujets.

LibreOffice et AntConc sous GNU / Linux

La première chose que nous devons faire est de vérifier que LibreOffice est installé sur notre distribution GNU / Linux. LibreOffice est une suite bureautique multiplateforme gratuite sous licence GPL et qui nous aide à éditer des documents texte, des diapositives, des feuilles de calcul, des bases de données, des dessins et des formules mathématiques d'une manière simple et efficace.

Si nous utilisons Debian, Linux Mint, Trisquel, Ubuntu ou toute autre distribution basée sur Debian, Nous n'aurons plus à nous occuper de son installation puisque dans la plupart de ces distributions dans leurs versions les plus récentes ainsi que dans d'autres telles que Mageia, Fedora et OpenSUSE, LibreOffice est déjà pré-installé et il suffit de le trouver et de l'exécuter depuis le panneau des applications ou par ligne de commande.

Si nous utilisons Debian Squeeze 6.0, nous devons mettre à jour OpenOffice vers LibreOffice en suivant ces instructions: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Après nous être assurés que LibreOffice est installé sur notre système, nous allons maintenant visiter le site Web AntLab où nous pouvons trouver des applications utiles développées par Laurence Anthony pour l'analyse de texte qualitative et la correspondance de mots avec des fichiers exécutables multiplateformes pour GNU / Linux, Mac OS et Windows.

AntConc est une application écrite dans le langage de programmation Perl qui nous aide à lister les mots par ordre alphabétique ou par fréquence d'apparition, les mots-clés, faire des correspondances et des groupes de mots à partir d'un fichier au format texte brut, en distinguant les caractères minuscules et majuscules. Pour le télécharger, rendez-vous sur ce lien: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html et sélectionnez dans la cinquième colonne où apparaît le pingouin Tux l'option pour télécharger AntConc 3.2.4u:

Lorsque le téléchargement du fichier sélectionné est terminé, nous ouvrons notre navigateur de fichiers préféré (Pcmanfm, Nautilus, Thunar, Dolphin ou tout autre) en l'ouvrant via le panneau d'environnement graphique que nous utilisons ou en appuyant sur alt + f2, en écrivant son nom dans minuscules et en appuyant sur Entrée à la fin, puis créez deux répertoires (dossiers) dans notre répertoire utilisateur, en nommant un Applications_extras et un autre AntConc comme sous-répertoire du premier:

Maintenant, nous allons dans le répertoire où le fichier antconc3.2.4u.tar.gz a été téléchargé (dans cet exemple étant Downloads) et nous ouvrons le fichier avec Xarchiver ou Fileroller pour décompresser son contenu dans le répertoire Antconc en sélectionnant l'option d'extraction dans notre gestionnaire de fichiers et en indiquant le chemin du répertoire / home / user / Extra_Applications / AntConc:

Une fois le contenu du package antconc3.2.4u.tar.gz extrait dans le répertoire AntConc dans Applications_extras, nous identifions le fichier antconc3.2.4u pour lui donner les autorisations d'exécution en cliquant avec le bouton droit de la souris, entrez les propriétés et autorisez le exécution du fichier en tant que programme:

Et avec cela, nous devrions pouvoir ouvrir AntConc en double-cliquant avec la souris sur le fichier antconc3.2.4u.

Si nous préférons, nous pouvons faire toute la procédure précédente via le terminal en exécutant les commandes suivantes et en changeant «utilisateur» par le nom que nous utilisons dans notre session:

Pour créer les répertoires:

$ mkdir / home / user / Applications_extras (appuyez sur Entrée)
$ mkdir / home / user / Applications_extras / AntConc (appuyez sur Entrée)

Accédez au répertoire AntConc et extrayez le contenu de antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (appuyez sur Entrée)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz (appuyez sur Entrée)

Autorisez à exécuter le fichier antconc3.2.4u en tant que programme:

$ chmod + x antconc3.2.4u (appuyez sur Entrée)

Et exécutez AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u (appuyez sur Entrée)

Quelle que soit la procédure que nous choisissons, si nous le souhaitons, nous pouvons copier le fichier antconc3.2.4u dans le répertoire / usr / bin et lui donner les autorisations nécessaires pour pouvoir exécuter AntConc à partir du terminal ou avec alt + f2 en écrivant uniquement antconc3.2.4 .XNUMXu. Pour cela, nous exécutons les commandes suivantes en tant que superutilisateur avec su ou sudo:

$ votre
(nous écrivons notre mot de passe root et appuyez sur Entrée)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# sortie

Et maintenant, juste en exécutant antconc3.2.4u avec notre utilisateur à partir de n'importe quel émulateur de terminal, AntConc s'ouvrira comme indiqué dans l'image précédente.

$antconc3.2.4u

Utiliser AntConc pour lister les mots par un caractère spécifique

Après avoir identifié comment télécharger et exécuter AntConc, nous allons maintenant céder la place pour illustrer son utilisation pour localiser certains mots au moyen d'une recherche par ordre alphabétique des caractères en minuscules et en majuscules. Si vous souhaitez approfondir le fonctionnement d'AntConc et toutes ses possibilités d'utilisation, vous pouvez consulter le document README_AntConc3.2.4.pdf dans notre répertoire / home / user / Aplicaciones_extras / AntConc ou le télécharger sur http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, ainsi que de consulter l'aide en ligne ou de visionner les didacticiels vidéo AntConc disponibles sur son site http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc ne peut fonctionner qu'avec des fichiers texte brut (".txt"), ".html", ".hml," ".xml" et son propre format ".ant", donc le contenu du document à partir duquel nous allons créer le identification de mot, nous le changerons de son format d'origine en ".odt", ".rtf", ".pdf" ou autre en ".txt" en faisant une sélection de tout le contenu, en le copiant et en le collant dans un nouveau texte plan de document exécutant notre éditeur de texte préféré (Leafpad, Gedit, Vim, Emacs, entre autres). Dans cet exemple nous chercherons à créer un index thématique à partir du livre «Collaborative Construction of Knowledge» à partir duquel nous pourrons visiter son site internet: http://seminario.edusol.info/seco3/ et que nous pouvons télécharger gratuitement à partir de ce lien: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Une fois le fichier téléchargé, nous le localisons dans notre répertoire de téléchargement, nous l'ouvrons avec notre visionneuse de document pdf (dans cet exemple Evince), nous sélectionnons tout son contenu en appuyant sur ctrl + a, nous le copions et le collons dans un nouveau plaine document texte:

Et nous sauvegardons notre nouveau document en texte brut avec le nom «Construccion_colaborativa_del_conocimiento.txt» dans le répertoire Documents:

Maintenant, nous exécutons AntConc et à partir du premier onglet en haut à gauche appelé "Fichier", nous ouvrons le fichier "Construccion_colaborativa_del_knowledge.txt":

Dans la colonne de gauche intitulée "Corpus Files", le nom de notre fichier texte apparaîtra maintenant, indiquant que nous allons travailler sur ce fichier, car dans AntConc nous pouvons charger plus d'un fichier texte et travailler dessus ensemble ou séparément:

Maintenant ce que nous allons faire est de lister tous les mots qui contiennent le caractère "A", pour identifier un mot-clé avec cette lettre majuscule, puisque AntConc nous offre la possibilité de distinguer les lettres minuscules et majuscules, ce qui est très utile pour identifier les noms propres ou les acronymes sous forme de liste. Pour cela on place le premier onglet appelé «Concordance» sur le côté droit de «Corpus Files», on décoche la case «Words» pour cocher la case «Case», tous deux en bas à droite de «Search Term», on écrit dans le champ Rechercher sous la lettre A et cliquer sur le rectangle violet qui dit "Démarrer":

Et il listera les résultats de ce qui suit. forme:

Comme nous pouvons le voir, certains caractères écrits avec des accents ressemblent au mot "Autónoma" au lieu de "Autónoma". C'est parce que nous devons indiquer à AntConc la langue de codage appropriée pour notre langue, car AntConc ne détecte pas que nous utilisons l'espagnol par défaut. Pour cela, nous ouvrons l'onglet "Paramètres Globlal" en haut à côté de "Fichier", nous allons à la dernière option "Paramètres de codage de langue" sur le côté droit, nous cliquons sur "Modifier" et sélectionnons la première option "Codages standard» Nous cliquez dessus, sélectionnez la troisième option dans la liste qui s'affiche à droite "Unicode (utf8)" et nous cliquons sur la case "Appliquer" en bas à droite de la fenêtre:

Après avoir appliqué les modifications, cliquez à nouveau sur le rectangle violet de «Démarrer» et les caractères accentués apparaîtront désormais lisiblement:

Nous examinons maintenant les mots avec la lettre A surlignée en bleu pour une identification facile et en fonction de nos considérations, nous sélectionnons ceux que nous voulons inclure dans l'index thématique, par exemple "L'analphabétisme informatique" dans la ligne numéro 17 étant le plus courant mot immédiat s'est avéré être le premier à être référencé dans notre index thématique à partir du contenu du texte de «Construction collaborative des savoirs».

Nous retournons au document pdf «Construction collaborative des connaissances» pour trouver dans quelles pages «L'analphabétisme informatique» apparaît en tapant «ctrl + f», en écrivant le mot «analphabétisme» dans le champ de recherche et en appuyant sur «entrée» à la fin et le nombre de fois nécessaire pour localiser le mot recherché sur toutes les pages. Nous ouvrons un nouveau document dans LibreOffice Writer pour créer notre index des sujets ou si nous travaillons sur le contenu d'un document qui est à l'origine en .odt, nous ouvrons ce document avec LibreOffice et nous ne créerons et éditerons son index des sujets que sur n'importe quelle page :

Si nous voulons aussi identifier avec AntConc dans quelles phrases «L'analphabétisme informatique» apparaît dans tout le contenu du document «Construccion_colaborativa_del_conocimiento.txt», nous écrivons «Analphabétisme informatique» dans le champ de recherche, décochez «Cas», cochez «Mots» et cliquez dessus pour "Démarrer":

Si nous cliquons sur l'une des lignes en surbrillance «Analphabétisme informatique» avec la couleur bleue, par exemple dans la ligne 4, dans l'onglet «Vue de fichier», il nous montrera le fragment du texte où cette sélection apparaît surlignée en noir à partir de l'arrière-plan:

De cette manière, AntConc nous est très utile lorsque nous avons écrit un livre, un essai ou un résumé et que nous ne faisions pas d'index thématique en parallèle ou pour analyser systématiquement les idées principales d'une œuvre pour faciliter sa lecture.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données: Miguel Ángel Gatón
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.

  1.   RAW-Basique dit

    Outil très intéressant .. .. je ne le savais pas .. et il m'est très utile ..

    Merci ..

  2.   Cristianhcd dit

    très bon article, intéressant

  3.   Vieil homme dit

    Merci beaucoup pour le partage

  4.   Comment installer Linux dit

    Excellente contribution, très utile. Savoir que vous pouvez avoir ce type d'outil sous Linux fait toujours une différence. Cordialement.

  5.   Phytoschido dit

    Excellente entrée. J'aime qu'ils publient ce type de contenu!

  6.   Jonathan dit

    Bonjour à tous. Merci pour vos commentaires et excuses pour avoir pu commenter jusqu'à présent. J'espère que ceux qui ont mis le tutorat en pratique n'ont eu aucun problème.