Kwalitatieve tekstanalyse en het maken van onderwerpindexen met AntConc en LibreOffice

Gegroet vrienden, ik ben erg blij om vanaf nu in <° mee te doen en deel te nemen aan alles wat binnen mijn bereik ligt Desde Linux. Mijn naam is Jathan en ik deel dit eerste bericht met u op basis van documentatie die ik heb gemaakt bij de sociale dienst van de IT-coördinatie van mijn faculteit. Ik hoop dat je het interessant en nuttig vindt en dat je er allerlei opmerkingen over maakt.

Als we in een tekstbestand trefwoorden willen vinden voor het maken van een thematische index, de belangrijkste ideeën van een werk of een ander soortgelijk doel willen analyseren, moeten we zoekopdrachten uitvoeren waarmee we onderscheid kunnen maken tussen hoofdletters en kleine letters binnen de woorden, evenals een lijst hiervan met de gewenste tekens zoals een letter, zodat we trefwoorden op een snellere en meer praktische manier kunnen vinden.

Het doel van deze documentatie is om het gebruik van een kwalitatieve tekstanalyse-applicatie en een teksteditor te presenteren en uit te leggen om de realisatie van een thematische index met Vrije Software te vergemakkelijken.

In het eerste deel de procedure voor de installatie van LibreOffice en de uitvoering van Ant Conc binnen het besturingssysteem GNU / Linux en later hoe u het moet doen binnen Windows- en Mac OS-systemen, terwijl in de volgende delen, ongeacht het besturingssysteem, wordt uitgelegd hoe u Ant Conc y LibreOffice Voorbeelden gebruiken om een ​​onderwerpindex te maken.

LibreOffice en AntConc op GNU / Linux

Het eerste dat we moeten doen, is controleren of LibreOffice is geïnstalleerd op onze GNU / Linux-distributie. LibreOffice is een gratis kantoorpakket voor meerdere platforms met een licentie van GPL en dat ons helpt tekstdocumenten, dia's, spreadsheets, databases, tekeningen en wiskundige formules op een eenvoudige en efficiënte manier te bewerken.

Als we gebruiken Debian, Linux Mint, Trisquel, Ubuntu of enige andere distributie gebaseerd op Debian, We zullen niet langer te maken hebben met de installatie ervan, aangezien in de meeste van deze distributies in hun meest recente versies en in andere zoals Mageia, Fedora en OpenSUSE, LibreOffice al vooraf is geïnstalleerd en je het gewoon hoeft te vinden en het uit te voeren vanuit het toepassingenpaneel of via de opdrachtregel.

Als we Debian Squeeze 6.0 gebruiken, moeten we OpenOffice bijwerken naar LibreOffice door deze instructies te volgen: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Nadat we ervoor hebben gezorgd dat LibreOffice op ons systeem is geïnstalleerd, gaan we nu verder met het bezoeken van de AntLab-website waar we enkele nuttige applicaties kunnen vinden die zijn ontwikkeld door Laurence Anthony voor kwalitatieve tekstanalyse en woordvergelijking met platformonafhankelijke uitvoerbare bestanden voor GNU / Linux, Mac OS en Windows.

AntConc is een applicatie geschreven in de programmeertaal Perl waarmee we woorden in alfabetische volgorde of op frequentie van voorkomen, trefwoorden kunnen vermelden, concordanties en groepen woorden uit een bestand kunnen maken in platte tekst, waarbij we onderscheid kunnen maken tussen kleine letters en hoofdletters. Om het te downloaden, ga naar deze link: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html en selecteer in de vijfde kolom waar de Tux-pinguïn verschijnt de optie om AntConc 3.2.4u te downloaden:

Wanneer het downloaden van het geselecteerde bestand is voltooid, openen we onze voorkeursbestandsbrowser (Pcmanfm, Nautilus, Thunar, Dolphin of een ander) door deze te openen via het grafische omgevingspaneel dat we gebruiken of door op alt + f2 te drukken en de naam in kleine letters en druk op enter aan het einde en maak vervolgens twee mappen (mappen) binnen onze gebruikersdirectory, waarbij u een Applications_extras en een andere AntConc noemt als een submap van de eerste:

Nu gaan we naar de directory waar het antconc3.2.4u.tar.gz-bestand werd gedownload (in dit voorbeeld Downloads) en openen we het bestand met Xarchiver of Fileroller om de inhoud uit te pakken naar de Antconc-directory door de extractie-optie in onze bestandsbeheerder en met vermelding van het directorypad / home / user / Extra_Applications / AntConc:

Zodra de inhoud van het antconc3.2.4u.tar.gz-pakket is uitgepakt naar de AntConc-directory in Applications_extras, identificeren we het antconc3.2.4u-bestand om het uitvoeringsrechten te geven door met de rechtermuisknop te klikken, eigenschappen in te voeren en de uitvoering toe te staan van het bestand als een programma:

En hiermee zouden we AntConc moeten kunnen openen door met de muis te dubbelklikken op het antconc3.2.4u-bestand.

Als we dat willen, kunnen we alle voorgaande procedures via de terminal uitvoeren door de volgende opdrachten uit te voeren en "gebruiker" te wijzigen met de naam die we in onze sessie gebruiken:

Om de mappen aan te maken:

$ mkdir / home / user / Applications_extras (druk op enter)
$ mkdir / home / user / Applications_extras / AntConc (druk op enter)

Ga naar de AntConc-directory en pak de inhoud van antconc3.2.4u.tar.gz uit:

$ cd / home / user / Applications_extras / AntConc / (druk op enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(druk op enter)

Sta toe om het antconc3.2.4u-bestand als een programma uit te voeren:

$ chmod + x antconc3.2.4u (druk op enter)

En voer AntConc uit:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(druk op enter)

Ongeacht de procedure die we kiezen, kunnen we desgewenst het antconc3.2.4u-bestand kopiëren naar de / usr / bin-directory en het de nodige machtigingen geven om AntConc vanaf de terminal te kunnen uitvoeren of met alt + f2 en alleen antconc3.2.4 schrijven .XNUMXu. Hiervoor voeren we de volgende commando's uit als superuser met su of sudo:

$ jouw
(we schrijven ons root-wachtwoord en drukken op enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# Uitgang

En nu, gewoon door antconc3.2.4u uit te voeren met onze gebruiker vanaf een willekeurige terminalemulator, wordt AntConc geopend zoals weergegeven in de vorige afbeelding.

$antconc3.2.4u

AntConc gebruiken om woorden op een specifiek teken weer te geven

Nu we hebben vastgesteld hoe AntConc moet worden gedownload en uitgevoerd, zullen we nu plaats maken voor voorbeelden van het gebruik ervan voor het lokaliseren van enkele woorden door middel van een zoekopdracht in alfabetische volgorde van tekens in zowel kleine letters als hoofdletters. Als u dieper in wilt gaan op de werking van AntConc en al zijn gebruiksmogelijkheden, kunt u het document README_AntConc3.2.4.pdf raadplegen in onze directory / home / user / Aplicaciones_extras / AntConc of het downloaden van http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, en raadpleeg de online help of bekijk de AntConc video-tutorials die beschikbaar zijn op haar website http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc kan alleen werken met platte tekstbestanden (".txt"), ".html", ".hml," ".xml" en zijn eigen formaat ".ant", dus de inhoud van het document waarvan we de woordidentificatie, zullen we het veranderen van het oorspronkelijke formaat in ".odt", ".rtf", ".pdf" of iets anders naar ".txt", een selectie maken van alle inhoud, kopiëren en plakken naar een nieuwe tekst documentvlak met onze favoriete teksteditor (onder andere Leafpad, Gedit, Vim, Emacs). In dit voorbeeld zullen we proberen een thematische index te maken van het boek «Collaborative Construction of Knowledge» van waaruit we de website kunnen bezoeken: http://seminario.edusol.info/seco3/ en die we gratis kunnen downloaden via deze link: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Zodra het bestand is gedownload, vinden we het in onze downloadmap, we openen het met onze pdf-documentviewer (in dit voorbeeld Evince), we selecteren alle inhoud door op ctrl + a te drukken, we kopiëren het en plakken het in een nieuw tekstdocument:

En we slaan ons nieuwe document op in platte tekst met de naam «Construccion_colaborativa_del_conocimiento.txt» in de map Documenten:

Nu starten we AntConc en vanaf het eerste tabblad linksboven genaamd "File" openen we het bestand "Construccion_colaborativa_del_knowledge.txt":

In de linkerkolom genaamd "Corpus Files" zal de naam van ons tekstbestand nu verschijnen, wat aangeeft dat we aan dit bestand zullen werken, aangezien we in AntConc meer dan één tekstbestand kunnen laden en er samen of afzonderlijk aan kunnen werken:

Wat we nu gaan doen is een lijst maken van alle woorden die het teken "A" bevatten, om een ​​trefwoord met deze hoofdletter te identificeren, aangezien AntConc ons de mogelijkheid biedt om kleine letters en hoofdletters te onderscheiden, wat erg handig is om eigennamen of acroniemen te identificeren in de vorm van een lijst. Hiervoor plaatsen we het eerste tabblad met de naam «Concordantie» aan de rechterkant van «Corpus Files», we halen het vinkje uit het veld «Woorden» om het veld «Case» te markeren, beide rechtsonder in «Zoekterm», schrijven we in het veld Zoek onder de letter A en klik op de paarse rechthoek met de tekst "Start":

En het zal de resultaten van het volgende vermelden. vorm:

Zoals we kunnen zien, lijken sommige tekens met accenten op het woord "Autónoma" in plaats van "Autónoma". Dit komt omdat we AntConc de juiste coderingstaal voor onze taal moeten vertellen, aangezien AntConc niet detecteert dat we standaard Spaans gebruiken. Hiervoor openen we de tab «Globlal Settings» bovenaan naast «File», we gaan naar de laatste optie «Language Encoding Settings» aan de rechterkant we klikken op «Edit» we selecteren de eerste optie «Standard Encodings» We klik erop, selecteer de derde optie uit de lijst die rechts verschijnt "Unicode (utf8)" en klik op het veld "Toepassen" rechtsonder in het venster:

Na het toepassen van de wijzigingen, klikken we opnieuw op de paarse rechthoek van «Start» en de karakters met accenten verschijnen nu leesbaar:

Nu bekijken we de woorden met de letter A blauw gemarkeerd voor gemakkelijke identificatie en op basis van onze overwegingen selecteren we de woorden die we in de thematische index willen opnemen, bijvoorbeeld 'Computer analfabetisme' in rij 17 is de meest voorkomende woord onmiddellijk gevonden om het eerste te zijn waarnaar verwezen wordt in onze thematische index uit de inhoud van de tekst van «Collaboratieve constructie van kennis».

We keren terug naar het pdf-document «Collaboratieve constructie van kennis» om te zoeken op welke pagina's «Computer analfabetisme» verschijnt door «ctrl + f» te typen, het woord «Analfabetisme» in het zoekveld te schrijven en op «enter» te drukken aan het einde en de het aantal keren dat nodig is om het gezochte woord op alle pagina's te vinden. We openen een nieuw document in LibreOffice Writer om onze onderwerpindex te maken of als we werken aan de inhoud van een document dat oorspronkelijk in .odt staat, openen we dat document met LibreOffice en we zullen de onderwerpindex alleen op een willekeurige pagina maken en bewerken :

Als we ons ook willen identificeren met AntConc waarin zinnen "Computer analfabetisme" voorkomen in alle inhoud van het document "Construccion_colaborativa_del_conocimiento.txt", schrijven we "Computer analfabetisme" in het zoekveld, vink "Case" uit, markeer "Words" en klik erop om "Start":

Als we klikken op een van de rijen gemarkeerd met "Computer analfabetisme" met blauwe kleur, bijvoorbeeld in rij 4, in het tabblad "Bestandsweergave", zal het ons het fragment van de tekst tonen waar deze selectie gemarkeerd wordt weergegeven met een zwarte achtergrondkleur :

Op deze manier is AntConc erg nuttig voor ons als we een boek, essay of samenvatting hebben geschreven en we geen thematische index parallel hebben gemaakt of om de belangrijkste ideeën van een werk systematisch te analyseren om het lezen ervan te vergemakkelijken.


6 reacties, laat de jouwe achter

Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: Miguel Ángel Gatón
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.

  1.   RAW-Basis zei

    Zeer interessante tool .. ..ik wist er niets van .. en het is erg nuttig voor mij ..

    Dank je ..

  2.   Cristianhcd zei

    heel goed artikel, interessant

  3.   Oude man zei

    Hartelijk dank voor het delen

  4.   Hoe Linux te installeren zei

    Geweldige bijdrage, erg handig. Wetende dat u dit soort tools in Linux kunt hebben, maakt altijd een verschil. Vriendelijke groeten.

  5.   Phytoschido zei

    Uitstekende instap. Ik vind het leuk dat ze dit soort inhoud publiceren!

  6.   jathan zei

    Hallo allemaal. Bedankt voor uw opmerkingen en onze excuses voor het feit dat u tot nu toe opmerkingen heeft kunnen maken. Ik hoop dat degenen die de tutoring hebben geïmplementeerd geen problemen hebben gehad.