Kvalitativ textanalys och skapande av ämnesindex med AntConc och LibreOffice

Hälsningar vänner och vänner, jag är väldigt glad att gå med och delta i det som är inom min räckvidd framöver i <° från Linux. Jag heter jathan och jag delar detta första inlägg med dig från en dokumentation som jag gjorde i socialtjänsten för datavetenskaplig samordning av min fakultet. Jag hoppas att du tycker det är intressant, användbart och ger alla typer av kommentarer.

När vi i en textfil vill hitta nyckelord för att skapa ett tematiskt index, analysera huvudidéerna för ett verk eller något annat liknande syfte, måste vi göra sökningar med hjälp av vilka vi kan skilja mellan stora och små bokstäver inom ord, samt en lista över dessa som markerar de önskade tecknen, t.ex. en bokstav så att vi kan hitta nyckelord snabbare och bekvämare.

Denna dokumentation syftar till att presentera och förklara användningen av en kvalitativ textanalysapplikation och en textredigerare för att underlätta skapandet av ett tematiskt index med fri programvara.

I den första delen, proceduren för installation av LibreOffice och utförandet av AntConc inom operativsystemet GNU / Linux och senare hur man gör det i Windows- och Mac OS-system, medan i följande delar oavsett operativsystem kommer det att förklaras hur man använder AntConc y LibreOffice Använda exempel för att skapa ett ämneindex.

LibreOffice och AntConc på GNU / Linux

Det första vi behöver göra är att verifiera att vi har LibreOffice installerat på vår GNU / Linux-distribution. LibreOffice är en gratis multiplatform kontorsvit licensierad med GPL och som hjälper oss att redigera textdokument, bilder, kalkylark, databaser, ritningar och matematiska formler på ett enkelt och effektivt sätt.

Om vi ​​använder Debian, LinuxMint, Trisquel, Ubuntu eller någon annan distribution baserad på Debian, Vi behöver inte längre hantera dess installation eftersom LibreOffice i de flesta av dessa distributioner i deras senaste versioner liksom i andra som Mageia, Fedora och OpenSUSE redan är förinstallerat och du bara behöver hitta den och köra det från applikationspanelen eller via kommandoraden.

Om vi ​​använder Debian Squeeze 6.0 måste vi uppdatera OpenOffice till LibreOffice genom att följa dessa instruktioner: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Efter att ha säkerställt att vi har LibreOffice installerat på vårt system fortsätter vi nu att besöka AntLab-webbplatsen där vi kan hitta några användbara applikationer som utvecklats av Laurence Anthony för kvalitativ textanalys och ordmatchning med plattforms körbara filer för GNU / Linux, Mac OS och Windows.

AntConc är en applikation som är skriven på programmeringsspråket Perl som gör det möjligt för oss att lista ord i alfabetisk ordning eller efter utseendefrekvens, nyckelord, skapa överensstämmelser och grupper av ord från en fil i klartextformat, med skillnad mellan gemener och versaler. För att ladda ner den, gå till den här länken: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html och välj i den femte kolumnen där Tux-pingvinen visas alternativet att ladda ner AntConc 3.2.4u:

När nedladdningen av den valda filen är klar öppnar vi vår önskade filwebbläsare (Pcmanfm, Nautilus, Thunar, Dolphin eller någon annan) genom att öppna den genom den grafiska miljöpanelen som vi använder eller genom att trycka på alt + f2 och skriva namnet i små bokstäver och trycka på enter i slutet och skapa sedan två kataloger (mappar) i vår användarkatalog, med namnet en Applications_extras och en annan AntConc som en underkatalog för den första:

Nu går vi till katalogen där antconc3.2.4u.tar.gz-filen laddades ner (i detta exempel Nedladdningar) och vi öppnar filen med Xarchiver eller Fileroller för att packa upp innehållet till Antconc-katalogen genom att välja extraheringsalternativet i vår filhanteraren och anger katalogvägen / hem / användare / Extra_Applications / AntConc:

När innehållet i antconc3.2.4u.tar.gz-paketet har extraherats till AntConc-katalogen inom Applications_extras, identifierar vi antconc3.2.4u-filen för att ge den exekveringsbehörigheter genom att klicka på höger musknapp, ange egenskaper och tillåta körning av filen som ett program:

Och med detta borde vi kunna öppna AntConc genom att dubbelklicka med musen på antconc3.2.4u-filen.

Om vi ​​föredrar kan vi göra alla föregående procedurer genom terminalen genom att utföra följande kommandon och ändra "användare" med namnet vi använder i vår session:

Så här skapar du kataloger:

$ mkdir / home / user / Applications_extras (tryck enter)
$ mkdir / home / user / Applications_extras / AntConc (tryck enter)

Byt till AntConc-katalogen och extrahera innehållet i antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (tryck enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(press enter)

Tillåt att köra antconc3.2.4u-filen som ett program:

$ chmod + x antconc3.2.4u (tryck enter)

Och kör AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(press enter)

Oavsett vilken procedur vi väljer kan vi om vi vill kopiera antconc3.2.4u-filen till / usr / bin-katalogen och ge den nödvändiga behörigheter för att kunna köra AntConc från terminalen eller med alt + f2 genom att bara skriva antconc3.2.4u. För detta utför vi följande kommandon som superanvändare med su eller sudo:

$ din
(vi skriver vårt root-lösenord och trycker på enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# utgång

Och nu, bara genom att köra antconc3.2.4u med vår användare från vilken terminalemulator som helst, öppnar AntConc som visas i föregående bild.

$antconc3.2.4u

Använda AntConc för att lista ord efter en specifik karaktär

Efter att ha redan identifierat hur man laddar ner och kör AntConc, kommer vi nu att ge plats för att exemplifiera dess användning för att hitta några ord med hjälp av en sökning i alfabetisk ordning av tecken i både gemener och versaler. Om du vill gå djupare in i driften av AntConc och alla dess användningsmöjligheter kan du läsa dokumentet README_AntConc3.2.4.pdf i vår katalog / hem / användare / Aplicaciones_extras / AntConc eller ladda ner det från http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, samt konsultera onlinehjälpen eller titta på AntConc-videohandledning som finns tillgänglig på webbplatsen http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc kan bara arbeta med vanliga textfiler (".txt"), ".html", ".hml," ".xml" och sitt eget format ".ant", så innehållet i dokumentet som vi kommer att göra ordidentifiering, vi kommer att ändra det från sitt ursprungliga format i ".odt", ".rtf", ".pdf" eller något annat till ".txt" och göra ett urval av allt innehåll, kopiera det och klistra in det i ett nytt textdokumentplan som kör vår föredragna textredigerare (bland annat Leafpad, Gedit, Vim, Emacs). I det här exemplet försöker vi skapa ett tematiskt index från boken «Collaborative Construction of Knowledge» från vilken vi kan besöka dess webbplats: http://seminario.edusol.info/seco3/ och som vi kan ladda ner fritt från den här länken: /seminario.edusol.info/seco3/pdf/seco3.pdf

När filen har laddats ner hittar vi den i vår nedladdningskatalog, vi öppnar den med vår pdf-dokumentvisare (i detta exempel Evince), vi väljer allt innehåll genom att trycka på ctrl + a, vi kopierar den och klistrar in den i en ny vanlig textdokument:

Och vi sparar vårt nya dokument i ren text med namnet "Construccion_colaborativa_del_conocimiento.txt" i katalogen Dokument:

Nu kör vi AntConc och från den första fliken uppe till vänster som heter "File" öppnar vi filen "Construccion_colaborativa_del_conocimiento.txt":

I den vänstra kolumnen "Corpus Files" kommer namnet på vår textfil nu att visas, vilket indikerar att vi kommer att arbeta med den här filen, eftersom vi i AntConc kan ladda mer än en textfil och arbeta med dem tillsammans eller separat:

Vad vi nu ska göra är att lista alla orden som innehåller tecknet "A" för att identifiera ett nyckelord med denna stora bokstav, eftersom AntConc erbjuder oss möjligheten att skilja mellan små och stora bokstäver, detta är mycket användbart för att identifiera egennamn eller akronymer i listform. För detta placerar vi den första fliken som heter «Concordance» på höger sida av «Corpus Files», avmarkerar rutan «Words» för att markera rutan «Case», båda i nedre högra sidan av «Söktermen», vi skriver i fältet Sök under bokstaven A och klicka på den lila rektangeln som säger "Start":

Och det kommer att lista resultaten av följande. form:

Som vi kan se verkar vissa tecken skrivna med accenter likna ordet "Autónoma" istället för "Autónoma". Detta beror på att vi måste berätta för AntConc rätt kodningsspråk för vårt språk, eftersom AntConc inte upptäcker att vi använder spanska som standard. För detta öppnar vi fliken «Globlal Settings» högst upp bredvid «File», vi går till det sista alternativet «Language Encoding Settings» på höger sida klickar vi på «Edit» vi väljer det första alternativet «Standard Encodings» We klicka på den, välj det tredje alternativet i listan som visas till höger "Unicode (utf8)" och klicka på "Apply" i den nedre högra delen av fönstret:

Efter att ha tillämpat ändringarna klickar vi igen på den lila rektangeln på «Start» och de accenterade tecknen visas nu läsbart:

Nu granskar vi orden med bokstaven A markerad i blått för enkel identifiering och utifrån våra överväganden väljer vi de som vi vill ta med i det tematiska indexet, till exempel "Dator analfabetism" i rad nummer 17 är den vanligaste ordet omedelbart visade sig vara det första som hänvisas till i vårt tematiska index från innehållet i texten "Samverkande konstruktion av kunskap".

Vi återgår till pdf-dokumentet «Samverkande kunskapskonstruktion» för att hitta på vilka sidor «Dator analfabetism» visas genom att skriva «ctrl + f», skriva ordet «Analfabetism» i sökfältet och trycka på «enter» i slutet och antalet gånger som är nödvändigt för att hitta det sökte ordet på alla sidor. Vi öppnar ett nytt dokument i LibreOffice Writer för att skapa vårt ämnesindex eller om vi arbetar med innehållet i ett dokument som ursprungligen finns i .odt, öppnar vi det dokumentet med LibreOffice och vi skapar och redigerar endast ämnesindex på vilken sida som helst :

Om vi ​​också vill identifiera oss med AntConc i vilka meningar "Computer analfabetism" visas i allt innehåll i dokumentet "Construccion_colaborativa_del_conocimiento.txt", skriver vi "Computer analfabetism" i sökfältet, avmarkerar "Case", markerar "Words" och klicka på den för att "Starta":

Om vi ​​klickar på någon av raderna som är markerade till «Dator analfabetism» med blå färg, till exempel i rad 4, på fliken «File View» kommer det att visa oss fragmentet av texten där detta val visas markerat med svart bakgrundsfärg :

På detta sätt är AntConc väldigt användbart för oss när vi har skrivit en bok, uppsats eller sammanfattning och vi inte gjorde ett tematiskt index parallellt eller för att systematiskt analysera huvudidéerna i ett verk för att underlätta dess läsning.


Innehållet i artikeln följer våra principer om redaktionell etik. Klicka på för att rapportera ett fel här.

6 kommentarer, lämna din

Lämna din kommentar

Din e-postadress kommer inte att publiceras.

*

*

  1. Ansvarig för uppgifterna: Miguel Ángel Gatón
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.

  1.   RAW-Basic sade

    Mycket intressant verktyg .. ..Jag visste inte om det .. och det är mycket användbart för mig ..

    Tack ..

  2.   Cristianhcd sade

    mycket bra artikel, intressant

  3.   Gammal man sade

    Tack så mycket för att dela

  4.   Hur man installerar Linux sade

    Bra bidrag, mycket användbart. Att veta att du kan ha dessa typer av verktyg i Linux gör alltid skillnad. Hälsningar.

  5.   Phytoschido sade

    Utmärkt inträde. Jag gillar att de publicerar den här typen av innehåll!

  6.   jathan sade

    Hej alla. Tack för dina kommentarer och en ursäkt för att du har kunnat kommentera hittills. Jag hoppas att de som har genomfört handledningen inte har haft några problem.