Jakościowa analiza tekstu i tworzenie indeksów tematycznych za pomocą AntConc i LibreOffice

Pozdrawiam przyjaciół. Bardzo się cieszę, że mogę dołączyć i uczestniczyć w tym, co jest w moim zasięgu, od teraz w <° Desde Linux. Nazywam się Jathan i dzielę się z Wami tym pierwszym wpisem na podstawie dokumentacji, którą zrobiłem w serwisie społecznym koordynacji IT mojego wydziału. Mam nadzieję, że uznasz to za interesujące, przydatne i podasz wszelkiego rodzaju komentarze.

Kiedy w pliku tekstowym chcemy znaleźć słowa kluczowe do stworzenia indeksu tematycznego, przeanalizować główne idee pracy lub w innym podobnym celu, musimy przeprowadzić wyszukiwanie, za pomocą którego możemy rozróżnić duże i małe litery w słowa, a także ich listę, z zaznaczeniem żądanych znaków, takich jak litera, abyśmy mogli szybciej i praktyczniej znaleźć słowa kluczowe.

Niniejsza dokumentacja ma na celu przedstawienie i wyjaśnienie użycia aplikacji do jakościowej analizy tekstu i edytora tekstu w celu ułatwienia tworzenia indeksu tematycznego z Wolnym Oprogramowaniem.

Pierwsza część wyjaśnia procedurę instalacji LibreOffice i wykonanie AntConc w systemie operacyjnym GNU / Linux i później, jak to zrobić w systemach Windows i Mac OS, podczas gdy w kolejnych częściach niezależnie od systemu operacyjnego zostanie wyjaśnione, jak używać AntConc y LibreOffice Korzystanie z przykładów do tworzenia indeksu tematycznego.

LibreOffice i AntConc w systemie GNU / Linux

Pierwszą rzeczą, którą musimy zrobić, jest sprawdzenie, czy mamy zainstalowany LibreOffice w naszej dystrybucji GNU / Linux. LibreOffice to darmowy wieloplatformowy pakiet biurowy na licencji GPL, który pomaga nam edytować dokumenty tekstowe, slajdy, arkusze kalkulacyjne, bazy danych, rysunki i formuły matematyczne w prosty i skuteczny sposób.

Jeśli używamy Debian, Linux Mint, Trisquel, Ubuntu lub jakiejkolwiek innej dystrybucji opartej na Debian, Nie będziemy już musieli zajmować się jego instalacją, ponieważ w większości tych dystrybucji w ich najnowszych wersjach, a także w innych, takich jak Mageia, Fedora i OpenSUSE, LibreOffice jest już wstępnie zainstalowany i wystarczy go znaleźć i uruchomić z panelu aplikacji lub z wiersza poleceń.

Jeśli używamy Debian Squeeze 6.0, musimy zaktualizować OpenOffice do LibreOffice, postępując zgodnie z następującymi instrukcjami: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Po upewnieniu się, że LibreOffice jest zainstalowany w naszym systemie, przejdziemy do odwiedzenia witryny AntLab, gdzie możemy znaleźć przydatne aplikacje opracowane przez Laurence Anthony'ego do jakościowej analizy tekstu i dopasowywania słów z wieloplatformowymi plikami wykonywalnymi dla systemów GNU / Linux, Mac System operacyjny i Windows.

AntConc to aplikacja napisana w języku programowania Perl, która pomaga nam wyświetlać słowa w kolejności alfabetycznej lub według częstotliwości występowania, słów kluczowych, dopasowywać i grupować słowa z pliku w formacie zwykłego tekstu, rozróżniając małe i duże litery. Aby go pobrać, przejdź do tego linku: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html i wybierz w piątej kolumnie, w której pojawia się pingwin Tux, opcję pobrania AntConc 3.2.4u:

Po zakończeniu pobierania wybranego pliku otwieramy naszą preferowaną przeglądarkę plików (Pcmanfm, Nautilus, Thunar, Dolphin lub inną), otwierając ją za pomocą panelu środowiska graficznego, którego używamy lub naciskając alt + f2, wpisując jego nazwę w małe litery i wciskając Enter na końcu, a następnie utwórz dwa katalogi (foldery) w naszym katalogu użytkownika, nazywając jeden Applications_extras, a drugi AntConc jako podkatalog pierwszego:

Teraz przechodzimy do katalogu, w którym został pobrany plik antconc3.2.4u.tar.gz (w tym przykładzie pobrane) i otwieramy plik za pomocą Xarchiver lub Fileroller, aby rozpakować jego zawartość do katalogu Antconc, wybierając opcję rozpakowywania w naszym menedżerze plików i wskazując ścieżkę do katalogu / home / user / Extra_Applications / AntConc:

Po wyodrębnieniu zawartości pakietu antconc3.2.4u.tar.gz do katalogu AntConc w ramach Applications_extras identyfikujemy plik antconc3.2.4u, aby nadać mu uprawnienia do wykonywania, klikając prawym przyciskiem myszy, wprowadzając właściwości i zezwalając na wykonanie polecenia plik jako program:

Dzięki temu powinniśmy być w stanie otworzyć AntConc, klikając dwukrotnie myszą plik antconc3.2.4u.

Jeśli wolimy, całą poprzednią procedurę możemy wykonać za pośrednictwem terminala, wykonując następujące polecenia i zmieniając „user” na nazwę, której używamy w naszej sesji:

Aby utworzyć katalogi:

$ mkdir / home / user / Applications_extras (naciśnij Enter)
$ mkdir / home / user / Applications_extras / AntConc (naciśnij Enter)

Przejdź do katalogu AntConc i wypakuj zawartość antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (naciśnij Enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz( naciśnij enter)

Pozwól uruchomić plik antconc3.2.4u jako program:

$ chmod + x antconc3.2.4u (naciśnij Enter)

I uruchom AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u( naciśnij enter)

Niezależnie od wybranej procedury, jeśli chcemy, możemy skopiować plik antconc3.2.4u do katalogu / usr / bin i nadać mu niezbędne uprawnienia, aby móc uruchomić AntConc z terminala lub z alt + f2 pisząc tylko antconc3.2.4u. W tym celu wykonujemy następujące polecenia jako superużytkownik za pomocą su lub sudo:

$ your
(wpisujemy hasło roota i wciskamy enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# wyjście

A teraz, po prostu uruchamiając antconc3.2.4u z naszym użytkownikiem z dowolnego emulatora terminala, AntConc otworzy się, jak pokazano na poprzednim obrazku.

$antconc3.2.4u

Używanie AntConc do wyświetlania słów według określonego znaku

Po ustaleniu, jak pobrać i uruchomić AntConc, teraz podamy przykład jego użycia do znajdowania niektórych słów za pomocą wyszukiwania w porządku alfabetycznym znaków, zarówno małych, jak i wielkich. Jeśli chcesz dokładniej zapoznać się z działaniem AntConc i wszystkimi jego możliwościami użycia, możesz zapoznać się z dokumentem README_AntConc3.2.4.pdf w naszym katalogu / home / user / Aplicaciones_extras / AntConc lub pobrać go z http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, a także zapoznaj się z pomocą online lub obejrzyj samouczki wideo AntConc dostępne na jej stronie internetowej http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc może działać tylko ze zwykłymi plikami tekstowymi („.txt”), „.html”, „.hml”, „.xml” i własnym formatem „.ant”, więc treść dokumentu, z którego utworzymy identyfikacji słów, zmienimy go z oryginalnego formatu w „.odt”, „.rtf”, „.pdf” lub innym na „.txt” dokonując zaznaczenia całej treści, kopiując i wklejając do nowego dokumentu tekstowego samolot z naszym preferowanym edytorem tekstu (między innymi Leafpad, Gedit, Vim, Emacs). W tym przykładzie będziemy starać się stworzyć indeks tematyczny z książki „Collaborative Construction of Knowledge”, z której możemy odwiedzić jej stronę internetową: http://seminario.edusol.info/seco3/ i którą możemy bezpłatnie pobrać z tego linku: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Po pobraniu pliku lokalizujemy go w naszym katalogu pobierania, otwieramy go za pomocą naszej przeglądarki dokumentów pdf (w tym przykładzie Evince), wybieramy całą jego zawartość naciskając ctrl + a, kopiujemy go i wklejamy do nowego zwykłego pliku dokument tekstowy:

I zapisujemy nasz nowy dokument w postaci zwykłego tekstu pod nazwą „Construccion_colaborativa_del_conocimiento.txt” w katalogu Dokumenty:

Teraz uruchamiamy AntConc i z pierwszej zakładki w lewym górnym rogu o nazwie „Plik” otwieramy plik „Construccion_colaborativa_del_conocimiento.txt”:

W lewej kolumnie o nazwie „Pliki korpusu” pojawi się teraz nazwa naszego pliku tekstowego, co oznacza, że ​​będziemy pracować nad tym plikiem, ponieważ w AntConc możemy załadować więcej niż jeden plik tekstowy i pracować nad nimi razem lub osobno:

Teraz wypiszemy wszystkie słowa, które zawierają znak „A”, aby zidentyfikować słowo kluczowe tą wielką literą, ponieważ AntConc oferuje nam możliwość rozróżnienia małych i dużych liter, co jest bardzo przydatne do identyfikacji nazw własnych lub akronimy w formie listy. W tym celu umieszczamy pierwszą zakładkę o nazwie «Zgodność» po prawej stronie «Plików Korpusu», odznaczamy pole «Słowa», aby zaznaczyć pole «Przypadek», oba w prawym dolnym rogu «Wyszukiwane hasło», piszemy w polu Wyszukaj poniżej litery A i kliknij fioletowy prostokąt z napisem „Start”:

I wyświetli wyniki następujących czynności. kształt:

Jak widać, niektóre znaki pisane z akcentami wyglądają podobnie do słowa „Autónoma” zamiast „Autónoma”. Dzieje się tak, ponieważ musimy poinformować AntConc o odpowiednim języku kodowania dla naszego języka, ponieważ AntConc nie wykrywa, że ​​domyślnie używamy hiszpańskiego. W tym celu otwieramy zakładkę "Ustawienia globalne" u góry obok "Plik", przechodzimy do ostatniej opcji "Ustawienia kodowania języka" po prawej stronie klikamy "Edytuj" i wybieramy pierwszą opcję "Kodowania standardowe »Klikamy na nią, wybieramy trzecią opcję z listy, która jest wyświetlana po prawej stronie„ Unicode (utf8) ”i klikamy na pole„ Zastosuj ”w prawej dolnej części okna:

Po zastosowaniu zmian kliknij ponownie fioletowy prostokąt „Start”, a akcentowane znaki będą teraz czytelne:

Teraz przeglądamy słowa z literą A podświetloną na niebiesko w celu łatwej identyfikacji i na podstawie naszych rozważań wybieramy te, które chcemy uwzględnić w indeksie tematycznym, na przykład „Analfabetyzm komputerowy” w wierszu 17 jest najczęściej słowo bezpośrednie okazało się jako pierwsze odniesione w naszym indeksie tematycznym z treści tekstu „Wspólne budowanie wiedzy”.

Wracamy do dokumentu pdf „Wspólne budowanie wiedzy”, aby dowiedzieć się, na których stronach pojawia się «Analfabetyzm komputerowy», wpisując «ctrl + f», wpisując słowo «Analfabetyzm» w polu wyszukiwania i naciskając «enter» na końcu i tyle razy, ile potrzeba, aby znaleźć wyszukiwane słowo na wszystkich stronach. Otwieramy nowy dokument w LibreOffice Writer, aby utworzyć nasz indeks tematyczny lub jeśli pracujemy nad treścią dokumentu, który pierwotnie znajduje się w .odt, otwieramy ten dokument w LibreOffice i będziemy tworzyć i edytować jego indeks tematyczny tylko na dowolnej stronie :

Jeśli chcemy również identyfikować się z AntConc, w których zdania „Analfabetyzm komputerowy” pojawia się w całej treści dokumentu „Construccion_colaborativa_del_conocimiento.txt”, w polu wyszukiwania wpisujemy „Analfabetyzm komputerowy”, odznaczamy „Case”, zaznaczamy „Słowa” i klikamy zacząć":

Jeśli klikniemy na którykolwiek z wierszy podświetlonych na «Analfabetyzm komputerowy» kolorem niebieskim, na przykład w wierszu 4, w zakładce «Widok pliku» pokaże nam się fragment tekstu, w którym zaznaczenie jest zaznaczone na czarno od tła:

W ten sposób AntConc jest dla nas bardzo przydatny, gdy napisaliśmy książkę, esej lub podsumowanie, a nie robiliśmy równolegle indeksu tematycznego lub systematycznie analizowaliśmy główne idee pracy, aby ułatwić jej czytanie.


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.

  1.   RAW-podstawowy powiedział

    Bardzo ciekawe narzędzie .. ..nie wiedziałem o tym .. i jest dla mnie bardzo przydatne ..

    Dziękuję ..

  2.   Cristianhcd powiedział

    bardzo dobry artykuł, ciekawy

  3.   Starzec powiedział

    Dziękuję bardzo za dzielenie

  4.   Jak zainstalować Linuksa powiedział

    Świetny wkład, bardzo przydatny. Świadomość, że w Linuksie możesz mieć tego typu narzędzie, zawsze robi różnicę. Pozdrowienia.

  5.   Phytoschido powiedział

    Doskonałe wejście. Podoba mi się, że publikują tego typu treści!

  6.   Jathan powiedział

    Cześć wszystkim. Dziękuję za uwagi i przeprosiny za możliwość komentowania do tej pory. Mam nadzieję, że osoby, które wprowadziły korepetycje w życie, nie miały żadnych problemów.