Minőségi szövegelemzés és tantárgyi indexek készítése az AntConc és a LibreOffice segítségével

Üdvözletem barátaim, nagyon boldog vagyok, hogy csatlakozhatok és részt vehetek mindenben, ami elérhető ezentúl <° Desde Linux. A nevem Jathan, és megosztom veletek ezt az első bejegyzést, amelyet a karom IT koordinációjának szociális szolgálatában készítettem. Remélem érdekesnek, hasznosnak találod, és mindenféle megjegyzést teszel.

Amikor egy szöveges fájlban kulcsszavakat szeretnénk találni egy tematikus index létrehozásához, elemeznünk kell egy mű fő gondolatait vagy más hasonló célt, akkor kereséseket kell végeznünk, amelyeken keresztül meg tudjuk különböztetni a szavak nagy- és kisbetűit, valamint ezek listája, amelyek kiemelik a kívánt karaktereket, például egy levelet, hogy gyorsabban és praktikusabban megtalálhassuk a kulcsszavakat.

Ennek a dokumentációnak az a célja, hogy bemutassa és elmagyarázza egy kvalitatív szövegelemző alkalmazás és egy szövegszerkesztő használatát a tematikus index szabad szoftverrel történő megvalósításának megkönnyítésére.

Az első rész elmagyarázza a telepítés menetét LibreOffice és végrehajtása AntConc az operációs rendszeren belül GNU / Linux és később, hogyan kell csinálni Windows és Mac OS rendszereken belül, míg a következő részekben, az operációs rendszertől függetlenül, elmagyarázzák, hogyan kell használni AntConc y LibreOffice Példák felhasználásával létrehozhat egy tárgymutatót.

LibreOffice és AntConc GNU / Linux rendszeren

Az első dolog, amit meg kell tennünk, annak ellenőrzése, hogy a LibreOffice telepítve van-e a GNU / Linux disztribúciónkon. A LibreOffice egy ingyenes, többplatformos irodai csomag, amelyet a GPL licencelt, és amely segít nekünk szöveges dokumentumok, diák, táblázatok, adatbázisok, rajzok és matematikai képletek egyszerű és hatékony szerkesztésében.

Ha használjuk Debian, Linux Mint, Trisquel, Ubuntu vagy bármilyen más terjesztés alapján Debian, A továbbiakban nem kell foglalkoznunk a telepítésével, mivel ezeknek a disztribúcióknak a legfrissebb verzióiban, valamint a többiben, például a Mageia, a Fedora és az OpenSUSE, a LibreOffice már előre van telepítve, és csak meg kell találnia és futtatnia kell az alkalmazások panelről vagy parancssorból.

Ha Debian Squeeze 6.0-t használunk, akkor az OpenOffice-t frissítenünk kell LibreOffice-ra az alábbi utasítások szerint: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Miután megbizonyosodtunk arról, hogy a LibreOffice telepítve van a rendszerünkön, most meglátogatjuk az AntLab webhelyét, ahol megtalálhatunk néhány hasznos alkalmazást, amelyeket Laurence Anthony fejlesztett ki a kvalitatív szövegelemzéshez és a szóegyeztetéshez a platformokon keresztüli futtatható fájlokkal GNU / Linux, Mac OS és Windows.

Az AntConc egy Perl programozási nyelven írt alkalmazás, amely lehetővé teszi számunkra, hogy ábécé sorrendben vagy a megjelenés gyakorisága, kulcsszavak alapján felsoroljuk a szavakat, egy fájlból egyhangú szövegeket és szavak csoportjait készítsük egyszerű szöveges formátumban, megkülönböztetve a kis- és nagybetűket. Töltse le ezt a linket: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html, és válassza ki az ötödik oszlopban, ahol a Tux pingvin jelenik meg az AntConc 3.2.4u letöltési lehetőségeként:

Amikor a kiválasztott fájl letöltése befejeződött, megnyitjuk az előnyben részesített fájlböngészőnket (Pcmanfm, Nautilus, Thunar, Dolphin vagy bármely más) azáltal, hogy megnyitjuk az általunk használt grafikus környezet panelen, vagy megnyomjuk az alt + f2 billentyűkombinációt, beírjuk a nevét kisbetűket és az Enter billentyűt nyomja meg a végén, majd hozzon létre két könyvtárat (mappát) a felhasználói könyvtárunkban, az egyik Applications_extras és egy másik AntConc nevet adva az első alkönyvtárának:

Most megyünk abba a könyvtárba, ahová az antconc3.2.4u.tar.gz fájlt letöltöttük (ebben a példában Letöltések), és megnyitjuk a fájlt az Xarchiver vagy a Fileroller segítségével, hogy kibontsuk annak tartalmát az Antconc könyvtárba a fájlkezelőnkben a kivonat opció kiválasztásával, és a könyvtár elérési útjának megjelölésével / home / user / Extra_Applications / AntConc:

Miután kibontotta az antconc3.2.4u.tar.gz csomag tartalmát az AntConc könyvtárba az Applications_extras oldalon, azonosítjuk az antconc3.2.4u fájlt, hogy a jobb egérgombbal kattintva végrehajtási engedélyeket kapjunk rá, megadjuk a tulajdonságokat és engedélyezzük a fájl programként:

Ezzel meg kell tudnunk nyitni az AntConc-t úgy, hogy duplán kattintunk az egérrel az antconc3.2.4u fájlra.

Ha úgy tetszik, akkor az összes előző eljárást elvégezhetjük a terminálon keresztül, végrehajtva a következő parancsokat, és megváltoztatva a "felhasználót" a munkamenetünk során használt név alapján:

Könyvtárak létrehozása:

$ mkdir / home / user / Applications_extras (nyomja meg az Enter billentyűt)
$ mkdir / home / user / Applications_extras / AntConc (nyomja meg az Enter billentyűt)

Váltson az AntConc könyvtárra, és vonja ki az antconc3.2.4u.tar.gz tartalmát:

$ cd / home / user / Applications_extras / AntConc / (nyomja meg az Enter billentyűt)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(press Enter)

Engedélyezze az antconc3.2.4u fájl futtatását programként:

$ chmod + x antconc3.2.4u (nyomja meg az Enter billentyűt)

És futtassa az AntConc-ot:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(press Enter)

Függetlenül a választott eljárástól, ha akarjuk, átmásolhatjuk az antconc3.2.4u fájlt az / usr / bin könyvtárba, és megadhatjuk neki a szükséges engedélyeket ahhoz, hogy az AntConc-ot a terminálról vagy az alt + f2 segítségével futtathassuk, csak az antconc3.2.4u írásával. Ehhez a következő parancsokat szuperfelhasználóként hajtjuk végre a su vagy a sudo segítségével:

$ a
(beírjuk a gyökér jelszavunkat és lenyomjuk az Enter billentyűt)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# kilépés

És most, csak az antconc3.2.4u futtatásával a felhasználónkkal bármely terminálemulátorból, az AntConc megnyílik az előző képen látható módon.

$antconc3.2.4u

Az AntConc segítségével szavakat lehet felsorolni egy adott karakter szerint

Miután már meghatároztuk az AntConc letöltésének és futtatásának módját, megadjuk a módját annak példájára, hogy egyes szavakat hogyan lehet megtalálni a betűk sorrendjében történő kereséssel kis- és nagybetűkkel egyaránt. Ha az AntConc működésébe és annak minden felhasználási lehetőségébe szeretne mélyebbre hatolni, akkor tekintse meg a README_AntConc3.2.4.pdf dokumentumot a / home / user / Aplicaciones_extras / AntConc könyvtárban, vagy töltse le a http: //www.antlab címről. .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, valamint olvassa el az online súgót, vagy nézze meg a http://www.antlab.sci.waseda.ac weboldalon elérhető AntConc video oktatóanyagokat. jp / antconc_index.html

Az AntConc csak egyszerű szöveges fájlokkal (".txt"), ".html", ".hml", "" .xml "és saját formátumú" .ant "-val tud együtt dolgozni, tehát a dokumentum tartalma, amelyből a szóazonosítás, az eredeti formátumot ".odt", ".rtf", ".pdf" vagy valamilyen más formában ".txt" -re változtatjuk, kiválasztva az összes tartalmat, átmásolva és beillesztve egy új szöveges dokumentumba. az általunk preferált szövegszerkesztőt futtató repülőgép (többek között Leafpad, Gedit, Vim, Emacs) Ebben a példában arra törekszünk, hogy tematikus indexet hozzunk létre az «Együttműködő tudásépítés» könyvből, amelyből meglátogathatjuk annak weboldalát: http://seminario.edusol.info/seco3/ és amelyet szabadon letölthetünk erről a linkről: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

A fájl letöltése után megkeresjük a letöltési könyvtárunkban, megnyitjuk a pdf dokumentum megtekintőnkkel (ebben a példában: Evince), a ctrl + a billentyűkombinációval kiválasztjuk az összes tartalmát, lemásoljuk és beillesztjük egy új sima felületre szöveges dokumentum:

És új dokumentumunkat egyszerű szövegben, a «Construccion_colaborativa_del_conocimiento.txt» névvel mentjük a Documents könyvtárba:

Most végrehajtjuk az AntConc alkalmazást, és a bal felső sarokban lévő "Fájl" nevű első fülről megnyitjuk a "Construccion_colaborativa_del_conocimiento.txt" fájlt:

A "Corpus Files" nevű bal oldali oszlopban most megjelenik a szöveges fájlunk neve, jelezve, hogy ezen a fájlon fogunk dolgozni, mivel az AntConc-ban egynél több szöveges fájlt tölthetünk be, és együtt vagy külön dolgozhatunk velük:

Most azt tesszük, hogy felsoroljuk az "A" karaktert tartalmazó szavakat, hogy azonosítsunk egy kulcsszót ezzel a nagybetűvel, mivel az AntConc lehetőséget kínál számunkra a kis- és nagybetűk megkülönböztetésére, ami nagyon hasznos a tulajdonnevek azonosításához vagy rövidítések listában. Ehhez helyezzük az első „Concordance” nevű fület a „Corpus Files” jobb oldalára, töröljük a „Words” négyzet bejelölését a „Case” négyzet jelöléséhez, mindkettőt a „Search Term” jobb alsó sarkában, a mezőbe írjuk Keressen az A betű alatt, és kattintson a "Start" feliratú lila téglalapra:

És felsorolja a következők eredményeit. alak:

Mint láthatjuk, néhány ékezetes karakter megegyezik az "Autónoma" szóval hasonló "Autónoma" szóval. Ennek oka, hogy meg kell mondanunk az AntConc-nak a nyelvünk megfelelő kódolási nyelvét, mivel az AntConc nem észleli, hogy alapértelmezés szerint spanyolul használjuk. Ehhez kinyitjuk a "Globlal Settings" lapot a tetején a "File" mellett, megyünk az utolsó opcióhoz "Language Encoding Settings" a jobb oldalon kattintsunk az "Edit" -re és kiválasztjuk az első opciót "Standard Encodings" »Kattintson rá, kiválasztjuk a harmadik opciót a jobb oldali" Unicode (utf8) "listából, és kattintsunk az ablak jobb alsó részén található" Apply "mezőre:

A változtatások alkalmazása után ismét rákattintunk a «Start» lila téglalapra, és az ékezetes karakterek most olvashatóan jelennek meg:

Most áttekintjük a kék színnel kiemelt A betűs szavakat az egyszerű azonosítás érdekében, és megfontolásaink alapján kiválasztjuk azokat, amelyeket fel akarunk venni a tematikus indexbe, például a "Számítógépes írástudatlanság" a 17. sorban a leggyakoribb szó. azonnal kiderült, hogy tematikus indexünkben elsőként hivatkozunk a "Tudás kollaboratív felépítése" szöveg tartalmából.

Visszatérünk az "Együttműködő tudásépítés" pdf dokumentumra, hogy megkeressük, mely oldalakon jelenik meg a "Számítógépes írástudatlanság" a "ctrl + f" beírásával, a keresőmezőbe az "írástudatlanság" szó beírásával és a végén az "enter" megnyomásával, valamint az alkalmak számával. hogy a keresett szó minden oldalon megtalálható legyen. Új dokumentumot nyitunk meg a LibreOffice Writer alkalmazásban a tárgymutatónk létrehozásához, vagy ha egy eredetileg .odt fájlban található dokumentum tartalmán dolgozunk, akkor ezt a dokumentumot a LibreOffice alkalmazással nyitjuk meg, és annak tárgyindexét csak bármely oldalon fogjuk létrehozni és szerkeszteni:

Ha azt is szeretnénk azonosítani az AntConc-tal, hogy a "Conferuccion_colaborativa_del_conocimiento.txt" dokumentum teljes tartalmában melyik mondatban jelenik meg a "Számítógép-írástudatlanság", akkor a keresőmezőbe a "Számítógép-írástudatlanságot" írjuk, töröljük az "Eset" jelölőnégyzetet, jelöljük be a "Szavak" jelölőnégyzetet, és kattintsunk rá. kezdeni":

Ha rákattintunk a kék színű «Számítógépes írástudatlanság» -ra kiemelt sorok valamelyikére, például a 4. sorban, akkor a «Fájl nézet» fülön megmutatja nekünk azt a szövegrészletet, ahol ez a kijelölés fekete színnel kiemelve jelenik meg. háttér:

Ily módon az AntConc nagyon hasznos számunkra, amikor könyvet, esszét vagy összefoglalót írtunk, és nem párhuzamosan készítettünk tematikus indexet, vagy szisztematikusan elemeztük a mű fő gondolatait az olvasás megkönnyítése érdekében.


Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra. Kötelező mezők vannak jelölve *

*

*

  1. Az adatokért felelős: Miguel Ángel Gatón
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.

  1.   RAW-Basic dijo

    Nagyon érdekes eszköz .. ..Nem tudtam róla .. és nagyon hasznos nekem.

    Köszönöm ..

  2.   Cristianhcd dijo

    nagyon jó cikk, érdekes

  3.   Idős ember dijo

    Köszönöm szépen a megosztás

  4.   A Linux telepítése dijo

    Nagy hozzájárulás, nagyon hasznos. Mindig tud változni az a tudat, hogy ilyen típusú eszközöket használhat a Linuxban. Üdvözlettel.

  5.   Phytoschido dijo

    Kiváló belépés. Tetszik, hogy ilyen típusú tartalmat tesznek közzé!

  6.   jathan dijo

    Üdv mindenkinek. Köszönöm a megjegyzéseket és a bocsánatkérést, hogy eddig tudtam nyilatkozni. Remélem, hogy azoknak, akik megvalósították a korrepetálást, nem voltak problémáik.