Kvalitatīva teksta analīze un priekšmetu indeksu veidošana ar AntConc un LibreOffice

Sveicieni, draugi un draugi, es esmu ļoti priecīgs pievienoties un piedalīties tajā, kas man ir pieejams no šī brīža <° From Linux. Mani sauc jathan, un es kopīgoju šo pirmo ierakstu ar jums, pamatojoties uz dokumentāciju, kuru es uzrakstīju savas fakultātes datorzinātņu koordinācijas sociālajā dienestā. Es ceru, ka jums tas būs interesanti, noderīgi un sniegsit visādus komentārus.

Kad teksta failā mēs vēlamies atrast atslēgvārdus tematiskā indeksa izveidei, analizēt darba galvenās idejas vai kādu citu līdzīgu mērķi, mums ir jāveic meklējumi, ar kuru palīdzību mēs varam atšķirt lielos un mazos burtus vārdos, kā arī to saraksts, kas izceļ vēlamās rakstzīmes, piemēram, burtu, lai mēs varētu ātrāk un praktiskāk atrast atslēgvārdus.

Šīs dokumentācijas mērķis ir iepazīstināt un izskaidrot kvalitatīvas teksta analīzes lietojumprogrammas un teksta redaktora izmantošanu, lai atvieglotu tematiskā indeksa izveidi ar bezmaksas programmatūru.

Pirmajā daļā tiks paskaidrota instalēšanas procedūra LibreOffice un izpilde AntConc operētājsistēmas ietvaros GNU / Linux un vēlāk, kā to izdarīt Windows un Mac OS sistēmās, savukārt turpmākajās daļās neatkarīgi no operētājsistēmas tiks paskaidrots, kā to izmantot AntConc y LibreOffice Piemēru izmantošana priekšmetu rādītāja izveidošanai.

LibreOffice un AntConc uz GNU / Linux

Pirmais, kas mums jādara, ir jāpārbauda, ​​vai mūsu GNU / Linux izplatīšanā ir instalēta LibreOffice. LibreOffice ir bezmaksas daudzplatformu biroja komplekts, kas licencēts GPL un kas mums palīdz vienkārši un efektīvi rediģēt teksta dokumentus, slaidus, izklājlapas, datu bāzes, rasējumus un matemātiskās formulas.

Ja mēs izmantojam Debian, LinuxMint, Trisquel, Ubuntu vai jebkura cita izplatīšana, kuras pamatā ir Debian, Mums vairs nebūs jātiek galā ar tā instalēšanu, jo lielākajā daļā šo izplatījumu jaunākajās versijās, kā arī citos, piemēram, Mageia, Fedora un OpenSUSE, LibreOffice jau ir iepriekš instalēts, un jums tas vienkārši jāatrod un jāpalaiž no lietojumprogrammu paneļa vai komandrindas.

Ja mēs izmantojam Debian Squeeze 6.0, mums ir jāatjaunina OpenOffice uz LibreOffice, izpildot šīs instrukcijas: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Pēc tam, kad esam pārliecinājušies, ka mūsu sistēmā ir instalēta LibreOffice, mēs tagad apmeklēsim AntLab vietni, kur mēs varam atrast dažas noderīgas Laurence Anthony izstrādātās lietojumprogrammas kvalitatīvai teksta analīzei un vārdu saskaņošanai ar starpplatformu izpildāmajiem failiem GNU / Linux, Mac OS un Windows.

AntConc ir programma, kas rakstīta Perla programmēšanas valodā, un tā palīdz mums uzskaitīt vārdus alfabētiskā secībā vai pēc izskata biežuma, atslēgvārdiem, no faila vienkāršā teksta formātā izveidot atbilstības un vārdu grupas, nošķirot mazos un lielos burtus. Lai to lejupielādētu, dodieties uz šo saiti: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html un piektajā slejā atlasiet, kur Tux pingvīns parādās kā iespēja lejupielādēt AntConc 3.2.4u:

Kad atlasītā faila lejupielāde ir pabeigta, mēs atveram vēlamo failu pārlūku (Pcmanfm, Nautilus, Thunar, Dolphin vai jebkuru citu), atverot to caur izmantoto grafiskās vides paneli vai nospiežot alt + f2, ierakstot tā nosaukumu mazie burti un hitting Enter beigās un pēc tam izveidojiet divus direktorijus (mapes) mūsu lietotāju direktorijā, nosaucot vienu Applications_extras un otru AntConc kā pirmā direktoriju:

Tagad mēs dodamies uz direktoriju, kurā tika lejupielādēts fails antconc3.2.4u.tar.gz (šajā piemērā ir Lejupielādes), un mēs atveram failu ar Xarchiver vai Fileroller, lai izpakotu tā saturu Antconc direktorijā, mūsu failu pārvaldniekā atlasot izvilkšanas opciju un norādot direktorijas ceļu / home / user / Extra_Applications / AntConc:

Kad antconc3.2.4u.tar.gz pakotnes saturs ir izvilkts AntConc direktorijā Applications_extras, mēs identificējam failu antconc3.2.4u, lai piešķirtu tam izpildes atļaujas, noklikšķinot ar peles labo pogu, ievadot rekvizītus un ļaujot izpildīt fails kā programma:

Un līdz ar to mums vajadzētu būt iespējai atvērt AntConc, divreiz noklikšķinot ar peli uz faila antconc3.2.4u.

Ja mēs vēlamies, mēs varam veikt visas iepriekšējās procedūras, izmantojot termināli, izpildot šādas komandas un mainot "lietotāju" pēc nosaukuma, kuru izmantojam mūsu sesijā:

Lai izveidotu direktorijus:

$ mkdir / home / user / Applications_extras (nospiediet taustiņu Enter)
$ mkdir / home / user / Applications_extras / AntConc (nospiediet taustiņu Enter)

Pārslēdzieties uz direktoriju AntConc un izvelciet antconc3.2.4u.tar.gz saturu:

$ cd / home / user / Applications_extras / AntConc / (nospiediet taustiņu Enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(presspress enter)

Atļaujiet palaist failu antconc3.2.4u kā programmu:

$ chmod + x antconc3.2.4u (nospiediet Enter)

Un palaidiet AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(presspress)

Neatkarīgi no izvēlētās procedūras, ja vēlaties, mēs varam nokopēt antconc3.2.4u failu direktorijā / usr / bin un piešķirt tai nepieciešamās atļaujas, lai AntConc varētu palaist no termināla vai ar Alt + f2 rakstot tikai antconc3.2.4u. Šim nolūkam mēs izpildām šādas komandas kā superlietotājs ar su vai sudo:

$ tavs
(mēs uzrakstām saknes paroli un nospiežam Enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# Izeja

Un tagad, vienkārši palaižot antconc3.2.4u ar mūsu lietotāju no jebkura termināļa emulatora, AntConc tiks atvērts, kā parādīts iepriekšējā attēlā.

$ antconc3.2.4u

AntConc izmantošana vārdu sarakstīšanai pēc konkrēta rakstzīmes

Pēc tam, kad esam noskaidrojuši, kā lejupielādēt un palaist AntConc, tagad mēs ļausim parādīt tā izmantošanu dažu vārdu atrašanā, meklējot burtus alfabētiskā secībā gan ar mazajiem, gan ar lielajiem burtiem. Ja vēlaties padziļināt AntConc darbību un visas tās izmantošanas iespējas, varat iepazīties ar dokumentu README_AntConc3.2.4.pdf mūsu direktorijā / home / user / Aplicaciones_extras / AntConc vai lejupielādēt no http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, kā arī skatiet tiešsaistes palīdzību vai noskatieties AntConc video pamācības, kas pieejamas tās vietnē http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc var strādāt tikai ar vienkārša teksta failiem (".txt"), ".html", ".hml", "" .xml "un savu formātu" .ant ", tāpēc tā dokumenta saturs, no kura veidosim vārdu identifikācija, mēs to mainīsim no sākotnējā formāta ".odt", ".rtf", ".pdf" vai kādā citā uz ".txt", atlasot visu saturu, kopējot un ielīmējot to jaunā teksta dokumentā. lidmašīna, kurā darbojas mūsu vēlamais teksta redaktors (Leafpad, Gedit, Vim, Emacs, cita starpā). Šajā piemērā mēs centīsimies izveidot tematisko rādītāju no grāmatas «Collaborative Construction of Knowledge», no kura mēs varam apmeklēt tās vietni: http://seminario.edusol.info/seco3/ un kuru mēs varam brīvi lejupielādēt no šīs saites: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Kad fails ir lejupielādēts, atrodam to mūsu lejupielāžu direktorijā, atveram ar mūsu pdf dokumentu skatītāju (šajā piemērā Evince), atlasām visu tā saturu, nospiežot ctrl + a, mēs to nokopējam un ielīmējam jaunā līdzenumā teksta dokuments:

Mēs savu jauno dokumentu saglabājam vienkāršā tekstā ar nosaukumu «Construccion_colaborativa_del_conocimiento.txt» direktorijā Dokumenti:

Tagad mēs palaižam AntConc un no pirmās cilnes augšējā kreisajā pusē ar nosaukumu "File" atveram failu "Construccion_colaborativa_del_knowledge.txt":

Kreisajā kolonnā ar nosaukumu "Corpus Files" tagad parādīsies mūsu teksta faila nosaukums, norādot, ka mēs strādāsim pie šī faila, jo AntConc mēs varam ielādēt vairāk nekā vienu teksta failu un strādāt ar tiem kopā vai atsevišķi:

Tagad mēs uzskaitīsim visus vārdus, kas satur burtu "A", lai identificētu atslēgvārdu ar šo lielo burtu, jo AntConc mums piedāvā iespēju atšķirt mazos un lielos burtus, kas ir ļoti noderīgi, lai identificētu īpašvārdus vai akronīmi saraksta veidā. Šim nolūkam mēs ievietojam pirmo cilni ar nosaukumu «Concordance» labajā pusē «Corpus Files», mēs noņemam atzīmi no izvēles rūtiņas «Words», lai atzīmētu lodziņu «Case», abas lapas «Search Term» apakšējā labajā pusē, mēs rakstām laukā Meklējiet zem burta A un noklikšķiniet uz violetā taisnstūra ar uzrakstu "Sākt":

Un tajā tiks uzskaitīti sekojošo rezultāti. forma:

Kā mēs redzam, dažas rakstzīmes, kas rakstītas ar akcentiem, šķiet līdzīgas vārdam "Autónoma", nevis "Autónoma". Tas ir tāpēc, ka mums ir jāpasaka AntConc savai valodai atbilstoša kodēšanas valoda, jo AntConc nenosaka, ka pēc noklusējuma mēs izmantojam spāņu valodu. Lai to izdarītu, augšpusē blakus failam atveram cilni "Globlal Settings", mēs dodamies uz pēdējo opciju "Valodas kodēšanas iestatījumi" labajā pusē noklikšķiniet uz "Rediģēt" un atlasiet pirmo opciju "Standarta kodējumi" »Mēs noklikšķinām uz tā, sarakstā atlasām trešo opciju, kas tiek parādīta labajā pusē" Unicode (utf8) ", un loga apakšējā labajā pusē noklikšķiniet uz lodziņa" Lietot ":

Pēc izmaiņu piemērošanas mēs atkal noklikšķinām uz purpursarkana taisnstūra «Sākt», un rakstzīmes ar akcentiem tagad parādīsies salasāmi:

Tagad mēs pārskatām vārdus ar burtu A, kas iezīmēti zilā krāsā, lai to varētu viegli identificēt, un, pamatojoties uz mūsu apsvērumiem, mēs atlasām tos, kurus vēlamies iekļaut tematiskajā rādītājā, piemēram, 17. rindā "Datoru analfabētisms" ir visizplatītākais vārds, kas nekavējoties tiek uzskatīts par pirmo, uz kuru mūsu tematiskajā rādītājā atsaucas no teksta «Zināšanu kopīga veidošana» satura.

Mēs atgriežamies pie pdf dokumenta «Zināšanu kopīga veidošana», lai atrastu, kurās lapās parādās «Datoru analfabētisms», ierakstot «ctrl + f», meklēšanas laukā ierakstot vārdu «Analfabētisms» un beigās nospiežot «Enter» un reižu skaits, kas nepieciešams meklētā vārda atrašanai visās lapās. Mēs atveram jaunu dokumentu LibreOffice Writer, lai izveidotu priekšmetu indeksu, vai, ja mēs strādājam ar dokumenta saturu, kas sākotnēji atrodas .odt, mēs atveram šo dokumentu ar LibreOffice, un tā tēmas indeksu izveidosim un rediģēsim tikai jebkurā lapā :

Ja mēs arī vēlamies identificēt ar AntConc, kuros teikumos "Datoru analfabētisms" parādās visā dokumenta "Construccion_colaborativa_del_conocimiento.txt" saturā, meklēšanas laukā mēs ierakstām "Datoru analfabētisms", noņemiet atzīmi no "Lieta", atzīmējiet "Vārdi" un noklikšķiniet uz sākt":

Ja mēs noklikšķināsim uz kādas no rindām, kas iezīmētas ar zilu krāsu, piemēram, 4. rindā, cilnē «Faila skats» cilnē «Faila skats» tiks parādīts teksta fragments, kurā šī atlase ir iezīmēta ar melnu no fona:

Tādā veidā AntConc mums ir ļoti noderīgs, kad esam uzrakstījuši grāmatu, eseju vai kopsavilkumu, un mēs paralēli neveicām tematisko rādītāju vai sistemātiski analizējam darba galvenās idejas, lai atvieglotu tā lasīšanu.


Raksta saturs atbilst mūsu principiem redakcijas ētika. Lai ziņotu par kļūdu, noklikšķiniet uz šeit.

6 komentāri, atstājiet savus

Atstājiet savu komentāru

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti ar *

*

*

  1. Atbildīgais par datiem: Migels Ángels Gatóns
  2. Datu mērķis: SPAM kontrole, komentāru pārvaldība.
  3. Legitimācija: jūsu piekrišana
  4. Datu paziņošana: Dati netiks paziņoti trešām personām, izņemot juridiskus pienākumus.
  5. Datu glabāšana: datu bāze, ko mitina Occentus Networks (ES)
  6. Tiesības: jebkurā laikā varat ierobežot, atjaunot un dzēst savu informāciju.

  1.   RAW-Basic teica

    Ļoti interesants rīks .. ..Es par to nezināju .. un man tas ir ļoti noderīgs ..

    Paldies..

  2.   Cristianhcd teica

    ļoti labs raksts, interesants

  3.   Vecs vīrs teica

    Liels paldies par dalīšanos

  4.   Kā instalēt Linux teica

    Liels ieguldījums, ļoti noderīgs. Zinot, ka Linux var izmantot šāda veida rīkus, vienmēr ir atšķirība. Sveicieni.

  5.   Fitoschido teica

    Lielisks ieraksts. Man patīk, ka viņi publicē šāda veida saturu!

  6.   Džitan teica

    Sveiki visiem. Paldies par jūsu komentāriem un atvainošanos, ka spējat komentēt līdz šim. Es ceru, ka tiem, kas ir ieviesuši apmācību, nav bijušas problēmas.