Qualitative na pagtatasa ng teksto at paglikha ng mga index ng paksa na may AntConc at LibreOffice

Pagbati mga kaibigan, napakasaya kong sumali at lumahok sa anumang abot-kaya ko mula ngayon sa <° Desde Linux. My name is Jathan and I share with you this first entry based on documentation that I did in the social service of the IT coordination of my faculty. Sana ay makita mo itong kawili-wili, kapaki-pakinabang, at gumawa ng lahat ng uri ng mga komento.

Kapag sa isang file ng teksto nais naming maghanap ng mga keyword para sa paglikha ng isang pampakay na index, pag-aralan ang mga pangunahing ideya ng isang trabaho o ilang iba pang katulad na layunin, kailangan naming gumawa ng mga paghahanap sa pamamagitan ng kung saan maaari nating makilala ang pagitan ng malalaki at maliliit na character sa loob ng mga salita, pati na rin ang isang listahan ng mga ito na nagha-highlight ng nais na mga character tulad ng isang liham upang maaari kaming makahanap ng mga keyword sa isang mas mabilis at mas praktikal na paraan.

Ang layunin ng dokumentasyong ito ay upang ipakita at ipaliwanag ang paggamit ng isang husay na aplikasyon ng pagsusuri sa tekstuwal at isang editor ng teksto upang mapadali ang pagsasakatuparan ng isang pampakay na indeks na may Libreng Software.

Sa unang bahagi, ang pamamaraan para sa pag-install ng LibreOffice at ang pagpapatupad ng AntConc sa loob ng operating system GNU / Linux at sa paglaon kung paano ito gawin sa loob ng mga system ng Windows at Mac OS, habang sa mga sumusunod na bahagi anuman ang operating system, ipapaliwanag kung paano gamitin AntConc y LibreOffice Paggamit ng mga halimbawa upang lumikha ng isang index ng paksa.

LibreOffice at AntConc sa GNU / Linux

Ang unang bagay na kailangan naming gawin ay i-verify na mayroon kaming naka-install na LibreOffice sa aming pamamahagi ng GNU / Linux. Ang LibreOffice ay isang libreng multiplatform office suite na lisensyado sa GPL at makakatulong sa amin na mag-edit ng mga dokumento ng teksto, slide, spreadsheet, database, guhit at pormulang matematika sa isang simple at mahusay na paraan.

Kung gumagamit kami Debian, Linux Mint, Trisquel, Ubuntu o anumang iba pang pamamahagi batay sa Debian, Hindi na namin haharapin ang pag-install nito dahil sa halos lahat ng mga pamamahagi na ito sa kanilang pinakabagong mga bersyon pati na rin ang iba pa tulad ng Mageia, Fedora at OpenSUSE, ang LibreOffice ay paunang naka-install at kailangan mo lang itong hanapin at patakbuhin ito mula sa panel ng mga aplikasyon o sa pamamagitan ng linya ng utos.

Kung gumagamit kami ng Debian Squeeze 6.0 kailangan naming i-update ang OpenOffice sa LibreOffice sumusunod sa mga tagubiling ito: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Matapos matiyak na mayroon kaming naka-install na LibreOffice sa aming system, magpapatuloy kami ngayon upang bisitahin ang website ng AntLab kung saan mahahanap namin ang ilang mga kapaki-pakinabang na application na binuo ni Laurence Anthony para sa pagsusulit ng husay sa teksto at pagtutugma ng salita sa mga cross-platform na maipapatupad na file para sa GNU / Linux, Mac OS at Windows.

Ang AntConc ay isang application na nakasulat sa wikang programa ng Perl na nagbibigay-daan sa amin upang ilista ang mga salita sa alpabetikong pagkakasunud-sunod o sa dalas ng hitsura, mga keyword, gumawa ng mga konkordansiya at mga pangkat ng mga salita mula sa isang file sa payak na format ng teksto, na nakikilala sa pagitan ng maliliit at malalaking character. Upang i-download ito, pumunta sa link na ito: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html at piliin sa ikalimang haligi kung saan lilitaw ang Tux penguin na pagpipilian upang mag-download ng AntConc 3.2.4u:

Kapag natapos ang pag-download ng napiling file, binubuksan namin ang aming ginustong file browser (Pcmanfm, Nautilus, Thunar, Dolphin o anumang iba pa) sa pamamagitan ng pagbubukas nito sa pamamagitan ng graphic na panel ng kapaligiran na ginagamit namin o sa pamamagitan ng pagpindot sa alt + f2, pagsulat ng pangalan nito sa maliit na titik at pagpindot ipasok sa dulo at pagkatapos ay lumikha ng dalawang direktoryo (folder) sa loob ng aming direktoryo ng gumagamit, na pinangalanan ang isang Applications_extras at isa pang AntConc bilang isang subdirectory ng una:

Pumunta kami ngayon sa direktoryo kung saan na-download ang file ng antconc3.2.4u.tar.gz (na nasa halimbawang ito Mga Pag-download) at binubuksan namin ang file sa Xarchiver o Fileroller upang ma-zip ang nilalaman nito sa direktoryo ng Antconc sa pamamagitan ng pagpili ng pagpipilian sa pagkuha sa aming file manager at na nagpapahiwatig ng path ng direktoryo / bahay / gumagamit / Extra_Applications / AntConc:

Kapag ang nilalaman ng pakete ng antconc3.2.4u.tar.gz ay nakuha sa direktoryo ng AntConc sa loob ng Applications_extras, kinikilala namin ang file na antconc3.2.4u upang bigyan ito ng mga pahintulot sa pagpapatupad sa pamamagitan ng pag-click sa kanang pindutan ng mouse, ipasok ang mga pag-aari at payagan ang pagpapatupad ng file bilang isang programa:

At sa pamamagitan nito dapat naming buksan ang AntConc sa pamamagitan ng pag-double click gamit ang mouse sa antconc3.2.4u file.

Kung gusto namin, magagawa namin ang lahat ng nakaraang pamamaraan sa pamamagitan ng terminal sa pamamagitan ng pagpapatupad ng mga sumusunod na utos at pagbabago ng "gumagamit" sa pangalang ginagamit namin sa aming session:

Upang likhain ang mga direktoryo:

$ mkdir / home / user / Applications_extras (pindutin ang enter)
$ mkdir / home / user / Applications_extras / AntConc (pindutin ang enter)

Baguhin sa direktoryo ng AntConc at kunin ang nilalaman ng antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (pindutin ang enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(press enter)

Payagan na patakbuhin ang file ng antconc3.2.4u bilang isang programa:

$ chmod + x antconc3.2.4u (pindutin ang enter)

At patakbuhin ang AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(press enter)

Hindi alintana ang pamamaraan na pinili namin, kung nais namin, maaari naming kopyahin ang file ng antconc3.2.4u sa direktoryo / usr / bin at bigyan ito ng kinakailangang mga pahintulot upang maipatakbo ang AntConc mula sa terminal o sa alt + f2 sa pamamagitan lamang ng pagsusulat ng antconc3.2.4u. Para sa mga ito isinasagawa namin ang mga sumusunod na utos bilang superuser sa su o sudo:

$ your
(Isusulat namin ang aming root password at pindutin ang enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# exit

At ngayon, sa pamamagitan lamang ng pagpapatakbo ng antconc3.2.4u sa aming gumagamit mula sa anumang terminal emulator, magbubukas ang AntConc tulad ng ipinakita sa nakaraang imahe.

$antconc3.2.4u

Paggamit ng AntConc upang ilista ang mga salita sa pamamagitan ng isang tukoy na character

Natukoy na kung paano mag-download at magpatakbo ng AntConc, magbibigay kami ngayon ng paraan upang maipakita ang paggamit nito para sa paghahanap ng ilang mga salita sa pamamagitan ng isang paghahanap sa alpabetikong pagkakasunud-sunod ng mga character sa parehong maliit at maliit na titik. Kung nais mong mapunta nang mas malalim sa pagpapatakbo ng AntConc at lahat ng mga posibilidad ng paggamit nito, maaari kang kumunsulta sa README_AntConc3.2.4.pdf na dokumento sa aming direktoryo / bahay / gumagamit / Aplicaciones_extras / AntConc o i-download ito mula sa http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, pati na rin kumunsulta sa online na tulong o panoorin ang mga AntConc video tutorial na magagamit sa website nito http://www.antlab.sci.waseda.ac. jp / antconc_index.html

Maaari lamang gumana ang AntConc sa mga simpleng file ng teksto (".txt"), ".html", ".hml," ".xml" at ang sarili nitong format na ".ant", kaya't ang nilalaman ng dokumento na kung saan gagawin namin ang pagkakakilanlan ng salita, babaguhin namin ito mula sa orihinal na format nito sa ".odt", ".rtf", ".pdf" o ilang iba pa sa ".txt" na gumagawa ng isang pagpipilian ng lahat ng nilalaman, kinopya ito at na-paste ito sa isang bagong dokumento sa teksto pagpapatakbo ng eroplano ang aming ginustong text editor (Leafpad, Gedit, Vim, Emacs, bukod sa iba pa). Sa halimbawang ito ay susubukan naming lumikha ng isang pampakay na index mula sa librong «Pakikipagtulungan Konstruksiyon ng Kaalaman» na kung saan maaari nating bisitahin ang website nito: http://seminario.edusol.info/seco3/ at kung saan malaya nating mai-download mula sa link na ito: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Kapag na-download na ang file, nahahanap namin ito sa aming direktoryo ng mga pag-download, binubuksan namin ito sa aming tagatingin ng dokumento ng pdf (sa halimbawang ito na Evince), pipiliin namin ang lahat ng nilalaman nito sa pamamagitan ng pagpindot sa ctrl + a, kinopya namin ito at ididikit sa isang bagong kapatagan dokumento ng teksto:

At nai-save namin ang aming bagong dokumento sa simpleng teksto na may pangalan ng «Construccion_colaborativa_del_conocimiento.txt» sa direktoryo ng Mga Dokumento:

Ngayon pinapatakbo namin ang AntConc at mula sa unang tab sa kaliwang itaas na tinatawag na "File" binubuksan namin ang file na "Construccion_colaborativa_del_ know knowledge.txt":

Sa kaliwang haligi na tinatawag na "Corpus Files" lilitaw na ngayon ang pangalan ng aming text file, na nagpapahiwatig na gagana ang pagtatrabaho namin sa file na ito, dahil sa AntConc maaari kaming mag-load ng higit sa isang file ng teksto at magkasama o magkahiwalay na gagana sa kanila.

Ngayon kung ano ang gagawin namin ay ilista ang lahat ng mga salitang naglalaman ng character na "A", upang makilala ang isang keyword gamit ang malaking titik na ito, dahil inaalok sa amin ng AntConc ang posibilidad na makilala ang mga maliliit at malalaking titik, ito ay napaka kapaki-pakinabang upang makilala ang wastong mga pangalan o mga akronim sa listahan ng listahan. Para dito inilalagay namin ang unang tab na tinatawag na «Concordance» sa kanang bahagi ng «Corpus Files», alisan ng tsek ang kahon na «Words» upang markahan ang kahon na «Kaso», kapwa sa kanang ibabang bahagi ng «Termino para sa Paghahanap», nagsusulat kami sa patlang Maghanap sa ibaba ng titik A at mag-click sa lila na parihaba na nagsasabing "Magsimula":

At ililista nito ang mga resulta ng mga sumusunod. Hugis:

Tulad ng nakikita natin, ang ilang mga character na nakasulat na may accent ay lilitaw na katulad sa salitang "Autónoma" sa halip na "Autónoma". Ito ay dahil dapat nating sabihin sa AntConc ang naaangkop na wikang pag-coding para sa aming wika, dahil hindi nakita ng AntConc na gumagamit kami ng Espanyol bilang default. Para dito binubuksan namin ang tab na «Mga Setting ng Globlal» sa tuktok sa tabi ng «File», pupunta kami sa huling pagpipilian «Mga Setting ng Pag-encode ng Wika» sa kanang bahagi na na-click namin sa «I-edit» pipiliin namin ang unang pagpipilian «Mga Karaniwang Pag-encode »Nag-click kami dito, piliin ang pangatlong pagpipilian mula sa listahan na lilitaw sa kanang" Unicode (utf8) "at mag-click sa kahon na" Ilapat "sa ibabang kanang bahagi ng window:

Matapos mailapat ang mga pagbabago, muli kaming nag-click sa lila na parihaba ng «Start» at ang mga accent na character ay lilitaw nang ligtas:

Sinusuri namin ngayon ang mga salitang may letrang A na naka-highlight sa asul para sa madaling pagkakakilanlan at batay sa aming mga pagsasaalang-alang, pinipili namin ang mga nais naming isama sa tematikong index, halimbawa ng "Computer illiteracy" sa hilera bilang 17 na pinakakaraniwan salitang kaagad na natagpuan na ang unang tinukoy sa aming tematikong index mula sa nilalaman ng teksto ng «Tulungang pagtatayo ng kaalaman».

Bumalik kami sa dokumentong pdf «Ang pagtutulungan ng kaalaman» upang makita kung aling mga pahina ang «Computer illiteracy» ay lilitaw sa pamamagitan ng pag-type ng «ctrl + f», pagsulat ng salitang «Illiteracy» sa patlang ng paghahanap at pagpindot sa «enter» sa dulo at bilang ng mga beses na kinakailangan upang mahanap ang hinahanap na salita sa lahat ng mga pahina. Magbubukas kami ng isang bagong dokumento sa LibreOffice Writer upang likhain ang aming index ng paksa o kung ginagawa namin ang nilalaman ng isang dokumento na orihinal na nasa. Ngayon, buksan namin ang dokumentong iyon sa LibreOffice at lilikha lamang at maie-edit namin ang index ng paksa sa anumang pahina :

Kung nais din naming makilala sa AntConc kung saan lumilitaw ang mga pangungusap na "Computer illiteracy" sa lahat ng nilalaman ng dokumento na "Construccion_colaborativa_del_conocimiento.txt", nagsusulat kami ng "Computer illiteracy" sa patlang ng paghahanap, alisan ng tsek ang "Kaso", markahan ang "Mga Salita" at i-click ito sa "Start":

Kung nag-click kami sa alinman sa mga hilera na naka-highlight sa «Computer illiteracy» na may asul na kulay, halimbawa sa hilera 4, sa tab na «View ng File» ipapakita sa amin ang fragment ng teksto kung saan lumilitaw ang pagpipiliang ito na naka-highlight na may itim na kulay ng background :

Sa ganitong paraan, ang AntConc ay lubhang kapaki-pakinabang sa amin kapag nagsulat kami ng isang libro, sanaysay o buod at hindi kami gumawa ng isang temang index sa kahanay o upang sistematikong pag-aralan ang pangunahing mga ideya ng isang akda upang mapadali ang pagbabasa nito.


Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: Miguel Ángel Gatón
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.

  1.   Batas-Batayan dijo

    Tunay na kagiliw-giliw na tool .. .. Hindi ko alam ang tungkol dito .. at napaka kapaki-pakinabang sa akin ..

    Salamat..

  2.   Cristianhcd dijo

    napakahusay na artikulo, kagiliw-giliw

  3.   Matandang lalaki dijo

    Maraming salamat sa pagbabahagi

  4.   Paano Mag-install ng Linux dijo

    Mahusay na kontribusyon, napaka kapaki-pakinabang. Ang pagkaalam na maaari kang magkaroon ng mga ganitong uri ng tool sa Linux ay laging may pagkakaiba. Pagbati.

  5.   Phytoschido dijo

    Napakahusay na entry. Gusto ko na nai-publish nila ang ganitong uri ng nilalaman!

  6.   Jonathan dijo

    Kamusta po sa lahat Salamat sa iyong mga komento at isang paghingi ng tawad para makapagkomento sa ngayon. Inaasahan kong ang mga nagpatupad ng pagtuturo ay walang mga problema.