Качествен текстов анализ и създаване на тематични индекси с AntConc и LibreOffice

Поздрави приятели, много се радвам да се присъединя и да участвам във всичко, което е в моя обсег от сега нататък в <° Desde Linux. Казвам се Джатан и споделям с вас този първи запис въз основа на документация, която направих в социалната служба на ИТ координацията на моя факултет. Надявам се да ви е интересно, полезно и да правите всякакви коментари.

Когато в текстов файл искаме да намерим ключови думи за създаване на тематичен индекс, да анализираме основните идеи на дадено произведение или някаква друга подобна цел, трябва да извършим търсения, с помощта на които можем да различаваме главни и малки букви в думите, както и списък с тях, открояващи желаните знаци като писмо, за да можем да намерим ключови думи по-бързо и по-практично.

Целта на тази документация е да представи и обясни използването на приложение за качествен текстов анализ и текстов редактор, за да улесни реализирането на тематичен индекс със свободен софтуер.

Първата част ще обясни процедурата за инсталиране LibreOffice и изпълнението на AntConc в рамките на операционната система GNU / Linux и по-късно как да го направите в Windows и Mac OS системи, докато в следващите части, независимо от операционната система, ще бъде обяснено как да се използва AntConc y LibreOffice Използване на примери за създаване на индекс на тема.

LibreOffice и AntConc на GNU / Linux

Първото нещо, което трябва да направим, е да проверим дали имаме LibreOffice инсталиран на нашата GNU / Linux дистрибуция. LibreOffice е безплатен мултиплатформен офис пакет, лицензиран с GPL, който ни помага да редактираме текстови документи, слайдове, електронни таблици, бази данни, чертежи и математически формули по прост и ефективен начин.

Ако използваме Debian, Linux Mint, Trisquel, Ubuntu или всяко друго разпространение въз основа на Debian, Вече няма да се налага да се занимаваме с инсталирането му, тъй като в повечето от тези дистрибуции в най-новите им версии, както и в други като Mageia, Fedora и OpenSUSE, LibreOffice вече е предварително инсталиран и просто трябва да го намерите и стартирате от панела с приложения или чрез команден ред.

Ако използваме Debian Squeeze 6.0, трябва да актуализираме OpenOffice до LibreOffice, като следваме тези инструкции: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

След като се уверим, че в нашата система има инсталиран LibreOffice, сега ще продължим да посещаваме уебсайта AntLab, където можем да намерим някои полезни приложения, разработени от Laurence Anthony за качествен текстов анализ и съвпадение на думи с изпълними файлове на различни платформи за GNU / Linux, Mac ОС и Windows.

AntConc е приложение, написано на езика за програмиране Perl, което ни позволява да изброяваме думи по азбучен ред или по честота на поява, ключови думи, да правим конкорданси и групи думи от файл в обикновен текстов формат, като правим разлика между малки и главни символи. За да го изтеглите, отидете на тази връзка: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html и изберете в петата колона, където пингвинът Tux се появява опцията за изтегляне на AntConc 3.2.4u:

Когато изтеглянето на избрания файл приключи, отваряме предпочитания от нас браузър на файлове (Pcmanfm, Nautilus, Thunar, Dolphin или който и да е друг), като го отваряме през панела на графичната среда, който използваме, или като натискаме alt + f2, записваме името му с малки букви и натискаме enter в края и след това създайте две директории (папки) в нашата потребителска директория, като назовете една Applications_extras и друга AntConc като поддиректория на първата:

Сега отиваме в директорията, където е изтеглен файлът antconc3.2.4u.tar.gz (в този пример е Изтегляния) и отваряме файла с Xarchiver или Fileroller, за да разархивираме съдържанието му в директорията Antconc, като изберете опцията за извличане в нашия файлов мениджър посочващ пътя на директорията / дома / потребителя / Extra_Applications / AntConc:

След като съдържанието на пакета antconc3.2.4u.tar.gz бъде извлечено в директорията AntConc в Applications_extras, ние идентифицираме файла antconc3.2.4u, за да му даде права за изпълнение, като щракнете с десния бутон на мишката, въведете свойства и позволете изпълнението на файл като програма:

И с това трябва да можем да отворим AntConc чрез двукратно щракване с мишката върху файла antconc3.2.4u.

Ако предпочитаме, можем да направим цялата предишна процедура през терминала, като изпълним следните команди и сменим "потребител" от името, което използваме в нашата сесия:

За да създадете директориите:

$ mkdir / home / user / Applications_extras (натиснете enter)
$ mkdir / home / user / Applications_extras / AntConc (натиснете enter)

Преминете към директорията AntConc и извлечете съдържанието на antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (натиснете enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(press enter)

Позволете да стартирате файла antconc3.2.4u като програма:

$ chmod + x antconc3.2.4u (натиснете Enter)

И стартирайте AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u (натиснете Enter)

Независимо от избраната от нас процедура, ако желаем, можем да копираме файла antconc3.2.4u в директорията / usr / bin и да му дадем необходимите разрешения, за да може да стартира AntConc от терминала или с alt + f2 да пише само antconc3.2.4u. За това изпълняваме следните команди като суперпотребител със su или sudo:

$ вашия
(ние пишем нашата root парола и натискаме enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# изход

И сега, просто като стартираме antconc3.2.4u с нашия потребител от който и да е емулатор на терминал, AntConc ще се отвори, както е показано в предишното изображение.

$antconc3.2.4u

Използване на AntConc за изброяване на думи от определен символ

След като вече идентифицирахме как да изтеглите и стартирате AntConc, сега ще продължим да илюстрираме използването му за намиране на някои думи чрез търсене в азбучен ред на символи както в малки, така и в главни букви. Ако искате да навлезете по-задълбочено в работата на AntConc и всички негови възможности за използване, можете да разгледате документа README_AntConc3.2.4.pdf в нашата директория / home / user / Aplicaciones_extras / AntConc или да изтеглите от http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, както и да се консултирате с онлайн помощ или да гледате видео уроците на AntConc, достъпни на уебсайта му http://www.antlab.sci.waseda.ac. jp / antconc_index.html

AntConc може да работи само с обикновени текстови файлове (".txt"), ".html", ".hml," ".xml" и собствен формат ".ant", така че съдържанието на документа, от който ще направим дума за идентификация, ще я променим от първоначалния й формат в ".odt", ".rtf", ".pdf" или някакъв друг на ".txt", като направим избор на цялото съдържание, копираме и поставим в нов текстов документ самолет, работещ с предпочитания от нас текстов редактор (Leafpad, Gedit, Vim, Emacs, наред с други). В този пример ще се стремим да създадем тематичен индекс от книгата «Съвместно изграждане на знания», от който можем да посетим нейния уебсайт: http://seminario.edusol.info/seco3/ и който можем да изтеглим свободно от тази връзка: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

След като файлът бъде изтеглен, ние го намираме в нашата директория за изтегляния, отваряме го с нашия PDF преглед на документи (в този пример Evince), избираме цялото му съдържание, като натискаме ctrl + a, копираме го и го поставяме в нов документ с обикновен текст :

И запазваме новия си документ в обикновен текст с името «Construccion_colaborativa_del_conocimiento.txt» в директорията Documents:

Сега изпълняваме AntConc и от първия раздел в горния ляв ъгъл, наречен „Файл“, отваряме файла „Construccion_colaborativa_del_conocimiento.txt“:

В лявата колона, наречена „Корпусни файлове“, сега ще се появи името на нашия текстов файл, което показва, че ще работим по този файл, тъй като в AntConc можем да заредим повече от един текстов файл и да работим върху тях заедно или поотделно:

Сега това, което ще направим, е да изброим всички думи, които съдържат символа "A", за да идентифицираме ключова дума с тази главна буква, тъй като AntConc ни предлага възможността да различаваме малки и главни букви, което е много полезно за идентифициране на правилни имена или съкращения в списъчна форма. За това поставяме първия раздел, наречен «Съгласуване» от дясната страна на «Корпусни файлове», премахваме отметката от квадратчето «Думи», за да маркираме полето «Дело», и двете в долната дясна страна на «Термин за търсене», пишем в полето Потърсете под буквата А и кликнете върху лилавия правоъгълник, на който пише „Старт“:

И ще изброи резултатите от следното. форма:

Както виждаме, някои символи, написани с ударения, изглеждат подобни на думата „Autónoma“ вместо „Autónoma“. Това е така, защото трябва да кажем на AntConc подходящия език за кодиране за нашия език, тъй като AntConc не открива, че използваме испански по подразбиране. За това отваряме раздела „Настройки на Globlal“ в горната част до „Файл“, отиваме до последната опция „Настройки за кодиране на език“ от дясната страна кликваме върху „Редактиране“ и избираме първата опция „Стандартни кодировки »Кликваме върху него, избираме третата опция от списъка, който се показва вдясно„ Unicode (utf8) “и кликваме върху полето„ Прилагане “в долната дясна част на прозореца:

След прилагане на промените отново щракваме върху лилавия правоъгълник на «Старт» и символите с акценти вече ще се появяват четливо:

Сега преглеждаме думите с буквата А, подчертана в синьо за лесно идентифициране и въз основа на нашите съображения избираме тези, които искаме да включим в тематичния указател, например „Компютърна неграмотност“ в ред номер 17 е най-често срещаната дума веднага се установи, че е първият, за който се говори в нашия тематичен указател от съдържанието на текста на «Съвместна конструкция на знанието».

Връщаме се към pdf документа «Съвместно изграждане на знания», за да открием на кои страници се появява «Компютърна неграмотност», като напишете «ctrl + f», напишете думата «Неграмотност» в полето за търсене и натиснете «enter» в края и броя пъти това е необходимо за намиране на търсената дума на всички страници. Отваряме нов документ в LibreOffice Writer, за да създадем нашия тематичен индекс, или ако работим върху съдържанието на документ, който първоначално е в .odt, отваряме този документ с LibreOffice и ще създадем и редактираме само неговия индекс на която и да е страница:

Ако искаме също да се идентифицираме с AntConc, в кои изречения „Компютърна неграмотност“ се появява във цялото съдържание на документа „Construccion_colaborativa_del_conocimiento.txt“, ние пишем „Компютърна неграмотност“ в полето за търсене, махнете отметката от „Case“, маркирайте „Words“ и щракнете върху него да започна":

Ако щракнем върху някой от редовете, маркирани на «Компютърна неграмотност» със син цвят, например в ред 4, в раздела «Изглед на файл» той ще ни покаже фрагмента от текста, където тази селекция се откроява с черно от заден план:

По този начин AntConc е много полезен за нас, когато сме написали книга, есе или резюме и не правим паралелно тематичен указател или системно анализираме основните идеи на дадено произведение, за да улесним неговото четене.


Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорен за данните: Мигел Анхел Гатон
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.

  1.   RAW-основен каза той

    Много интересен инструмент .. ..Не знаех за него .. и ми е много полезен ..

    Благодаря ти..

  2.   Кристианхд каза той

    много добра статия, интересна

  3.   Старец каза той

    Благодаря ви много за споделянето

  4.   Как да инсталирам Linux каза той

    Страхотен принос, много полезен. Знанието, че можете да разполагате с този тип инструменти в Linux, винаги има значение. За разбирането.

  5.   Фитошидо каза той

    Отлично влизане. Харесва ми, че публикуват този тип съдържание!

  6.   джатан каза той

    Здравейте всички. Благодаря за вашите коментари и извинение за възможността да коментирате до момента. Надявам се, че тези, които са приложили уроците, не са имали проблеми.