Квалитативна анализа текста и израда индекса предмета са АнтЦонц и ЛибреОффице

Поздрав пријатељи, веома сам срећан што ћу се придружити и учествовати у свему што ми је надохват руке од сада у <° Desde Linux. Моје име је Јатхан и делим са вама овај први унос на основу документације коју сам урадио у социјалној служби ИТ координације мог факултета. Надам се да ће вам бити занимљиво, корисно и да ћете дати све врсте коментара.

Када у текстуалној датотеци желимо да пронађемо кључне речи за стварање тематског индекса, анализирамо главне идеје дела или неку другу сличну намену, треба да извршимо претраге помоћу којих можемо да разликујемо велика и мала слова унутар речи, као и списак ових који истичу жељене знакове као што је слово како бисмо брже и практичније пронашли кључне речи.

Циљ садашње документације је да представи и објасни употребу апликације за квалитативну анализу текста и уређивача текста како би се олакшало стварање тематског индекса са бесплатним софтвером.

У првом делу поступак за уградњу ЛибреОффице и извршење АнтЦонц у оквиру оперативног система ГНУ / Линук и касније како то учинити у системима Виндовс и Мац ОС, док ће у следећим деловима, без обзира на оперативни систем, бити објашњено како се користи АнтЦонц y ЛибреОффице Коришћење примера за креирање индекса предмета.

ЛибреОффице и АнтЦонц на ГНУ / Линук

Прво што треба да урадимо је да проверимо да ли имамо ЛибреОффице инсталиран на нашој ГНУ / Линук дистрибуцији. ЛибреОффице је бесплатни канцеларијски пакет за више платформи лиценциран са ГПЛ и који нам помаже да на једноставан и ефикасан начин уређујемо текстуалне документе, слајдове, прорачунске табеле, базе података, цртеже и математичке формуле.

Ако користимо Дебиан, ЛинукМинт, Трискуел, Убунту или било која друга дистрибуција заснована на Дебиан, Нећемо више морати да се бавимо његовом инсталацијом, јер је у већини ових дистрибуција у њиховим најновијим верзијама, као и у другима као што су Магеиа, Федора и ОпенСУСЕ, ЛибреОффице већ унапред инсталиран и само га морате пронаћи и покренути са табле апликација или командном линијом.

Ако користимо Дебиан Скуеезе 6.0, морамо ажурирати ОпенОффице на ЛибреОффице следећи ова упутства: хттп://ввв.доблесеис.цом.ар/инсталар-либреоффице-3-ен-дебиан-скуеезе.

Након што се побринемо да имамо ЛибреОффице инсталиран на нашем систему, сада ћемо прећи на посету веб локацији АнтЛаб где можемо пронаћи неке корисне апликације које је развио Лауренце Антхони за квалитативну анализу текста и подударање речи са вишеплатформним извршним датотекама за ГНУ / Линук, Мац ОС и Виндовс.

АнтЦонц је апликација написана на програмском језику Перл која нам помаже да пописамо речи по абецедном реду или према учесталости појављивања, кључне речи, правимо подударања и групе речи из датотеке у формату обичног текста, правећи разлику између малих и великих слова. Да бисте га преузели, идите на ову везу: хттп: //ввв.антлаб.сци.васеда.ац.јп/антцонц_индек.хтмл и одаберите у петој колони где се појављује пингвин Тук могућност преузимања АнтЦонц 3.2.4у:

Када је преузимање изабране датотеке завршено, отварамо наш омиљени прегледач датотека (Пцманфм, Наутилус, Тхунар, Долпхин или било који други) тако што ћемо га отворити кроз панел графичког окружења који користимо или притиском на тастере алт + ф2, уписујући његово име малим словима и притискајући ентер на крају, а затим креирајте два директоријума (директоријума) у нашем корисничком директоријуму, именујући један Апплицатионс_ектрас и други АнтЦонц као поддиректоријум првог:

Сада идемо у директоријум где је преузета датотека антцонц3.2.4у.тар.гз (у овом примеру је Преузимања), а датотеку отварамо помоћу Ксарцхивер или Филероллер да бисмо распаковали њен садржај у директоријум Антцонц одабиром опције издвајања у нашем управитељ датотека и назначење путање директоријума / хоме / усер / Ектра_Апплицатионс / АнтЦонц:

Једном када је садржај пакета антцонц3.2.4у.тар.гз издвојен у директоријум АнтЦонц у оквиру Апплицатионс_ектрас, идентификујемо датотеку антцонц3.2.4у да бисмо јој дали дозволе за извршавање кликом десног тастера миша, унели својства и дозволили извршење датотеке као програма:

А са овим бисмо требали моћи да отворимо АнтЦонц двоструким кликом миша на датотеку антцонц3.2.4у.

Ако више волимо, све претходне поступке можемо извршити преко терминала извршавањем следећих наредби и променом „корисник“ именом које користимо у нашој сесији:

Да бисте креирали директоријуме:

$ мкдир / хоме / усер / Апплицатионс_ектрас (притисните ентер)
$ мкдир / хоме / усер / Апплицатионс_ектрас / АнтЦонц (притисните ентер)

Пређите на директоријум АнтЦонц и извуците садржај антцонц3.2.4у.тар.гз:

$ цд / хоме / усер / Апплицатионс_ектрас / АнтЦонц / (притисните ентер)
$ тар -кзвф /хоме/усуарио/Десцаргас/антцонц3.2.4у.тар.гз(пресс ентер)

Дозволите покретање датотеке антцонц3.2.4у као програма:

$ цхмод + к антцонц3.2.4у (притисните ентер)

И покрените АнтЦонц:

$ /хоме/усуарио/Аплицационес_ектрас/АнтЦонц/антцонц3.2.4у(пресс ентер)

Без обзира на процедуру коју смо изабрали, ако желимо, можемо копирати датотеку антцонц3.2.4у у директоријум / уср / бин и дати јој потребне дозволе за покретање АнтЦонц-а са терминала или са алт + ф2 само писањем антцонц3.2.4у. За ово извршавамо следеће наредбе као суперусер са су или судо:

$ иоур
(напишемо роот лозинку и притиснемо ентер)
# цп /хоме/усер/Ектрас_Апплицатионс/АнтЦонц/антцонц3.2.4у / уср / бин
# цхмод а + рвк /уср/бин/антцонц3.2.4у
# излаз

И сада, само покретањем антцонц3.2.4у са нашим корисником из било ког емулатора терминала, АнтЦонц ће се отворити као што је приказано на претходној слици.

$ антцонц3.2.4у

Коришћење АнтЦонц-а за пописивање речи према одређеном карактеру

Пошто смо идентификовали како да преузмемо и покренемо АнтЦонц, сада ћемо указати на пример његове употребе за лоцирање неких речи претрагом по абецедном реду знакова и у малим и у великим словима. Ако желите да дубље уђете у рад АнтЦонц-а и све његове могућности употребе, можете погледати документ РЕАДМЕ_АнтЦонц3.2.4.пдф у нашем директоријуму / хоме / усер / Аплицационес_ектрас / АнтЦонц или га преузети са хттп: //ввв.антлаб .сци.васеда.ац.јп / софтваре / антцонц335 / АнтЦонц_реадме.пдф, као и консултујте онлајн помоћ или погледајте АнтЦонц видео водиче доступне на њеној веб страници хттп://ввв.антлаб.сци.васеда.ац. јп / антцонц_индек.хтмл

АнтЦонц може радити само са датотекама са обичним текстом (".ткт"), ".хтмл", ".хмл," .кмл "и властитим форматом" .ант ", тако да садржај документа од којег ћемо направити идентификација речи, променићемо је из изворног формата у ".одт", ".ртф", ".пдф" или неком другом у ".ткт" правећи избор целог садржаја, копирајући га и лепећи у нови раван текстуалног документа на којем радимо наш омиљени уређивач текста (Леафпад, Гедит, Вим, Емацс, између осталог). У овом примеру тражићемо да створимо тематски индекс из књиге «Колаборативна конструкција знања» из које можемо да посетимо њену веб страницу: хттп://семинарио.едусол.инфо/сецо3/ и коју можемо слободно преузети са ове везе: хттп: / /семинарио.едусол.инфо/сецо3/пдф/сецо3.пдф

Једном када се датотека преузме, проналазимо је у нашем директоријуму за преузимања, отварамо је помоћу нашег прегледача пдф докумената (у овом примеру Евинце), одабиремо сав њен садржај притиском на цтрл + а, копирамо је и залепимо у нови документ са обичним текстом :

И нови документ чувамо у обичном тексту са именом «Цонструццион_цолаборатива_дел_цоноцимиенто.ткт» у директоријуму Документи:

Сада извршавамо АнтЦонц и са прве картице у горњем левом углу под називом „Филе“ отварамо датотеку „Цонструццион_цолаборатива_дел_цоноцимиенто.ткт“:

У левој колони под називом „Корпусне датотеке“ сада ће се појавити име наше текстуалне датотеке, што указује да ћемо радити на овој датотеци, јер у АнтЦонц можемо учитати више текстуалних датотека и радити на њима заједно или одвојено:

Сада ћемо урадити списак свих речи које садрже знак „А“, како бисмо идентификовали кључну реч са овим великим словом, јер нам АнтЦонц нуди могућност разликовања малих и великих слова, што је врло корисно за идентификацију властитих имена или акронима у облику листе. За ово поставимо прву картицу под називом „Цонцорданце“ на десну страну „Цорпус Филес“, поништите потврдни оквир „Вордс“ да бисте означили поље „Цасе“, обоје у доњој десној страни „Појма за претрагу“, пишемо у поље Претражите испод слова А и кликните на љубичасти правоугаоник на којем стоји „Старт“:

И наводиће резултате следећег. облик:

Као што видимо, неки знакови написани са акцентима изгледају слично речи „Аутонома“ уместо „Аутонома“. То је зато што АнтЦонц-у морамо рећи одговарајући језик кодирања за наш језик, јер АнтЦонц не открива да подразумевано користимо шпански језик. За ово отварамо картицу „Глоблал Сеттингс“ на врху поред „Филе“, идемо на последњу опцију „Лангуаге Енцодинг Сеттингс“ са десне стране кликнемо на „Едит“ и изаберемо прву опцију „Стандард Енцодингс» Ве кликните на њу, изаберите трећу опцију са листе која се појављује на десној страни „Уницоде (утф8)“ и кликните на поље „Примени“ у доњем десном делу прозора:

Након примене промена, поново кликнемо на љубичасти правоугаоник «Старт» и знакови са акцентима сада ће се појавити читко:

Сада прегледавамо речи са словом означеним словом А ради лакше идентификације и на основу наших разматрања бирамо оне које желимо да уврстимо у тематски индекс, на пример „Рачунарска неписменост“ у реду број 17 је најчешћа реч за које се у нашем тематском индексу наводи да се на њих први позива из садржаја текста „Колаборативна конструкција знања“.

Враћамо се пдф документу „Колаборативна конструкција знања“ да бисмо пронашли на којим се страницама појављује „Рачунарска неписменост“ тако што ћете откуцати „цтрл + ф“, уписати реч „Неписменост“ у поље за претрагу и притиснути „ентер“ на крају и број пута то је неопходно за проналажење тражене речи на свим страницама. Отварамо нови документ у ЛибреОффице Вритер-у да бисмо креирали наш индекс предмета или ако радимо на садржају документа који је изворно у .одт-у, отворит ћемо тај документ помоћу ЛибреОффице и креираћемо и уредити његов индекс предмета на било којој страници:

Ако такође желимо да се идентификујемо са АнтЦонц-ом у којим реченицама се „Компјутерска неписменост“ појављује у целом садржају документа „Цонструццион_цолаборатива_дел_цоноцимиенто.ткт“, у поље за претрагу напишемо „Рачунарска неписменост“, уклоните ознаку из „Цасе“, означите „Вордс“ и кликните на "Старт":

Ако кликнемо на било који ред означен плавом бојом на „Рачунарска неписменост“, на пример у реду 4, на картици „Приказ датотеке“ приказат ће нам фрагмент текста у којем је овај избор истакнут црном бојом позадина:

На овај начин, АнтЦонц нам је веома користан када смо написали књигу, есеј или резиме и нисмо паралелно радили тематски индекс или систематски анализирали главне идеје дела како бисмо олакшали његово читање.


Оставите свој коментар

Ваша емаил адреса неће бити објављена. Обавезна поља су означена са *

*

*

  1. За податке одговоран: Мигуел Ангел Гатон
  2. Сврха података: Контрола нежељене поште, управљање коментарима.
  3. Легитимација: Ваш пристанак
  4. Комуникација података: Подаци се неће преносити трећим лицима, осим по законској обавези.
  5. Похрана података: База података коју хостује Оццентус Нетворкс (ЕУ)
  6. Права: У било ком тренутку можете ограничити, опоравити и избрисати своје податке.

  1.   РАВ-Басиц дијо

    Веома занимљив алат .. ..Нисам знао за то .. и веома ми је користан ..

    Хвала вам..

  2.   Цристианхцд дијо

    врло добар чланак, занимљив

  3.   Старац дијо

    Пуно вам хвала на подели

  4.   Како инсталирати Линук дијо

    Велики допринос, врло користан. Знање да у Линуку можете имати ову врсту алата увек има разлике. Поздрави.

  5.   Фитосцхидо дијо

    Одличан улаз. Свиђа ми се што објављују ову врсту садржаја!

  6.   јатхан дијо

    Поздрав свима. Хвала на коментарима и извињење што сте до сада могли да коментаришете. Надам се да они који су туторство спроводили у пракси нису имали проблема.