AntConc 및 LibreOffice를 사용하여 질적 텍스트 분석 및 주제 색인 생성

안녕하세요 친구들, 저는 지금부터 <°에서 제가 할 수 있는 모든 일에 참여하게 되어 매우 기쁩니다. Desde Linux. 제 이름은 Jathan이고 제가 교수진의 IT 조정 사회 봉사 활동에서 수행한 문서를 바탕으로 이 첫 번째 항목을 여러분과 공유합니다. 이 내용이 흥미롭고 유용하며 다양한 의견을 제시해 주시기를 바랍니다.

텍스트 파일에서 주제별 색인 생성을위한 키워드를 찾고, 작품의 주요 아이디어 또는 기타 유사한 목적을 분석하려면 단어 내에서 대문자와 소문자를 구분할 수있는 검색을 수행해야합니다. 더 빠르고 실용적인 방법으로 키워드를 찾을 수 있도록 문자와 같이 원하는 문자를 강조 표시하는 목록을 제공합니다.

이 문서의 목적은 자유 소프트웨어로 주제별 색인을 쉽게 구현할 수 있도록 질적 텍스트 분석 응용 프로그램과 텍스트 편집기의 사용을 제시하고 설명하는 것입니다.

첫 번째 부분에서는 설치 절차 LibreOffice 및 실행 앤트콘크 운영 체제 내 GNU / 리눅스 그리고 나중에 Windows 및 Mac OS 시스템 내에서 수행하는 방법에 대해 설명하며 다음 부분에서는 운영 체제에 관계없이 사용 방법에 대해 설명합니다. 앤트콘크 y LibreOffice 예제를 사용하여 주제 색인을 만듭니다.

GNU / Linux의 LibreOffice 및 AntConc

가장 먼저해야 할 일은 GNU / Linux 배포판에 LibreOffice가 설치되어 있는지 확인하는 것입니다. LibreOffice는 GPL 라이선스가 부여 된 무료 멀티 플랫폼 오피스 제품군으로 텍스트 문서, 슬라이드, 스프레드 시트, 데이터베이스, 그림 및 수학 공식을 간단하고 효율적으로 편집 할 수 있도록 도와줍니다.

우리가 사용하는 경우 데비안, LinuxMint, Trisquel, Ubuntu 또는 데비안, 최신 버전과 Mageia, Fedora 및 OpenSUSE와 같은 다른 배포판의 대부분의 배포판에서 LibreOffice가 이미 사전 설치되어 있으므로 찾아서 실행하기 만하면 더 이상 설치를 처리 할 필요가 없습니다. 응용 프로그램 패널 또는 명령 줄에서.

Debian Squeeze 6.0을 사용하는 경우 다음 지침에 따라 OpenOffice를 LibreOffice로 업데이트해야합니다. http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

시스템에 LibreOffice가 설치되어 있는지 확인한 후 이제 AntLab 웹 사이트를 방문하여 Laurence Anthony가 개발 한 몇 가지 유용한 응용 프로그램을 찾아 GNU / Linux, Mac 용 교차 플랫폼 실행 파일과의 질적 텍스트 분석 및 단어 일치를 찾을 수 있습니다. OS 및 Windows.

AntConc는 Perl 프로그래밍 언어로 작성된 응용 프로그램으로, 알파벳 순서 또는 출현 빈도, 키워드, 파일에서 일치 및 단어 그룹을 일반 텍스트 형식으로 나열하고 소문자와 대문자를 구분하는 데 도움이됩니다. 다운로드하려면 http : //www.antlab.sci.waseda.ac.jp/antconc_index.html 링크로 이동하여 Tux 펭귄이 나타나는 다섯 번째 열에서 AntConc 3.2.4u 다운로드 옵션을 선택하십시오.

선택한 파일의 다운로드가 완료되면 사용하는 그래픽 환경 패널을 통해 열거 나 alt + f2를 누르고 이름을 입력하여 선호하는 파일 브라우저 (Pcmanfm, Nautilus, Thunar, Dolphin 등)를 엽니 다. 소문자를 입력하고 마지막에 엔터를 치면 사용자 디렉토리 내에 두 개의 디렉토리 (폴더)를 생성하여 하나의 Applications_extras와 다른 AntConc를 첫 번째 하위 디렉토리로 명명합니다.

이제 antconc3.2.4u.tar.gz 파일이 다운로드 된 디렉토리 (이 예제 다운로드에 있음)로 이동하고 Xarchiver 또는 Fileroller로 파일을 열어 Antconc 디렉토리에 압축 해제 옵션을 선택하여 압축을 풉니 다. 파일 관리자 및 디렉토리 경로 / home / user / Extra_Applications / AntConc를 표시합니다.

antconc3.2.4u.tar.gz 패키지의 내용이 Applications_extras 내의 AntConc 디렉토리에 추출되면 antconc3.2.4u 파일을 식별하여 마우스 오른쪽 버튼을 클릭하여 실행 권한을 부여하고 속성을 입력하고 실행을 허용합니다. 프로그램으로 파일의 :

그리고 이것으로 antconc3.2.4u 파일을 마우스로 더블 클릭하여 AntConc를 열 수 있습니다.

원하는 경우 다음 명령을 실행하고 세션에서 사용하는 이름으로 "user"를 변경하여 터미널을 통해 이전 절차를 모두 수행 할 수 있습니다.

디렉토리를 생성하려면 :

$ mkdir / home / user / Applications_extras (Enter 누르기)
$ mkdir / home / user / Applications_extras / AntConc (Enter 누르기)

AntConc 디렉토리로 변경하고 antconc3.2.4u.tar.gz의 컨텐츠를 추출하십시오.

$ cd / home / user / Applications_extras / AntConc / (Enter 누르기)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(Enter 누르기)

antconc3.2.4u 파일을 프로그램으로 실행하도록 허용합니다.

$ chmod + x antconc3.2.4u (Enter 키 누르기)

그리고 AntConc를 실행하십시오.

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(Enter 누르기)

우리가 선택한 절차에 관계없이 원하는 경우 antconc3.2.4u 파일을 / usr / bin 디렉토리에 복사하고 터미널에서 AntConc를 실행할 수 있도록 필요한 권한을 부여하거나 간단히 작성하여 alt + f2를 사용하여 antconc3.2.4u. 이를 위해 su 또는 sudo를 사용하여 수퍼 유저로 다음 명령을 실행합니다.

$ 귀하의
(우리는 루트 암호를 작성하고 Enter를 누르십시오)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# 이탈

이제 터미널 에뮬레이터에서 사용자와 함께 antconc3.2.4u를 실행하기 만하면 AntConc가 이전 이미지와 같이 열립니다.

$antconc3.2.4u

AntConc를 사용하여 특정 문자로 단어 나열

AntConc를 다운로드하고 실행하는 방법을 확인 했으므로 이제 소문자와 대문자로 된 알파벳 순서로 검색하여 일부 단어를 찾는 데 사용하는 예를 보여줄 것입니다. AntConc의 작동과 모든 사용 가능성에 대해 자세히 알아 보려면 디렉토리 / home / user / Aplicaciones_extras / AntConc에있는 문서 README_AntConc3.2.4.pdf를 참조하거나 http : //www.antlab에서 다운로드 할 수 있습니다. .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, 온라인 도움말을 참조하거나 웹 사이트 http://www.antlab.sci.waseda.ac에서 제공되는 AntConc 비디오 튜토리얼을보십시오. jp / antconc_index.html

AntConc는 일반 텍스트 파일 ( ".txt"), ".html", ".hml", ".xml"및 자체 형식 ".ant"로만 작업 할 수 있으므로 문서의 내용은 단어 식별, ".odt", ".rtf", ".pdf"등의 원래 형식에서 ".txt"로 변경하여 모든 내용을 선택하고 새 텍스트에 복사하여 붙여 넣습니다. 우리가 선호하는 텍스트 편집기 (Leafpad, Gedit, Vim, Emacs 등)를 실행하는 문서 플레인. 이 예에서 우리는 웹 사이트 http://seminario.edusol.info/seco3/를 방문 할 수 있고 다음 링크에서 무료로 다운로드 할 수있는«Collaborative Construction of Knowledge»책에서 주제별 색인을 만들려고합니다. http : / /seminario.edusol.info/seco3/pdf/seco3.pdf

파일이 다운로드되면 다운로드 디렉토리에서 파일을 찾고 pdf 문서 뷰어 (이 예에서는 Evince)로 파일을 열고 ctrl + a를 눌러 모든 콘텐츠를 선택하고 복사 한 다음 새 일반에 붙여 넣습니다. 텍스트 문서 :

그리고 새 문서를 문서 디렉토리에«Construccion_colaborativa_del_conocimiento.txt»라는 이름의 일반 텍스트로 저장합니다.

이제 AntConc를 실행하고 왼쪽 상단의 "File"이라는 첫 번째 탭에서 "Construccion_colaborativa_del_knowledge.txt"파일을 엽니 다.

"Corpus Files"라는 왼쪽 열에 텍스트 파일의 이름이 표시되어이 파일에 대해 작업 할 것임을 나타냅니다. AntConc에서 둘 이상의 텍스트 파일을로드하고 함께 또는 개별적으로 작업 할 수 있기 때문입니다.

이제 우리가 할 일은 대문자로 키워드를 식별하기 위해 문자 "A"를 포함하는 모든 단어를 나열하는 것입니다. AntConc는 소문자와 대문자를 구별 할 수있는 가능성을 제공하기 때문에 고유 한 이름이나 두문자어를 식별하는 데 매우 유용합니다. 목록의 형태로. 이를 위해«Corpus Files»오른쪽에«Concordance»라는 첫 번째 탭을 배치하고«검색어»의 오른쪽 하단에있는«사례»상자를 표시하기 위해«단어»상자를 선택 취소합니다. A 아래의 필드를 검색하고 "시작"이라고 표시된 자주색 사각형을 클릭합니다.

그리고 다음의 결과를 나열합니다. 모양:

보시다시피 악센트가있는 일부 문자는 "Autónoma"대신 "Autónoma"라는 단어와 유사하게 나타납니다. 이는 AntConc가 기본적으로 스페인어를 사용하고 있음을 감지하지 못하기 때문에 AntConc에 우리 언어에 적합한 코딩 언어를 알려야하기 때문입니다. 이를 위해 "파일"옆 상단에있는 "글로벌 설정"탭을 열고 오른쪽에있는 마지막 옵션 "언어 인코딩 설정"으로 이동하여 "편집"을 클릭하고 첫 번째 옵션 "표준 인코딩»We 그것을 클릭하고 오른쪽에 표시된 목록에서 세 번째 옵션을 선택합니다. "Unicode (utf8)"그리고 창 오른쪽 아래에있는 "적용"상자를 클릭합니다.

변경 사항을 적용한 후 다시«시작»의 자주색 사각형을 클릭하면 악센트 부호가있는 문자가 읽기 쉽게 나타납니다.

이제 우리는 쉽게 식별 할 수 있도록 파란색으로 강조 표시된 문자 A가있는 단어를 검토하고 있으며 고려 사항에 따라 주제 색인에 포함 할 단어를 선택합니다. 예를 들어 17 행의 "컴퓨터 문맹"이 가장 일반적인 단어입니다. 즉각적인 단어는«협동적인 지식 구성»텍스트의 내용에서 주제 색인에서 가장 먼저 언급 된 것으로 확인되었습니다.

pdf 문서«Collaborative construction of knowledge»로 돌아가서«ctrl + f»를 입력하고 검색 필드에«Illiteracy»를 입력 한 다음 끝에«enter»를 눌러«컴퓨터 문맹»이 나타나는 페이지를 찾습니다. 모든 페이지에서 검색된 단어를 찾는 데 필요한 횟수입니다. LibreOffice Writer에서 새 문서를 열어 주제 색인을 생성하거나 원래 .odt에있는 문서의 내용에 대해 작업하는 경우 LibreOffice에서 해당 문서를 열고 모든 페이지에서 주제 색인 만 만들고 편집합니다. :

또한 "Construccion_colaborativa_del_conocimiento.txt"문서의 모든 내용에 "컴퓨터 문맹"이라는 문장이있는 AntConc를 사용하여 식별하려면 검색 필드에 "컴퓨터 문맹"을 입력하고 "사례"를 선택 취소하고 "단어"를 표시합니다. "시작"하려면 클릭하십시오.

예를 들어 4 행에서 파란색으로«컴퓨터 문맹»으로 강조 표시된 행을 클릭하면«파일보기»탭에서이 선택 사항이 배경에서 검정색으로 강조 표시된 텍스트 조각이 표시됩니다.

이런 식으로 AntConc은 우리가 책, 에세이 또는 요약을 작성하고 주제별 색인을 병렬로 작성하지 않았거나 읽기를 용이하게하기 위해 작품의 주요 아이디어를 체계적으로 분석하지 않을 때 매우 유용합니다.


6 코멘트, 당신의 것을 남겨주세요

코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자 : Miguel Ángel Gatón
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.

  1.   RAW 기본

    매우 흥미로운 도구 .. .. 몰랐습니다 .. 매우 유용합니다 ..

    주셔서 감사합니다 ..

  2.   Cristianhcd

    아주 좋은 기사, 흥미로운

  3.   노인

    공유 주셔서 대단히 감사합니다

  4.   Linux를 설치하는 방법

    큰 기여, 매우 유용합니다. Linux에서 이러한 유형의 도구를 사용할 수 있다는 것을 아는 것은 항상 차이를 만듭니다. 문안 인사.

  5.   피토 스키도

    훌륭한 입장. 나는 그들이 이런 유형의 콘텐츠를 게시하는 것을 좋아합니다!

  6.   자단

    안녕하세요 여러분. 지금까지 의견을 보내 주셔서 감사합니다. 과외를 실천해 주신 분들에게 문제가 없었 으면합니다.