AntConcとLibreOfficeを使用した定性的なテキスト分析とサブジェクトインデックスの作成

友人の皆さん、私はこれから <° で手の届く範囲のことに喜んで参加し、参加します。 Desde Linux。私の名前はジェイサンです。この最初のエントリは、私が教員の IT 調整の社会奉仕活動で行った文書に基づいて共有します。興味深く、役に立ち、さまざまなコメントをしていただければ幸いです。

テキストファイルで主題索引を作成するためのキーワードを見つけたり、作品の主なアイデアやその他の同様の目的を分析したりする場合は、検索を行う必要があります。これにより、内の大文字と小文字を区別できます。単語、および文字などの目的の文字を強調表示するこれらのリスト。これにより、キーワードをより速く、より実用的な方法で見つけることができます。

現在のドキュメントは、定性的なテキスト分析アプリケーションとテキストエディタの使用法を提示して説明し、フリーソフトウェアでテーマ別インデックスを作成しやすくすることを目的としています。

最初の部分では、のインストールの手順 LibreOfficeの との実行 アントコンク オペレーティングシステム内 GNU / Linuxの その後、WindowsおよびMac OSシステム内でそれを行う方法、オペレーティングシステムに関係なく、次の部分では、使用方法について説明します。 アントコンク y LibreOfficeの 例を使用して主題索引を作成します。

GNU / Linux上のLibreOfficeとAntConc

最初に行う必要があるのは、GNU / LinuxディストリビューションにLibreOfficeがインストールされていることを確認することです。 LibreOfficeは、GPLでライセンスされた無料のマルチプラットフォームオフィススイートであり、テキストドキュメント、スライド、スプレッドシート、データベース、図面、数式を簡単かつ効率的に編集するのに役立ちます。

使用している場合 Debian、LinuxMint、Trisquel、Ubuntu またはに基づくその他の配布 Debianの、最新バージョンのこれらのディストリビューションのほとんど、およびMageia、Fedora、OpenSUSEなどの他のディストリビューションでは、LibreOfficeがすでにプリインストールされており、それを見つけて実行するだけでよいため、インストールを処理する必要はありません。アプリケーションパネルまたはコマンドラインから。

Debian Squeeze 6.0を使用している場合は、次の手順に従ってOpenOfficeをLibreOfficeに更新する必要があります:http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze。

システムにLibreOfficeがインストールされていることを確認したら、AntLab Webサイトにアクセスします。ここでは、GNU / Linux、Mac用のクロスプラットフォーム実行可能ファイルとの定性的なテキスト分析および単語照合のためにLaurenceAnthonyによって開発されたいくつかの便利なアプリケーションを見つけることができます。 OSとWindows。

AntConcは、Perlプログラミング言語で記述されたアプリケーションで、アルファベット順または出現頻度、キーワード、一致、および単語のグループをプレーンテキスト形式でファイルから作成し、小文字と大文字を区別するのに役立ちます。 ダウンロードするには、次のリンクにアクセスしてください:http://www.antlab.sci.waseda.ac.jp/antconc_index.htmlそして、Tuxペンギンが表示される3.2.4番目の列で、AntConcXNUMXuをダウンロードするオプションを選択します。

選択したファイルのダウンロードが完了したら、使用するグラフィカル環境パネルから開くか、alt + f2を押して名前を入力することにより、優先ファイルブラウザー(Pcmanfm、Nautilus、Thunar、Dolphinなど)を開きます。最後に小文字でEnterキーを押してから、ユーザーディレクトリ内にXNUMXつのディレクトリ(フォルダ)を作成し、XNUMXつのApplications_extrasと別のAntConcを最初のサブディレクトリとして指定します。

次に、antconc3.2.4u.tar.gzファイルがダウンロードされたディレクトリ(この例ではダウンロード)に移動し、XarchiverまたはFilerollerでファイルを開いて、コンテンツをAntconcディレクトリに解凍します。ファイルマネージャとディレクトリパス/ホーム/ユーザー/ Extra_Applications / AntConcを示します:

antconc3.2.4u.tar.gzパッケージのコンテンツがApplications_extras内のAntConcディレクトリに抽出されたら、antconc3.2.4uファイルを識別して、マウスの右ボタンをクリックし、プロパティを入力して実行を許可することにより、実行権限を付与します。プログラムとしてのファイルの:

これで、antconc3.2.4uファイルをマウスでダブルクリックしてAntConcを開くことができるはずです。

必要に応じて、次のコマンドを実行し、セッションで使用する名前で「user」を変更することにより、ターミナルを介して前のすべての手順を実行できます。

ディレクトリを作成するには:

$ mkdir / home / user / Applications_extras(Enterキーを押す)
$ mkdir / home / user / Applications_extras / AntConc(Enterキーを押す)

AntConcディレクトリに移動し、antconc3.2.4u.tar.gzのコンテンツを抽出します。

$ cd / home / user / Applications_extras / AntConc /(Enterキーを押す)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(Enterキーを押す)

antconc3.2.4uファイルをプログラムとして実行できるようにします。

$ chmod + x antconc3.2.4u(Enterキーを押す)

そして、AntConcを実行します。

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u(Enterキーを押す)

選択した手順に関係なく、必要に応じて、antconc3.2.4uファイルを/ usr / binディレクトリにコピーし、ターミナルから、またはalt + f2でAntConcを実行するために必要なアクセス許可を与えることができます。 antconc3.2.4u。 このために、suまたはsudoを使用してスーパーユーザーとして次のコマンドを実行します。

$あなたの
(rootパスワードを入力してEnterキーを押します)
#cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
#chmod a + rwx /usr/bin/antconc3.2.4u
# 出口

そして今、任意のターミナルエミュレータからユーザーとantconc3.2.4uを実行するだけで、前の画像に示すようにAntConcが開きます。

$antconc3.2.4u

AntConcを使用して特定の文字で単語を一覧表示する

AntConcをダウンロードして実行する方法をすでに特定したので、次に、小文字と大文字の両方でアルファベット順に検索することにより、いくつかの単語を見つけるための使用例を示します。 AntConcの操作とそのすべての使用可能性について詳しく知りたい場合は、ディレクトリ/ home / user / Aplicaciones_extras / AntConcにあるドキュメントREADME_AntConc3.2.4.pdfを参照するか、http://www.antlabからダウンロードしてください。 .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdfのほか、オンラインヘルプを参照するか、Webサイトhttp://www.antlab.sci.waseda.ac。jp /で入手できるAntConcビデオチュートリアルをご覧ください。 antconc_index.html

AntConcは、プレーンテキストファイル( ".txt")、 "。html"、 "。hml"、 "。xml"および独自の形式 ".ant"でのみ機能するため、作成元のドキュメントのコンテンツは単語の識別については、「。odt」、「。rtf」、「。pdf」などの元の形式から「.txt」に変更し、すべてのコンテンツを選択してコピーし、新しい形式に貼り付けます。推奨するテキストエディタ(Leafpad、Gedit、Vim、Emacsなど)を実行するテキストドキュメントプレーン。 この例では、本«Collaborative Construction of Knowledge»からテーマ別インデックスを作成し、そこからWebサイトhttp://seminario.edusol.info/seco3/にアクセスし、次のリンクから無料でダウンロードできます。 http:/ /seminario.edusol.info/seco3/pdf/seco3.pdf

ファイルがダウンロードされたら、ダウンロードディレクトリに配置し、PDFドキュメントビューア(この例ではEvince)で開き、ctrl + aを押してすべてのコンテンツを選択し、コピーして新しいファイルに貼り付けます。プレーンテキストドキュメント:

そして、新しいドキュメントを「Construccion_colaborativa_del_conocimiento.txt」という名前のプレーンテキストでDocumentsディレクトリに保存します。

次に、AntConcを実行し、左上の「ファイル」という最初のタブから「Construccion_colaborativa_del_conocimiento.txt」ファイルを開きます。

「コーパスファイル」と呼ばれる左側の列に、テキストファイルの名前が表示されます。これは、AntConcで複数のテキストファイルをロードして、一緒にまたは別々に作業できるため、このファイルで作業することを示します。

次に、文字「A」を含むすべての単語をリストして、この大文字でキーワードを識別します。AntConcは小文字と大文字を区別する可能性を提供するため、これは固有名詞または頭字語を識別するのに非常に役立ちます。リスト形式で。 このために、「CorpusFiles」の右側に「Concordance」という最初のタブを配置し、「SearchTerm」の右下にある「Case」ボックスをマークするために「Words」ボックスのチェックを外します。文字Aの下の[検索]フィールドで、「開始」と表示されている紫色の長方形をクリックします。

そして、それは以下の結果をリストします。 形状:

ご覧のとおり、アクセント付きで書かれた文字の中には、「Autónoma」ではなく「Autónoma」という単語に似ているものがあります。 これは、AntConcがデフォルトでスペイン語を使用していることを検出しないため、AntConcに言語に適したコーディング言語を指示する必要があるためです。 このために、上部の「ファイル」の横にある「グローバル設定」タブを開き、右側の最後のオプション「言語エンコーディング設定」に移動し、「編集」をクリックして、最初のオプション「標準エンコーディング」を選択します。それをクリックし、右側に表示されるリストから8番目のオプション「Unicode(utfXNUMX)」を選択し、ウィンドウの右下にある「適用」ボックスをクリックします。

変更を適用した後、«開始»の紫色の長方形をもう一度クリックすると、アクセント付きの文字が読みやすく表示されます。

現在、識別しやすいようにAの文字が青色で強調表示されている単語を確認し、考慮事項に基づいて、テーマ別インデックスに含めたい単語を選択しています。たとえば、行番号17の「コンピューターの非識字」が最も一般的です。 «知識の共同構築»のテキストの内容から、テーマ別インデックスで最初に参照された単語が即時に見つかりました。

PDFドキュメント「知識の共同構築」に戻り、「ctrl + f」と入力し、検索フィールドに「Illiteracy」という単語を入力し、最後に「Enter」を押して、「Computerilliteracy」が表示されるページを見つけます。すべてのページで検索された単語を見つけるために必要な回数。 LibreOffice Writerで新しいドキュメントを開いて主題インデックスを作成するか、元々.odtにあるドキュメントのコンテンツで作業している場合は、LibreOfficeでそのドキュメントを開き、任意のページでのみ主題インデックスを作成および編集します。 :

ドキュメント「Construccion_colaborativa_del_conocimiento.txt」のすべてのコンテンツに「Computerilliteracy」という文が含まれているAntConcでも識別したい場合は、検索フィールドに「Computer illiteracy」と入力し、「Case」のチェックを外して「Words」にマークを付けます。それをクリックして「開始」します。

たとえば4行目など、青色で「コンピュータリテラシー」に強調表示されている行のいずれかをクリックすると、[ファイルビュー]タブで、この選択が背景から黒で強調表示されているテキストの断片が表示されます。

このように、AntConcは、本、エッセイ、要約を書いたときに、テーマ別の索引を並行して作成したり、作品の主要なアイデアを体系的に分析して読みやすくしたりする場合に非常に役立ちます。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。

  1.   RAW-基本

    非常に興味深いツール....私はそれについて知りませんでした..そしてそれは私にとって非常に便利です..

    ありがとうございます..

  2.   Cristianhcd

    とても良い記事、興味深い

  3.   老人

    共有のためにありがとうございました

  4.   Linuxのインストール方法

    大きな貢献、非常に便利です。 Linuxでこれらのタイプのツールを使用できることを知っていると、常に違いが生じます。 ご挨拶。

  5.   フィトシド

    優れたエントリー。 彼らがこの種のコンテンツを公開しているのが好きです!

  6.   ジェイサン

    こんにちは、みんな。 コメントをありがとうございます。これまでコメントできたことをお詫びします。 個別指導を実践された方には問題ないことを願っております。