تحليل النص النوعي وإنشاء فهارس الموضوع باستخدام AntConc و LibreOffice

تحياتي لكم أيها الأصدقاء، يسعدني جدًا الانضمام والمشاركة في كل ما هو في متناول يدي من الآن فصاعدًا في <° Desde Linux. اسمي جاثان وأشارككم هذا الإدخال الأول استنادًا إلى الوثائق التي قمت بها في الخدمة الاجتماعية لتنسيق تكنولوجيا المعلومات في هيئة التدريس. أتمنى أن تجده ممتعًا ومفيدًا وأن تقدم جميع أنواع التعليقات.

عندما نريد البحث في ملف نصي عن كلمات رئيسية لإنشاء فهرس موضوعي ، أو تحليل الأفكار الرئيسية للعمل أو غرض آخر مشابه ، نحتاج إلى إجراء عمليات بحث يمكننا بواسطتها التمييز بين الأحرف الكبيرة والصغيرة داخل بالإضافة إلى قائمة بها تبرز الأحرف المرغوبة مثل الحرف حتى نتمكن من العثور على الكلمات الرئيسية بطريقة أسرع وأكثر عملية.

يهدف التوثيق الحالي إلى تقديم وشرح استخدام تطبيق التحليل النصي النوعي ومحرر النصوص لتسهيل إنشاء فهرس مواضيعي باستخدام البرمجيات الحرة.

الجزء الأول سوف يشرح إجراءات التثبيت LibreOffice وإعدام أنتكونك داخل نظام التشغيل جنو / لينكس وفيما بعد كيفية القيام بذلك في أنظمة Windows و Mac OS ، بينما في الأجزاء التالية بغض النظر عن نظام التشغيل ، سيتم شرح كيفية الاستخدام أنتكونك y LibreOffice استخدام الأمثلة لإنشاء فهرس الموضوع.

LibreOffice و AntConc على جنو / لينكس

أول شيء علينا القيام به هو التحقق من تثبيت LibreOffice على توزيعة GNU / Linux الخاصة بنا. LibreOffice عبارة عن مجموعة مكتبية مجانية متعددة الأنظمة الأساسية ومرخصة مع GPL والتي تساعدنا على تحرير المستندات النصية والشرائح وجداول البيانات وقواعد البيانات والرسومات والصيغ الرياضية بطريقة بسيطة وفعالة.

إذا كنا نستخدم ملفات Debian و LinuxMint و Trisquel و Ubuntu أو أي توزيع آخر على أساس ديبيان، لن نضطر بعد الآن إلى التعامل مع التثبيت لأنه في معظم هذه التوزيعات في أحدث إصداراتها بالإضافة إلى غيرها مثل Mageia و Fedora و OpenSUSE ، تم تثبيت LibreOffice مسبقًا بالفعل وعليك فقط العثور عليه وتشغيله من لوحة التطبيقات أو عن طريق سطر الأوامر.

إذا كنا نستخدم Debian Squeeze 6.0 ، فعلينا تحديث OpenOffice إلى LibreOffice باتباع الإرشادات التالية: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

بعد التأكد من تثبيت LibreOffice على نظامنا ، سننتقل الآن إلى زيارة موقع AntLab حيث يمكننا العثور على بعض التطبيقات المفيدة التي طورها Laurence Anthony لتحليل النص النوعي ومطابقة الكلمات مع الملفات القابلة للتنفيذ عبر الأنظمة الأساسية لـ GNU / Linux و Mac نظام التشغيل وويندوز.

AntConc هو تطبيق مكتوب بلغة برمجة Perl يسمح لنا بسرد الكلمات بترتيب أبجدي أو حسب تكرار الظهور والكلمات الرئيسية وإنشاء توافقات ومجموعات من الكلمات من ملف بتنسيق نص عادي ، والتمييز بين الأحرف الصغيرة والكبيرة. لتنزيله ، انتقل إلى هذا الرابط: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html وحدد في العمود الخامس حيث يظهر Tux penguin خيار تنزيل AntConc 3.2.4u:

عند الانتهاء من تنزيل الملف المحدد ، نفتح متصفح الملفات المفضل لدينا (Pcmanfm أو Nautilus أو Thunar أو Dolphin أو أي ملف آخر) عن طريق فتحه من خلال لوحة البيئة الرسومية التي نستخدمها أو بالضغط على alt + f2 ، وكتابة اسمه باللغة الأحرف الصغيرة وضرب الإدخال في النهاية ثم إنشاء مجلدين (مجلدين) داخل دليل المستخدم لدينا ، مع تسمية أحدهما Applications_extras والآخر AntConc كدليل فرعي للأول:

ننتقل الآن إلى الدليل حيث تم تنزيل ملف antconc3.2.4u.tar.gz (يجري في هذا المثال التنزيلات) ونفتح الملف باستخدام Xarchiver أو Fileroller لفك ضغط محتواه إلى دليل Antconc عن طريق تحديد خيار الاستخراج في مدير الملفات لدينا و يشير إلى مسار الدليل / home / user / Extra_Applications / AntConc:

بمجرد استخراج محتوى حزمة antconc3.2.4u.tar.gz إلى دليل AntConc داخل Applications_extras ، نحدد ملف antconc3.2.4u لمنحه أذونات التنفيذ من خلال النقر على زر الفأرة الأيمن ، وإدخال الخصائص والسماح بتنفيذ ملف كبرنامج:

وبهذا يجب أن نكون قادرين على فتح AntConc عن طريق النقر المزدوج بالماوس على ملف antconc3.2.4u.

إذا كنا نفضل ، فيمكننا القيام بكل الإجراءات السابقة من خلال المحطة بتنفيذ الأوامر التالية وتغيير "المستخدم" بالاسم الذي نستخدمه في جلستنا:

لإنشاء الدلائل:

$ mkdir / home / user / Applications_extras (اضغط إدخال)
$ mkdir / home / user / Applications_extras / AntConc (اضغط إدخال)

غيّر إلى دليل AntConc واستخرج محتوى antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (اضغط على Enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz (اضغط إدخال)

السماح بتشغيل ملف antconc3.2.4u كبرنامج:

$ chmod + x antconc3.2.4u (اضغط على Enter)

وقم بتشغيل AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u (اضغط إدخال)

بغض النظر عن الإجراء الذي نختاره ، إذا أردنا ، يمكننا نسخ ملف antconc3.2.4u إلى الدليل / usr / bin وإعطائه الأذونات اللازمة لتتمكن من تشغيل AntConc من المحطة أو باستخدام alt + f2 بمجرد كتابة antconc3.2.4u. لهذا نقوم بتنفيذ الأوامر التالية كمستخدم متميز مع su أو sudo:

سو $
(نكتب كلمة مرور الجذر الخاصة بنا ونضغط على Enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# خروج

والآن ، بمجرد تشغيل antconc3.2.4u مع مستخدمنا من أي محاكي طرفي ، سيتم فتح AntConc كما هو موضح في الصورة السابقة.

antconc3.2.4u دولار

استخدام AntConc لسرد الكلمات بحرف معين

بعد أن حددنا بالفعل كيفية تنزيل AntConc وتشغيله ، سنفسح المجال الآن لتوضيح استخدامه لتحديد بعض الكلمات عن طريق البحث بالترتيب الأبجدي للأحرف بالحروف الصغيرة والكبيرة. إذا كنت ترغب في التعمق في تشغيل AntConc وجميع إمكانيات استخدامه ، يمكنك الرجوع إلى المستند README_AntConc3.2.4.pdf في الدليل / home / user / Aplicaciones_extras / AntConc أو تنزيله من http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf ، وكذلك استشر التعليمات عبر الإنترنت أو شاهد دروس الفيديو AntConc المتوفرة على موقعها على الإنترنت http://www.antlab.sci.waseda.ac. jp / antconc_index.html

لا يمكن لـ AntConc العمل إلا مع ملفات النص العادي (".txt") و ".html" و ".hml" و ".xml" وتنسيقها الخاص ".ant" ، وبالتالي فإن محتوى المستند الذي سننشئ منه تعريف الكلمات ، سنقوم بتغييره من تنسيقه الأصلي في ".odt" أو ".rtf" أو ".pdf" أو غيره إلى ".txt" ، مما يجعل تحديد كل المحتوى ونسخه ولصقه في مستند نصي جديد طائرة تشغل محرر النصوص المفضل لدينا (Leafpad و Gedit و Vim و Emacs وغيرها). سنسعى في هذا المثال إلى إنشاء فهرس موضوعي من كتاب "البناء التعاوني للمعرفة" يمكننا من خلاله زيارة موقعه على الويب: http://seminario.edusol.info/seco3/ والذي يمكننا تنزيله مجانًا من هذا الرابط: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

بمجرد تنزيل الملف ، نحدده في دليل التنزيلات الخاص بنا ، ونفتحه باستخدام عارض مستندات pdf الخاص بنا (في هذا المثال Evince) ، ونختار كل محتوياته بالضغط على ctrl + a ، ونقوم بنسخه ولصقه في ملف عادي جديد مستند نصي:

ونحفظ وثيقتنا الجديدة بنص عادي باسم «Construccion_colaborativa_del_conocimiento.txt» في دليل المستندات:

نقوم الآن بتشغيل AntConc ومن علامة التبويب الأولى في أعلى اليسار المسمى "ملف" نفتح الملف "Construccion_colaborativa_del_knowledge.txt":

في العمود الأيسر المسمى «ملفات Corpus» ، سنرى الآن اسم ملفنا النصي يشير إلى أننا سنعمل على هذا الملف ، لأنه في AntConc يمكننا تحميل أكثر من ملف نصي والعمل عليها معًا أو بشكل منفصل:

الآن ما سنفعله هو سرد جميع الكلمات التي تحتوي على الحرف "A" ، لتحديد كلمة رئيسية بهذا الحرف الكبير ، نظرًا لأن AntConc يوفر لنا إمكانية التمييز بين الأحرف الصغيرة والكبيرة ، وهذا مفيد جدًا لتحديد الأسماء الصحيحة أو الاختصارات في شكل قائمة. لهذا نضع علامة التبويب الأولى المسماة «Concordance» على الجانب الأيمن من «Corpus Files» ، وقم بإلغاء تحديد مربع «Words» لوضع علامة على مربع «Case» ، وكلاهما في الجانب الأيمن السفلي من «Search Term» ، نكتب في الحقل ابحث أسفل الحرف A وانقر على المستطيل الأرجواني الذي يقول "ابدأ":

وسوف يسرد نتائج ما يلي. شكل:

كما نرى ، تظهر بعض الأحرف المكتوبة بحركات مشابهة لكلمة "Autónoma" بدلاً من "Autónoma". هذا لأنه يجب علينا إخبار AntConc بلغة التشفير المناسبة للغتنا ، نظرًا لأن AntConc لا يكتشف أننا نستخدم الإسبانية بشكل افتراضي. لهذا نفتح علامة التبويب «Globlal Settings» في الجزء العلوي بجوار «ملف» ، ننتقل إلى الخيار الأخير «إعدادات ترميز اللغة» في الجانب الأيمن نضغط على «تحرير» نختار الخيار الأول «ترميز قياسي »نضغط عليه ، نختار الخيار الثالث من القائمة التي تظهر على اليمين" Unicode (utf8) "ونضغط على مربع" تطبيق "في الجزء الأيمن السفلي من النافذة:

بعد تطبيق التغييرات ، نضغط مرة أخرى على المستطيل الأرجواني لـ «ابدأ» وستظهر الأحرف المعلمة الآن بشكل واضح:

نقوم الآن بمراجعة الكلمات التي تحتوي على الحرف A المميز باللون الأزرق لسهولة التعرف عليها واستنادًا إلى اعتباراتنا ، نختار الكلمات التي نريد تضمينها في الفهرس المواضيعي ، على سبيل المثال "الأمية الحاسوبية" في الصف رقم 17 هي الأكثر شيوعًا تم العثور على الكلمة الفورية لتكون أول ما يشار إليه في فهرسنا الموضوعي من محتوى نص "البناء التعاوني للمعرفة".

نعود إلى وثيقة pdf «البناء التعاوني للمعرفة» لنجد في أي صفحات تظهر «الأمية الحاسوبية» بكتابة «ctrl + f» ، وكتابة كلمة «الأمية» في حقل البحث والضغط على «دخول» في النهاية والعلامة. عدد المرات اللازمة لتحديد الكلمة التي تم البحث عنها في جميع الصفحات. نفتح مستندًا جديدًا في LibreOffice Writer لإنشاء فهرس الموضوع الخاص بنا أو إذا كنا نعمل على محتوى مستند موجود في الأصل بتنسيق .odt ، فإننا نفتح هذا المستند باستخدام LibreOffice وسنقوم فقط بإنشاء فهرس الموضوع الخاص به وتحريره على أي صفحة :

إذا أردنا أيضًا التعرف على AntConc التي تظهر فيها الجمل "الأمية في الكمبيوتر" في جميع محتويات المستند "Construccion_colaborativa_del_conocimiento.txt" ، نكتب "أمية الكمبيوتر" في حقل البحث ، وقم بإلغاء تحديد "الحالة" ، ووضع علامة على "الكلمات" والنقر عليها للبدأ":

إذا نقرنا على أي من الصفوف المميزة لـ «الأمية الحاسوبية» باللون الأزرق ، على سبيل المثال في الصف 4 ، في علامة التبويب «عرض الملف» ، فسوف يظهر لنا جزء النص حيث يظهر هذا التحديد مظللًا باللون الأسود للخلفية :

بهذه الطريقة ، يعد AntConc مفيدًا جدًا لنا عندما نكتب كتابًا أو مقالة أو ملخصًا ولم نقم بعمل فهرس موضوعي بالتوازي أو لتحليل الأفكار الرئيسية للعمل بشكل منهجي لتسهيل قراءته.


6 تعليقات ، اترك لك

اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: ميغيل أنخيل جاتون
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.

  1.   RAW الأساسي قال

    أداة شيقة جدا .. .. لم أكن أعرف عنها .. وهي مفيدة جدا لي ..

    وشكرا لكم ..

  2.   كريستيانش قال

    مقالة جيدة جدا ومثيرة للاهتمام

  3.   رجل عجوز قال

    شكرا جزيلا لك على المشاركة

  4.   كيفية تثبيت Linux قال

    مساهمة عظيمة ومفيدة جدا. إن معرفة أنه يمكنك الحصول على هذه الأنواع من الأدوات في Linux يحدث دائمًا فرقًا. مع تحياتي.

  5.   فيتوشيدو قال

    دخول ممتاز. يعجبني أنهم ينشرون هذا النوع من المحتوى!

  6.   جاثان قال

    مرحبا جميعا. شكرًا لتعليقاتك واعتذارًا عن قدرتك على التعليق حتى الآن. آمل ألا يواجه أولئك الذين نفذوا الدروس الخصوصية أي مشاكل.