Ποιοτική ανάλυση κειμένου και δημιουργία ευρετηρίων θεμάτων με AntConc και LibreOffice

Χαιρετισμούς φίλες και φίλοι, είμαι πολύ χαρούμενος που συμμετέχω και συμμετέχω σε ό,τι μπορώ από εδώ και στο εξής στο <° Desde Linux. Ονομάζομαι Jathan και μοιράζομαι μαζί σας αυτήν την πρώτη καταχώριση βάσει τεκμηρίωσης που έκανα στην κοινωνική υπηρεσία του συντονισμού πληροφορικής της σχολής μου. Ελπίζω να το βρείτε ενδιαφέρον, χρήσιμο και να κάνετε κάθε είδους σχόλια.

Όταν σε ένα αρχείο κειμένου θέλουμε να βρούμε λέξεις-κλειδιά για τη δημιουργία ενός θεματικού ευρετηρίου, να αναλύσουμε τις κύριες ιδέες ενός έργου ή κάποιου άλλου παρόμοιου σκοπού, πρέπει να κάνουμε αναζητήσεις μέσω των οποίων μπορούμε να διακρίνουμε μεταξύ κεφαλαίων και πεζών χαρακτήρων μέσα στις λέξεις, καθώς και μια λίστα με αυτά που επισημαίνουν τους επιθυμητούς χαρακτήρες, όπως ένα γράμμα, ώστε να μπορούμε να βρούμε λέξεις-κλειδιά με πιο γρήγορο και πρακτικό τρόπο.

Ο στόχος αυτής της τεκμηρίωσης είναι να παρουσιάσει και να εξηγήσει τη χρήση μιας ποιοτικής εφαρμογής ανάλυσης κειμένου και ενός προγράμματος επεξεργασίας κειμένου για να διευκολύνει τη δημιουργία ενός θεματικού ευρετηρίου με Ελεύθερο Λογισμικό.

Το πρώτο μέρος θα εξηγήσει τη διαδικασία εγκατάστασης LibreOffice και την εκτέλεση του AntConc εντός του λειτουργικού συστήματος GNU / Linux και αργότερα πώς να το κάνετε σε συστήματα Windows και Mac OS, ενώ στα ακόλουθα μέρη ανεξάρτητα από το λειτουργικό σύστημα, θα εξηγηθεί πώς να χρησιμοποιήσετε AntConc y LibreOffice Χρήση παραδειγμάτων για τη δημιουργία ευρετηρίου θέματος.

LibreOffice και AntConc στο GNU / Linux

Το πρώτο πράγμα που πρέπει να κάνουμε είναι να επαληθεύσουμε ότι έχουμε εγκαταστήσει το LibreOffice στη διανομή GNU / Linux. Το LibreOffice είναι μια δωρεάν σουίτα γραφείου πολλαπλών μορφών με άδεια GPL και μας βοηθά να επεξεργαζόμαστε έγγραφα κειμένου, διαφάνειες, υπολογιστικά φύλλα, βάσεις δεδομένων, σχέδια και μαθηματικούς τύπους με απλό και αποτελεσματικό τρόπο.

Εάν χρησιμοποιούμε Debian, Linux Mint, Trisquel, Ubuntu ή οποιαδήποτε άλλη διανομή με βάση Debian, Δεν θα χρειαστεί πλέον να ασχοληθούμε με την εγκατάστασή του, καθώς στις περισσότερες από αυτές τις διανομές στις πιο πρόσφατες εκδόσεις τους, καθώς και σε άλλες όπως το Mageia, το Fedora και το OpenSUSE, το LibreOffice είναι ήδη προεγκατεστημένο και απλά πρέπει να το βρείτε και να το εκτελέσετε από τον πίνακα εφαρμογών ή με γραμμή εντολών.

Εάν χρησιμοποιούμε το Debian Squeeze 6.0, πρέπει να ενημερώσουμε το OpenOffice στο LibreOffice ακολουθώντας αυτές τις οδηγίες: http://www.dobleseis.com.ar/instalar-libreoffice-3-en-debian-squeeze.

Αφού βεβαιωθούμε ότι έχουμε εγκαταστήσει το LibreOffice στο σύστημά μας, θα προχωρήσουμε τώρα για να επισκεφτούμε τον ιστότοπο AntLab όπου μπορούμε να βρούμε μερικές χρήσιμες εφαρμογές που αναπτύχθηκαν από τον Laurence Anthony για ποιοτική ανάλυση κειμένου και αντιστοίχιση λέξεων με εκτελέσιμα αρχεία πολλαπλών πλατφορμών για GNU / Linux, Mac OS και Windows.

Το AntConc είναι μια εφαρμογή γραμμένη στη γλώσσα προγραμματισμού Perl που μας επιτρέπει να παραθέτουμε λέξεις με αλφαβητική σειρά ή κατά συχνότητα εμφάνισης, λέξεις-κλειδιά, να κάνουμε συμφωνίες και ομάδες λέξεων από ένα αρχείο σε μορφή απλού κειμένου, διακρίνοντας μεταξύ πεζών και κεφαλαίων χαρακτήρων. Για να το κατεβάσετε, μεταβείτε σε αυτόν τον σύνδεσμο: http: //www.antlab.sci.waseda.ac.jp/antconc_index.html και επιλέξτε στην πέμπτη στήλη όπου ο πιγκουίνος Tux εμφανίζεται η επιλογή λήψης του AntConc 3.2.4u:

Όταν ολοκληρωθεί η λήψη του επιλεγμένου αρχείου, ανοίγουμε το προτιμώμενο πρόγραμμα περιήγησης αρχείων (Pcmanfm, Nautilus, Thunar, Dolphin ή οποιοδήποτε άλλο) ανοίγοντας το μέσω του πίνακα γραφικών περιβάλλοντος που χρησιμοποιούμε ή πατώντας alt + f2, γράφοντας το όνομά του σε πεζά και πατώντας enter στο τέλος και, στη συνέχεια, δημιουργήστε δύο καταλόγους (φακέλους) στον κατάλογο χρηστών μας, ονομάζοντας ένα Applications_extras και ένα άλλο AntConc ως υποκατάλογο του πρώτου:

Τώρα πηγαίνουμε στον κατάλογο όπου έγινε λήψη του αρχείου antconc3.2.4u.tar.gz (σε αυτό το παράδειγμα είναι Λήψεις) και ανοίγουμε το αρχείο με Xarchiver ή Fileroller για να αποσυμπιέσουμε το περιεχόμενό του στον κατάλογο Antconc επιλέγοντας την επιλογή εξαγωγής στο Διαχείριση αρχείων και ένδειξη της διαδρομής καταλόγου / home / user / Extra_Applications / AntConc:

Μόλις εξαχθεί το περιεχόμενο του πακέτου antconc3.2.4u.tar.gz στον κατάλογο AntConc στο Applications_extras, εντοπίζουμε το αρχείο antconc3.2.4u για να του δώσουμε δικαιώματα εκτέλεσης κάνοντας κλικ στο δεξί κουμπί του ποντικιού, εισαγάγετε ιδιότητες και επιτρέψτε την εκτέλεση του αρχείου ως πρόγραμμα:

Και με αυτό, θα πρέπει να μπορούμε να ανοίγουμε το AntConc κάνοντας διπλό κλικ με το ποντίκι στο αρχείο antconc3.2.4u.

Εάν προτιμούμε, μπορούμε να κάνουμε όλη την προηγούμενη διαδικασία μέσω του τερματικού εκτελώντας τις ακόλουθες εντολές και αλλάζοντας το "χρήστη" με το όνομα που χρησιμοποιούμε στη συνεδρία μας:

Για να δημιουργήσετε τους καταλόγους:

$ mkdir / home / user / Applications_extras (πατήστε enter)
$ mkdir / home / user / Applications_extras / AntConc (πατήστε enter)

Αλλαγή στον κατάλογο AntConc και εξαγωγή του περιεχομένου του antconc3.2.4u.tar.gz:

$ cd / home / user / Applications_extras / AntConc / (πατήστε enter)
$ tar -xzvf /home/usuario/Descargas/antconc3.2.4u.tar.gz(press enter)

Επιτρέψτε την εκτέλεση του αρχείου antconc3.2.4u ως πρόγραμμα:

$ chmod + x antconc3.2.4u (πατήστε enter)

Και εκτελέστε το AntConc:

$ /home/usuario/Aplicaciones_extras/AntConc/antconc3.2.4u (πατήστε enter)

Ανεξάρτητα από τη διαδικασία που επιλέγουμε, αν το επιθυμούμε, μπορούμε να αντιγράψουμε το αρχείο antconc3.2.4u στον κατάλογο / usr / bin και να του δώσουμε τα απαραίτητα δικαιώματα για να μπορέσουμε να εκτελέσουμε το AntConc από το τερματικό ή με alt + f2 γράφοντας απλώς antconc3.2.4u. Για αυτό εκτελούμε τις ακόλουθες εντολές ως superuser με su ή sudo:

$ σας
(γράφουμε τον κωδικό πρόσβασης root και πατάμε enter)
# cp /home/user/Extras_Applications/AntConc/antconc3.2.4u / usr / bin
# chmod a + rwx /usr/bin/antconc3.2.4u
# exit

Και τώρα, απλώς εκτελώντας το antconc3.2.4u με τον χρήστη μας από οποιονδήποτε εξομοιωτή τερματικού, το AntConc θα ανοίξει όπως φαίνεται στην προηγούμενη εικόνα.

$antconc3.2.4u

Χρησιμοποιώντας το AntConc για τη λίστα λέξεων με συγκεκριμένο χαρακτήρα

Έχοντας ήδη προσδιορίσει πώς να κατεβάσετε και να εκτελέσετε το AntConc, θα δώσουμε τώρα τρόπο για να παραδείξουμε τη χρήση του για τον εντοπισμό ορισμένων λέξεων μέσω μιας αναζήτησης με αλφαβητική σειρά χαρακτήρων τόσο σε πεζά όσο και σε κεφαλαία. Εάν θέλετε να πάτε πιο βαθιά στη λειτουργία του AntConc και όλων των δυνατοτήτων χρήσης του, μπορείτε να συμβουλευτείτε το έγγραφο README_AntConc3.2.4.pdf στον κατάλογο / home / user / Aplicaciones_extras / AntConc ή να το κατεβάσετε από το http: //www.antlab .sci.waseda.ac.jp / software / antconc335 / AntConc_readme.pdf, καθώς και συμβουλευτείτε την ηλεκτρονική βοήθεια ή παρακολουθήστε τα εκπαιδευτικά βίντεο AntConc που είναι διαθέσιμα στον ιστότοπό του http://www.antlab.sci.waseda.ac. jp / antconc_index.html

Το AntConc μπορεί να λειτουργήσει μόνο με αρχεία απλού κειμένου (".txt"), ".html", ".hml," ".xml" και τη δική του μορφή ".ant", έτσι ώστε το περιεχόμενο του εγγράφου από το οποίο θα δημιουργήσουμε αναγνώριση λέξεων, θα το αλλάξουμε από την αρχική του μορφή σε ".odt", ".rtf", ".pdf" ή κάποιο άλλο σε ".txt" κάνοντας μια επιλογή όλου του περιεχομένου, αντιγράφοντάς το και επικολλώντας το σε ένα νέο επίπεδο εγγράφου κειμένου που εκτελεί τον προτιμώμενο επεξεργαστή κειμένου (Leafpad, Gedit, Vim, Emacs, μεταξύ άλλων). Σε αυτό το παράδειγμα θα επιδιώξουμε να δημιουργήσουμε ένα θεματικό ευρετήριο από το βιβλίο «Συνεργατική Κατασκευή Γνώσης» από το οποίο μπορούμε να επισκεφθούμε τον ιστότοπό του: http://seminario.edusol.info/seco3/ και το οποίο μπορούμε ελεύθερα να κατεβάσουμε από αυτόν τον σύνδεσμο: http: / /seminario.edusol.info/seco3/pdf/seco3.pdf

Μετά τη λήψη του αρχείου, το εντοπίζουμε στον κατάλογο λήψεων, το ανοίγουμε με το πρόγραμμα προβολής εγγράφων pdf (σε αυτό το παράδειγμα Evince), επιλέγουμε όλο το περιεχόμενό του πατώντας ctrl + a, το αντιγράφουμε και το επικολλάμε σε ένα νέο έγγραφο απλού κειμένου :

Και αποθηκεύουμε το νέο μας έγγραφο σε απλό κείμενο με το όνομα "Construccion_colaborativa_del_conocimiento.txt" στον κατάλογο εγγράφων:

Τώρα εκτελούμε το AntConc και από την πρώτη καρτέλα πάνω αριστερά που ονομάζεται "File" ανοίγουμε το αρχείο "Construccion_colaborativa_del_conocimiento.txt":

Στην αριστερή στήλη με την ονομασία "Corpus Files" θα εμφανιστεί τώρα το όνομα του αρχείου κειμένου μας, υποδεικνύοντας ότι θα εργαζόμαστε σε αυτό το αρχείο, καθώς στο AntConc μπορούμε να φορτώσουμε περισσότερα από ένα αρχεία κειμένου και να τα επεξεργαστούμε μαζί ή ξεχωριστά:

Τώρα αυτό που θα κάνουμε είναι να απαριθμήσουμε όλες τις λέξεις που περιέχουν τον χαρακτήρα "A", για να προσδιορίσουμε μια λέξη-κλειδί με αυτό το κεφαλαίο γράμμα, καθώς η AntConc μας προσφέρει τη δυνατότητα διάκρισης πεζών και κεφαλαίων γραμμάτων, κάτι που είναι πολύ χρήσιμο για τον εντοπισμό κατάλληλων ονομάτων ή ακρωνυμίων με τη μορφή λίστας. Για αυτό τοποθετούμε την πρώτη καρτέλα που ονομάζεται «Concordance» στη δεξιά πλευρά του «Corpus Files», αποεπιλέξτε το πλαίσιο «Words» για να επισημάνετε το πλαίσιο «Case», και στην κάτω δεξιά πλευρά του «Όρου αναζήτησης», γράφουμε το πεδίο Αναζήτηση κάτω από το γράμμα A και κάντε κλικ στο μωβ ορθογώνιο που λέει "Έναρξη":

Και θα απαριθμήσει τα αποτελέσματα των παρακάτω. σχήμα:

Όπως μπορούμε να δούμε, ορισμένοι χαρακτήρες γραμμένοι με τόνους μοιάζουν με τη λέξη "Autónoma" αντί για "Autónoma". Αυτό συμβαίνει επειδή πρέπει να πούμε στην AntConc την κατάλληλη γλώσσα κωδικοποίησης για τη γλώσσα μας, καθώς η AntConc δεν εντοπίζει ότι χρησιμοποιούμε τα Ισπανικά από προεπιλογή. Για αυτό ανοίγουμε την καρτέλα «Ρυθμίσεις σφαιρικού» στην κορυφή δίπλα στο «Αρχείο», πηγαίνουμε στην τελευταία επιλογή «Ρυθμίσεις κωδικοποίησης γλώσσας» στη δεξιά πλευρά κάνοντας κλικ στο «Επεξεργασία» επιλέγουμε την πρώτη επιλογή «Τυπικές κωδικοποιήσεις» εμείς κάντε κλικ σε αυτό, επιλέξτε την τρίτη επιλογή από τη λίστα που εμφανίζεται στα δεξιά "Unicode (utf8)" και κάνουμε κλικ στο πλαίσιο "Εφαρμογή" στο κάτω δεξί μέρος του παραθύρου:

Αφού εφαρμόσουμε τις αλλαγές, κάνουμε ξανά κλικ στο μωβ ορθογώνιο του «Έναρξη» και οι τονισμένοι χαρακτήρες θα εμφανίζονται τώρα ευανάγνωστα:

Τώρα εξετάζουμε τις λέξεις με το γράμμα A που επισημαίνεται με μπλε χρώμα για εύκολη αναγνώριση και με βάση τις εκτιμήσεις μας, επιλέγουμε αυτές που θέλουμε να συμπεριλάβουμε στο θεματικό ευρετήριο, για παράδειγμα "Αναλφαβητισμός υπολογιστών" στη σειρά αριθ. 17 που είναι η πιο κοινή λέξη βρέθηκε ο πρώτος που αναφέρεται στο θεματικό μας ευρετήριο από το περιεχόμενο του κειμένου της «Συνεργατικής κατασκευής γνώσης».

Επιστρέφουμε στο έγγραφο pdf «Συνεργατική κατασκευή γνώσης» για να βρούμε σε ποιες σελίδες εμφανίζεται «Αναλφαβητισμός υπολογιστών» πληκτρολογώντας «ctrl + f», γράφοντας τη λέξη «Αναλφαβητισμός» στο πεδίο αναζήτησης και πατώντας «enter» στο τέλος και τον αριθμό των φορών αυτό είναι απαραίτητο για τον εντοπισμό της λέξης που αναζητήθηκε σε όλες τις σελίδες. Ανοίγουμε ένα νέο έγγραφο στο LibreOffice Writer για να δημιουργήσουμε το ευρετήριο θέματος ή εάν εργαζόμαστε για το περιεχόμενο ενός εγγράφου που είναι αρχικά στο .odt, ανοίγουμε αυτό το έγγραφο με το LibreOffice και θα δημιουργήσουμε και θα επεξεργαστούμε μόνο το ευρετήριο θέματος σε οποιαδήποτε σελίδα:

Αν θέλουμε επίσης να ταυτοποιήσουμε με το AntConc σε ποιες φράσεις "Αναλφαβητισμός υπολογιστών" εμφανίζεται σε όλο το περιεχόμενο του εγγράφου "Construccion_colaborativa_del_conocimiento.txt", γράφουμε "Αναλφαβητισμός υπολογιστή" στο πεδίο αναζήτησης, καταργήστε την επιλογή "Περίπτωση", σημειώστε "Λέξεις" και κάντε κλικ σε αυτό να ξεκινήσω":

Εάν κάνουμε κλικ σε οποιαδήποτε από τις σειρές που επισημαίνονται στο «Αναλφαβητισμός υπολογιστών» με μπλε χρώμα, για παράδειγμα στη σειρά 4, στην καρτέλα «Προβολή αρχείων» θα μας δείξει το κομμάτι του κειμένου όπου αυτή η επιλογή εμφανίζεται επισημασμένη με μαύρο χρώμα Ιστορικό:

Με αυτόν τον τρόπο, το AntConc είναι πολύ χρήσιμο για εμάς όταν έχουμε γράψει ένα βιβλίο, ένα δοκίμιο ή μια περίληψη και δεν κάναμε παράλληλα ένα θεματικό ευρετήριο ή για να αναλύσουμε συστηματικά τις κύριες ιδέες ενός έργου για να διευκολύνουμε την ανάγνωσή του.


Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.

  1.   RAW-Βασικό dijo

    Πολύ ενδιαφέρον εργαλείο .. .. Δεν το ήξερα .. και είναι πολύ χρήσιμο ..

    Σας ευχαριστώ ..

  2.   Κριστιάνχκ dijo

    πολύ καλό άρθρο, ενδιαφέρον

  3.   Γέρος dijo

    Σας ευχαριστώ πολύ για την κοινή χρήση

  4.   Πώς να εγκαταστήσετε το Linux dijo

    Μεγάλη συνεισφορά, πολύ χρήσιμη. Το να γνωρίζετε ότι μπορείτε να έχετε αυτούς τους τύπους εργαλείων στο Linux κάνει πάντα τη διαφορά. Χαιρετισμοί.

  5.   Φιτοσίντο dijo

    Εξαιρετική είσοδος. Μου αρέσει που δημοσιεύουν αυτόν τον τύπο περιεχομένου!

  6.   Τζάθαν dijo

    Γεια σε όλους. Σας ευχαριστούμε για τα σχόλιά σας και συγνώμη που έχετε τη δυνατότητα να σχολιάσετε μέχρι τώρα. Ελπίζω ότι όσοι έχουν εφαρμόσει την διδασκαλία στην πράξη δεν είχαν κανένα πρόβλημα.