Ένα από τα πιο συνηθισμένα καθήκοντα που έχουν οι δημοσιογράφοι, οι μπλόγκερ ή οι συγγραφείς γενικά είναι να μεταφράζουν σε κείμενο όσα ειπώθηκαν σε μια συνέντευξη, ηχογράφηση και οποιοδήποτε ήχο στον οποίο λέγεται ένα θέμα. Αυτή είναι μια κάπως περίπλοκη δραστηριότητα που περιλαμβάνει ακρόαση, απομνημόνευση, μεταγραφή, επαναφορά του κομματιού, μετάβαση προς τα εμπρός, διευκρίνιση του ήχου για εστίαση των φωνών κ.λπ. Για να γίνει αυτή η δραστηριότητα λίγο πιο εύκολη, γεννήθηκε ένα πρόγραμμα αναπαραγωγής για το Gnome που ονομάζεται Parlatype.
Τι είναι το Parlatype;
Parlatype είναι ένα απλό πρόγραμμα αναπαραγωγής ήχου που μας επιτρέπει να μεταγράψουμε χειροκίνητα ήχο σε κείμενο με απλό και πολύ αποτελεσματικό τρόπο. Αναπτύχθηκε χρησιμοποιώντας τη γλώσσα C και λειτουργεί τέλεια στο περιβάλλον επιφάνειας εργασίας του GNOME.
Η απλότητα του εργαλείου του επιτρέπει να τρέχει σε οποιονδήποτε υπολογιστή, η κατανάλωση πόρων είναι ελάχιστη, η ευκολία χρήσης είναι απίστευτη και το εργαλείο ενημερώνεται συνεχώς από την ομάδα ανάπτυξης του.
Χαρακτηριστικά Parlatype
Η εφαρμογή διαθέτει μια σειρά λειτουργιών που βοηθούν τη μεταγραφή από ομιλία σε κείμενο να είναι περισσότερο ή λιγότερο, επισημαίνοντας τα ακόλουθα χαρακτηριστικά:
- Έχει μια διεπαφή που μας επιτρέπει να οπτικοποιούμε τα κύματα του εν λόγω ήχου, επισημαίνοντας τις παύσεις, τα σημεία και τις φωνές, αυτό μας επιτρέπει να μεταγράψουμε τον ήχο ακολουθώντας τα κενά στον ήχο.
- Μπορείτε να προσαρμόσετε την ταχύτητα αναπαραγωγής ήχου σύμφωνα με τις προτιμήσεις σας.
- Ένα από τα χαρακτηριστικά που μου αρέσουν περισσότερο σε αυτό το εργαλείο είναι ότι κάθε φορά που διακόπτουμε τον ήχο επιστρέφει μερικά δευτερόλεπτα πίσω, κάτι που μας επιτρέπει να μην χάνουμε το νήμα της μεταγραφής όταν αναπαράγεται ξανά. (μπορείτε να προσαρμόσετε αυτήν την επιλογή).
- Το Parlatype έχει εξαιρετική ενοποίηση με το LibreOffice, επομένως οι λάτρεις αυτής της σουίτας γραφείου θα έχουν πολλές περισσότερες δυνατότητες, ωστόσο, μπορούμε να χρησιμοποιήσουμε οποιαδήποτε σουίτα γραφείου κατά τη μεταγραφή.
- Έχει εξαιρετική συμβατότητα με τις περισσότερες σύγχρονες μορφές ήχου, καθώς είναι εξοπλισμένο με το πλαίσιο GStreamer.
- Ενσωμάτωση με πλήκτρα πολυμέσων.
- ρυθμιζόμενη διεπαφή.
- Υποστήριξη για πολλές γλώσσες.
- Μια μεγάλη κοινότητα ανάπτυξης και πολύ λεπτομερή τεκμηρίωση.
- Δωρεάν και ανοιχτού κώδικα.
Πώς να εγκαταστήσετε το Parlatype;
Το Parlatype έχει επίσημη υποστήριξη για το Ubuntu και τις παραγόμενες διανομές του, η εγκατάσταση είναι αρκετά απλή, απλά πρέπει να εγκαταστήσουμε το PPA του εργαλείου και στη συνέχεια να εγκαταστήσουμε την εφαρμογή με τις ακόλουθες εντολές:
$sudo add-apt-repository ppa: gabor-karsay / parlatype $sudo apt-get update y & sudo apt install parlatype
Τέλος, τρέξτε το εργαλείο και αρχίστε να απολαμβάνετε.
Οι χρήστες άλλων διανομών μπορούν να δοκιμάσουν το Parlatype ακολουθώντας την εγκατάσταση από τον πηγαίο κώδικα του, για να εκτελέσουν τις ακόλουθες εντολές:
$ git clone https://github.com/gkarsay/parlatype.git
$ cd parlatype
$ ./autogen.sh --prefix=/usr --disable-introspection
$ make
$ sudo make install
Όταν προσπαθείτε να εγκαταστήσετε το PPA, εμφανίζεται το ακόλουθο μήνυμα: «Αυτός ο PPA δεν υποστηρίζει xenial».
Προφανώς, δεν θα μπορώ να απολαύσω το Parlatype στο Mint 18.1 μου
Λυπάμαι.
ο ppa δίνει πολλά προβλήματα, καλύτερα να το συντάξετε, αυτή τη συμβουλή σας δίνω γιατί ο φίλος σας Popeye είμαι ... ..
sudo apt-get install build-essential automake autoconf intltool libgirepository1.0-dev libgladeui-dev gtk-doc-tools yelp-tools libgtk-3-dev libgstreamer1.0-dev libgstreamer-plugins-base1.0.libg3-dev libgstreamer-plugins-base0.libg1.0-dev0 -πρόσθετα-καλά
wget https://github.com/gkarsay/parlatype/releases/download/v1.5.1/parlatype-1.5.1.tar.gz
tar -zxvf parlatype-1.5.1.tar.gz
cd parlatype-*
autoreconf
./configure --prefix=/usr --disable-introspection
Προτιμώ το πρόθεμα σε ~/.local
κάνω
sudo κάνει την εγκατάσταση καθαρή
και για απεγκατάσταση:
τύπος ομιλίας cd*
κάντε απεγκατάσταση
Σας ευχαριστούμε για την εισαγωγή αυτού του λογισμικού.
Όταν διάβασα τον τίτλο στο RSS, περίμενα ότι θα πήγαινε από ομιλία σε κείμενο μόνο του και ότι έπρεπε να διορθώσετε μόνο λάθη.
Κάνοντας χρήση του Julius, του CMI Sphinx, του Open Mind Speech, του Vox Forge ή ακόμα και του Google
Παλιότερα προσπάθησα να χρησιμοποιήσω αυτό το λογισμικό και ήταν πολύ δυσκίνητο, και τίποτα παραγωγικό, σήμερα μπορείς να υπαγορεύεις στο πρόγραμμα περιήγησης google ή στην εφαρμογή εγγράφων του και σου το γράφει αρκετά καλά, ακόμα και από tablet ή κινητό τηλέφωνο, αλλά νομίζω ότι πρόκειται να κατασκευαστεί ένα apk που θα μετατρέψει τις εγγραφές σου σε κείμενο ή σε εφαρμογή επιφάνειας εργασίας (και νόμιζα ότι επρόκειτο για αυτό).
https://github.com/katchsvartanian/voiceRecognition
Χρησιμοποιήστε το Google API για ομιλία σε κείμενο από αρχεία FLAC.
Αναζητώντας προγράμματα αναγνώρισης ομιλίας από ένα αρχείο ήχου, που προκλήθηκε από την ανάγνωση αυτού του άρθρου, φαίνεται ότι δεν έχει σημειωθεί μεγάλη πρόοδος από τότε που ασχολήθηκα με το θέμα πριν από χρόνια, εκτός από αυτήν τη βελόνα στα άχυρα, την οποία μοιράζομαι γιατί ήταν πολύ δύσκολο για μένα να βρω κάτι νέο.