গুগল স্পিচ ইঞ্জিন ব্যবহার করে পাঠ্যকে বাক্যে রূপান্তর করতে আজ আমি আপনার সাথে একটি খুব দরকারী স্ক্রিপ্ট ভাগ করছি। এই স্ক্রিপ্টের প্রধান সুবিধা হ'ল এটি গুগল দ্বারা আরোপিত 100 বাইট সীমাটি "বাতিল" করে। আসলে, সত্যি বলতে, এটি এই সীমাটিকে সম্মান করে তবে সমস্ত লাইন স্বয়ংক্রিয়ভাবে প্রেরণ করে, তাই এই সীমাবদ্ধতাটি ব্যবহারকারী নজরে না যায় not তবে সবচেয়ে বেশি দাবি করা ব্যক্তিরা লক্ষ্য করবেন যে রূপান্তরটি গুগল অনুবাদে আমরা যেভাবে অর্জন করতে পারি তার একই মানের নয়, মূলত এই সীমাটির কারণে এবং পুরো পাঠটি একের মধ্যেই পাস করা সম্ভব নয়। একটি ইতিবাচক পয়েন্ট হিসাবে, এটি যুক্ত করা উচিত যে এই স্ক্রিপ্টটি আপনাকে রূপান্তরিত করার জন্য পাঠ্যের ভাষা নির্দিষ্ট করতে দেয়।
স্পষ্ট করে জানিয়ে দেওয়া যাক, অনুসরণ করার পদক্ষেপগুলি কী কী।
অনুসরণ করার জন্য ধাপ
1.- T2s.sh নামে একটি ফাইল তৈরি করুন
2.- নিম্নলিখিত বিষয়বস্তু অনুলিপি করুন:
#! / বিন / বাশ #################################### # ড্যান ফাউন্টেনের স্পিচ স্ক্রিপ্ট # # UsemosLinux দ্বারা পরিবর্তিত # # টকটোডানএফ@gmail.com # ################################ INPUT = $ * STRINGNUM = 0 ary = ($ {ইনপুট: 2}) প্রতিধ্বনি "---------------------------" প্রতিধ্বনি "ড্যান ফাউন্টেনের স্পিচ স্ক্রিপ্ট" প্রতিধ্বনি "টকটোড্যানএফ @ gmail.com "প্রতিধ্বনি" --------------------------- "কী" "{a! আরি [@]}" কী শর্টটিএমপি করুন [ $ STRINGNUM] = "$ OR SHORTTMP [$ STRINGNUM]} $ {ary [$ কী]}" LENGTH = $ (প্রতিধ্বনি $ {# শর্টটিএমপি [$ STRINGNUM]}) # তে "শব্দ: $ কী, $ {আরি [$ কী] # "# টিচো" এতে যুক্ত হচ্ছে: $ STRINGNUM "যদি [[" "EN LENGTH" -lt "100"]]; তারপরে # নতুন নতুন লাইন শর্ট শুরু করুন [$ STRINGNUM] = $ OR SHORTTMP [$ STRINGNUM] STRING অন্য STRINGNUM = $ (($ STRINGNUM + 1)) SHORTTMP [$ STRINGNUM] = "$ {আরি [$ কী] SH" ছোট [ $ STRINGNUM] = "$ {ary [$ key]}" "" $ {! ছোট [@]} "do #echo" লাইনে কী করার জন্য ফাই করা হয়েছে: $ কীটি হ'ল: {OR ছোট [$ কী] e "প্রতিধ্বনি" প্লে খেলছে: $ (($ কী +1)) এর $ (($ STRINGNUM + 1)) "এমপ্লেয়ার" http://translate.google.com/translate_tts? অর্থাৎ = ইউটিএফ -8 এবংtl = $ {1} & q = $ OR ছোট [$ কী] done "সম্পন্ন
3.- স্ক্রিপ্টে সম্পাদনের অনুমতিগুলি প্রদান করুন:
sudo chmod + x t2s.sh
4.- প্যারামিটার হিসাবে পাস করার স্ক্রিপ্টটি কার্যকর করুন: ক) পাঠ্যের সাথে সম্পর্কিত ভাষা কোড, খ) পাঠ্যকে রূপান্তরিত করতে। উদাহরণ স্বরূপ:
./t2s.sh en রূপান্তর করার জন্য এটি খুব আকর্ষণীয় পাঠ্য।
এটাই, আশা করি আপনি এটি উপভোগ করবেন।
কত সুন্দর, আপনাকে অনেক ধন্যবাদ 😉
মেয়েটির কী সুন্দর কণ্ঠস্বর, আমি মনে করি প্রেমে পড়েছি 😛 😛
ক্ষমা করবেন, আপনি কি আমাকে চীনা সাহায্য করতে পারেন? এটি চীনা অক্ষর সনাক্ত করে না, কেবল পিনইন।
এটি মেল পরীক্ষা করে এমন স্ক্রিপ্টের জন্য বা ব্যক্তিগতকৃত অ্যালার্মের জন্য ভাল যা জাগ্রত যখন আপনাকে পূর্বাভাস এবং মুলতুবি বার্তাগুলি xD বলে দেয়
এখানে আমি একটি পরীক্ষার ভিডিও করেছি 😛 https://www.youtube.com/watch?v=O3IeK7PjA_0
ভাল! ধন্যবাদ!
এটি খুব ভাল লাগছে, আমাকে কেবল এমপিজি 123 install ইনস্টল করতে হয়েছিল 🙂
টিউবটি mpg123 ইনস্টল করার জন্য তবে এটি দুর্দান্ত, এটি যদি কিছু শব্দ না মানায় তবে এটি ডান টিক লেটার ইত্যাদি বলে says
EH EH
ভাইরাস ডাটাবেস আপডেট করা হয়েছে (?)
apt update &&//t2.sh en ভাইরাস ডাটাবেস আপডেট করা হয়েছে
হাহাহাহা দুর্দান্ত, এর জন্য আমার ইতিমধ্যে কিছু ব্যবহার রয়েছে, সন্দেহ ছাড়াই কামুক ভয়েস =), ভাগ করে নেওয়ার জন্য ধন্যবাদ।
ম্যাক ওএসএক্স ব্যবহারকারী হিসাবে, স্ক্রিপ্টটি ব্যবহার করা আমার পক্ষে সম্ভব হয়নি যেহেতু আমার কাছে এমপিজি 123 চালু নেই, সুতরাং স্ক্রিপ্টটি সংশোধন করে এবং ভিএলসি ব্যবহার করে আমরা ম্যাক ওএস এক্সে এটি সঠিকভাবে কাজ করতে ছেড়ে যেতে পারি can
http://pastebin.com/C2Mkp1Qy
সমস্যাটি হ'ল ভিএলসি অবশ্যই কার্যকর থাকে এবং এটি সম্পাদন শেষ হওয়ার পরে বন্ধ হয় না এবং গ্রাফিকাল ইন্টারফেসটি খোলার থেকে রোধ করতে আপনি সিভিএলসি ব্যবহার করতে পারেন
এটা করা যেতে পারে
cvlc –play-and-প্রস্থান «https://translate.google.com/translate_tts?tl=$ái1-lex.europa.eu&q=$selSHORT পরিবার$key]}»
যাতে এটি পুনরুত্পাদন শেষে বন্ধ হয়
হাই ছেলেরা আমি এই ত্রুটিটি পেয়েছি, আসুন দেখুন কেউ কি সমস্যাটি আমাকে বলে কিনা
প্লে বাজানো: 1 এর 1
HTTP অনুরোধ ব্যর্থ হয়েছে: 404 পাওয়া যায় নি
[mpg123.c: 610] ত্রুটি: http সংস্থানটিতে অ্যাক্সেস http://translate.google.com/translate_tts?tl=hola&q= ব্যর্থ।
[কোড] প্লে বাজানো: 1 এর 1
HTTP অনুরোধ ব্যর্থ হয়েছে: 404 পাওয়া যায় নি
[mpg123.c: 610] ত্রুটি: http সংস্থানটিতে অ্যাক্সেস http://translate.google.com/translate_tts?tl=hola&q= ব্যর্থ। [/ কোড]
সমস্যাটি হ'ল আপনি স্ক্রিপ্টটি ভুল ব্যবহার করছেন।
আপনি যখন এটি চালান, আপনাকে প্রথম পরামিতি হিসাবে পাঠ্যের ভাষাটি পাস করতে হবে, যেমন পোস্টটিতে উদাহরণ হিসাবে দেখানো হয়েছে।
আমি আপনাকে অন্য একটি উদাহরণ দিচ্ছি:
./t2s.sh এ এটি একটি সাধারণ উদাহরণ।
লক্ষ্য করুন যে ts2.sh এর পরে এটি "en" (যার অর্থ "ইংরেজি", অর্থাত্ ইংরেজী) follows স্প্যানিশদের জন্য, "এস" ব্যবহার করুন এবং তারপরে সেই ভাষায় বাক্যটি যা আপনি রূপান্তর করতে চান।
আলিঙ্গন! পল।
আপনি স্পোক কমান্ড না জানেন? hehe
espeak -v হ'ল «হ্যালো»
হ্যাঁ তবে এক নয়। এই ভয়েস তাই অনেক ভাল। 🙂
আমরা রাজি!
গ্রিটিংস!
যাদের mpg123 -q নিয়ে সমস্যা আছে বা এটি পছন্দ করেন না তাদের জন্য আপনি এমপ্লেয়ারে স্যুইচ করতে পারেন
mpg123 -q "http://translate.google.com/translate_tts?tl=$ পরিবার 1-lex.europa.eu&q=$selSHORT পরিবার$key]}"
এমপ্লেয়ার «http://translate.google.com/translate_tts?tl=$ পরিবারে প্রথম & q=$selSHORT পরিবার$key]}»
আরও ভাল "এমপ্লেয়ার-সত্যই শান্ত" তাই এটি পাঠ্য সহ আউটপুট পূরণ করে না
আমার অ্যাপ্লিকেশনগুলির জন্য গুগল ব্যবহার করার একটি খুব ভাল ধারণা আমাকে গ্লাভসের মতো স্যুট করে।
http://github.com/alfa30/t2v
আরেকটি প্রশ্ন; কেউ কি আমাকে বলতে পারবেন কীভাবে আউটপুট অডিও রেকর্ড করবেন ???
আমি নিজেই আপনাকে উত্তর, কারণ আমি সবেমাত্র পেয়েছি। Mpg123 ব্যবহার করে, আমি স্ক্রিপ্টের 38 লাইনটি সংশোধন করেছি, দেখতে এটি:
mpg123 -q -w Audio.wav «http://translate.google.com/translate_tts?tl=$ 1াকা XNUMX য়েন্দ্র &q=$selSHORT পরিবার$key]}
আমি -W অডিও.ওয়াভ যুক্ত করেছি। এটি বাক্যাংশের অডিও সহ একটি ওয়াভ ফাইল তৈরি করে, তবে আমি এটি রেখে দিয়েছি, এটি শোনা যায় না। আপনি যদি বাক্যাংশটি শুনতে চান তবে আপনাকে অন্য একটি লাইন যুক্ত করতে হবে। আপনি উভয় এই মত চেহারা হবে:
mpg123 -q -w Audio.wav «http://translate.google.com/translate_tts?tl=$ পরিবার 1-lex.europa.eu&q=$selSHORT পরিবার$key]}» &
mpg123 -q "http://translate.google.com/translate_tts?tl=$ পরিবার 1-lex.europa.eu&q=$selSHORT পরিবার$key]}"
অবশ্যই এটি আরও কার্যকর এবং পরিষ্কার উপায়ে করা যেতে পারে তবে কমপক্ষে এটি আমার পক্ষে কাজ করে।
দুর্দান্ত জোসে জিডিএফ, আমি আপনার পদ্ধতিটি খুব ভাল ফলাফল, শুভেচ্ছা দিয়ে চেষ্টা করেছি।
দ্বিতীয় মৃত্যুদন্ডে ট্র্যাফিক সংরক্ষণ করতে আপনি প্রথম। উত্পাদিত .wav পুনরুত্পাদন করতে পারেন
আচ্ছা হ্যাঁ, আমরা ইনস্টল থাকা কোনও প্লেয়ার ব্যবহার করছি using উদাহরণস্বরূপ, ভিএলসি প্লেয়ারের সাথে এটি হবে:
vlc Audio.wav
ভাল, কে ভিএলসি বলেছে, যিনি টার্মিনাল দ্বারা কাজ করে এমনগুলি সহ অন্য কোনও খেলোয়াড় বলেছেন।
এবং স্ক্রিপ্টটি যতবার ব্যবহৃত হবে ততবার ফাইলটি ওভাররাইট করা এড়াতে নামের জন্য একটি ভেরিয়েবল ব্যবহার করা উচিত। যে নামটি ব্যবহারকারী শুরুর আগে (পড়ুন কমান্ড) রাখবেন ... তবে এটি কার্ল cur করবে 😀
আমি পিএইচপি-তে এটি করেছি (একটি অ্যাসিস্ট্রিক ফোন সিস্টেমের জন্য অডিও তৈরি করতে *)
<?php
$ url = 'http://translate.google.com/translate_tts?ie=UTF-8&q={ক্যোয়ারী}% 0A & tl = হল & prev = ইনপুট ';
যদি (গণনা ($ আরজিভি) <= 1)
$ নাম = বেসনাম (g আরজিভি [0]);
ডাই ($ নাম। 'ব্যবহার:'। $ নাম।
}
অ্যারে_শিফ্ট (g আরজিভি);
$ ক্যোয়ারী = ইমপ্লোড ('', $ আরজিভি);
$ ফাইলের নাম = str_replace (অ্যারে ('', ',', ','। '),' - ', $ ক্যোয়ারী);
$ ফাইলের নাম = str_replace ('-', '-', $ ফাইলের নাম);
; url = str_replace ('{কোয়েরি}', Rawurlencode ($ কোয়েরি), $ url);
$ চ = কার্ল_ইনিট ();
curl_setopt ($ ch, CURLOPT_URL, $ url);
curl_setopt ($ ch, CURLOPT_HEADER, 0);
কার্ল_সেটপ্ট ($ সিএইচ, সিআরএলওপি XNUMX রিটার্নটি ট্রান্সফার, সত্য);
$ ফলাফল = curl_exec ($ ch);
curl_close ($ ch);
$ পথ = getcwd ()। '/'। $ ফাইলের নাম;
ফাইল_পুট_কন্টেন্টস ($ পথ। 'mp3', $ ফলাফল);
@exec ("sox {$ path} .mp3 -b 16 -r 8000 -t wavpcm {$ path} .wav");
@ ইউলিংক ($ পথ। '। এমপি 3');
এই কমান্ডটি দিয়ে আমি কীভাবে ইতিমধ্যে আউটপুট অডিও রেকর্ড করতে পেরেছি:
arecord ~ / zhongwen.mp3 & ./t2s.sh zh ni hao; fg
এবং শেষে রেকর্ডিং বন্ধ করতে ctrl + c।
আমি কখনও পিএইচপি ব্যবহার করি নি
তবে চলমান অবস্থায়:
পিএইচপি 5 পাঠ্য থেকে স্পিচ.পিপি হ্যালো
কনসোলা এটি হোস্ট করে:
sox FAIL ফর্ম্যাট: ফাইল এক্সটেনশনের জন্য কোনও হ্যান্ডলার `এমপি 3 ′
যে কোনও অবদানের প্রশংসা করা হয়েছে, আমি পরে আবার চেষ্টা করব।
গুগল ভাষা অনুবাদকের জন্য 2 টি অ্যাপ্লিকেশন + পাঠ্য থেকে স্পিচ অনুবাদ:
http://www.linuxhispano.net/2014/05/29/traductor-de-google-voz/
আমি মনে করি এটি রূপান্তর করার সর্বোত্তম উপায়, লিনাক্স> _ এর অন্যান্য বিকল্পগুলির মতো ভয়েসটি খারাপ নয়
এটি কোনও সরল পাঠ্য ফাইলটি পড়ার কোনও উপায় আছে কি?
পুরো বইগুলিকে অডিওতে রূপান্তর করা খুব উপকারী হবে
ভাল, এটি আমার পক্ষে কাজ করে না, আমি জানি না কেন, এটি প্রকাশিত হয়:
xxxxx: ~ / ডকুমেন্টস / লিনাক্স $। / t2s.sh হ্যালো /
---------
ড্যান ফোয়ারা দ্বারা স্পিচ স্ক্রিপ্ট
টকটোড্যানএফ@gmail.com
---------
প্লে বাজানো: 1 এর 1
http_open: HTTP / 1.0 400 খারাপ অনুরোধ
http://translate.google.com: অনুরূপ কোন ফাইল বা ডিরেক্টরি নেই
আমি এমপিজি 123 ইনস্টল করেছি এবং আমি খুব কম পরীক্ষা করেছি এবং কিছুই করেছি…। আগাম ধন্যবাদ
আরে, শব্দটি শুনতে এবং অনুবাদকের শব্দগুলি রেকর্ড করার জন্য, এই স্ক্রিপ্টটি আমাকে খুব ভালভাবে পরিবেশন করেছে।
আসলে, আমি স্ক্রিপ্টটি আমার নিজের প্রয়োজনের সাথে খাপ খাইয়ে নিতে পরিবর্তন করেছি: পাঠ্য শব্দের একটি তালিকাতে (লেমারিও) বক্তৃতাতে রূপান্তর; আমার ভয়েস wav এ সংরক্ষণ করুন, ওগে রূপান্তর করুন এবং পড়ার শব্দ অনুসারে তাদের নাম দিন।
আমি কেডিয়ালগ ব্যবহার করে কেডিয়ালগ ব্যবহার করে শব্দের তালিকাসহ ফাইলটি যেখানে এবং সেই ডিরেক্টরিটি যেখানে ভয়েস অডিও সংরক্ষণ করতে চাই সেগুলি নির্দিষ্ট করেছিলাম।
যখন ডাব্লুএইভি থেকে ওজিজি রূপান্তর শেষ হয়, এটি দুটি ফোল্ডার তৈরি করে যেখানে একদিকে ওয়াভ এবং অন্যদিকে ওগ সংরক্ষণ করা হয়।
প্রথমে আমি রেগে গিয়েছিলাম কারণ আমি উচ্চারণগুলির সাথে শব্দগুলি সঠিকভাবে না পড়ি, তবে আমি দেখতে পেলাম যে আপনাকে কোডে "এস & ie = ইউটিএফ 8" যুক্ত করতে হবে। এক মুহুর্তের জন্য আমি চরিত্রের এনকোডিংটি ভুলে গিয়েছি।
আমি আপনাকে স্ক্রিপ্টের কোডটি রেখেছি যা এটি আপনাকে সহায়তা করার ক্ষেত্রে করে:
#################################################################### #########################
#! / বিন / ব্যাশ
########################################
# পাঠ্য থেকে স্পিচ বক্তৃতা #
# ইগনাসিও ক্রুজ মার্টিনিজ দ্বারা গৃহীত #
# মেলটি গোপন এক্সডি #
########################################
লেমেরির পথ এবং নাম নির্দিষ্ট করতে # কেডিই ডায়ালগ বক্স
soyunarchivo = $ (কেডিয়ালগ ইনপুটবক্স «ফাইলের পাথ এবং নাম লিখুন (এটির একটি এক্সটেনশন সহ):»)
ভয়েস ফাইলগুলির জন্য গন্তব্য ফোল্ডার নির্দিষ্ট করতে # কেডিই ডায়ালগ বক্স
পাথ = $ (কেডিয়ালগ ইনপুটবক্স «ভয়েস অডিও সংরক্ষণ করার জন্য পাথটি প্রবেশ করুন:»)
বিড়ালের মাধ্যমে টেক্সট ফাইলের সমস্ত লাইন পড়তে হয়, প্রতিটি লাইনে একটি শব্দ থাকে consists
আমার জন্য cat (বিড়াল $ sounefile)
do
প্রতিধ্বনি $ i
# গুগল অনুবাদ ব্যবহার করে বক্তৃতায় রূপান্তর করা, এনকোডিংটি ভুলে যাবেন না যাতে এটি উচ্চারণগুলি পড়ে
mpg123 -q -w "$ পথ" $ i.wav "http://translate.google.com/translate_tts?tl=es&ie=UTF8&q=$i"
mpg123 -q "http://translate.google.com/translate_tts?tl=es&ie=UTF8&q=$i"
# wf ফাইলগুলিকে ওজিতে রূপান্তর করতে ffmpeg ব্যবহার করে
ffmpeg -i "$ পথ" $ i.wav -acodec libvorbis "$ পথ" $ i.ogg
সম্পন্ন
এই লাইনগুলির সাথে ফোল্ডারগুলি WAV বা OGG এ ভয়েস ফাইলগুলি সংগঠিত করতে তৈরি করা হয়েছে
mkdir "$ পথ" WAV
এমভি "$ পথ" *। wav "$ পথ" WAV
mkdir "$ পথ" ওজিজি
এমভি "$ পথ" *। ogg "$ পথ" ওজিজি
#KDE ডায়ালগ বাক্সটি নির্দেশিত কাজ শেষ হয়েছে
kdialog gmsgbox 'প্রক্রিয়া সমাপ্ত'
#################################################################### #######################
এখন, উত্পন্ন ভয়েস ফাইলগুলি ব্যবহার করার লাইসেন্স সম্পর্কে আপনার কারও কি জ্ঞান আছে?
কপিরাইট এবং সম্পর্কিত বিষয়গুলির সীমাবদ্ধতা। এটি আমার পক্ষে আগ্রহী কারণ আমি এই ভয়েস ফাইলগুলির কয়েকটি এমন লোকদের সমর্থন করার জন্য ব্যবহার করার পরিকল্পনা করছি যাঁরা সাক্ষর হয়ে উঠছেন, মূলত এটি একটি অলাভজনক প্রকল্প।
এবং এটি হ'ল এই সরঞ্জামটির স্পেনীয় ভাষার জন্য সবচেয়ে ভাল অনুভূতি রয়েছে, দুর্ভাগ্যক্রমে লিনাক্সে তেমন কিছু নেই। এমব্রোলা আমাকে গেসপেকারের সাথে একসাথে সেট আপ করতে অনেক কষ্ট দিয়েছেন।
ধন্যবাদ এবং আপনাকে দেখতে।
ধারণা নেই ... গুগল অনুবাদক লাইসেন্স দেখতে হবে।
স্ক্রিপ্টটি আমার পক্ষে কার্যকর হয়নি, স্পষ্টতই এটি ইউআরএল সম্পর্কিত একটি সমস্যা, যারা আগ্রহী তাদের জন্য সঠিক URL:
http://translate.google.com/translate_tts?tl=es&q=Hola
হ্যালো! আমি আপনার স্ক্রিপ্টটি দিয়ে পরীক্ষা করেছি এবং এটি সম্পাদন করার সময়, এটি আমাকে বলেছিল যে এটি অডিওটি খুঁজে পাচ্ছে না, তাই আমি ইউআরএল প্রবেশ করিয়েছি এবং মনে হয় মিঃ গুগল একটি ক্যাপচা রেখেছিল ...
স্ক্রিপ্ট আপডেট করুন