मेन्यू

वॉयस ओवर कार्यक्रम। स्व-आवाज़: ध्वनि द्वारा पाठ पढ़ने के कार्यक्रम

छत

कार्यक्रम "" जोर से पाठ फ़ाइलों को पढ़ने के लिए है। मानव आवाज की ध्वनियों को पुन: उत्पन्न करने के लिए, कंप्यूटर पर स्थापित किसी भी भाषण सिंथेसाइज़र का उपयोग किया जा सकता है। किसी भी मल्टीमीडिया प्रोग्राम ("प्ले", "पॉज़", "स्टॉप") में मौजूद मानक बटनों के समान, स्पीच प्लेबैक को मानक बटनों का उपयोग करके नियंत्रित किया जा सकता है। एप्लिकेशन क्लिपबोर्ड की सामग्री को जोर से पढ़ सकता है, दस्तावेजों में निहित पाठ दिखा सकता है, फ़ॉन्ट और रंग सेटिंग्स बदल सकता है, सिस्टम ट्रे (अधिसूचना क्षेत्र) से पढ़ने की प्रक्रिया को नियंत्रित कर सकता है या वैश्विक कीबोर्ड शॉर्टकट का उपयोग कर सकता है, कीबोर्ड पर टाइप किया गया पाठ बोल सकता है, वर्तनी की जांच कर सकता है। , कई छोटी फ़ाइलों के लिए एक टेक्स्ट फ़ाइल को विभाजित करें, होमोग्राफ देखें। "" पंक्तियों के सिरों पर सभी हाइफ़न पाठ से निकालने की क्षमता प्रदान करता है; यह शब्दों को पढ़ते समय हकलाने से बच जाएगा। फ़ाइल स्वरूप समर्थित: AZW, AZW3, CHM, DjVu, DOC, DOCX, EML, EPUB, FB2, FB3, HTML, LIT, MOBI, ODP, ODS, ODT, PDB, PDF, PPT, PPTX, PRC, RTF, TCR, डब्ल्यूपीडी, एक्सएलएस, एक्सएलएसएक्स।


फाइल का आकार:एमबी
संस्करण:परिवर्तनों का इतिहास
लाइसेंस के प्रकार:फ्रीवेयर
ऑपरेटिंग सिस्टम:
इंटरफ़ेस भाषाएँ: रूसी, अंग्रेजी, अरबी, अर्मेनियाई, बल्गेरियाई, हंगेरियन,
वियतनामी, डच, ग्रीक, स्पेनिश, इतालवी, चीनी,
कोरियाई, जर्मन, फारसी, पोलिश, पुर्तगाली, रोमानियाई,
सर्बियाई, स्लोवेनियाई, तुर्की, यूक्रेनी, फिनिश, फिलिपिनो,
फ्रेंच, क्रोएशियाई, चेक, जापानी
मदद फ़ाइलें: रूसी, अंग्रेजी, स्पेनिश, इतालवी, कोरियाई, जर्मन,
यूक्रेनी, फ्रेंच, चेक

पोर्टेबल संस्करण: डाउनलोड करें(एमबी)
"बालाबोल्का" के पोर्टेबल (पोर्टेबल) संस्करण को इंस्टॉलेशन की आवश्यकता नहीं है और इसे "फ्लैश ड्राइव" से चलाया जा सकता है।
कंप्यूटर पर कम से कम एक स्पीच सिंथेसाइज़र (आवाज़) अवश्य स्थापित होना चाहिए।

कंसोल एप्लिकेशन: डाउनलोड करें(केबी)
कंसोल एप्लिकेशन में ग्राफिकल इंटरफ़ेस नहीं है और यह टेक्स्ट मोड में चलता है।
ऑपरेटिंग मोड को कमांड लाइन विकल्प या कॉन्फ़िगरेशन फ़ाइल का उपयोग करके सेट किया जा सकता है।

फाइलों से टेक्स्ट निकालने की उपयोगिता: डाउनलोड(एमबी)
कार्यक्रम आपको विभिन्न स्वरूपों की फाइलों से पाठ निकालने की अनुमति देता है।
उपयोगिता में ग्राफिकल इंटरफ़ेस नहीं है और यह टेक्स्ट मोड में चलता है।

यह अभी भी स्पष्ट नहीं है कि ऐसे कार्यक्रम की आवश्यकता क्यों है? यहां कुछ उपयोगी संबंधित लिंक दिए गए हैं:

कार्यक्रम "" आपको थीम का उपयोग करके इसकी उपस्थिति बदलने की अनुमति देता है।




प्रोग्राम कंप्यूटर आवाज का उपयोग कर सकता है जो एसएपीआई 4, एसएपीआई 5 या माइक्रोसॉफ्ट स्पीच प्लेटफॉर्म का समर्थन करता है। फ्री और पेड (कमर्शियल) स्पीच इंजन हैं। उच्चतम गुणवत्ता वाला वाक् संश्लेषण व्यावसायिक आवाज़ों द्वारा प्रदान किया जाता है।

कंपनी द्वारा निर्मित स्पीच सिंथेसाइज़र रियलस्पीक(मुफ्त वोट, माइक्रोसॉफ्ट के सर्वर पर प्रकाशित):

  • ब्रिटिश अंग्रेजी (19.4 एमबी)
  • स्पेनिश (21.7 एमबी)
  • इतालवी (21.5 एमबी)
  • जर्मन (20.7 एमबी)
  • फ्रेंच (22.5 एमबी)

ओल्गा याकोवलेवा ने एक खुला स्रोत बहुभाषी भाषण सिंथेसाइज़र विकसित किया है आरएचवॉयस(रूसी, अंग्रेजी, जॉर्जियाई, किर्गिज़, तातार, यूक्रेनी और एस्पेरान्तो उपलब्ध हैं):

  • भाषण सिंथेसाइज़र का विवरण
  • विंडोज संस्करण

ल्विव के यारोस्लाव कोज़ाक ने एक यूक्रेनी भाषण सिंथेसाइज़र बनाया उक्रवोक्स. यूक्रेनी रेडियो उद्घोषक इगोर मुराशको की आवाज को आधार के रूप में लिया गया था।

  • उक्रवोक्स

वाणिज्यिक भाषण सिंथेसाइज़र में से, निम्नलिखित आवाज़ें रूसी उपयोगकर्ताओं के लिए रुचिकर हैं:

  • समय सारणी
  • कैट्या, मिलेनातथा यूरी
  • निकोलाई(डिगालो - अकापेला एलन स्पीच क्यूब)
  • तात्यानातथा कहावत(इवोना)

आप हार्पो वेबसाइट पर IVONA और Nuance से रूसी कंप्यूटर वॉयस खरीद सकते हैं। Acapela Group की रूसी आवाज़ Infovox 4 सॉफ़्टवेयर उत्पाद में शामिल है: आप इसे रूसी कंपनी Elita Group की वेबसाइट पर खरीद सकते हैं।

माइक्रोसॉफ्ट स्पीच प्लेटफार्म


माइक्रोसॉफ्ट स्पीच प्लेटफॉर्म (संस्करण 11.0) उपकरणों का एक सेट है जो डेवलपर्स को आवाज पहचान और टेक्स्ट-टू-स्पीच समाधान बनाने में सक्षम बनाता है।

वाक् सिंथेसाइज़र का उपयोग करने के लिए, आपको निम्नलिखित घटकों को डाउनलोड और इंस्टॉल करना होगा:

  1. Microsoft भाषण प्लेटफ़ॉर्म - रनटाइम प्लेटफ़ॉर्म का सर्वर भाग है जो प्रोग्राम के लिए API प्रदान करता है (फ़ाइल x86_SpeechPlatformRuntime\SpeechPlatformRuntime.msi)।
  2. माइक्रोसॉफ्ट स्पीच प्लेटफॉर्म - रनटाइम लैंग्वेज - सर्वर साइड के लिए भाषाओं का एक सेट। वर्तमान में 26 भाषाओं के लिए आवाजें पेश की जाती हैं, जिसमें एक रूसी आवाज भी शामिल है ऐलेना(फाइलें जिनके नाम "MSSpeech_TTS_" से शुरू होते हैं)।

SAPI 5 वॉयस के लिए उपयोग किए जाने वाले टैग (कंट्रोल कमांड) का उपयोग माइक्रोसॉफ्ट स्पीच प्लेटफॉर्म वॉयस के लिए भी किया जा सकता है। लेकिन याद रखें, SAPI 5 वॉयस और माइक्रोसॉफ्ट स्पीच प्लेटफॉर्म आवाज एक दूसरे के साथ संगत नहीं हैं, इसलिए आप वॉयस या लैंग टैग का उपयोग करके उनके बीच स्विच नहीं कर सकते।

उच्चारण सुधार


भाषण प्रजनन की गुणवत्ता में सुधार के लिए उपयोगकर्ता एक विशेष प्रतिस्थापन सूची का उपयोग कर सकता है। यह उन मामलों में उपयोगी है जहां शब्दों या व्यक्तिगत शब्दांशों के उच्चारण को बदलने की आवश्यकता होती है; इसके लिए टेक्स्ट में कुछ एक्सप्रेशन को आवश्यक रीडेबल एक्सप्रेशन से बदल दिया जाता है। ऐसे प्रतिस्थापन नियम लिखने के लिए, नियमित अभिव्यक्तियों के वाक्य-विन्यास का उपयोग किया जाता है; प्रतिस्थापन सूचियाँ *.rex फ़ाइलों में संग्रहीत हैं।

रूसी उपयोगकर्ताओं के अनुरोध पर, *.dic एक्सटेंशन के साथ उच्चारण सुधार शब्दकोशों के लिए समर्थन जोड़ा गया था। टॉकर प्रोग्राम में शब्दकोशों के इस प्रारूप का उपयोग किया गया था। साधारण प्रतिस्थापन नियम नियमित अभिव्यक्तियों की तुलना में पाठ पर तेजी से लागू होते हैं।

*.bxd प्रारूप अन्य दो प्रारूपों के लाभों को जोड़ता है। शब्दकोश में साधारण पाठ प्रतिस्थापन के लिए नियमित अभिव्यक्ति और नियम दोनों हो सकते हैं। एक विशेष संपादक में, आप चयनित कंप्यूटर आवाज और एक विशिष्ट भाषा दोनों के लिए अलग-अलग शब्दकोश बना सकते हैं।

शब्दकोश फ़ाइलें "में स्थित हैं दस्तावेज़\बालाबोल्का" ("My Documents\Balabolka"विंडोज एक्सपी में)।

वर्तनी जांच


कार्यक्रम "" का समर्थन करता है हनस्पेल(hunspell.github.io)। हनस्पेल एक वर्तनी परीक्षक है जिसे जटिल शब्द निर्माण और व्यापक आकारिकी वाली भाषाओं के लिए डिज़ाइन किया गया है। हनस्पेल का उपयोग OpenOffice.org और लिब्रे ऑफिस ऑफिस सुइट्स के साथ-साथ मोज़िला फ़ायरफ़ॉक्स ब्राउज़र में भी किया जाता है।

विंडोज के लिए डिक्शनरी यहां से डाउनलोड की जा सकती है:

आवाज अभिनय के लिए सॉफ्टवेयर के संचालन का लगभग एक ही सिद्धांत है।

सेवा कार्य और संचालन एल्गोरिथ्म:

  • एक समर्पित क्षेत्र में टेक्स्ट दर्ज करें या एक दस्तावेज़ अपलोड करें।
  • उसके बाद, आपके द्वारा स्थापित इंजन लॉन्च किया जाता है।
  • अगला कदम एक आवाज का चयन करना है।
  • वांछित आरामदायक पढ़ने की गति का चयन करें

ऐसी सेवाओं में एकमात्र कमी है - यह गलत उच्चारण, तनाव, भाषण त्रुटियां हैं। अन्यथा, वे एक उत्कृष्ट काम करते हैं, यहां तक ​​​​कि आवाज भी लंबे समय से मानव जैसी हो गई है।

वाक् विश्लेषण और प्रसंस्करण इंजन विशेष सॉफ्टवेयर हैं, जैसे कंप्यूटर से जुड़े उपकरणों के लिए ड्राइवर। पाठ की जानकारी को वाक् में बदलने के लिए वे वॉयस मॉड्यूल के कामकाज और पाठक के लॉन्च के लिए आवश्यक हैं।

इस तरह के एप्लिकेशन में इंटरैक्शन और डिज़ाइन का ग्राफिकल इंटरफ़ेस नहीं होता है। पाठ के साथ काम करना शुरू करने के लिए, आपको एक पाठक कार्यक्रम की आवश्यकता है।

इंजन को पहले लोड किए बिना किसी भी सेवा को स्थापित करते समय, जानकारी को पुन: प्रस्तुत नहीं किया जाएगा। शुरुआती अक्सर यह गलती करते हैं।

मुख्य इंजन मानक:

  • SAPI 4 काफी पुराना लेकिन काफी विश्वसनीय मानक है। रूपांतरण और पढ़ने की गुणवत्ता आधुनिक स्तर के लिए पर्याप्त नहीं है, इसलिए फिलहाल इसका व्यावहारिक रूप से उपयोग नहीं किया जाता है।
  • SAPI 5 व्यावहारिक रूप से सबसे लोकप्रिय मानक है, सभी आधुनिक वॉयस इंजन इसके सख्त मार्गदर्शन में काम करते हैं। विभिन्न प्रकार की आवाजों और स्वरों को पुन: पेश कर सकते हैं।
  • एमएस स्पीच प्लेटफॉर्म रीडिंग के कामकाज के लिए मानकों और उपकरणों का एक सेट है।

आधुनिक इंजन के उदाहरण:

  • टेक्स्ट-टू-स्पीच इंजन (नाम - निकोलाई) रूसी में एक पुरुष आवाज के साथ एक सामान्य सॉफ्टवेयर है, जो बड़ी संख्या में पाठक सेवाओं के लिए उपयुक्त है। इसके अलावा साइट पर इसके लिए भाषा पैक हैं। केवल एक खामी है - परीक्षण अवधि दो सप्ताह है, इसलिए यदि आप इसे और अधिक उपयोग करना चाहते हैं, तो आपको सदस्यता के लिए भुगतान करना होगा।
  • Acapela (नाम - अलीना) एक लोकप्रिय रूसी आवाज इंजन है जिसमें एक प्रसिद्ध कंपनी की सुखद महिला आवाज है। आधुनिक SAPI-5 मानक के अनुसार काम करता है।
  • कतेरीना 2 एक सुखद महिला आवाज के साथ रूसी में भाषण समारोह का काफी अच्छा कार्यान्वयन है, जो टीटीएसई की तकनीकी विशेषताओं में तुलनीय है। लगातार अपडेट किया जाता है और आवाज में सुधार होता है। ध्वन्यात्मक भाग का अद्यतन विशेष रूप से महत्वपूर्ण और निर्णायक था, और अब कात्या व्यावहारिक रूप से तनाव में गलती नहीं करती है।
  • RHVoice एक आधुनिक बहुभाषी ओपन सोर्स टेक्स्ट-टू-स्पीच कन्वर्टर है जिसमें यूजर मोड में स्वतंत्र रूप से कॉन्फ़िगर करने की क्षमता है। इसका उपयोग इस समय चल रहे सभी ऑपरेटिंग सिस्टम के साथ किया जाता है।
  • इवोना तात्याना/मैक्सिम एक प्रगतिशील इंजन है जो पुरुष और महिला दोनों आवाजों में भाषण को पुन: प्रस्तुत करने में सक्षम है। उत्कृष्ट ध्वनि गुणवत्ता, रूपांतरण प्रक्रिया और एक रीडिंग फ़ंक्शन हजारों एल्गोरिदम द्वारा काम किया, जो लगभग कभी भी भाषण और वर्तनी की त्रुटियां नहीं करता है। इंटोनेशन अधिकतम गैर-रोबोटिक है।

सेवाएं जो रूसी में ऑनलाइन पाठ पढ़ सकती हैं

गोवोरिल्का

सॉफ्टवेयर की आधिकारिक वेबसाइट: vector-ski.ru/vecs/govorilka/

एक छोटा, लेकिन काफी कार्यात्मक कार्यक्रम जो आवाज से जानकारी पढ़ने का उत्कृष्ट काम करता है। बड़ी संख्या में भाषाओं का समर्थन करता है, लेकिन उन भाषाओं के साथ सीधे काम करेगा जो आपके इंजन द्वारा समर्थित हैं। पठन प्रक्रिया को एमपी3 फ़ाइल में सहेजने का एक अनूठा अवसर है। यदि आप एक ऑडियोबुक बनाना चाहते हैं तो यह बहुत आसान है।

मुख्य कार्य:

  • एक सुलभ एन्कोडिंग में विभिन्न स्रोतों से पाठ जानकारी का पुनरुत्पादन।
  • टेक्स्ट का आकार 2GB तक हो सकता है.
  • वेब पेज पढ़ने की क्षमता।
  • पढ़ने की गति और आवाज की विशेषताओं को बदलने, ध्वनि को समायोजित करने, और इसी तरह के कार्य उपलब्ध हैं।
  • किसी भी गति से सार्वजनिक एक्सटेंशन के साथ एक ऑडियो फ़ाइल में कार्यक्रम के परिणाम को रिकॉर्ड करना।
  • यदि दस्तावेज़ में कई शीट हैं, तो एप्लिकेशन स्वतंत्र रूप से अंत तक बदल जाएगा और इसे उपयोगकर्ता को प्रदर्शित करेगा।
  • नए संस्करण में, उच्चारण और प्रसंस्करण गुणवत्ता में सुधार उपलब्ध हो गया है।
  • यदि आपने अपना काम पूरा नहीं किया है, लेकिन आपको छोड़ने की जरूरत है, तो आप इसे सुरक्षित रूप से बंद कर सकते हैं, क्योंकि सॉफ्टवेयर कर्सर की अंतिम स्थिति और खोले गए दस्तावेज़ को याद रखने में सक्षम है। जब आप वापस लौटते हैं, तो बस कार्यक्रम शुरू करें और वहीं से शुरू करें जहां आपने छोड़ा था।
  • कार्यक्रम इंटरफ़ेस पूरी तरह से रूसी में है।
  • एप्लिकेशन ग्राफिकल इंटरफेस के साथ आधुनिक ऑपरेटिंग सिस्टम के सभी संस्करणों के साथ संगत है।

दुर्जनों का नेता

सॉफ्टवेयर की आधिकारिक वेबसाइट: aoys.narod.ru/part3.htm

यह न केवल पाठ जानकारी देने की सेवा है, बल्कि एक पूर्ण संपादक भी है। दो SAPI4 / SAPI5 मानकों का उपयोग करके काम करना संभव है, लेकिन दूसरे की सिफारिश की जाती है - एक अधिक आधुनिक और उच्च गुणवत्ता वाला इंजन। कार्यक्रम पाठ रूपांतरण में उत्कृष्ट परिणाम दिखाता है: यह पाठ में त्रुटियों को ठीक करने और इसे सही ढंग से पढ़ने में सक्षम है, इसमें उच्च गुणवत्ता वाले आवाज संकेतक हैं, भाषण और ध्वन्यात्मक त्रुटियां नहीं करते हैं। इस सब के साथ, बड़ी संख्या में शब्दकोशों का उपयोग किए बिना प्रसंस्करण बहुत तेज है।

कार्यक्रम की मुख्य विशेषताएं:

  • विभिन्न स्रोतों से ग्रंथों का पुनरुत्पादन: मैनुअल इनपुट, बड़ी संख्या में उपलब्ध प्रारूपों की फाइलें डाउनलोड करना, छवियों का आयात करना।
  • बेहतर ध्वनि गुणवत्ता के लिए अतिरिक्त ऑडियो कोडेक कनेक्ट करना।
  • पाठ में वर्तनी की जाँच करें और त्रुटियाँ प्रदर्शित करें।
  • उच्चारण शब्दकोश उपलब्ध हैं और इसे मैन्युअल रूप से अपडेट और संपादित करना संभव है।
  • रूसी के लिए उत्कृष्ट भाषण समर्थन: शब्दों, वाक्यांशों की कोई ध्वन्यात्मक और उच्चारण त्रुटियां नहीं।
  • आधुनिक विंडोज ऑपरेटिंग सिस्टम पर काम करता है।

बालाबोल्का


सॉफ्टवेयर डाउनलोड करने और उपयोग करने के लिए वेबसाइट: cross-plus-a.ru/balabolka.html

प्रमुख विशेषताऐं:

  • टेक्स्ट इनपुट न केवल सामान्य तरीकों से उपलब्ध है, बल्कि बफर से भी उपलब्ध है।
  • टाइपिंग की प्रक्रिया में ध्वनि जानकारी।
  • अपलोड करने और संसाधित करने के लिए कई फ़ाइल एक्सटेंशन का समर्थन करता है। उदाहरण के लिए, मानक के अलावा, हैं: सीएचएम, डीजेवीयू, डब्ल्यूपीडी।
  • त्रुटियों के लिए पाठ को पार्स करता है और परिणाम प्रदर्शित करता है।
  • विभाजन करता है।

आईसीई बुक रीडर


डाउनलोड और विवरण के लिए वेबसाइट: Ice-graphics.com/ICEReader/IndexR.html

एसएपीआई परिवार के आधुनिक इंजनों का समर्थन करने वाली पाठ्य जानकारी देने के लिए सबसे शक्तिशाली सॉफ्टवेयर।

कार्यात्मक:

  • टेक्स्ट इनपुट न केवल विभिन्न तरीकों से उपलब्ध है।
  • टाइप किए गए टेक्स्ट का वॉयसओवर।
  • त्रुटियों के लिए पाठ की जाँच करता है और परिणाम प्रदर्शित करता है।
  • किसी भी चयनित एक्सटेंशन में कार्य के परिणाम को ऑडियो फ़ाइल में सहेजता है।
  • स्कोरिंग प्रक्रिया को स्थापित करने के लिए इसकी महान कार्यक्षमता है: गति से समय तक।
  • रूसी के लिए अच्छा समर्थन, निरंतर अद्यतन और कार्य तंत्र में सुधार।
  • विंडोज परिवार के ऑपरेटिंग सिस्टम के सभी आधुनिक संस्करणों के साथ काम करता है।
  • 250,000 पुस्तकों के पुस्तकालय का प्रबंधन करने और उनमें निहित जानकारी को संसाधित करने में सक्षम।

बातूनी आदमी

सुविधाजनक सॉफ्टवेयर जिसमें काफी सरल सहज ज्ञान युक्त अंतरफलक है, जिसे नवीनतम एमएस एजेंट प्रौद्योगिकी के आधार पर बनाया गया है। SAPI परिवार के इंजनों का समर्थन करता है। बड़ी संख्या में आवश्यक कार्य हैं।

कार्यक्रम की विशेषताएं:

  • विभिन्न फ़ाइल एक्सटेंशन चला सकते हैं और सहेज सकते हैं।
  • कमांड लाइन का उपयोग करके प्रबंधन करना संभव है।
  • यह स्वचालित रूप से एक्सप्लोरर में एम्बेडेड होता है और फ़ाइल पर क्लिक करके खुलता है।
  • परिणामों को सुनने के लिए अंतर्निहित खिलाड़ी का समर्थन करता है।
  • एप्लिकेशन में अतिरिक्त मनोरंजन तत्व हैं।
  • कार्यक्रम की आवाज और काम के परिणाम को एक ऑडियो फाइल में रिकॉर्ड किया जा सकता है।
  • अच्छा रूसी समर्थन।
  • विंडोज परिवार के ऑपरेटिंग सिस्टम के आधुनिक संस्करणों के साथ काम करता है।

RussAcc

सेवा को डाउनलोड करने और स्थापित करने के लिए वेबसाइट: bzsoft.spb.ru/russacc.html

ऑडियोबुक बनाने की अतिरिक्त क्षमता के साथ पाठ्य जानकारी देने के लिए एक प्रभावी कार्यक्रम।

कार्यात्मक:

  • विभिन्न स्रोतों से ग्रंथों का प्लेबैक: मैनुअल इनपुट, बड़ी संख्या में उपलब्ध प्रारूपों की फाइलें डाउनलोड करना।
  • उच्च गुणवत्ता उच्चारण और तनावों का सही स्थान।
  • कंप्यूटर स्क्रीन से किताबें पढ़ता है, और आप इस समय संपादित कर सकते हैं।
  • विशेषताओं की पसंद के साथ विभिन्न एक्सटेंशन की ध्वनि फ़ाइलों को रिकॉर्ड करने का एक अनूठा कार्य है।
  • एप्लिकेशन के डिज़ाइन और स्वरूप को अनुकूलित करने के लिए बढ़िया कार्यक्षमता।
  • रूसी के लिए उत्कृष्ट भाषण समर्थन।
  • विंडोज परिवार के ऑपरेटिंग सिस्टम के सभी आधुनिक संस्करणों में काम करता है।

एक उच्च गुणवत्ता वाला पाठक, जो बीटा परीक्षण में है, लेकिन पहले से ही बहुत अच्छी कार्यक्षमता और सुविधाएँ प्रदान करता है।

इस बात से सहमत हैं कि आप किताब तभी पढ़ सकते हैं जब आप बैठे हों, मिनीबस या मेट्रो में खाना खा रहे हों, लेकिन तब नहीं जब आप बाइक चला रहे हों या जॉगिंग कर रहे हों। इसके अलावा, जब आपकी आंखें बहुत थकी हुई हों तो पढ़ना बहुत हानिकारक है। एप्लिकेशन "रीडर" आपको इन सभी समस्याओं में मदद करेगा। यह सेंटर फॉर स्पीच टेक्नोलॉजीज द्वारा बनाया गया था और टेक्स्ट को आवाज देने के लिए इसका अपना इंजन है। इसके अलावा, आपको कम से कम 6 अलग-अलग आवाजों के विकल्प की पेशकश की जाती है जो पाठ को पूरी तरह से आवाज देती हैं। सबसे दिलचस्प बात यह है कि यह न केवल पाठ को पढ़ रहा है, बल्कि पाठ को सहजता से पढ़ने का प्रयास काफी श्रव्य है।

एप्लिकेशन लॉन्च करने के बाद, आपको एक संक्षिप्त निर्देश दिखाया जाएगा, जिसे आपको ध्यान से पढ़ना चाहिए। आप एप्लिकेशन में EPUB, TXT, FB2 और RTF स्वरूपों में कोई भी पुस्तक जोड़ सकते हैं। मुख्य स्क्रीन एक बुकशेल्फ़ है जिस पर 3 पहले से तैयार किताबें हैं। एक नई किताब जोड़ने के लिए, शीर्ष पट्टी पर प्लस चिह्न पर क्लिक करें, और फिर अपने डिवाइस पर उस पुस्तक का चयन करें जिसकी आपको आवश्यकता है। यदि आप पहले से जोड़ी गई किसी पुस्तक को संपादित करना चाहते हैं, तो उस पर अपनी उँगली पकड़ें, और फिर आवश्यक फ़ील्ड भरें। जब आप कोई पुस्तक खोलते हैं और यदि वह पहली बार खुलती है, तो आपको तब तक प्रतीक्षा करनी होगी जब तक कि वाक् इंजन के लिए पुस्तक का पाठ संसाधित नहीं हो जाता। पाठक का इंटरफ़ेस बहुत ही सरल और न्यूनतर है। केंद्र में पाठ है, बाईं ओर स्क्रीन की चमक को समायोजित करने के लिए एक स्लाइडर है, और दाईं ओर पढ़ने की गति का समायोजन है। निचला पैनल चयनित पठन गति पर पृष्ठ संख्या और घंटों की कुल संख्या दिखाता है। केवल एक चीज जो असुविधाजनक है, वह है आसानी से रिवाइंड करने और पृष्ठ का चयन करने की क्षमता का अभाव। आप केवल मोटे तौर पर एक पृष्ठ का चयन कर सकते हैं। किताब खोलने के बाद पहला कदम हैड आइकन पर क्लिक करना है और उस आवाज का चयन करना है जिसे आप डाउनलोड करना चाहते हैं। साथ ही पाठक के निचले पैनल पर आपको पुस्तक की सामग्री को देखने की क्षमता मिलेगी और आप सेटिंग में जा सकते हैं।

सेटिंग्स में, आप टेक्स्ट का फ़ॉन्ट, आकार और पृष्ठभूमि का रंग बदल सकते हैं। एप्लिकेशन वर्तमान में बीटा परीक्षण में है, इसलिए कृपया ध्यान दें कि यह सभी उपकरणों पर ठीक से काम नहीं कर सकता है। आइए संक्षेप में कहें: "रीडर" अपने स्वयं के वॉयस इंजन के साथ एक बहुत ही उच्च गुणवत्ता वाला पाठक है, जो अब भी इसे सौंपे गए कार्यों के साथ पूरी तरह से मुकाबला करता है। उपयोग करके खुश!
ऐसा एप्लिकेशन डाउनलोड करें जो पुस्तकों और दस्तावेजों को ध्वनि (जोर से पढ़ता है) - Android के लिए रीडरआप नीचे दिए गए लिंक का अनुसरण कर सकते हैं।

डेवलपर: भाषण प्रौद्योगिकी केंद्र
प्लेटफार्म: एंड्रॉइड 4.0 और इसके बाद के संस्करण
इंटरफ़ेस भाषा: रूसी (RUS)
शर्त: नि: शुल्क (मुक्त)
जड़: जरूरत नहीं



सभी स्वास्थ्य!

लोक ज्ञान: "प्राचीन काल से, एक किताब एक व्यक्ति को उठाती है" ...

जो कोई भी आधुनिक डिजिटल दुनिया के बारे में कुछ भी कहता है, वह कागज जल्द ही खत्म हो जाएगा, आदि। फिर भी, मेरी राय में, किताबें आने वाले लंबे समय के लिए उपयोगी और प्रासंगिक होंगी। इसके विपरीत, आधुनिक प्रौद्योगिकियां आपको उन पुस्तकों और सूचनाओं को खोजने में मदद करती हैं जिनकी आपको अधिक तेज़ी से और आसानी से आवश्यकता होती है। अब, वैसे, आप एक टैबलेट पर एक संपूर्ण पुस्तकालय डाउनलोड कर सकते हैं, और कहीं भी इससे परिचित हो सकते हैं, उदाहरण के लिए, काम करने के रास्ते पर, घर पर, स्कूल में, आदि!

लेकिन एक और प्लस है जो आधुनिक सॉफ्टवेयर हमें देता है - वह है किताबों को सुनने की क्षमता, जैसे कि वे आपको एक जीवित व्यक्ति द्वारा पढ़ी जा रही हों! आधुनिक आवाज इंजन आपको पुरुष, महिला, बच्चों की आवाज में पाठ सुनने की अनुमति देते हैं। नीचे दी गई हर चीज़ पर अधिक...

महत्वपूर्ण!नीचे प्रस्तुत कार्यक्रमों के लिए आपके पुस्तक के पाठ (पत्रिका, समाचार पत्र, आदि) को पढ़ने में सक्षम होने के लिए, एक आवाज इंजन की आवश्यकता है। वे। काम करने के लिए आपको एक पाठक + इंजन की आवश्यकता है! वैसे, पढ़ने की गुणवत्ता सीधे इंजन पर निर्भर करती है (ताकि "बी-मी" न हो, आपको एक अच्छा वॉयस इंजन चुनने की आवश्यकता है)।इस लेख के दूसरे भाग में इंजनों के बारे में विस्तार से।

पढ़ने का कार्यक्रम चुनना

(नोट: पाठ पढ़ने के लिए)

गोवोरिल्का

आवाज से पाठ पढ़ने के लिए डिज़ाइन किया गया एक बहुत छोटा कार्यक्रम। प्रोग्राम विभिन्न भाषाओं में टेक्स्ट पढ़ सकता है, जिसके आधार पर आप किस वॉयस इंजन से जुड़ते हैं। आपको MP3 फ़ाइलें बनाने की अनुमति देता है (उदाहरण के लिए, ऑडियोबुक बनाना, जो हाल ही में इतना लोकप्रिय है)।

टॉकर प्रोग्राम की मुख्य विंडो

प्रमुख विशेषताऐं:

  1. विभिन्न फाइलों से पाठ पढ़ना: डॉस और विंडोज एन्कोडिंग; पठनीय पाठ आकार में 2 जीबी हो सकता है; वर्ड, एचटीएमएल फाइलें खोलता है;
  2. पढ़ने की गति, आवाज की ऊंचाई, मात्रा, आदि को समायोजित करने की क्षमता;
  3. एमपी 3 प्रारूप में पठनीय पाठ रिकॉर्ड करने की क्षमता (वैसे, आप बढ़ी हुई गति से रिकॉर्ड कर सकते हैं);
  4. प्रोग्राम स्वचालित रूप से पुस्तक के पृष्ठों (पाठ) को फ़्लिप करता है जैसे आप पढ़ते हैं (और इसे आपको दिखाता है);
  5. अलग-अलग शब्दों और वाक्यांशों को सही करना संभव है, उन्हें कैसे सही ढंग से उच्चारण करने की आवश्यकता है;
  6. प्रोग्राम बंद करते समय - यह स्वचालित रूप से कर्सर की अंतिम स्थिति को याद रखता है;
  7. पूरी तरह से रूसी में, विंडोज 7, 8, 10 के सभी आधुनिक संस्करणों में काम करता है।

दुर्जनों का नेता

यह प्रोग्राम 2 इन 1 है: यह यूनिकोड सपोर्ट वाला टेक्स्ट एडिटर और SAPI4 / SAPI5 के सपोर्ट के साथ स्पीच सिंथेसाइज़र (यानी टेक्स्ट-टू-स्पीच सॉफ्टवेयर) दोनों है। नोट: इंजन के बारे में, लेख का दूसरा भाग देखें) कार्यक्रम अपने कई प्रतिस्पर्धियों से अलग है, क्योंकि। इसके विकास के दौरान, विशेष शब्दकोश प्रतिस्थापन एल्गोरिदम का उपयोग किया गया था, जो पठनीय पाठ के सही उच्चारण को प्रभावित करते हैं। डेमागोग शब्दविहीन वर्तनी जाँच को भी लागू करता है।

डेमागोग - उदाहरण पढ़ें // मुख्य विंडो

कार्यक्रम की मुख्य विशेषताएं:

  1. विभिन्न प्रारूपों से पाठ पढ़ना: एमएस वर्ड, ई-बुक और एचटीएमएल (चित्र आयात करने के लिए समर्थन);
  2. प्रारूपों में ऑडियो फ़ाइलों को रिकॉर्ड करने की क्षमता: WAV, MP3, OGG, WMA, MP4;
  3. कस्टम ऑडियो कोडेक्स कनेक्ट करने की क्षमता;
  4. वर्तनी त्रुटियों को उजागर करना;
  5. उच्चारण शब्दकोशों (डीआईसी प्रारूप) के लिए समर्थन, उन्हें संपादित करने की क्षमता;
  6. 100% रूसी भाषा का समर्थन;
  7. ओएस विंडोज एक्सपी, विस्टा, 7, 8, 10 (32/64 बिट्स) में काम करता है।

बालाबोल्का

"बालाबोल्का" कार्यक्रम का मुख्य उद्देश्य पुस्तकों, दस्तावेजों आदि के ग्रंथों को "जीवित मानव" स्वर में पढ़ना है। पढ़ने के लिए, आपके पीसी पर स्थापित किसी भी वॉयस इंजन का उपयोग किया जा सकता है।

प्रमुख विशेषताऐं:

  1. "सामान्य" रीडिंग (अन्य उपयोगिताओं के रूप में) के अलावा, "बालाबोल्का" क्लिपबोर्ड से टेक्स्ट पढ़ सकता है, विभिन्न दस्तावेजों से टेक्स्ट दिखा सकता है, कीबोर्ड पर टाइप किए गए टेक्स्ट का उच्चारण कर सकता है;
  2. फ़ाइल स्वरूपों की एक बड़ी संख्या का समर्थन करता है: AZW, AZW3, CHM, DjVu, DOC, DOCX, EPUB, FB2, HTML, LIT, MOBI, ODT, PDB, PDF, PRC, RTF, TCR, WPD;
  3. वर्तनी की जाँच कर सकते हैं, बड़े दस्तावेज़ों को कई छोटे दस्तावेज़ों में विभाजित कर सकते हैं, समरूपों की खोज कर सकते हैं;
  4. पाठ को ऑडियो फ़ाइल स्वरूपों के रूप में सहेजा जा सकता है: WAV, MP3, MP4, OGG और WMA;
  5. माइक्रोसॉफ्ट स्पीच एपीआई (एसएपीआई) से पैकेज के साथ काम करना जानता है;
  6. आप भाषण की गति और समय को बदल सकते हैं;
  7. रूसी भाषा के लिए पूर्ण समर्थन;
  8. ओएस: माइक्रोसॉफ्ट विंडोज एक्सपी/विस्टा/7/8/10।

आईसीई बुक रीडर

ICE बुक रीडर टेक्स्ट पढ़ने के लिए सबसे शक्तिशाली कार्यक्रमों में से एक है (ऑरलली और बस पीसी स्क्रीन से)। मुख्य लाभों में से एक: कार्यक्रम आपकी दृष्टि को बचाता है, जिससे आपको पुस्तक से पाठ के प्रदर्शन को अनुकूलित करने का अवसर मिलता है ताकि यह आपके लिए सबसे सुविधाजनक हो (फ़ॉन्ट आकार, इंडेंटेशन, रंग, आदि - दर्जनों विभिन्न पैरामीटर)।

किताब पढ़ने का उदाहरण

जहाँ तक उपयोगकर्ता के लिए ज़ोर से किताबें पढ़ने का सवाल है, ICE बुक रीडर, निश्चित रूप से ऐसा कर सकता है (अन्यथा मैं इसे समीक्षा में शामिल नहीं करता)। SAPI4 और SAPI5 वॉयस इंजन का समर्थन करता है।

पढ़ने के अलावा, यह किताब से एमपी3/डब्ल्यूएवी फाइलें बना सकता है (जिसे बाद में किसी भी एमपी3 प्लेयर पर सुना जा सकता है)। एमपी 3 किताबें बनाते समय, आपको बड़ी WAV फ़ाइलों को संग्रहीत करने की आवश्यकता नहीं होती है - कार्यक्रम उन्हें मक्खी पर एमपी 3 में बदल देता है। वैसे, मल्टी-थ्रेडेड कर्नेल के लिए धन्यवाद, प्रोग्राम बहुत जल्दी एक ऑडियोबुक बना सकता है: कई स्पीच सिंथेसिस मॉड्यूल (एसएपीआई) एक साथ पूरी किताब को "बोल" सकते हैं।

अंतिम लेकिन कम से कम, ICE बुक रीडर आपको अपनी पुस्तक हार्ड ड्राइव को साफ करने की अनुमति देता है: 250,000 पुस्तकों की जानकारी को प्रबंधित करने का एक तरीका! कार्यक्रम विंडोज के सभी लोकप्रिय संस्करणों में काम करता है: XP, 7, 8, 10।

बातूनी आदमी

डेवलपर साइट: http://govorunplus.narod.ru/

MS Agent 2.0 तकनीक पर आधारित एक सरल और विश्वसनीय प्रोग्राम। वाक् संश्लेषण के लिए, यह आपके सिस्टम में मौजूद किसी भी SAPI इंजन का उपयोग कर सकता है। कार्यक्रम का डिज़ाइन चमकता नहीं है, लेकिन यह काफी मूल है (नीचे स्क्रीन)। हां, और कार्यक्रम काफी बहुक्रियाशील है (इसलिए यह ऐसा मामला है जब पहली नज़र में निष्कर्ष निकालना समय से पहले होता है!)

कार्यक्रम की विशेषताएं:

  1. फ़ाइल स्वरूपों को पढ़ता और सहेजता है: TXT, RTF (वर्ड के किसी भी संस्करण में तैयार किया जा सकता है);
  2. कमांड लाइन के साथ काम करने की क्षमता;
  3. फ़ाइल पर राइट-क्लिक करके पाठ पढ़ने के लिए एक्सप्लोरर में एकीकृत करने की क्षमता (केवल विन 98/एमई, एनटी, 2000, एक्सपी द्वारा समर्थित);
  4. एक अंतर्निहित मीडिया प्लेयर है;
  5. कार्यक्रम में चुटकुले, सूत्र, हास्य, आदि शामिल हैं - आप कभी ऊब नहीं पाएंगे;
  6. WAV फ़ाइल में प्रतिलिपि प्रस्तुत करने योग्य भाषण रिकॉर्ड किया जा सकता है;
  7. कार्यक्रम को स्वयं द्वारा अनुकूलित किया जा सकता है: रंग, डिज़ाइन, फोंट, आदि;
  8. रूसी में, विंडोज एक्सपी, 7, 8, 10 में काम करता है।

RussAcc

ज़ोर से पाठ पढ़ने और ऑडियो पुस्तकें बनाने के लिए एक बहुत तेज़ और सुविधाजनक कार्यक्रम (इसमें कई प्रारूप हैं, विशेष रूप से समान सॉफ़्टवेयर की तुलना में: wav, mp3, amr, aac)। इसके अलावा, कार्यक्रम आपको ग्रंथों में तनाव को सही ढंग से रखने और पीसी स्क्रीन से किताबें पढ़ने की अनुमति देता है। कार्यक्रम में एक अंतर्निहित संपादक और इसके द्वारा पुन: प्रस्तुत किया गया कोई भी पाठ है - आप इसे संपादित कर सकते हैं।

मुख्य कार्यक्रम विंडो // RussAcc

प्रोग्राम सेटिंग्स में, आप फ़ॉन्ट आकार सेट कर सकते हैं, रंग निर्दिष्ट कर सकते हैं जिसके साथ पठनीय टुकड़े को हाइलाइट करना है। आप MP3 रिकॉर्डिंग पैरामीटर निर्दिष्ट और कॉन्फ़िगर कर सकते हैं: बिट दर, बिट्स की संख्या, आदि।

RussAcc सभी लोकप्रिय साउंड इंजनों का समर्थन करता है और उनके साथ काम करता है। अपने स्वयं के डेटाबेस में, प्रत्येक शब्द के लिए कार्यक्रम के अलग-अलग परिस्थितियों में उच्चारण के साथ अपने विशेष रूप होते हैं (3 मिलियन से अधिक रूप!)

वैसे, RussAcc fb2 जैसे लोकप्रिय ई-बुक प्रारूप का समर्थन करता है (और इसे नियमित txt फ़ाइल में भी परिवर्तित कर सकता है)। नए ओएस विंडोज 7, 8.1, 10 के साथ संगत रूसी भाषा का समर्थन करता है।

आवाज इंजन: पुरुष और महिला

भाषण इंजन - यह विशेष सॉफ्टवेयर है, एक प्रकार का ड्राइवर, जो कंप्यूटर को "बोलने" के लिए आवश्यक है (यानी, पाठ को भाषण में बदलने के लिए)। नेटवर्क में अब सैकड़ों इंजन हैं: पेड और फ्री दोनों हैं। सर्वोत्तम पठन गुणवत्ता, निश्चित रूप से, भुगतान किए गए इंजनों द्वारा दिखाई जाती है।

महत्वपूर्ण लेख: वाक् संश्लेषण इंजन में कोई डिज़ाइन या इंटरफ़ेस नहीं होता है। इसे सिस्टम में स्थापित करने के बाद - आपको कोई भी बदलाव दिखाई नहीं देगा! इंजन के साथ काम करने के लिए, आपको ग्रंथों को पढ़ने के लिए किसी प्रकार के कार्यक्रम की आवश्यकता होती है: बालाबोल्का, गोवोरुन, आइस रीडर, आदि, थोड़ा अधिक मैंने उन लोगों का हवाला दिया जो "मुझे पसंद हैं")।

इसीलिए, वैसे, उपयोगकर्ता अक्सर इस या उस प्रोग्राम को डांटते हैं कि वह रूसी पाठ नहीं पढ़ सकता (या बिल्कुल नहीं)। वे बस एक भाषण इंजन स्थापित करने की आवश्यकता के बारे में भूल जाते हैं।

मानकों के बारे में कुछ शब्द ...

वॉयस इंजन को विभिन्न मानकों (तथाकथित) में लागू किया जा सकता है, सबसे बुनियादी तीन हैं: एसएपीआई 4, एसएपीआई 5 या माइक्रोसॉफ्ट स्पीच प्लेटफॉर्म (नोट: लगभग हर पाठक में, आप एक भाषण इंजन चुन सकते हैं).

एसएपीआई 4

एक ठोस मानक, दस साल पहले प्रासंगिक था। आज यह पुराना हो चुका है, और आधुनिक कंप्यूटर/लैपटॉप पर इसका उपयोग उचित नहीं है।

एसएपीआई 5

माइक्रोसॉफ्ट स्पीच प्लेटफार्म

Microsoft स्पीच प्लेटफ़ॉर्म डेवलपर टूल का एक बड़ा सेट है जो टेक्स्ट-टू-स्पीच क्षमताओं को सक्षम करता है।

उपकरणों का एक सेट है जो विभिन्न अनुप्रयोगों के डेवलपर्स को पाठ को आवाज में बदलने की क्षमता को लागू करने की अनुमति देता है।

टिप्पणी! वाक् सिंथेसाइज़र के काम करने के लिए, आपको यह करना होगा:

Microsoft स्पीच प्लेटफ़ॉर्म - रनटाइम - प्लेटफ़ॉर्म का सर्वर भाग जो प्रोग्राम के लिए API प्रदान करता है;
Microsoft भाषण प्लेटफ़ॉर्म - रनटाइम भाषाएँ - सर्वर साइड के लिए भाषाएँ।

टेक्स्ट-टू-स्पीच इंजन डिगालो // निकोलाई

वेबसाइट: http://www.digalo.com/index.htm

बहुत लोकप्रिय रूसी आवाज इंजन (पुरुष आवाज!)। अधिकांश कार्यक्रमों के लिए उपयुक्त है जो आवाज से पाठ पढ़ सकते हैं। मेरी विनम्र राय में, सर्वश्रेष्ठ सार्वजनिक भाषण संश्लेषण इंजनों में से एक (रूसी में)। रूसी के अलावा, वैसे, डेवलपर की वेबसाइट पर कई और भाषाओं के इंजन उपलब्ध हैं। माइनस: पंजीकरण के बिना, यह केवल दो सप्ताह के लिए काम करता है।

वेबसाइट: http://www.acapela-group.com/

Alenka Acapela की अपेक्षाकृत नई रूसी महिला भाषण इंजन है। 22 kHz की आवृत्ति के साथ SAPI-5 मानक के अनुसार काम करता है। कुछ यूजर्स का मानना ​​है कि अलीना की आवाज निकोलाई से ज्यादा अच्छी है।

डेवलपर कंपनी: स्कैनसॉफ्ट रियलस्पीक

एक महिला आवाज के साथ बहुत अच्छा भाषण इंजन। इंजन को अंतिम रूप देने के बाद, यह "निकोलाई" के बराबर हो गया। इंजन का ध्वन्यात्मक आधार एक महत्वपूर्ण अद्यतन से गुजरा है, तनाव सेट करने के लिए एल्गोरिथ्म को बदल दिया गया है (जिसका ध्वनि पर सकारात्मक प्रभाव पड़ा), और उच्चारण की गति के साथ समस्या को ठीक कर दिया गया है।

वेबसाइट: http://tiflo.info/rhvoice/

RHVoice एक खुला स्रोत बहुभाषी वाक् सिंथेसाइज़र है। विंडोज और लिनक्स ओएस पर इस्तेमाल किया जा सकता है। सिंथेसाइज़र SAPI5 के साथ संगत है। सिंथेसाइज़र डेवलपर - ओल्गा याकोवलेवा।

वैसे, इंजन स्पीकर द्वारा रिकॉर्ड किए गए स्पीच बेस पर आधारित है। रूसी आवाज "एलेना" और "इरिना" आधिकारिक वेबसाइट पर डाउनलोड के लिए उपलब्ध हैं।

इवोना तातियाना/मैक्सिम

वेबसाइट: https://www.ivona.com/us/about-us/voice-portfolio/

बहुत ही रोचक युवा आवाज इंजन (उनमें से 2 हैं: नर और मादा आवाज)। कई लोग तात्याना की आवाज़ को सर्वश्रेष्ठ में से एक मानते हैं (यदि सर्वश्रेष्ठ नहीं!) ऊपर दिए गए लिंक का उपयोग करके, आप सुन सकते हैं कि आपके ग्रंथ कैसे ध्वनि करेंगे, इसलिए बोलने के लिए, एक पोर्टफोलियो (मेरी राय में, वे बहुत अच्छे लगते हैं)।

क्या इंजन सबसे अधिक इस्तेमाल किया जाएगा - मुझे नहीं पता, समय बताएगा!

वैसे, क्या आपको लगता है कि एक भाषण इंजन कभी विकसित होगा जो एक सामान्य व्यक्ति की आवाज से अलग नहीं है? या शायद यह पहले से मौजूद है, लेकिन मैंने इसके बारे में नहीं सुना है ... (नाम फेंक दो!)

अभी के लिए बस इतना ही, शुभकामनाएँ!

भाषण सिंथेसाइज़र कार्यक्रम हर साल हमारे जीवन का अधिक से अधिक हिस्सा बनते जा रहे हैं। वे हमें विदेशी भाषाओं को अधिक अच्छी तरह से सीखने की अनुमति देते हैं, ग्रंथों का एक सुविधाजनक ऑडियो प्रारूप में अनुवाद करते हैं, विभिन्न उपयोगिता कार्यक्रमों की कार्यक्षमता में उपयोग किए जाते हैं, और बहुत कुछ। और जब हम में से कुछ को ऑडियो प्रारूप में कुछ पाठ को ऑनलाइन पुन: पेश करने की आवश्यकता होती है, तो हम में से कई विभिन्न भाषण संश्लेषण सेवाओं और कार्यक्रमों की ओर रुख करते हैं जो हमें वहां आवश्यक पाठ को बदलने में मदद कर सकते हैं। इस लेख में मैं ऐसे उत्पादों के नेटवर्क संस्करणों के बारे में बात करूंगा, वर्णन करूंगा कि ऑनलाइन भाषण सिंथेसाइज़र क्या है, ऑनलाइन भाषण संश्लेषण सेवाएं क्या मौजूद हैं, और उनका उपयोग कैसे करें।

प्रारंभ में, दृष्टिहीन लोगों के लिए कंप्यूटर आवाज का उपयोग करके पाठ को पुन: उत्पन्न करने के लिए भाषण सिंथेसाइज़र विकसित किए गए थे। लेकिन धीरे-धीरे, बड़े पैमाने पर दर्शकों द्वारा उनके फायदे की सराहना की गई, और अब लगभग कोई भी पीसी पर भाषण सिंथेसाइज़र डाउनलोड कर सकता है, या ऑपरेटिंग सिस्टम के कुछ संस्करणों में मौजूद विकल्पों का उपयोग कर सकता है।

तो आप कौन सा ऑनलाइन स्पीच सिंथेसाइज़र चुन सकते हैं? नीचे मैं कई सेवाओं की सूची दूंगा जो आपको टेक्स्ट-टू-स्पीच ऑनलाइन खेलने की अनुमति देती हैं।

इवोना एक बेहतरीन सिंथेसाइज़र है

इस ऑनलाइन सेवा के वॉयस इंजन बहुत उच्च गुणवत्ता वाले हैं, एक अच्छा ध्वन्यात्मक आधार है, ध्वनि काफी स्वाभाविक है, और "धातु" कंप्यूटर की आवाज प्रतिस्पर्धी सेवाओं की तुलना में यहां बहुत कम महसूस की जाती है।

इवोना सेवा में कई भाषाओं का समर्थन है, रूसी संस्करण में एक पुरुष आवाज (मैक्सिम) और एक महिला आवाज (तात्याना) है।

  1. वाक् सिंथेसाइज़र का उपयोग करने के लिए, इस संसाधन में लॉग इन करें, बाईं ओर एक विंडो होगी जिसमें आपको पढ़ने के लिए पाठ सम्मिलित करना होगा।
  2. टेक्स्ट डालें, व्यक्ति के नाम के साथ बटन पर क्लिक करें, भाषा (रूसी) और उच्चारण विकल्प (महिला या पुरुष) का चयन करें और "प्ले" बटन पर क्लिक करें।

दुर्भाग्य से, साइट की मुफ्त कार्यक्षमता 250 वर्णों के वाक्य तक सीमित है, और पाठ के साथ गंभीर कार्य की तुलना में सेवा की क्षमताओं को प्रदर्शित करने के लिए अधिक अभिप्रेत है। केवल एक शुल्क के लिए महान अवसर प्राप्त किए जा सकते हैं।

अकापेला - वाक् पहचान सेवा

एक कंपनी जो विभिन्न तकनीकी समाधानों के लिए अपने वॉयस इंजन बेचती है, आपको ऑनलाइन अकापेला स्पीच सिंथेसाइज़र का उपयोग करने की पेशकश करती है। यद्यपि इस सेवा की अभिव्यंजना इवोना जितनी ऊँची नहीं है, फिर भी, यहाँ उच्चारण की गुणवत्ता भी बहुत अच्छी है। Acapela संसाधन 34 भाषाओं में लगभग 100 आवाज़ों का समर्थन करता है।

  1. संसाधन की कार्यक्षमता का उपयोग करने के लिए, निर्दिष्ट सेवा खोलें, बाईं ओर विंडो में रूसी का चयन करें (एक भाषा चुनें - रूसी)।
  2. नीचे वांछित टेक्स्ट डालें और "सुनो" बटन पर क्लिक करें (सुनो)।

ऑडियो रीडिंग के लिए अधिकतम टेक्स्ट साइज 300 कैरेक्टर है।

टेक्स्ट से भाषण - ऑनलाइन सेवा

आप टेक्स्ट टू स्पीच का ऑनलाइन अनुवाद करने के लिए टेक्स्ट से वाक् सेवा का भी उपयोग कर सकते हैं। यह टेक्स्ट को एमपी3 ऑडियो फाइल में बदलने के सिद्धांत पर काम करता है, जिसे आप अपने कंप्यूटर पर डाउनलोड कर सकते हैं। सेवा 50,000 वर्णों के पाठ रूपांतरण का समर्थन करती है, जो कि काफी बड़ी राशि है।

  1. पाठ से वाक् सेवा के साथ काम करने के लिए, उस पर जाएं, "भाषा चुनें" विकल्प में, "रूसी" चुनें (यहां केवल एक आवाज है - वेलेंटीना)।
  2. एक बड़ी विंडो में, वॉयस एक्टिंग के लिए आवश्यक टेक्स्ट दर्ज करें (पेस्ट करें), फिर "ऑडियो फाइल बनाएं" बटन पर क्लिक करें।
  3. पाठ संसाधित किया जाएगा, फिर आप परिणाम सुन सकते हैं, और फिर इसे अपने पीसी पर डाउनलोड कर सकते हैं।
  4. ऐसा करने के लिए, "ऑडियो फ़ाइल डाउनलोड करें" पर राइट-क्लिक करें और दिखाई देने वाले मेनू से "इस रूप में लक्ष्य सहेजें" चुनें।

Google अनुवाद का भी उपयोग किया जा सकता है

प्रसिद्ध Google अनुवादक ऑनलाइन में एक अंतर्निहित टेक्स्ट-टू-स्पीच फ़ंक्शन है, और यहां पढ़े जाने वाले टेक्स्ट की मात्रा बहुत अधिक हो सकती है।

  1. इसके साथ काम करने के लिए, इस सेवा में लॉग इन करें (यहां)।
  2. बाईं ओर विंडो में रूसी भाषा का चयन करें, और "सुनो" के नीचे स्पीकर वाले बटन पर क्लिक करें।

प्लेबैक गुणवत्ता काफी सहनीय स्तर पर है, लेकिन अब और नहीं।

टेक्स्ट-टू-स्पीच - ऑनलाइन स्पीच सिंथेसाइज़र

एक अन्य संसाधन जो सामान्य गुणवत्ता का वाक् संश्लेषण करता है। नि: शुल्क कार्यक्षमता 1000 वर्ण टाइपिंग तक सीमित है।

  1. सेवा के साथ काम करने के लिए, इस साइट पर जाएं, दाईं ओर विंडो में, "भाषा" विकल्प (भाषा) के बगल में, रूसी का चयन करें।
  2. विंडो में, आवश्यक टेक्स्ट टाइप करें (या किसी बाहरी स्रोत से कॉपी करें), और फिर दाईं ओर "से इट" बटन पर क्लिक करें।
  3. निर्दिष्ट पाठ के उच्चारण के लिए एक लिंक आपके ई-मेल या वेब पेज में भी नीचे "हां" बटन पर क्लिक करके रखा जा सकता है।

टेक्स्ट-टू-स्पीच के लिए वैकल्पिक पीसी सॉफ्टवेयर

टेक्स्ट स्पीचप्रो ऑडियोबुकमेकर, ईस्पीक, वॉयस रीडर 15, वॉयस और कई अन्य जैसे भाषण संश्लेषण कार्यक्रम भी हैं जो टेक्स्ट को भाषण में परिवर्तित कर सकते हैं। उन्हें आपके कंप्यूटर पर डाउनलोड और इंस्टॉल करने की आवश्यकता होती है, और इन उत्पादों की कार्यक्षमता और क्षमताएं आमतौर पर मानी जाने वाली ऑनलाइन सेवाओं की क्षमताओं से थोड़ी अधिक होती हैं। उनका विस्तृत विवरण एक अलग व्यापक सामग्री के योग्य है।

निष्कर्ष

तो कौन सा भाषण सिंथेसाइज़र ऑनलाइन चुनना है? उनमें से ज्यादातर में, मुफ्त सुविधाएं काफी सीमित हैं, और ध्वनि की गुणवत्ता के मामले में, इवोना सेवा अपने प्रतिस्पर्धियों को पीछे छोड़ देगी। यदि आप अपने पाठ को एक ऑडियो फ़ाइल में शीघ्रता से अनुवाद करने की संभावना में रुचि रखते हैं, तो "पाठ्य से वाक्" संसाधन का उपयोग करें - यह काफी कम समय में अच्छी गुणवत्ता वाला परिणाम देता है।

संपर्क में