ElevenLabs Launch : अमेरिका की वॉइस और ऑडियो टेक कंपनी ElevenLabs ने अपना नया और सबसे एडवांस्ड Speech-to-Text मॉडल Scribe v2 Realtime पेश किया है। यह मॉडल बहुत तेजी से बोले गए शब्दों को टेक्स्ट में बदल देता है। कंपनी का कहना है कि यह मॉडल 93.5% सटीकता के साथ सिर्फ 150 मिलीसेकंड में ट्रांसक्रिप्शन करता है।
Scribe v2 Realtime मॉडल से अब बोले गए शब्द तुरंत टेक्स्ट में बदलेंगे, ElevenLabs ने भारत के लिए खास डेटा सुरक्षा विकल्प और 90 से ज्यादा भाषाओं का सपोर्ट दिया है।
भारत की 11 भाषाएं शामिल
Scribe v2 Realtime 90 से ज्यादा भाषाओं में काम करता है, जिनमें भारत की हिंदी, तमिल, बंगाली और तेलुगू समेत 11 भाषाएं जैसी प्रमुख लैंग्वेज शामिल हैं। यह मॉडल रियल टाइम में ट्रांसक्रिप्शन करता है जिससे डेवलपर्स और कंपनियां कस्टमर सपोर्ट, मीडिया, मेडिकल और एजुकेशन जैसे क्षेत्रों में इसका इस्तेमाल कर सकती हैं।
रियल टाइम कम्युनिकेशन के नए मानक
Scribe v2 Realtime में Negative Latency Prediction, Text Conditioning और Manual Commit Control जैसी एडवांस तकनीकें दी गई हैं। ये फीचर्स मॉडल को और अधिक सटीक और तेज बनाते हैं। इसका उपयोग लाइव ट्रांसक्रिप्शन, कैप्शनिंग, कंप्लायंस मॉनिटरिंग और मेडिकल डिक्टेशन जैसे कामों में किया जा सकता है।
READ MORE: मरे हुए पिता से बातचीत कर रहा है ये इंसान
भारत के लिए खास डेटा सुरक्षा सुविधा
ElevenLabs ने भारत के लिए India Data Residency Option भी जोड़ा है, जिससे कंपनियां अपने डेटा को देश के अंदर ही सुरक्षित रख सकती हैं और स्थानीय डेटा नियमों का पालन कर सकती हैं। इसके अलावा, ElevenLabs Agents के साथ इसका इंटीग्रेशन डेवलपर्स को AI चैट और वॉइस बेस्ड ऐप्स बनाने में मदद करेगा।
खास फीचर्स और उपयोग
इस मॉडल में Voice Activity Detection (VAD), Smart Speaker Diarisation, Custom Vocabulary और Zero Retention Mode जैसी खूबियां हैं, जो संवेदनशील डेटा की सुरक्षा सुनिश्चित करती हैं।
READ MORE: यूनिवर्सल और वार्नर म्यूजिक AI कंपनियों के साथ कर रहे ऐतिहासिक समझौते
डेवलपर्स के लिए इसका नया ElevenLabs API जारी किया गया है जिसकी जानकारी और डिप्लॉयमेंट ऑप्शन elevenlabs.io/docs/capabilities/speech-to-text पर उपलब्ध हैं।
