MAI-Voice-1 और MAI-1-preview के जरिए Microsoft AI अब पॉडकास्ट, इंटरैक्टिव स्टोरीटेलिंग और टेक्स्ट क्वेरी में नए अनुभव ला रहा है।
Microsoft MAI AI models: Microsoft AI (MAI) ने हाल ही में दो नए AI मॉडल पेश किए हैं, जो Copilot और अन्य AI अनुभवों को और भी प्रभावशाली बनाने के लिए डिज़ाइन किए गए हैं। कंपनी का कहना है कि ये मॉडल उपयोगकर्ताओं को अधिक उच्च गुणवत्ता वाली आवाज़ और उन्नत निर्देश–अनुसरण क्षमताएं प्रदान करेंगे, जो पॉडकास्ट, इंटरैक्टिव स्टोरीटेलिंग और अन्य एप्लिकेशन में इस्तेमाल हो सकें।
MAI-Voice-1: अभिव्यक्तिपूर्ण आवाज़ उत्पन्न करना
MAI-Voice-1 Microsoft का पहला अत्यंत अभिव्यक्तिपूर्ण स्पीच जेनरेशन सिस्टम है। यह एक सेकंड में एक मिनट तक का ऑडियो उत्पन्न करने में सक्षम है और एक ही GPU पर उच्च गुणवत्ता वाली आवाज़ प्रदान करता है। यह मॉडल एकल और बहु–स्पीकर परिदृश्यों के लिए ऑप्टिमाइज्ड है। MAI-Voice-1 पहले ही Copilot Daily और Podcasts फीचर्स में इंटीग्रेट हो चुका है। इसके अलावा, Copilot Labs में इसे प्रयोग करने के लिए भी उपलब्ध कराया गया है, जहां उपयोगकर्ता इंटरैक्टिव “चुने अपनी कहानी” जैसी एप्लिकेशन या गाइडेड मेडिटेशन आज़मा सकते हैं।
Read More: Microsoft का बड़ा बयान, AI से बढ़ेगी इंसानों की क्षमता
MAI-1-preview: निर्देश-अनुसरण और परीक्षण
दूसरा मॉडल, MAI-1-preview, लगभग 15,000 NVIDIA H100 GPUs पर प्रशिक्षित मिक्स–ऑफ–एक्सपर्ट्स फाउंडेशन मॉडल है। यह टेक्स्ट आधारित क्वेरी के लिए निर्देश–अनुसरण क्षमताएं प्रदान करता है और इसे Copilot टेक्स्ट परिदृश्यों और LMArena जैसे कम्युनिटी प्लेटफॉर्म पर परीक्षण के लिए बनाया गया है।
Read More: Google Vs Microsoft: टेक इंडस्ट्री की नई जंग, किसे मिलेगी बादशाहत?
Microsoft ने बताया कि ये दोनों मॉडल केवल शुरुआती कदम हैं। कंपनी अगले चरण में GB200 क्लस्टर का उपयोग करके बड़े पैमाने पर मॉडल डेवलपमेंट और डिप्लॉयमेंट करेगी। MAI अपने घरेलू मॉडल, पार्टनर तकनीकों और ओपन–सोर्स इनोवेशन के मिश्रण से हर दिन लाखों इंटरैक्शन को बेहतर बनाने का लक्ष्य रखता है।