Google ने SignGemma, एक AI मॉडल का अनावरण किया जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है

Google ने साइनगेमा की घोषणा की है, जो एक नया आर्टिफिशियल इंटेलिजेंस (AI) मॉडल है जो साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद कर सकता है। मॉडल, जो मॉडल ऑफ मॉडल का हिस्सा होगा, वर्तमान में माउंटेन व्यू-आधारित टेक दिग्गज द्वारा परीक्षण किया जा रहा है और इस साल के अंत में लॉन्च होने की उम्मीद है। अन्य सभी Gemma मॉडल के समान, Singgemma एक ओपन-सोर्स AI मॉडल भी होगा, जो व्यक्तियों और व्यवसायों के लिए उपलब्ध है। यह पहली बार Google I/O 2025 कीनोट के दौरान दिखाया गया था, और यह भाषण और सुनने की अक्षमता वाले लोगों की मदद करने के लिए डिज़ाइन किया गया है जो प्रभावी रूप से उन लोगों के साथ संवाद करते हैं जो साइन लैंग्वेज को नहीं समझते हैं।

Signgemma हाथ की गतिविधियों और चेहरे के भावों को ट्रैक कर सकता है

में एक डाक एक्स पर (पूर्व में ट्विटर के रूप में जाना जाता था), Google डीपमाइंड के आधिकारिक हैंडल ने एआई मॉडल का एक डेमो और इसकी रिलीज की तारीख के बारे में कुछ विवरण साझा किए। हालाँकि, यह पहली बार नहीं है जब हमने साइनगेममा को देखा है। यह भी संक्षेप में Google I/O इवेंट में Gus Martin, Gemma Product Manager द्वारा दीपमाइंड में दिखाया गया था।

हम SignGemma की घोषणा करने के लिए रोमांचित हैं, जो कि साइन लैंग्वेज को बोले गए पाठ में अनुवाद करने के लिए हमारा सबसे सक्षम मॉडल है। 🧏

यह खुला मॉडल इस साल के अंत में जेम्मा मॉडल परिवार में आ रहा है, जिसमें समावेशी तकनीक के लिए नई संभावनाएं हैं।

अपनी प्रतिक्रिया और रुचि को जल्दी साझा करें … pic.twitter.com/nhl9g5y8ta

– Google DeepMind (@googledeepmind) 27 मई, 2025

शोकेस के दौरान, मार्टिंस ने इस बात पर प्रकाश डाला कि एआई मॉडल वास्तविक समय में साइन लैंग्वेज से टेक्स्ट ट्रांसलेशन प्रदान करने में सक्षम है, जिससे आमने-सामने संचार को सहज बना दिया गया है। मॉडल को साइन भाषाओं के विभिन्न शैलियों के डेटासेट पर भी प्रशिक्षित किया गया था, हालांकि, यह अंग्रेजी भाषा में अनुवाद करते समय अमेरिकी साइन लैंग्वेज (एएसएल) के साथ सर्वश्रेष्ठ प्रदर्शन करता है।

अनुसार बहुभाषी के लिए, चूंकि यह एक ओपन-सोर्स मॉडल है, इसलिए SignGemma इंटरनेट से कनेक्ट करने की आवश्यकता के बिना कार्य कर सकता है। यह सीमित कनेक्टिविटी वाले क्षेत्रों में उपयोग करने के लिए उपयुक्त बनाता है। यह कहा जाता है कि यह मिथुन नैनो फ्रेमवर्क पर बनाया गया है और हाथ के आंदोलनों, आकृतियों और चेहरे के भावों को ट्रैक और विश्लेषण करने के लिए एक विज़न ट्रांसफार्मर का उपयोग करता है। डेवलपर्स के लिए इसे उपलब्ध कराने से परे, Google मॉडल को अपने मौजूदा एआई टूल में एकीकृत कर सकता है, जैसे कि मिथुन लाइव।

इसे “साइन लैंग्वेज को बोले गए टेक्स्ट में अनुवाद करने के लिए हमारा सबसे सक्षम मॉडल” कहते हुए, दीपमाइंड ने इस बात पर प्रकाश डाला कि यह इस साल के अंत में जारी किया जाएगा। एक्सेसिबिलिटी-केंद्रित बड़े भाषा मॉडल वर्तमान में अपने शुरुआती परीक्षण चरण में है, और टेक दिग्गज ने एक प्रकाशित किया है ब्याज -रूप व्यक्तियों को इसे आज़माने और प्रतिक्रिया प्रदान करने के लिए आमंत्रित करने के लिए।

Source link

Signgemma हाथ की गतिविधियों और चेहरे के भावों को ट्रैक कर सकता है

Leave a Comment Cancel reply