अब बोले और बन जाएगा वीडियो: गूगल का नया AI Gemini Omni Flash लॉन्च
गूगल ने आर्टिफिशियल इंटेलिजेंस के क्षेत्र में बड़ा कदम उठाते हुए अपना नया मल्टीमॉडल एआई मॉडल Gemini Omni लॉन्च किया है। यह एआई टेक्स्ट के साथ-साथ फोटो, ऑडियो और वीडियो को एक साथ समझने और जनरेट करने में सक्षम है। कंपनी का लक्ष्य आर्टिफिशियल जनरल इंटेलिजेंस (AGI) की दिशा में मजबूत प्रगति करना है।
इस सीरीज का पहला टूल Gemini Omni Flash है, जिसे धीरे-धीरे Gemini App, Google Flow और YouTube Shorts में इंटीग्रेट किया जा रहा है। फिलहाल इसका फोकस वीडियो निर्माण और एडिटिंग पर है, लेकिन आने वाले समय में यह इमेज और ऑडियो जनरेशन भी कर सकेगा।
कैसे काम करता है Gemini Omni?
Gemini Omni एक मल्टीमोडल इंजन की तरह काम करता है, जो टेक्स्ट, ऑडियो और विजुअल इनपुट को अलग-अलग प्रोसेस करने के बजाय एक साथ समझता है। इससे यह ज्यादा सटीक और प्राकृतिक आउटपुट तैयार करता है।
1. बोलकर या टाइप करके वीडियो एडिटिंग
यूजर्स अब केवल भाषा के जरिए वीडियो एडिट कर सकेंगे। यह एआई पिछले निर्देशों को याद रखकर वीडियो में कैरेक्टर, बैकग्राउंड और कैमरा एंगल को लगातार एडजस्ट करता है। इससे एडिटिंग प्रक्रिया बेहद सरल हो जाती है।
2. भौतिकी आधारित मोशन समझ
Gemini Omni सिर्फ पैटर्न कॉपी नहीं करता, बल्कि ग्रेविटी और मोशन जैसी भौतिक अवधारणाओं को समझकर रियलिस्टिक वीडियो तैयार करता है। यह अलग-अलग इनपुट जैसे फोटो, टेक्स्ट और स्टाइल को जोड़कर एक यूनिफाइड वीडियो बनाता है।
3. डिजिटल अवतार फीचर
यह एआई यूजर का डिजिटल अवतार बनाने में भी सक्षम है, जो उनकी आवाज और लुक की नकल कर सकता है। हालांकि, डीपफेक के खतरे को देखते हुए वॉइस फीचर्स पर फिलहाल सीमित परीक्षण किया जा रहा है। सुरक्षा के लिए गूगल ने *SynthID* तकनीक भी जोड़ी है, जो एआई-जनरेटेड वीडियो की पहचान के लिए अदृश्य वाटरमार्क लगाती है।
किसे मिलेगा यह फीचर?
गूगल ने इस फीचर का रोलआउट शुरू कर दिया है। यह पहले चरण में Google AI Plus, Pro और Ultra सब्सक्राइबर्स के लिए उपलब्ध है। वहीं, जल्द ही इसे आम यूजर्स के लिए YouTube Create और YouTube Shorts पर मुफ्त में जारी किया जाएगा। इसके बाद डेवलपर्स और कंपनियों के लिए API एक्सेस भी उपलब्ध होगा।
गूगल का यह कदम एआई आधारित वीडियो क्रिएशन और एडिटिंग के क्षेत्र में एक बड़ा बदलाव माना जा रहा है, जो भविष्य में कंटेंट निर्माण को और अधिक आसान और तेज बना सकता है।