तपाईंको कल्पना अब लामो भिडियोमा उत्रिने, एआई भिडियोको समय सीमा तोड्ने नयाँ प्रविधि

टेकमाण्डु

२०८२ माघ २३, शुक्रबार

काठमाण्डौ — आर्टिफिसियल इन्टेलिजेन्स (एआई) बाट भिडियो बनाउँदा केही सेकेन्डमै दृश्यहरू बिग्रिने र धमिलो हुने समस्या (Drift) समाधान गर्न वैज्ञानिकहरूले ठूलो सफलता हात पारेका छन्। स्विजरल्याण्डको ‘ईपीएफएल’ (EPFL) विश्वविद्यालयका अनुसन्धानकर्ताहरूले जेनेरेटिभ भिडियोको समय सीमालाई निकै अगाडि धकेल्दै गुणस्तरीय लामो भिडियो बनाउने नयाँ प्रविधि विकास गरेका हुन्।

हालसम्मका एआई मोडलहरूले ३० सेकेन्डभन्दा लामो भिडियो बनाउँदा दृश्यको तर्क (Logic), रंग र आकारहरू बिस्तारै बिग्रिँदै जाने ‘ड्रिफ्ट’ को समस्या थियो। तर, ईपीएफएलको ‘विटा’ (VITA) प्रयोगशालाका वैज्ञानिकहरूले एआईलाई ‘आफ्नै गल्तीबाट सिक्ने’ (Error Recycling) अनौठो तरिका सिकाएर यसको स्थायी समाधान निकालेका छन्।

‘गल्ती’ बाटै सुध्रिन्छ भिडियो

प्रविधिको भाषामा भिडियो बिग्रिने प्रक्रियालाई ‘ड्रिफ्ट’ भनिन्छ। एआईले भिडियो बनाउँदा अघिल्लो फ्रेममा भएको सानो गल्ती अर्को फ्रेममा झन् बढ्दै जान्छ। ईपीएफएलको टोलीले विकास गरेको नयाँ विधिमा एआईले भिडियो बनाउँदै गर्दा हुने गल्तीहरूलाई स्मृति (Memory) मा राख्छ र अर्को पटक तालिम लिँदा ती गल्तीहरूलाई आफैँ सुधार्छ।

अनुसन्धान टोलीका प्रमुख प्रो. अलेक्जेन्डर अलाहीका अनुसार यो प्रणाली खराब मौसममा पाइलटलाई तालिम दिए जस्तै हो। “हाम्रो मोडलले खराब डेटा देखेपछि पनि कसरी सही बाटोमा फर्कने र स्पष्ट दृश्य बनाउने भन्ने कुरा आफैँ सिक्छ,” उनले भने।

‘स्टेबल भिडियो इन्फिनिटी’ (SVI) र लेयरसिंक (LayerSync)

वैज्ञानिकहरूले यो विधिलाई ‘स्टेबल भिडियो इन्फिनिटी’ (SVI) नाम दिएका छन्, जसले धेरै मिनेटसम्मका गुणस्तरीय भिडियोहरू तयार पार्न सक्छ। यसका साथै उनीहरूले ‘लेयरसिंक’ (LayerSync) नामक अर्को प्रविधि पनि विकास गरेका छन्, जसले भिडियो, तस्बिर र आवाजको गुणस्तरलाई आन्तरिक रूपमै सुधार्न मद्दत गर्दछ।

यो प्रविधिको सबैभन्दा ठूलो विशेषता भनेको यसका लागि धेरै ठूलो डेटा वा शक्तिशाली प्रोसेसिङ पावरको आवश्यकता पर्दैन। यसले गर्दा साधारण उपकरणहरूबाटै उच्च स्तरको भिडियो उत्पादन सम्भव हुने देखिएको छ।

फिल्म र गेमिङ क्षेत्रमा उत्साह

यो नयाँ प्रविधि सार्वजनिक भएपछि विश्वभरका एनिमेटर, फिल्म निर्माता र भिडियो गेम विकासकर्ताहरूले निकै चासो देखाएका छन्। गिटहब (GitHub) मा यसको ‘ओपन सोर्स’ कोडलाई हजारौँले मन पराएका छन् भने एआई समुदायमा यसको चर्चा चुलिएको छ।

आगामी अप्रिलमा आयोजना हुने ‘इन्टरनेशनल कन्फरेन्स अन लर्निङ रिप्रेजेन्टेसन’ (ICLR 2026) मा यो प्रविधिलाई आधिकारिक रूपमा प्रस्तुत गरिनेछ। यसले भविष्यमा स्वायत्त प्रणाली (Autonomous Systems) लाई मानिससँग अझ सुरक्षित र प्रभावकारी रूपमा अन्तरक्रिया गर्न सघाउने अपेक्षा गरिएको छ।