विषयसूची:
- Google का एल्गोरिदम काम करता है
- प्रसंग को ध्यान में रखते हुए स्वचालित सुधार
- शायद हम इस तकनीक को पिक्सेल में देखेंगे
Google और MIT के शोधकर्ताओं ने एक एल्गोरिथ्म विकसित किया जो चौड़े-कोण शॉट्स में खामियों के लिए सही करना चाहता है।
आपने देखा होगा कि कुछ लोगों के चेहरे खिंचे हुए, थोड़े चौड़े या फोटो में कुछ विकृति के साथ दिखते हैं। यद्यपि यह फोटोग्राफर के कुछ कौशल के कारण हो सकता है, सच्चाई यह है कि मोबाइल उपकरणों से वाइड-एंगल लेंस के साथ शॉट आमतौर पर उन वस्तुओं या लोगों में विरूपण का कारण बनते हैं जो छवि के किनारे पर हैं।
इस समस्या को हल करने के लिए अलग-अलग तरीके हैं, लेकिन अभी तक कोई भी Google के नए प्रस्ताव के समान प्रभावी नहीं है। हालांकि इसे ठीक करना आसान लग सकता है, यह नहीं है, क्योंकि इसमें जटिल स्थानीय संपादन की आवश्यकता होती है जो फोटो में बाकी वस्तुओं को प्रभावित नहीं करता है।
Google का एल्गोरिदम काम करता है
जैसा कि शोधकर्ता बताते हैं, यह एल्गोरिथ्म चेहरे का पता लगाता है और एक जाल बनाता है जो इस प्रकार के विरूपण को स्वचालित रूप से रिवर्स करने की अनुमति देता है जब एक चौड़े कोण के साथ एक शॉट लेते हुए जैसा कि छवि में चित्रित किया गया है:
इस एल्गोरिथ्म को निम्नलिखित छवियों में लागू करते समय हम अंतर बता सकते हैं। यह एक सेल्फी है जिसे 97 ° क्षेत्र के साथ एक विस्तृत कोण लेंस के साथ लिया गया था।
पहली छवि चेहरों में विकृतियों को दिखाती है और दूसरी यह बताती है कि एल्गोरिथ्म ने चेहरे की आकृतियों को उनकी मूल स्थिति में कैसे पुनर्स्थापित किया।
यही है, वाइड-एंगल लेंस का उपयोग करते समय यह प्रक्रिया स्वचालित रूप से सक्रिय हो जाती है, चेहरे को यह विशेष सहायता प्रदान करती है, लेकिन शेष छवि में बदलाव के बिना। और हां, इस स्वचालित सुधार (लगभग 920 मिलीसेकंड) की गति उपयोगकर्ताओं के लिए पता लगाना असंभव बना देती है।
उनके द्वारा किए गए परीक्षणों के अनुसार, यह एल्गोरिथ्म मोबाइल क्षेत्र से लगभग सभी संभावनाओं को कवर करते हुए, देखने के क्षेत्र में 70 ° से 120 ° की सीमा में सफलतापूर्वक काम करता है।
इस एल्गोरिथ्म की क्षमता का लाभ उठाने के लिए, उपयोगकर्ता को कोई कार्रवाई करने या किसी विशेष कैमरा मोड को सक्रिय करने की आवश्यकता नहीं होगी। यह फ़ंक्शन स्वचालित रूप से केवल तभी लागू किया जाएगा जब यह पता लगाएगा कि वाइड एंगल लेंस का उपयोग किया गया है।
प्रसंग को ध्यान में रखते हुए स्वचालित सुधार
हम निम्न वीडियो में इस एल्गोरिथ्म की गतिशीलता देख सकते हैं:
एल्गोरिथ्म स्वचालित रूप से दृश्य में दिखाई देने वाली बाकी वस्तुओं को ध्यान में रखते हुए सही करता है, जिससे यह सुनिश्चित होता है कि तस्वीर के पूरे संदर्भ मेल खाते हैं। परिणाम बिना विवरण के स्वाभाविक हैं जो बताते हैं कि तस्वीर को बिल्कुल संशोधित किया गया है।
इस परियोजना के पीछे की टीम ने फ़्लिकर पर एक फोटो गैलरी साझा की है जिसमें दिखाया गया है कि उनके एल्गोरिथ्म की गतिशीलता की तुलना में विभिन्न तरीकों से इस समस्या का पता कैसे चलता है। 160 से अधिक तस्वीरें हैं (जैसे कि आप लेख की शुरुआत में देखते हैं) जो हमें परिणामों का मूल्यांकन करने में मदद करती हैं।
शायद हम इस तकनीक को पिक्सेल में देखेंगे
हम उम्मीद कर सकते हैं कि यह एल्गोरिथ्म या कुछ व्युत्पन्न तकनीक पिक्सेल की अगली पीढ़ी में लागू होगी, क्योंकि इस परियोजना में भाग लेने वाली टीम Google के कर्मचारी हैं।
हालांकि, उन्होंने जो दस्तावेज़ साझा किया है, उसमें उन्होंने इसके बारे में कुछ भी उल्लेख नहीं किया है। एल्गोरिथ्म के इन पहले परीक्षणों में एक बार फिर यह दिखाने में सफल रहा है कि कृत्रिम बुद्धिमत्ता की क्षमता कैसे मोबाइल उपकरणों की गतिशीलता में सुधार कर सकती है और उपयोगकर्ताओं के लिए जीवन को आसान बना सकती है।
बिना किसी संदेह के, हमारे मोबाइल डिवाइस में एक समान गतिशील होने से तस्वीरों में इन विकृतियों को संपादित करने के लिए बहुत सारे सिरदर्द और समय की बचत होगी।
