प्रॉडक्ट से जुड़ी खबरें

ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन की सुविधा, ML Kit के GenAI Prompt API के लिए क्वालिटी में कैसे सुधार करती है

तीन मिनट में पढ़ें

28 जनवरी 2026

4 लेखक

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन (एपीओ)

हम आपको यह बताते हुए बेहद खुशी हो रही है कि हम ML Kit Prompt API के इस्तेमाल के उदाहरणों को प्रोडक्शन में लाने में आपकी मदद करने के लिए, Vertex AI पर डिवाइस पर मौजूद मॉडल को टारगेट करने वाले, ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन (एपीओ) की सुविधा लॉन्च कर रहे हैं. ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन एक ऐसा टूल है जो इस्तेमाल के उदाहरणों के लिए, सबसे सही प्रॉम्प्ट अपने-आप ढूंढने में आपकी मदद करता है.

डिवाइस पर मौजूद एआई की सुविधा अब सिर्फ़ एक वादा नहीं है, बल्कि यह एक वास्तविकता है. Gemini Nano v3 के रिलीज़ होने के साथ, हम भाषा को समझने और मल्टीमॉडल की क्षमताओं को सीधे तौर पर उपयोगकर्ताओं के हाथों में दे रहे हैं. Gemini Nano मॉडल फ़ैमिली के ज़रिए, हम Android इकोसिस्टम में काम करने वाले डिवाइसों को ज़्यादा से ज़्यादा कवरेज दे रहे हैं. हालांकि, अगली पीढ़ी के स्मार्ट ऐप्लिकेशन बनाने वाले डेवलपर के लिए, एक शक्तिशाली मॉडल का ऐक्सेस पाना सिर्फ़ पहला चरण है. असली चुनौती कस्टम बनाने में है: मोबाइल हार्डवेयर की सीमाओं का उल्लंघन किए बिना, अपने इस्तेमाल के खास उदाहरण के लिए, फ़ाउंडेशन मॉडल को विशेषज्ञ-स्तर के परफ़ॉर्मेंस के हिसाब से कैसे बनाया जाए?

सर्वर-साइड पर, बड़े एलएलएम ज़्यादा बेहतर होते हैं और इन्हें डोमेन के हिसाब से कम अडैप्टेशन की ज़रूरत होती है. अगर ज़रूरत हो, तो LoRA (लो-रैंक अडैप्टेशन) फ़ाइन-ट्यूनिंग जैसे ज़्यादा बेहतर विकल्पों का इस्तेमाल किया जा सकता है. हालांकि, Android AICore के यूनीक आर्किटेक्चर में, शेयर किए गए, मेमोरी-इफ़िशिएंट सिस्टम मॉडल को प्राथमिकता दी जाती है. इसका मतलब है कि शेयर की गई इन सिस्टम सेवाओं पर, हर ऐप्लिकेशन के लिए कस्टम LoRA अडैप्टर डिप्लॉय करने में समस्याएं आती हैं.

हालांकि, एक और तरीका है जो उतना ही असरदार हो सकता है. Vertex AI पर प्रॉम्प्ट को अपने-आप ऑप्टिमाइज़ करने की सुविधा (एपीओ) का इस्तेमाल करके, डेवलपर फ़ाइन-ट्यूनिंग जैसी क्वालिटी हासिल कर सकते हैं. साथ ही, वे Android के नेटिव एक्ज़ीक्यूशन एनवायरमेंट में आसानी से काम कर सकते हैं. बेहतर सिस्टम इंस्ट्रक्शन पर फ़ोकस करके, एपीओ की मदद से डेवलपर, मॉडल के व्यवहार को ज़्यादा मज़बूती और स्केलेबिलिटी के साथ अपनी ज़रूरत के मुताबिक बना सकते हैं. ऐसा फ़ाइन-ट्यूनिंग के पारंपरिक तरीकों से नहीं किया जा सकता.

ध्यान दें: Gemini Nano V3, Gemma 3N मॉडल का बेहतर वर्शन है. Gemma 3N के ओपन सोर्स मॉडल पर किए गए सभी प्रॉम्प्ट ऑप्टिमाइज़ेशन, Gemini Nano V3 पर भी लागू होंगे. ज़रूरी शर्तें पूरी करने वाले डिवाइसों पर, ML Kit GenAI API, Android डेवलपर के लिए क्वालिटी को बेहतर बनाने के लिए nano-v3 मॉडल का इस्तेमाल करते हैं

एपीओ, प्रॉम्प्ट को स्टैटिक टेक्स्ट के तौर पर नहीं, बल्कि प्रोग्राम की जा सकने वाली ऐसी सुविधा के तौर पर देखता है जिसे ऑप्टिमाइज़ किया जा सकता है. यह सर्वर-साइड मॉडल (जैसे, Gemini Pro और Flash) का इस्तेमाल करके, प्रॉम्प्ट के सुझाव देता है. साथ ही, अलग-अलग वर्शन का आकलन करता है और आपके टास्क के लिए सबसे सही वर्शन ढूंढता है. इस प्रोसेस में, परफ़ॉर्मेंस को बेहतर बनाने के लिए तीन खास तकनीकी सिस्टम का इस्तेमाल किया जाता है:

गड़बड़ियों का अपने-आप विश्लेषण करने की सुविधा: APO, ट्रेनिंग डेटा से गड़बड़ी के पैटर्न का विश्लेषण करता है. इससे, शुरुआती प्रॉम्प्ट में मौजूद खास कमियों का अपने-आप पता चलता है.
सिमेंटिक इंस्ट्रक्शन डिस्टिलेशन: यह ट्रेनिंग के लिए दिए गए कई उदाहरणों का विश्लेषण करता है, ताकि किसी टास्क के "असल मकसद" का पता लगाया जा सके. इससे ऐसे निर्देश तैयार किए जाते हैं जो डेटा के असल डिस्ट्रिब्यूशन को ज़्यादा सटीक तरीके से दिखाते हैं.
पैरलल कैंडिडेट टेस्टिंग: एपीओ, एक बार में एक आइडिया की टेस्टिंग करने के बजाय, कई प्रॉम्प्ट कैंडिडेट जनरेट करता है और उनकी टेस्टिंग करता है. इससे क्वालिटी के लिए ग्लोबल मैक्सिमम की पहचान की जा सकती है.

एपीओ, फ़ाइन ट्यूनिंग क्वालिटी को क्यों बेहतर बना सकता है

आम तौर पर यह माना जाता है कि फ़ाइन-ट्यूनिंग से, प्रॉम्प्टिंग के मुकाबले हमेशा बेहतर क्वालिटी मिलती है. हालांकि, ऐसा नहीं है. Gemini Nano v3 जैसे आधुनिक फ़ाउंडेशन मॉडल के लिए, प्रॉम्प्ट इंजीनियरिंग अपने-आप में असरदार हो सकती है:

सामान्य क्षमताओं को बनाए रखना: फ़ाइन-ट्यूनिंग ( PEFT/LoRA) की वजह से, मॉडल के वेट, डेटा के किसी खास डिस्ट्रिब्यूशन पर ज़्यादा इंडेक्स हो जाते हैं. इससे अक्सर "कैटास्ट्रॉफ़िक फ़ॉरगेटिंग" की समस्या होती है. इसमें मॉडल, आपके खास सिंटैक्स को बेहतर तरीके से समझ पाता है, लेकिन सामान्य लॉजिक और सुरक्षा के मामले में उसकी परफ़ॉर्मेंस खराब हो जाती है. APO में वेट में कोई बदलाव नहीं किया जाता. इससे बेस मॉडल की क्षमताओं को बनाए रखने में मदद मिलती है.
निर्देशों का पालन करना और रणनीति का पता लगाना: Gemini Nano v3 को सिस्टम के मुश्किल निर्देशों का पालन करने के लिए, काफ़ी ट्रेनिंग दी गई है. APO इस सुविधा का इस्तेमाल करके, निर्देशों का सही स्ट्रक्चर पता लगाता है. इससे मॉडल की छिपी हुई क्षमताओं का पता चलता है. साथ ही, ऐसी रणनीतियों का पता चलता है जिन्हें इंजीनियर शायद ही खोज पाते हैं.

इस तरीके की पुष्टि करने के लिए, हमने अलग-अलग प्रोडक्शन वर्कलोड में APO का आकलन किया. पुष्टि करने पर हमें पता चला है कि अलग-अलग इस्तेमाल के मामलों में, सटीकता में 5 से 8% की बढ़ोतरी हुई है.डिवाइस पर डिप्लॉय की गई कई सुविधाओं में, APO ने क्वालिटी में काफ़ी सुधार किया है.

Use Case	टास्क का टाइप	टास्क का ब्यौरा	मेट्रिक	एपीओ में सुधार
विषय के हिसाब से कॉन्टेंट को कैटगरी में बांटना	टेक्स्ट क्लासिफ़िकेशन	किसी समाचार रिपोर्ट को फ़ाइनेंस, खेल-कूद वगैरह जैसे विषयों में बांटना	सटीकता	+5%
क्वेरी के मकसद के हिसाब से कैटगरी तय करना	टेक्स्ट क्लासिफ़िकेशन	ग्राहक सेवा से जुड़ी क्वेरी को इंटेंट में बांटना	सटीकता	+8.0%
वेबपेज का अनुवाद	टेक्स्ट का अनुवाद	किसी वेबपेज का अंग्रेज़ी से स्थानीय भाषा में अनुवाद करना	BLEU	+8.57%

डेवलपर के लिए, बिना किसी रुकावट वाला एंड-टू-एंड वर्कफ़्लो

सामान्य क्षमताओं को बनाए रखना: फ़ाइन-ट्यूनिंग ( PEFT/LoRA) की वजह से, मॉडल के वेट, डेटा के किसी खास डिस्ट्रिब्यूशन पर ज़्यादा इंडेक्स हो जाते हैं. इससे अक्सर "कैटास्ट्रॉफ़िक फ़ॉरगेटिंग" की समस्या होती है. इसमें मॉडल, आपके खास सिंटैक्स को बेहतर तरीके से समझ पाता है, लेकिन सामान्य लॉजिक और सुरक्षा के मामले में उसकी परफ़ॉर्मेंस खराब हो जाती है. APO में वेट में कोई बदलाव नहीं किया जाता. इससे बेस मॉडल की क्षमताओं को बनाए रखने में मदद मिलती है.
निर्देशों का पालन करना और रणनीति का पता लगाना: Gemini Nano v3 को सिस्टम के मुश्किल निर्देशों का पालन करने के लिए, काफ़ी ट्रेनिंग दी गई है. APO इस सुविधा का इस्तेमाल करके, निर्देशों का सही स्ट्रक्चर पता लगाता है. इससे मॉडल की छिपी हुई क्षमताओं का पता चलता है. साथ ही, ऐसी रणनीतियों का पता चलता है जिन्हें इंजीनियर शायद ही खोज पाते हैं.

इस तरीके की पुष्टि करने के लिए, हमने अलग-अलग प्रोडक्शन वर्कलोड में APO का आकलन किया. पुष्टि करने पर हमें पता चला है कि अलग-अलग इस्तेमाल के मामलों में, सटीकता में 5 से 8% की बढ़ोतरी हुई है.उपयोगकर्ता के डिवाइस पर डिप्लॉय की गई कई सुविधाओं में, APO ने क्वालिटी में काफ़ी सुधार किया है.

नतीजा

ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन (एपीओ) की रिलीज़, डिवाइस पर जनरेटिव एआई के लिए एक अहम पड़ाव है. फ़ाउंडेशन मॉडल और एक्सपर्ट-लेवल की परफ़ॉर्मेंस के बीच के अंतर को कम करके, हम डेवलपर को ज़्यादा बेहतर मोबाइल ऐप्लिकेशन बनाने के लिए टूल उपलब्ध करा रहे हैं. चाहे आपने ज़ीरो-शॉट ऑप्टिमाइज़ेशन का इस्तेमाल अभी शुरू किया हो या डेटा पर आधारित रिफ़ाइनमेंट के साथ प्रोडक्शन को स्केल किया हो, डिवाइस पर बेहतर एआई की सुविधा पाने का तरीका अब ज़्यादा आसान हो गया है. ML Kit के प्रॉम्प्ट एपीआई और Vertex AI के ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन की मदद से, डिवाइस पर इस्तेमाल के उदाहरणों को आज ही प्रोडक्शन में लॉन्च करें.

इसी विषय से जुड़े लिंक:

लेखक:

Chetan Tekur

प्रॉडक्ट मैनेजर

read_more प्रोफ़ाइल देखें
Chao Zhao

सॉफ़्टवेयर इंजीनियर

read_more प्रोफ़ाइल देखें
Paul Zhou

सीनियर स्टाफ़ सॉफ़्टवेयर इंजीनियर

read_more प्रोफ़ाइल देखें
Caren Chang

डेवलपर रिलेशंस इंजीनियर

read_more प्रोफ़ाइल देखें

पढ़ना जारी रखें

02 Apr 2026

02 Apr 2026

प्रॉडक्ट से जुड़ी खबरें

AICore Developer Preview में Gemma 4 का एलान

arrow_forward

Google में, हम सबसे बेहतरीन एआई मॉडल को सीधे तौर पर आपके Android डिवाइसों पर उपलब्ध कराने के लिए प्रतिबद्ध हैं. आज हम अपने सबसे नए और बेहतरीन ओपन मॉडल, Gemma 4 को लॉन्च करने का एलान करते हुए बेहद खुश हैं.
Caren Chang, David Chou • तीन मिनट में पढ़ें
3 लेखक

30 अक्टूबर 2025

30 अक्टूबर 2025

प्रॉडक्ट से जुड़ी खबरें

ML Kit का Prompt API: डिवाइस पर Gemini Nano की कस्टम सुविधाएं अनलॉक करें

arrow_forward

एआई की मदद से, लोगों की दिलचस्पी के हिसाब से ऐप्लिकेशन का अनुभव तैयार करना आसान हो गया है. इससे कॉन्टेंट को लोगों के लिए सही फ़ॉर्मैट में बदला जा सकता है. हमने पहले डेवलपर को, ML Kit GenAI API के ज़रिए Gemini Nano के साथ इंटिग्रेट करने की सुविधा दी थी. ये एपीआई, खास इस्तेमाल के उदाहरणों के लिए बनाए गए हैं. जैसे, खास जानकारी देना और इमेज के बारे में जानकारी देना.
Caren Chang, Chengji Yan, Penny Li • दो मिनट में पढ़ें
09 Jun 2026

09 Jun 2026

प्रॉडक्ट से जुड़ी खबरें

Android डेवलपर की प्रॉडक्टिविटी बढ़ाने के लिए तीन सबसे अहम अपडेट

arrow_forward

हर साल, Google I/O में अलग-अलग ईकोसिस्टम और प्रॉडक्ट के बारे में नई घोषणाएं की जाती हैं और नए संसाधन उपलब्ध कराए जाते हैं. इनमें Android डेवलपमेंट भी शामिल है. डेवलपमेंट का काम एआई और एजेंट की मदद से काम करने वाले टूल की ओर बढ़ रहा है. इसलिए, हमने अपनी सेवाओं का दायरा बढ़ाया है, ताकि हम आपकी बेहतर तरीके से मदद कर सकें. हालांकि, Android के लिए ऐप्लिकेशन बनाने का फ़ैसला आपका होगा.
Simona Milanovic • दो मिनट में पढ़ें