ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन की सुविधा, ML Kit के GenAI Prompt API के लिए क्वालिटी को बेहतर बनाने में कैसे मदद करती है

पढ़ने में 3 मिनट लगेंगे

28 जनवरी 2026

4 लेखक

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन (एपीओ)

एमएल किट के प्रॉम्प्ट एपीआई के इस्तेमाल के उदाहरणों को प्रोडक्शन में लाने में आपकी मदद करने के लिए, हमें Vertex AI पर ऑन-डिवाइस मॉडल को टारगेट करने वाले, अपने-आप प्रॉम्प्ट ऑप्टिमाइज़ होने की सुविधा (एपीओ) के बारे में बताते हुए खुशी हो रही है. ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन एक ऐसा टूल है जो आपके इस्तेमाल के उदाहरणों के लिए, सबसे सही प्रॉम्प्ट अपने-आप ढूंढने में आपकी मदद करता है.

डिवाइस पर एआई की सुविधा अब कोई सपना नहीं रहा, बल्कि यह हकीकत में बदल गई है. Gemini Nano v3 को रिलीज़ करने के साथ ही, हम उपयोगकर्ताओं को भाषा समझने और मल्टीमॉडल की बेहतरीन सुविधाएं उपलब्ध करा रहे हैं. Gemini Nano मॉडल की मदद से, हम Android ईकोसिस्टम के अलग-अलग डिवाइसों पर काम कर सकते हैं. हालांकि, आने वाली पीढ़ी के स्मार्ट ऐप्लिकेशन बनाने वाले डेवलपर के लिए, एक शक्तिशाली मॉडल का ऐक्सेस पाना सिर्फ़ पहला चरण है. असल चुनौती कस्टम बनाने में है: मोबाइल हार्डवेयर की सीमाओं का उल्लंघन किए बिना, अपने खास इस्तेमाल के उदाहरण के लिए, फ़ाउंडेशन मॉडल को एक्सपर्ट लेवल की परफ़ॉर्मेंस के हिसाब से कैसे बनाया जाए?

सर्वर-साइड पर काम करने वाले बड़े एलएलएम, ज़्यादा बेहतर होते हैं. साथ ही, इन्हें डोमेन के हिसाब से कम अडजस्ट करने की ज़रूरत होती है. ज़रूरत पड़ने पर भी, LoRA (लो-रैंक अडैप्टेशन) फ़ाइन-ट्यूनिंग जैसे ज़्यादा बेहतर विकल्पों का इस्तेमाल किया जा सकता है. हालांकि, Android AICore के यूनीक आर्किटेक्चर में, शेयर किए गए, मेमोरी का कम इस्तेमाल करने वाले सिस्टम मॉडल को प्राथमिकता दी जाती है. इसका मतलब है कि शेयर की गई इन सिस्टम सेवाओं पर, हर ऐप्लिकेशन के लिए कस्टम LoRA अडैप्टर डिप्लॉय करने में समस्याएं आती हैं.

हालांकि, एक और तरीका है जो उतना ही असरदार हो सकता है. Vertex AI पर प्रॉम्प्ट को अपने-आप ऑप्टिमाइज़ करने की सुविधा (एपीओ) का इस्तेमाल करके, डेवलपर फ़ाइन-ट्यूनिंग जैसी क्वालिटी हासिल कर सकते हैं. साथ ही, वे Android के नेटिव एक्ज़ीक्यूशन एनवायरमेंट में आसानी से काम कर सकते हैं. बेहतर सिस्टम इंस्ट्रक्शन पर फ़ोकस करके, एपीओ की मदद से डेवलपर, मॉडल के व्यवहार को ज़्यादा मज़बूती और स्केलेबिलिटी के साथ अपनी ज़रूरत के मुताबिक बना सकते हैं. ऐसा फ़ाइन-ट्यूनिंग के पारंपरिक तरीकों से नहीं किया जा सकता.

ध्यान दें: Gemini Nano V3, Gemma 3N मॉडल का क्वालिटी ऑप्टिमाइज़ किया गया वर्शन है. ओपन सोर्स Gemma 3N मॉडल पर किए गए सभी प्रॉम्प्ट ऑप्टिमाइज़ेशन, Gemini Nano V3 पर भी लागू होंगे. ज़रूरी शर्तें पूरी करने वाले डिवाइसों पर, ML Kit GenAI API, Android डेवलपर के लिए क्वालिटी को बेहतर बनाने के लिए nano-v3 मॉडल का इस्तेमाल करते हैं

एपीओ, प्रॉम्प्ट को स्टैटिक टेक्स्ट के तौर पर नहीं, बल्कि प्रोग्राम की जा सकने वाली ऐसी सुविधा के तौर पर देखता है जिसे ऑप्टिमाइज़ किया जा सकता है. यह सर्वर-साइड मॉडल (जैसे, Gemini Pro और Flash) का इस्तेमाल करके, प्रॉम्प्ट के सुझाव देता है. साथ ही, अलग-अलग वर्शन का आकलन करता है और आपके टास्क के लिए सबसे सही वर्शन ढूंढता है. इस प्रोसेस में, परफ़ॉर्मेंस को बेहतर बनाने के लिए तीन खास तकनीकी तरीकों का इस्तेमाल किया जाता है:

गड़बड़ी का अपने-आप विश्लेषण करना: एपीओ, ट्रेनिंग डेटा से गड़बड़ी के पैटर्न का विश्लेषण करता है. इससे, शुरुआती प्रॉम्प्ट में मौजूद कमियों का अपने-आप पता चलता है.
सिमेंटिक इंस्ट्रक्शन डिस्टिलेशन: यह ट्रेनिंग के लिए दिए गए कई उदाहरणों का विश्लेषण करता है, ताकि किसी टास्क के "असल मकसद" का पता लगाया जा सके. इससे ऐसे निर्देश तैयार किए जाते हैं जो डेटा के असल डिस्ट्रिब्यूशन को ज़्यादा सटीक तरीके से दिखाते हैं.
पैरलल कैंडिडेट टेस्टिंग: एपीओ, एक बार में एक आइडिया की टेस्टिंग करने के बजाय, कई प्रॉम्प्ट कैंडिडेट जनरेट करता है और उनकी टेस्टिंग करता है. इससे क्वालिटी के लिए ग्लोबल मैक्सिमम की पहचान की जा सकती है.

एपीओ, फ़ाइन ट्यूनिंग क्वालिटी को क्यों बेहतर बना सकता है

आम तौर पर यह माना जाता है कि फ़ाइन-ट्यूनिंग से, प्रॉम्प्टिंग के मुकाबले हमेशा बेहतर क्वालिटी मिलती है. हालांकि, ऐसा नहीं है. Gemini Nano v3 जैसे आधुनिक फ़ाउंडेशन मॉडल के लिए, प्रॉम्प्ट इंजीनियरिंग अपने-आप में असरदार हो सकती है:

सामान्य क्षमताओं को बनाए रखना: फ़ाइन-ट्यूनिंग ( PEFT/LoRA) की वजह से, मॉडल के वेट को डेटा के किसी खास डिस्ट्रिब्यूशन पर ओवर-इंडेक्स करने के लिए मजबूर किया जाता है. इससे अक्सर "कैटस्ट्रॉफ़िक फ़ॉरगेटिंग" की समस्या होती है. इसमें मॉडल, आपके खास सिंटैक्स को बेहतर तरीके से समझ पाता है, लेकिन सामान्य लॉजिक और सुरक्षा के मामले में उसकी परफ़ॉर्मेंस खराब हो जाती है. एपीओ, वेट में कोई बदलाव नहीं करता है. इससे बेस मॉडल की क्षमताओं को बनाए रखने में मदद मिलती है.
निर्देशों का पालन करना और रणनीति का पता लगाना: Gemini Nano v3 को मुश्किल सिस्टम निर्देशों का पालन करने के लिए, अच्छी तरह से ट्रेन किया गया है. एपीओ, मॉडल की छिपी हुई क्षमताओं को अनलॉक करने के लिए, निर्देश के सही स्ट्रक्चर का पता लगाकर इसका फ़ायदा उठाता है. साथ ही, अक्सर ऐसी रणनीतियों का पता लगाता है जिन्हें ढूंढना, इंजीनियर के लिए मुश्किल हो सकता है.

इस तरीके की पुष्टि करने के लिए, हमने अलग-अलग प्रोडक्शन वर्कलोड में APO का आकलन किया. पुष्टि करने पर हमें पता चला है कि अलग-अलग इस्तेमाल के मामलों में, 5 से 8% तक सटीक नतीजे मिले हैं.उपयोगकर्ता के डिवाइस पर डिप्लॉय की गई कई सुविधाओं में, APO ने क्वालिटी में काफ़ी सुधार किया है.

Use Case	टास्क का टाइप	टास्क का ब्यौरा	मेट्रिक	एपीओ को बेहतर बनाना
विषय के हिसाब से कॉन्टेंट को कैटगरी में बांटना	टेक्स्ट क्लासिफ़िकेशन	किसी समाचार रिपोर्ट को फ़ाइनेंस, खेल-कूद वगैरह जैसे विषयों में बांटना	सटीकता	+5%
क्वेरी के मकसद के हिसाब से कैटगरी तय करना	टेक्स्ट क्लासिफ़िकेशन	ग्राहक सेवा से जुड़ी क्वेरी को इंटेंट में बांटना	सटीकता	+8.0%
वेबपेज का अनुवाद	टेक्स्ट का अनुवाद	किसी वेबपेज का अंग्रेज़ी से स्थानीय भाषा में अनुवाद करना	BLEU	+8.57%

डेवलपर के लिए, बिना किसी रुकावट वाला एंड-टू-एंड वर्कफ़्लो

सामान्य क्षमताओं को बनाए रखना: फ़ाइन-ट्यूनिंग ( PEFT/LoRA) की वजह से, मॉडल के वेट को डेटा के किसी खास डिस्ट्रिब्यूशन पर ओवर-इंडेक्स करने के लिए मजबूर किया जाता है. इससे अक्सर "कैटस्ट्रॉफ़िक फ़ॉरगेटिंग" की समस्या होती है. इसमें मॉडल, आपके खास सिंटैक्स को बेहतर तरीके से समझ पाता है, लेकिन सामान्य लॉजिक और सुरक्षा के मामले में उसकी परफ़ॉर्मेंस खराब हो जाती है. एपीओ, वेट में कोई बदलाव नहीं करता है. इससे बेस मॉडल की क्षमताओं को बनाए रखने में मदद मिलती है.
निर्देशों का पालन करना और रणनीति का पता लगाना: Gemini Nano v3 को मुश्किल सिस्टम निर्देशों का पालन करने के लिए, अच्छी तरह से ट्रेन किया गया है. एपीओ, मॉडल की छिपी हुई क्षमताओं को अनलॉक करने के लिए, निर्देश के सही स्ट्रक्चर का पता लगाकर इसका फ़ायदा उठाता है. साथ ही, अक्सर ऐसी रणनीतियों का पता लगाता है जिन्हें ढूंढना, इंजीनियर के लिए मुश्किल हो सकता है.

इस तरीके की पुष्टि करने के लिए, हमने अलग-अलग प्रोडक्शन वर्कलोड में APO का आकलन किया. पुष्टि करने पर, हमें अलग-अलग इस्तेमाल के उदाहरणों में 5 से 8% तक की सटीक जानकारी मिली है.उपयोगकर्ता के डिवाइस पर डिप्लॉय की गई कई सुविधाओं में, APO ने क्वालिटी में काफ़ी सुधार किया है.

नतीजा

ऑटोमेटेड प्रॉम्प्ट ऑप्टिमाइज़ेशन (एपीओ) की रिलीज़, उपयोगकर्ता के डिवाइस पर जनरेटिव एआई के लिए एक अहम पड़ाव है. हम फ़ाउंडेशन मॉडल और एक्सपर्ट-लेवल परफ़ॉर्मेंस के बीच के अंतर को कम कर रहे हैं. साथ ही, डेवलपर को ज़्यादा बेहतर मोबाइल ऐप्लिकेशन बनाने के लिए टूल उपलब्ध करा रहे हैं. चाहे आपने ज़ीरो-शॉट ऑप्टिमाइज़ेशन का इस्तेमाल अभी शुरू किया हो या डेटा पर आधारित रिफ़ाइनमेंट की मदद से प्रोडक्शन को बढ़ाया हो, डिवाइस पर मौजूद अच्छी क्वालिटी की इंटेलिजेंस का इस्तेमाल करने का तरीका अब ज़्यादा आसान हो गया है.ML Kit के Prompt API और Vertex AI के Automated Prompt Optimization की मदद से, उपयोगकर्ता के डिवाइस पर इस्तेमाल के उदाहरणों को आज ही प्रोडक्शन में लॉन्च करें.

इसी विषय से जुड़े लिंक:

लेखक:

Chetan Tekur

प्रॉडक्ट मैनेजर

read_more प्रोफ़ाइल देखें
Chao Zhao

सॉफ़्टवेयर इंजीनियर

read_more प्रोफ़ाइल देखें
Paul Zhou

सीनियर स्टाफ़ सॉफ़्टवेयर इंजीनियर

read_more प्रोफ़ाइल देखें
Caren Chang

डेवलपर रिलेशंस इंजीनियर

read_more प्रोफ़ाइल देखें

पढ़ना जारी रखें

02 Apr 2026

02 Apr 2026

प्रॉडक्ट से जुड़ी खबरें

AICore Developer Preview में Gemma 4 का एलान

arrow_forward

Google में, हम आपको बेहतरीन एआई मॉडल उपलब्ध कराने के लिए प्रतिबद्ध हैं. ये मॉडल, सीधे तौर पर आपके Android डिवाइसों पर उपलब्ध होंगे. आज हमें यह बताते हुए बेहद खुशी हो रही है कि हमने अपना सबसे नया और बेहतरीन ओपन मॉडल, Gemma 4 लॉन्च कर दिया है.
Caren Chang, David Chou • तीन मिनट में पढ़ा जा सकता है
3 लेखक

30 अक्टूबर 2025

30 अक्टूबर 2025

प्रॉडक्ट से जुड़ी खबरें

ML Kit का Prompt API: डिवाइस पर Gemini Nano की कस्टम सुविधाएं अनलॉक करें

arrow_forward

एआई की मदद से, उपयोगकर्ताओं की पसंद के हिसाब से ऐप्लिकेशन के अनुभव को बेहतर बनाना आसान हो गया है. इससे कॉन्टेंट को उपयोगकर्ताओं के लिए सही फ़ॉर्मैट में बदला जा सकता है. हमने पहले डेवलपर को ML Kit GenAI API के ज़रिए Gemini Nano के साथ इंटिग्रेट करने की सुविधा दी थी. ये एपीआई, खास इस्तेमाल के उदाहरणों के लिए बनाए गए हैं. जैसे, खास जानकारी देना और इमेज के बारे में जानकारी देना.
Caren Chang, Chengji Yan, Penny Li • दो मिनट में पढ़ें
24 जून 2026

24 जून 2026

प्रॉडक्ट से जुड़ी खबरें

Google Play पर बिलिंग के ज़्यादा विकल्प और कम शुल्क

arrow_forward

Google Play पर, हम उपयोगकर्ताओं को सबसे अच्छा अनुभव देने के लिए प्रतिबद्ध हैं. साथ ही, हम यह भी पक्का करते हैं कि डेवलपर के पास सफल होने के लिए ज़रूरी टूल और अडैप्टेबिलिटी हो.
Paul Feng • तीन मिनट में पढ़ा जा सकता है