איך כתיבת פרומפטים משופרת מאפשרת שיפורים באיכות של GenAI Prompt API ב-ML Kit

3 דקות קריאה

28 Jan 2026

4 מחברים

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

אופטימיזציה אוטומטית של הנחיות (APO)

כדי לעזור לכם להשתמש בתרחישי השימוש של ML Kit Prompt API בסביבת ייצור, אנחנו שמחים להודיע על אופטימיזציה אוטומטית של הנחיות (APO) שמיועדת למודלים במכשיר ב-Vertex AI. כתיבת פרומפטים משופרת היא כלי שעוזר לכם למצוא באופן אוטומטי את הפרומפט האופטימלי לתרחישי השימוש שלכם.

העידן של AI במכשיר כבר לא הבטחה – הוא מציאות. עם ההשקה של Gemini Nano v3, אנחנו מעניקים למשתמשים יכולות חסרות תקדים של הבנת שפה ומולטי-מודאליות ישירות בכף היד. באמצעות משפחת המודלים Gemini Nano, אנחנו מספקים כיסוי רחב של מכשירים נתמכים בסביבה העסקית של Android. אבל למפתחים שיוצרים את הדור הבא של אפליקציות חכמות, גישה למודל עוצמתי היא רק השלב הראשון. האתגר האמיתי הוא התאמה אישית: איך מתאימים מודל בסיסי לביצועים ברמת מומחה לתרחיש השימוש הספציפי שלכם בלי לחרוג ממגבלות החומרה של הנייד?

בעולם של צד השרת, מודלים גדולים של שפה (LLM) הם בדרך כלל בעלי יכולות גבוהות ודורשים פחות התאמה לדומיין. גם כשצריך, אפשר להשתמש באפשרויות מתקדמות יותר כמו כוונון עדין של LoRA (התאמה בדרגה נמוכה). עם זאת, הארכיטקטורה הייחודית של Android AICore נותנת עדיפות למודל מערכת משותף ויעיל בזיכרון. המשמעות היא שפריסת מתאמי LoRA מותאמים אישית לכל אפליקציה בנפרד מציבה אתגרים בשירותי המערכת המשותפים האלה.

אבל יש דרך חלופית שיכולה להיות משפיעה באותה מידה. בעזרת כתיבת פרומפטים משופרת (APO) ב-Vertex AI, מפתחים יכולים להשיג איכות שמתקרבת לזו של כוונון עדין, וכל זאת תוך עבודה חלקה בסביבת ההרצה המקורית של Android. השיטה APO מתמקדת בהוראות מערכת מעולות, ומאפשרת למפתחים להתאים את התנהגות המודל בצורה חזקה וניתנת להרחבה יותר מאשר פתרונות מסורתיים של כוונון עדין.

הערה: ‫Gemini Nano V3 הוא גרסה שעברה אופטימיזציה לאיכות של מודל Gemma 3N המהולל. כל האופטימיזציות להנחיות שמתבצעות במודל Gemma 3N בקוד פתוח יחולו גם על Gemini Nano V3. במכשירים נתמכים, ממשקי ה-API של ML Kit GenAI משתמשים במודל nano-v3 כדי למקסם את האיכות למפתחי Android

ה-APO מתייחס להנחיה לא כטקסט סטטי, אלא כפלטפורמה שניתנת לתכנות שאפשר לבצע בה אופטימיזציה. הוא משתמש במודלים בצד השרת (כמו Gemini Pro ו-Flash) כדי להציע הנחיות, להעריך וריאציות ולמצוא את ההנחיה האופטימלית למשימה הספציפית שלכם. התהליך הזה משתמש בשלושה מנגנונים טכניים ספציפיים כדי למקסם את הביצועים:

ניתוח שגיאות אוטומטי: APO מנתח דפוסי שגיאות מנתוני האימון כדי לזהות באופן אוטומטי נקודות חולשה ספציפיות בהנחיה הראשונית.
זיקוק הוראות סמנטיות: המודל מנתח דוגמאות אימון רבות כדי לזקק את 'הכוונה האמיתית' של משימה, ויוצר הוראות שמשקפות בצורה מדויקת יותר את התפלגות הנתונים האמיתית.
בדיקת מועמדים במקביל: במקום לבדוק רעיון אחד בכל פעם, APO יוצרת ובודקת מספר מועמדים להנחיות במקביל כדי לזהות את המקסימום הגלובלי של האיכות.

למה APO יכול לשפר את האיכות של כוונון עדין

יש תפיסה מוטעית נפוצה שלפיה כוונון עדין תמיד מניב איכות טובה יותר מאשר יצירת הנחיות. במודלי בסיס מתקדמים כמו Gemini Nano v3, הנדסת פרומפטים יכולה להניב תוצאות משמעותיות גם בלי שימוש בטכניקות אחרות:

שמירה על יכולות כלליות: כוונון עדין ( PEFT/LoRA) גורם למשקלים של מודל להסתמך יותר מדי על חלוקה ספציפית של נתונים. לעתים קרובות זה מוביל ל'שכחה קטסטרופלית', שבה המודל משתפר בתחביר הספציפי שלכם אבל נחלש בלוגיקה כללית ובבטיחות. ‫APO לא משנה את המשקלים, וכך משמר את היכולות של מודל הבסיס.
מילוי הוראות וגילוי אסטרטגיות: Gemini Nano v3 עבר אימון קפדני כדי למלא הוראות מערכת מורכבות. ‫APO מנצל את זה על ידי מציאת מבנה ההוראות המדויק שפותח את היכולות הסמויות של המודל, ולעתים קרובות מגלה אסטרטגיות שמהנדסים אנושיים עשויים להתקשות למצוא.

כדי לאמת את הגישה הזו, ביצענו הערכה של APO בעומסי עבודה מגוונים בסביבת ייצור. האימות שלנו הראה שיפורים עקביים בדיוק של 5-8% במגוון תרחישי שימוש.בקרב תכונות רבות שמוטמעות במכשיר, APO סיפק שיפורים משמעותיים באיכות.

תרחיש לדוגמה	סוג המשימה	תיאור המשימה	מדד	שיפור APO
סיווג נושאים	סיווג הטקסט	לסווג כתבת חדשות לנושאים כמו פיננסים, ספורט וכו'	דיוק	עלייה של 5%
סיווג לפי כוונת המשתמש	סיווג הטקסט	סיווג שאילתה של שירות לקוחות לפי כוונות	דיוק	עלייה של 8.0%
תרגום של דף אינטרנט	תרגום טקסט	תרגום דף אינטרנט מאנגלית לשפה מקומית	BLEU	עלייה של 8.57%

תהליך עבודה חלק מקצה לקצה למפתחים

שמירה על יכולות כלליות: כוונון עדין ( PEFT/LoRA) גורם למשקלים של מודל להסתמך יותר מדי על חלוקה ספציפית של נתונים. לעתים קרובות זה מוביל ל'שכחה קטסטרופלית', שבה המודל משתפר בתחביר הספציפי שלכם אבל נחלש בלוגיקה כללית ובבטיחות. ‫APO לא משנה את המשקלים, וכך משמר את היכולות של מודל הבסיס.
מילוי הוראות וגילוי אסטרטגיות: Gemini Nano v3 עבר אימון קפדני כדי למלא הוראות מערכת מורכבות. ‫APO מנצל את זה על ידי מציאת מבנה ההוראות המדויק שפותח את היכולות הסמויות של המודל, ולעתים קרובות מגלה אסטרטגיות שמהנדסים אנושיים עשויים להתקשות למצוא.

סיכום

ההשקה של אופטימיזציה אוטומטית של הנחיות (APO) מסמנת נקודת מפנה בשימוש ב-AI גנרטיבי במכשיר. אנחנו מצמצמים את הפער בין מודלים בסיסיים לבין ביצועים ברמת מומחה, וכך מספקים למפתחים את הכלים לבניית אפליקציות לנייד שהן חזקות יותר. גם אם אתם רק מתחילים עם אופטימיזציה ללא נתונים או עוברים להגדרה של שיפורים מבוססי-נתונים, עכשיו קל יותר להבין איך להגיע לאיכות גבוהה של אינטליגנציה במכשיר.אפשר להשיק היום תרחישי שימוש במכשיר לייצור באמצעות Prompt API של ML Kit וכתיבת פרומפטים משופרת ב-Vertex AI.

קישורים רלוונטיים:

נכתב על ידי:

Chetan Tekur

ניהול מוצרים

read_more הצגת הפרופיל
Chao Zhao

מהנדס תוכנה

read_more הצגת הפרופיל
Paul Zhou

מהנדס תוכנה בכיר

read_more הצגת הפרופיל
Caren Chang

מהנדס יחסי מפתחים

read_more הצגת הפרופיל

להמשך קריאה

02 Apr 2026

02 Apr 2026

חדשות על מוצרים

השקת Gemma 4 בתצוגה המקדימה למפתחים של AICore

arrow_forward

אנחנו ב-Google מחויבים להביא את מודלי ה-AI הכי משוכללים ישירות למכשירי Android שנמצאים בכיס שלכם. היום אנחנו שמחים להודיע על השקת המודל הפתוח המתקדם ביותר שלנו: Gemma 4.
Caren Chang, David Chou • משך הקריאה: 3 דקות
3 Authors

30 באוקטובר 2025

30 באוקטובר 2025

חדשות על מוצרים

‫ML Kit’s Prompt API: Unlock Custom On-Device Gemini Nano Experiences

arrow_forward

‫AI מאפשר ליצור בקלות חוויית שימוש מותאמת אישית באפליקציות, שבה התוכן מומר לפורמט המתאים למשתמשים. בעבר, אפשרנו למפתחים לשלב את Gemini Nano באמצעות ממשקי API של ML Kit GenAI שמותאמים לתרחישי שימוש ספציפיים כמו סיכום ותיאור תמונות.
Caren Chang, Chengji Yan, Penny Li • משך הקריאה: 2 דקות
16 Jul 2026

16 Jul 2026

חדשות על מוצרים

גרסה יציבה של Android Studio Quail 2: ריבוי משימות עם סוכן ה-AI של Android Studio

arrow_forward

גרסת Android Studio Quail 2 יציבה ומוכנה לשימוש בסביבת ייצור. היא מביאה שינוי לסביבת הפיתוח המשולבת (IDE) עם תהליכי עבודה מקבילים של סוכנים, פרופילים של דליפות זיכרון שמשולבים באופן מקורי ותיקון קריסות בהתאם להקשר.
Amman Asfaw • משך הקריאה: 3 דקות
- #Gemini in Android Studio
- ‎# Quail 2
- ‎#Android Studio
- +1 ↩