חדשות על מוצרים

איך אופטימיזציה אוטומטית של הנחיות משפרת את האיכות של GenAI Prompt API ב-ML Kit

משך הקריאה: 3 דקות

אופטימיזציה אוטומטית של הנחיות (APO)

כדי לעזור לכם להשתמש בתרחישי השימוש של ML Kit Prompt API בסביבת ייצור, אנחנו שמחים להודיע על אופטימיזציה אוטומטית של הנחיות (APO) שמיועדת למודלים במכשיר ב-Vertex AI. התכונה 'אופטימיזציה אוטומטית של הנחיות' עוזרת לכם למצוא באופן אוטומטי את ההנחיה האופטימלית לתרחישי השימוש שלכם.

העידן של AI במכשיר כבר לא הבטחה – הוא מציאות. עם ההשקה של Gemini Nano v3, אנחנו מעניקים למשתמשים יכולות חסרות תקדים של הבנת שפה ומולטי-מודאליות ישירות בכף היד. באמצעות משפחת המודלים Gemini Nano, אנחנו מספקים כיסוי רחב של מכשירים נתמכים בסביבה העסקית של Android. אבל למפתחים שיוצרים את הדור הבא של אפליקציות חכמות, גישה למודל עוצמתי היא רק השלב הראשון. האתגר האמיתי הוא התאמה אישית: איך מתאימים מודל בסיסי לביצועים ברמת מומחה לתרחיש השימוש הספציפי שלכם בלי לחרוג מהמגבלות של חומרת הנייד?

בעולם של מעקב בצד השרת, מודלים גדולים של שפה הם בדרך כלל בעלי יכולות גבוהות ודורשים פחות התאמה לדומיין. גם כשצריך, אפשר להשתמש באפשרויות מתקדמות יותר כמו כוונון עדין של LoRA (התאמה בדרגה נמוכה). עם זאת, הארכיטקטורה הייחודית של Android AICore נותנת עדיפות למודל מערכת משותף ויעיל בזיכרון. המשמעות היא שפריסת מתאמי LoRA מותאמים אישית לכל אפליקציה בנפרד מציבה אתגרים בשירותי המערכת המשותפים האלה.

אבל יש דרך חלופית שיכולה להיות משפיעה באותה מידה. בעזרת אופטימיזציה אוטומטית של הנחיות (APO) ב-Vertex AI, מפתחים יכולים להשיג איכות שמתקרבת לזו של כוונון עדין, וכל זאת תוך עבודה חלקה בסביבת הביצוע המקורית של Android. השיטה APO מתמקדת בהוראות מערכת מעולות, ומאפשרת למפתחים להתאים את התנהגות המודל בצורה חזקה וניתנת להרחבה יותר מאשר פתרונות מסורתיים של כוונון עדין.

הערה: ‫Gemini Nano V3 הוא גרסה שעברה אופטימיזציה לאיכות של מודל Gemma 3N המהולל. כל האופטימיזציות של ההנחיות שמתבצעות במודל Gemma 3N בקוד פתוח יחולו גם על Gemini Nano V3. במכשירים נתמכים, ממשקי ה-API של ML Kit GenAI משתמשים במודל nano-v3 כדי למקסם את האיכות למפתחי Android

APO block diagram.jpg

ה-APO מתייחס להנחיה לא כאל טקסט סטטי, אלא כאל משטח שניתן לתכנות שאפשר לבצע בו אופטימיזציה. הוא משתמש במודלים בצד השרת (כמו Gemini Pro ו-Flash) כדי להציע הנחיות, להעריך וריאציות ולמצוא את ההנחיה האופטימלית למשימה הספציפית שלכם. התהליך הזה משתמש בשלושה מנגנונים טכניים ספציפיים כדי למקסם את הביצועים:

  1. ניתוח שגיאות אוטומטי: APO מנתח דפוסי שגיאות מנתוני האימון כדי לזהות באופן אוטומטי נקודות חולשה ספציפיות בהנחיה הראשונית.
  2. זיקוק הוראות סמנטיות: המודל מנתח דוגמאות אימון רבות כדי לזקק את "הכוונה האמיתית" של משימה, ויוצר הוראות שמשקפות בצורה מדויקת יותר את התפלגות הנתונים האמיתית.
  3. בדיקה מקבילה של מועמדים: במקום לבדוק רעיון אחד בכל פעם, APO יוצרת ובודקת במקביל מספר מועמדים להנחיות כדי לזהות את המקסימום הגלובלי של האיכות.

למה APO יכול לשפר את איכות הכוונון

יש תפיסה מוטעית נפוצה שלפיה כוונון עדין תמיד מניב איכות טובה יותר מאשר הנחיות. במודלים מודרניים כמו Gemini Nano v3, הנדסת הנחיות יכולה להניב תוצאות משמעותיות גם בלי שימוש בטכניקות אחרות:

  • שמירה על יכולות כלליות: כוונון עדין ( PEFT/LoRA) גורם למשקלים של מודל להתמקד יתר על המידה בהתפלגות נתונים ספציפית. זה מוביל לעיתים קרובות ל'שכחה קטסטרופלית', שבה המודל משתפר בתחביר הספציפי שלכם אבל נחלש בלוגיקה ובבטיחות הכלליות. ‫APO לא משנה את המשקלים, וכך משמר את היכולות של מודל הבסיס.
  • מילוי הוראות וגילוי אסטרטגיות: Gemini Nano v3 עבר אימון קפדני כדי למלא הוראות מערכת מורכבות. ה-APO מנצל את זה על ידי מציאת מבנה ההוראות המדויק שפותח את היכולות הסמויות של המודל, ולעתים קרובות הוא מגלה אסטרטגיות שמהנדסים אנושיים עשויים להתקשות למצוא. 

כדי לאמת את הגישה הזו, ביצענו הערכה של APO בעומסי עבודה מגוונים בסביבת ייצור. האימות שלנו הראה שיפורים עקביים בדיוק של 5-8% במגוון תרחישי שימוש.בקרב תכונות רבות שמוטמעות במכשיר, APO סיפק שיפורים משמעותיים באיכות.

תרחיש לדוגמהסוג המשימהתיאור המשימהמדדשיפור של APO
סיווג נושאיםסיווג טקסטסיווג כתבה לנושאים כמו פיננסים, ספורט וכו'דיוקעלייה של 5%
סיווג לפי כוונת המשתמשסיווג טקסטסיווג שאילתה של שירות לקוחות לפי כוונותדיוקעלייה של 8.0%
תרגום של דף אינטרנטתרגום טקסטתרגום דף אינטרנט מאנגלית לשפה מקומיתBLEUעלייה של 8.57%

תהליך עבודה חלק מקצה לקצה למפתחים

יש תפיסה מוטעית נפוצה שלפיה כוונון עדין תמיד מניב איכות טובה יותר מאשר הנחיות. במודלים מודרניים כמו Gemini Nano v3, הנדסת הנחיות יכולה להניב תוצאות משמעותיות גם בלי שימוש בטכניקות אחרות:

  • שמירה על יכולות כלליות: כוונון עדין ( PEFT/LoRA) גורם למשקלים של מודל להתמקד יתר על המידה בהתפלגות נתונים ספציפית. זה מוביל לעיתים קרובות ל'שכחה קטסטרופלית', שבה המודל משתפר בתחביר הספציפי שלכם אבל נחלש בלוגיקה ובבטיחות הכלליות. ‫APO לא משנה את המשקלים, וכך משמר את היכולות של מודל הבסיס.
  • מילוי הוראות וגילוי אסטרטגיות: Gemini Nano v3 עבר אימון קפדני כדי למלא הוראות מערכת מורכבות. ה-APO מנצל את זה על ידי מציאת מבנה ההוראות המדויק שפותח את היכולות הסמויות של המודל, ולעתים קרובות הוא מגלה אסטרטגיות שמהנדסים אנושיים עשויים להתקשות למצוא. 

כדי לאמת את הגישה הזו, ביצענו הערכה של APO בעומסי עבודה מגוונים בסביבת ייצור. האימות שלנו הראה שיפורים עקביים בדיוק של 5-8% במגוון תרחישי שימוש.בקרב תכונות רבות שמוטמעות במכשיר, APO סיפק שיפורים משמעותיים באיכות.

סיכום

ההשקה של אופטימיזציה אוטומטית של הנחיות (APO) מסמנת נקודת מפנה בשימוש ב-AI גנרטיבי במכשיר. אנחנו מצמצמים את הפער בין מודלים בסיסיים לבין ביצועים ברמת מומחה, וכך מספקים למפתחים את הכלים לבניית אפליקציות לנייד שהן חזקות יותר. גם אם אתם רק מתחילים עם אופטימיזציה ללא נתונים או עוברים לשלב הייצור עם שיפור מבוסס-נתונים, עכשיו קל יותר להבין איך להגיע לאיכות גבוהה של בינה מלאכותית במכשיר. אפשר להשיק היום תרחישי שימוש במכשיר באמצעות Prompt API של ML Kit ואופטימיזציה אוטומטית של הנחיות ב-Vertex AI. 

קישורים רלוונטיים: 

להמשך הקריאה