שיפור רמת המעורבות של המשתמשים באמצעות יצירת תמונות על ידי AI

משך הקריאה: 5 דקות

13 Oct 2025

הוספה של תמונות בהתאמה אישית לאפליקציה יכולה לשפר באופן משמעותי את חוויית המשתמש ולהתאים אותה אישית, וגם להגביר את מעורבות המשתמשים. בפוסט הזה נסביר על שתי יכולות חדשות ליצירת תמונות באמצעות Firebase AI Logic: תכונות העריכה הייעודיות של Imagen, שזמינות כרגע בגרסת טרום-השקה (Preview), והזמינות לכלל המשתמשים (GA) של Gemini 2.5 Flash Image (שנקרא גם Nano Banana), שנועד ליצירת תמונות בהקשר או בשיחה.

הגברת מידת העניין של המשתמשים באמצעות תמונות שנוצרו באמצעות Firebase AI Logic

אפשר להשתמש במודלים של יצירת תמונות כדי ליצור דמויות אווטאר מותאמות אישית לפרופיל המשתמש, או לשלב נכסים חזותיים מותאמים אישית ישירות בתהליכי עבודה מרכזיים במסך.

לדוגמה, Imagen מציע תכונות עריכה חדשות (בגרסת טרום-השקה למפתחים). עכשיו אפשר לצייר מסכה ולהשתמש בתיקון פגמים כדי ליצור פיקסלים באזור המוסתר. בנוסף, אפשר להשתמש ב-Outpainting כדי ליצור פיקסלים מחוץ למסכה.

‫Imagen תומך בתיקון תמונות, ומאפשר ליצור רק חלק מתמונה.

לחלופין, אפשר להשתמש ב-Gemini 2.5 Flash Image (שנקרא גם Nano Banana) כדי ליצור תמונות רלוונטיות להקשר. המודל הזה מתבסס על ידע נרחב על העולם ועל יכולות החשיבה הרציונלית של מודלים של Gemini, ולכן הוא אידיאלי ליצירת איורים דינמיים שתואמים לחוויית השימוש הנוכחית באפליקציה.

משתמשים ב-Gemini 2.5 Flash Image כדי ליצור איורים דינמיים שרלוונטיים להקשר של האפליקציה.

בנוסף, המשתמשים יכולים לערוך תמונה באמצעות שפה טבעית, בשיחה ובאופן איטרטיבי.

איך משתמשים ב-Gemini 2.5 Flash Image כדי לערוך תמונה באמצעות שפה טבעית

כשמתחילים לשלב AI באפליקציה, חשוב לקרוא על בטיחות ב-AI. חשוב במיוחד להעריך את סיכוני האבטחה של האפליקציה, לשקול לבצע שינויים כדי לצמצם את סיכוני הבטיחות, לבצע בדיקות בטיחות שמתאימות לתרחיש השימוש, לבקש משוב מהמשתמשים ולפקח על התוכן.

‫Imagen או Gemini: הבחירה שלכם

ההבדל בין Gemini 2.5 Flash Image (‏Nano Banana) לבין Imagen הוא במיקוד העיקרי וביכולות המתקדמות שלהם. ‫Gemini 2.5 Flash Image הוא מודל תמונות שמשתייך למשפחת Gemini הגדולה יותר. הוא מצטיין בעריכת תמונות בשיחה, בשמירה על הקשר ועל עקביות הנושא בכמה איטרציות, ובהסתמכות על "ידע על העולם והסקת מסקנות" כדי ליצור תמונות רלוונטיות להקשר או להטמיע תמונות מדויקות ברצפים ארוכים של טקסט.

‫Imagen הוא מודל ייעודי של Google ליצירת תמונות, שנועד לספק שליטה יצירתית רבה יותר. הוא מתמחה ביצירת תמונות שנראות אמיתיות עם פרטים מדויקים, בסגנונות ספציפיים ובמתן אמצעי בקרה מפורשים לציון יחס הגובה-רוחב או הפורמט של התמונה שנוצרת.

תמונות ב-Gemini 2.5 Flash
(Nano Banana 🍌)

Imagen

🌎 ידע רחב במגוון נושאים וחשיבה רציונלית להקשרים רלוונטיים יותר של תמונות

💬 עריכת תמונות בשיחה תוך שמירה על ההקשר

‫📖 הטמעת רכיבים חזותיים מדויקים ברצפים ארוכים של טקסט

‫📐 מציינים את יחס הגובה-רוחב או את הפורמט של התמונות שנוצרו

🖌️תמיכה בעריכה מבוססת-מסכה לתיקון תמונות ולציור מחוץ לתמונה.

🎚️ שליטה רבה יותר בפרטים של התמונה שנוצרת (איכות, פרטים אומנותיים וסגנונות ספציפיים)

בואו נראה איך משתמשים בהם באפליקציה.

השלמת תמונה באמצעות Imagen

לפני כמה חודשים השקנו תכונות עריכה חדשות ל-Imagen. למרות ש-Imagen מוכן עכשיו לשימוש בסביבת הייצור ליצירת תמונות, תכונות העריכה עדיין נמצאות בתצוגה מקדימה למפתחים.

תכונות העריכה ב-Imagen כוללות הוספה לתמונה והרחבה גנרטיבית, שהן תכונות עריכה של תמונות שמבוססות על מסכות. היכולת החדשה הזו מאפשרת למשתמשים לשנות אזורים ספציפיים בתמונה בלי ליצור מחדש את כל התמונה. כך תוכלו לשמור את החלקים הכי טובים בתמונה ולשנות רק את מה שאתם רוצים.

שימוש בתכונות העריכה של Imagen כדי לבצע שינויים מדויקים וממוקדים בתמונה, תוך שמירה על שלמות שאר התמונה

השינויים האלה מתבצעים תוך שמירה על רכיבי הליבה והשלמות הכוללת של התמונה המקורית, ושינוי רק של האזור במסכה.

כדי להשתמש ב-Imagen לתיקון תמונות, צריך קודם לאתחל imagen-3.0-capability-001 מודל Imagen ספציפי שתומך בתכונות עריכה:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
        Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
            "imagen-3.0-capability-001",
            generationConfig = ImagenGenerationConfig(
                numberOfImages = 1,
                aspectRatio = ImagenAspectRatio.SQUARE_1x1,
                imageFormat = ImagenImageFormat.jpeg(compressionQuality = 75),
            ),
        )

משם, מגדירים את פונקציית התיקון:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val prompt = "remove the pancakes and make it an omelet instead"

suspend fun inpaintImageWithMask(sourceImage: Bitmap, maskImage: Bitmap, prompt: String, editSteps: Int = 50): Bitmap {
        val imageResponse = editingModel.editImage(
            referenceImages = listOf(
                ImagenRawImage(sourceImage.toImagenInlineImage()),
                ImagenRawMask(maskImage.toImagenInlineImage()),
            ),
            prompt = prompt,
            config = ImagenEditingConfig(
                editMode = ImagenEditMode.INPAINT_INSERTION,
                editSteps = editSteps,
            ),
        )
        return imageResponse.images.first().asBitmap()
    }

אתם מספקים גם sourceImage, גם maskImage וגם הנחיה לעריכה, וגם את מספר שלבי העריכה שצריך לבצע.

אפשר לראות את התכונה בפעולה בדוגמה לעריכה ב-Imagen בקטלוג הדוגמאות של AI ל-Android.

בנוסף, Imagen תומך בהרחבה גנרטיבית, שמאפשרת למודל ליצור את הפיקסלים מחוץ למסכה. אפשר גם להשתמש ביכולות ההתאמה האישית של תמונות ב-Imagen כדי לשנות את הסגנון של תמונה או לעדכן נושא בתמונה. מידע נוסף זמין בתיעוד למפתחים של Android.

יצירת תמונות בשיחה באמצעות Gemini 2.5 Flash Image

אחת הדרכים לערוך תמונות באמצעות Gemini 2.5 Flash Image היא להשתמש ביכולות השיחה הרב-שלבית של המודל.

קודם כול, מפעילים את המודל:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
    modelName = "gemini-2.5-flash-image",
    // Configure the model to respond with text and images (required)
    generationConfig = generationConfig {
        responseModalities = listOf(ResponseModality.TEXT,
        ResponseModality.IMAGE)
    }
)

כדי להשיג תוצאה דומה לשיטה מבוססת-המסכה של Imagen שמתוארת למעלה, אפשר להשתמש ב-chat API כדי להתחיל שיחה עם Gemini 2.5 Flash Image.

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

// Initialize the chat
val chat = model.startChat()


// Load a bitmap
val source = ImageDecoder.createSource(context.contentResolver, uri)
val bitmap = ImageDecoder.decodeBitmap(source)


// Create the initial prompt instructing the model to edit the image
val prompt = content {
    image(bitmap)
    text("remove the pancakes and add an omelet")
}

// To generate an initial response, send a user message with the image and text prompt
var response = chat.sendMessage(prompt)

// Inspect the returned image
var generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

אפשר לראות את הפעולה שלו בדוגמה לשיחה עם תמונות ב-Gemini בקטלוג הדוגמאות של AI ל-Android, ולקרוא עליו מידע נוסף בתיעוד של Android.

סיכום

גם Imagen וגם Gemini 2.5 Flash Image מציעים יכולות עוצמתיות, שמאפשרות לכם לבחור את המודל האידיאלי ליצירת תמונות כדי להתאים אישית את האפליקציה ולשפר את מעורבות המשתמשים, בהתאם לתרחיש השימוש הספציפי שלכם.

נכתב על ידי:

Thomas Ezan

Senior Developer Relations Engineer

read_more הצגת הפרופיל
Mozart Louis

מהנדס יחסי מפתחים

read_more הצגת הפרופיל

להמשך הקריאה

17 Apr 2026

17 Apr 2026

חדשות על מוצרים

היקש היברידי ניסיוני ומודלים חדשים של Gemini ל-Android

arrow_forward

אם אתם מפתחי Android שרוצים להטמיע תכונות חדשניות מבוססות-AI באפליקציה שלכם, לאחרונה השקנו עדכונים חדשים ומתקדמים.
Thomas Ezan • משך הקריאה: 3 דקות
17 דצמבר 2025

17 דצמבר 2025

חדשות על מוצרים

בניית אפליקציות חכמות יותר באמצעות Gemini 3 Flash

arrow_forward

היום אנחנו מרחיבים את משפחת מודלי Gemini 3 עם ההשקה של Gemini 3 Flash, מודל AI מתקדם שנועד לספק מהירות גבוהה בעלות נמוכה.
Thomas Ezan • משך הקריאה: 2 דקות
26 מאי 2026

26 מאי 2026

חדשות על מוצרים

העדכונים הכי חשובים בנושא AI ב-Android ליצירת חוויות חכמות מ-Google I/O ‏2026

arrow_forward

באירוע Google I/O 2026, הצגנו את השינוי ב-Android ממערכת הפעלה למערכת חכמה. הדגמנו גם איך אפשר ליצור חוויות חכמות באופן מקורי באמצעות המערכת, ולשלב את היכולות של ה-AI של Google באפליקציות שלכם.
Jingyu Shi • משך הקריאה: 2 דקות
- ‎#Google I/O
- #Android
- ‎#AppFunctions
- ‎#במכשיר
- +2 ↩

נכתב על ידי:

Senior Developer Relations Engineer

מהנדס יחסי מפתחים

להמשך הקריאה

Thomas Ezan • משך הקריאה: 3 דקות

Thomas Ezan • משך הקריאה: 2 דקות

Jingyu Shi • משך הקריאה: 2 דקות

כדאי תמיד להיות בעניינים