Berita Produk

Meningkatkan engagement pengguna dengan Pembuatan Gambar AI

Waktu baca: 5 menit

Menambahkan gambar kustom ke aplikasi Anda dapat meningkatkan dan mempersonalisasi pengalaman pengguna secara signifikan serta meningkatkan interaksi pengguna. Postingan ini membahas dua kemampuan baru untuk pembuatan gambar dengan Firebase AI Logic: fitur pengeditan Imagen khusus, yang saat ini dalam pratinjau, dan ketersediaan umum Gemini 2.5 Flash Image (alias "Nano Banana"), yang dirancang untuk pembuatan gambar kontekstual atau percakapan. 

Meningkatkan interaksi pengguna dengan gambar yang dibuat melalui Firebase AI Logic

Model pembuatan gambar dapat digunakan untuk membuat avatar profil pengguna kustom atau untuk mengintegrasikan aset visual yang dipersonalisasi langsung ke dalam alur layar utama.  

Misalnya, Imagen menawarkan fitur pengeditan baru (dalam pratinjau developer). Sekarang Anda dapat menggambar mask dan menggunakan inpainting untuk membuat piksel dalam area yang diberi mask. Selain itu, outpainting tersedia untuk membuat piksel di luar mask.   

Rekonstruksi gambar Imagen.png

Imagen mendukung inpainting, sehingga memungkinkan pembuatan hanya sebagian gambar. 

Atau, Gemini 2.5 Flash Image (alias Nano Banana), dapat menggunakan pengetahuan umum yang lebih luas dan kemampuan penalaran model Gemini untuk membuat gambar yang relevan secara kontekstual, yang ideal untuk membuat ilustrasi dinamis yang selaras dengan pengalaman dalam aplikasi pengguna saat ini.   

 

Ilustrasi nano banana dalam konteks.png

Gunakan Gemini 2.5 Flash Image untuk membuat ilustrasi dinamis yang relevan secara kontekstual dengan aplikasi Anda. 

Terakhir, kemampuan untuk mengedit gambar secara percakapan dan berulang memungkinkan pengguna mengedit foto menggunakan bahasa alami.

 

photo edit natural language.png

Gunakan Gemini 2.5 Flash Image untuk mengedit gambar menggunakan bahasa alami.

Saat mulai mengintegrasikan AI ke aplikasi Anda, penting untuk mempelajari keamanan AI. Anda harus menilai risiko keamanan aplikasi Anda, mempertimbangkan penyesuaian untuk mengurangi risiko keamanan, melakukan pengujian keamanan yang sesuai dengan kasus penggunaan Anda, serta meminta masukan pengguna dan memantau konten.

Imagen atau Gemini: Pilihan ada di tangan Anda 

Perbedaan antara Gemini 2.5 Flash Image ("Nano Banana") dan Imagen terletak pada fokus utama dan kemampuan tingkat lanjutnya. Gemini 2.5 Flash Image, sebagai model gambar dalam rangkaian model Gemini yang lebih besar, unggul dalam pengeditan gambar percakapan, mempertahankan konteks dan konsistensi subjek di beberapa iterasi, serta memanfaatkan "pengetahuan dan penalaran umum" untuk membuat visual yang relevan secara kontekstual atau menyematkan visual yang akurat dalam urutan teks yang panjang. 

Imagen adalah model pembuatan gambar khusus Google, yang dirancang untuk kontrol kreatif yang lebih besar, yang mengkhususkan diri dalam output yang sangat fotorealistik, detail artistik, gaya tertentu, dan memberikan kontrol eksplisit untuk menentukan rasio aspek atau format gambar yang dihasilkan.

Gambar Gemini 2.5 Flash 
(Nano Banana 🍌)
Imagen

🌎 pengetahuan dan penalaran dunia untuk gambar yang lebih relevan secara kontekstual
  

💬 mengedit gambar secara percakapan sambil mempertahankan konteks
  

📖 menyematkan visual yang akurat dalam urutan teks yang panjang

📐 menentukan rasio aspek atau format gambar yang dihasilkan

 

🖌️Dukungan pengeditan berbasis mask untuk in-painting dan out-painting. 

 

🎚️ kontrol yang lebih besar atas detail gambar yang dihasilkan (kualitas, detail artistik, dan gaya tertentu)

Mari kita lihat cara menggunakannya di aplikasi Anda.
 

Rekonstruksi dengan Imagen 

Beberapa bulan lalu, kami merilis fitur pengeditan baru untuk Imagen. Meskipun Imagen kini siap untuk produksi pembuatan gambar, fitur pengeditan masih dalam pratinjau developer.

Fitur pengeditan Imagen mencakup inpainting dan outpainting, fitur pengeditan gambar berbasis mask. Kemampuan baru ini memungkinkan pengguna mengubah area tertentu pada gambar tanpa membuat ulang seluruh gambar. Artinya, Anda dapat mempertahankan bagian terbaik gambar dan hanya mengubah bagian yang ingin Anda ubah.

Imagen inpainting dog.png

Menggunakan fitur pengeditan Imagen untuk melakukan perubahan yang ditargetkan secara presisi pada gambar dan menjamin integritas gambar lainnya

Perubahan ini dilakukan dengan tetap mempertahankan elemen inti dan integritas keseluruhan gambar asli serta hanya mengubah area dalam mask.

Untuk menerapkan inpainting dengan Imagen, inisialisasi imagen-3.0-capability-001 model Imagen tertentu yang mendukung fitur pengeditan terlebih dahulu:

  // Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
        Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
            "imagen-3.0-capability-001",
            generationConfig = ImagenGenerationConfig(
                numberOfImages = 1,
                aspectRatio = ImagenAspectRatio.SQUARE_1x1,
                imageFormat = ImagenImageFormat.jpeg(compressionQuality = 75),
            ),
        )

Dari sana, tentukan fungsi inpainting:

  // Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val prompt = "remove the pancakes and make it an omelet instead"

suspend fun inpaintImageWithMask(sourceImage: Bitmap, maskImage: Bitmap, prompt: String, editSteps: Int = 50): Bitmap {
        val imageResponse = editingModel.editImage(
            referenceImages = listOf(
                ImagenRawImage(sourceImage.toImagenInlineImage()),
                ImagenRawMask(maskImage.toImagenInlineImage()),
            ),
            prompt = prompt,
            config = ImagenEditingConfig(
                editMode = ImagenEditMode.INPAINT_INSERTION,
                editSteps = editSteps,
            ),
        )
        return imageResponse.images.first().asBitmap()
    }

Anda memberikan sourceImage, maskImage, dan perintah untuk pengeditan serta jumlah langkah pengeditan yang akan dilakukan.

Anda dapat melihat cara kerjanya di Contoh Pengeditan Imagen dalam katalog Contoh AI Android.

Selain itu, Imagen mendukung outpainting yang memungkinkan Anda membiarkan model menghasilkan piksel di luar mask. Anda juga dapat menggunakan kemampuan Penyesuaian gambar Imagen untuk mengubah gaya gambar atau memperbarui subjek dalam gambar. Baca selengkapnya di dokumentasi developer Android.

Pembuatan gambar berbasis percakapan dengan Gemini 2.5 Flash Image

Salah satu cara untuk mengedit gambar dengan Gemini 2.5 Flash Image adalah dengan menggunakan kemampuan chat multi-turn model.

Pertama, lakukan inisialisasi model:

  // Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
    modelName = "gemini-2.5-flash-image",
    // Configure the model to respond with text and images (required)
    generationConfig = generationConfig {
        responseModalities = listOf(ResponseModality.TEXT,
        ResponseModality.IMAGE)
    }
)

Untuk mencapai hasil yang serupa dengan metode Imagen berbasis mask yang dijelaskan di atas, kita dapat menggunakan chat API untuk memulai percakapan dengan Gemini 2.5 Flash Image.

  // Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

// Initialize the chat
val chat = model.startChat()


// Load a bitmap
val source = ImageDecoder.createSource(context.contentResolver, uri)
val bitmap = ImageDecoder.decodeBitmap(source)


// Create the initial prompt instructing the model to edit the image
val prompt = content {
    image(bitmap)
    text("remove the pancakes and add an omelet")
}

// To generate an initial response, send a user message with the image and text prompt
var response = chat.sendMessage(prompt)

// Inspect the returned image
var generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

Anda dapat melihat cara kerjanya di contoh Gemini Image Chat dalam katalog Contoh AI Android dan membaca selengkapnya di dokumentasi Android.

Kesimpulan

Imagen dan Gemini 2.5 Flash Image menawarkan kemampuan yang canggih, sehingga Anda dapat memilih model pembuatan gambar yang ideal untuk mempersonalisasi aplikasi dan meningkatkan engagement pengguna, bergantung pada kasus penggunaan spesifik Anda.

Ditulis oleh:

Lanjutkan membaca