Meningkatkan interaksi pengguna dengan Pembuatan Gambar AI

Waktu baca: 5 menit

13 Oktober 2025

Menambahkan gambar kustom ke aplikasi dapat meningkatkan dan mempersonalisasi pengalaman pengguna secara signifikan serta meningkatkan interaksi pengguna. Postingan ini membahas dua kemampuan baru untuk pembuatan gambar dengan Firebase AI Logic: fitur pengeditan Imagen khusus, yang saat ini dalam pratinjau, dan ketersediaan umum Gemini 2.5 Flash Image (a.k.a "Nano Banana"), yang dirancang untuk pembuatan gambar kontekstual atau percakapan.

Meningkatkan interaksi pengguna dengan gambar yang dibuat melalui Firebase AI Logic

Model pembuatan gambar dapat digunakan untuk membuat avatar profil pengguna kustom atau mengintegrasikan aset visual yang dipersonalisasi langsung ke dalam alur layar utama.

Misalnya, Imagen menawarkan fitur pengeditan baru (dalam pratinjau developer). Sekarang Anda dapat menggambar mask dan menggunakan inpainting untuk membuat piksel dalam area yang di-mask. Selain itu, outpainting tersedia untuk membuat piksel di luar mask.

Imagen mendukung inpainting, yang memungkinkan pembuatan hanya sebagian gambar.

Atau, Gemini 2.5 Flash Image (a.k.a Nano Banana), dapat menggunakan pengetahuan umum yang diperluas dan kemampuan penalaran model Gemini untuk membuat gambar yang relevan secara kontekstual, yang ideal untuk membuat ilustrasi dinamis yang selaras dengan pengalaman dalam aplikasi pengguna saat ini.

Gunakan Gemini 2.5 Flash Image untuk membuat ilustrasi dinamis yang relevan secara kontekstual dengan aplikasi Anda.

Terakhir, kemampuan untuk mengedit gambar secara percakapan dan berulang memungkinkan pengguna mengedit foto menggunakan bahasa alami.

Gunakan Gemini 2.5 Flash Image untuk mengedit gambar menggunakan bahasa alami.

Saat mulai mengintegrasikan AI ke aplikasi, penting untuk mempelajari tentang keamanan AI. Secara khusus, penting untuk menilai risiko keamanan aplikasi Anda, mempertimbangkan penyesuaian untuk mengurangi risiko keamanan, melakukan pengujian keamanan yang sesuai dengan kasus penggunaan Anda, serta meminta masukan pengguna dan memantau konten.

Imagen atau Gemini: Pilihan ada di tangan Anda

Perbedaan antara Gemini 2.5 Flash Image ("Nano Banana") dan Imagen terletak pada fokus utama dan kemampuan canggihnya. Gemini 2.5 Flash Image, sebagai model gambar dalam keluarga Gemini yang lebih besar, unggul dalam pengeditan gambar percakapan, mempertahankan konteks dan konsistensi subjek di beberapa iterasi, serta memanfaatkan "pengetahuan umum dan penalaran" untuk membuat visual yang relevan secara kontekstual atau menyematkan visual yang akurat dalam urutan teks yang panjang.

Imagen adalah model pembuatan gambar khusus Google, yang dirancang untuk kontrol kreatif yang lebih besar, yang mengkhususkan diri dalam output yang sangat fotorealistis, detail artistik, gaya tertentu, dan menyediakan kontrol eksplisit untuk menentukan rasio aspek atau format gambar yang dibuat.

Gemini 2.5 Flash Images
(Nano Banana 🍌)

Imagen

🌎 pengetahuan umum dan penalaran untuk gambar yang lebih relevan secara kontekstual

💬 mengedit gambar secara percakapan sambil mempertahankan konteks

📖 menyematkan visual yang akurat dalam urutan teks yang panjang

📐 menentukan rasio aspek atau format gambar yang dibuat

🖌️Dukungan pengeditan berbasis mask untuk in-painting dan out-painting.

🎚️ kontrol yang lebih besar atas detail gambar yang dibuat (kualitas, detail artistik, dan gaya tertentu)

Mari kita lihat cara menggunakannya di aplikasi Anda.

Inpainting dengan Imagen

Beberapa bulan yang lalu, kami merilis fitur pengeditan baru untuk Imagen. Meskipun Imagen kini siap untuk produksi pembuatan gambar, fitur pengeditan masih dalam pratinjau developer.

Fitur pengeditan Imagen mencakup inpainting dan outpainting, fitur pengeditan gambar berbasis mask. Kemampuan baru ini memungkinkan pengguna mengubah area tertentu pada gambar tanpa membuat ulang seluruh gambar. Artinya, Anda dapat mempertahankan bagian terbaik gambar dan hanya mengubah bagian yang ingin Anda ubah.

Gunakan fitur pengeditan Imagen untuk membuat perubahan yang ditargetkan secara tepat dalam gambar dan menjamin integritas gambar lainnya

Perubahan ini dilakukan dengan mempertahankan elemen inti dan integritas keseluruhan gambar asli serta hanya mengubah area dalam mask.

Untuk menerapkan inpainting dengan Imagen, pertama-tama lakukan inisialisasi imagen-3.0-capability-001, model Imagen tertentu yang mendukung fitur pengeditan:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
        Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
            "imagen-3.0-capability-001",
            generationConfig = ImagenGenerationConfig(
                numberOfImages = 1,
                aspectRatio = ImagenAspectRatio.SQUARE_1x1,
                imageFormat = ImagenImageFormat.jpeg(compressionQuality = 75),
            ),
        )

Dari sana, tentukan fungsi inpainting:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val prompt = "remove the pancakes and make it an omelet instead"

suspend fun inpaintImageWithMask(sourceImage: Bitmap, maskImage: Bitmap, prompt: String, editSteps: Int = 50): Bitmap {
        val imageResponse = editingModel.editImage(
            referenceImages = listOf(
                ImagenRawImage(sourceImage.toImagenInlineImage()),
                ImagenRawMask(maskImage.toImagenInlineImage()),
            ),
            prompt = prompt,
            config = ImagenEditingConfig(
                editMode = ImagenEditMode.INPAINT_INSERTION,
                editSteps = editSteps,
            ),
        )
        return imageResponse.images.first().asBitmap()
    }

Anda memberikan sourceImage, maskImage, dan perintah untuk pengeditan serta jumlah langkah pengeditan yang akan dilakukan.

Anda dapat melihatnya dalam tindakan di Contoh Pengeditan Imagen di katalog Contoh AI Android.

Imagen juga mendukung outpainting yang memungkinkan Anda mengizinkan model membuat piksel di luar mask. Anda juga dapat menggunakan kemampuan Penyesuaian gambar Imagen untuk mengubah gaya gambar atau memperbarui subjek dalam gambar. Baca selengkapnya di dokumentasi developer Android.

Pembuatan gambar percakapan dengan Gemini 2.5 Flash Image

Salah satu cara untuk mengedit gambar dengan Gemini 2.5 Flash Image adalah menggunakan kemampuan chat multi-turn model.

Pertama, lakukan inisialisasi model:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
    modelName = "gemini-2.5-flash-image",
    // Configure the model to respond with text and images (required)
    generationConfig = generationConfig {
        responseModalities = listOf(ResponseModality.TEXT,
        ResponseModality.IMAGE)
    }
)

Untuk mencapai hasil yang serupa dengan metode Imagen berbasis mask yang dijelaskan di atas, kita dapat menggunakan chat API untuk memulai percakapan dengan Gemini 2.5 Flash Image.

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

// Initialize the chat
val chat = model.startChat()


// Load a bitmap
val source = ImageDecoder.createSource(context.contentResolver, uri)
val bitmap = ImageDecoder.decodeBitmap(source)


// Create the initial prompt instructing the model to edit the image
val prompt = content {
    image(bitmap)
    text("remove the pancakes and add an omelet")
}

// To generate an initial response, send a user message with the image and text prompt
var response = chat.sendMessage(prompt)

// Inspect the returned image
var generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

Anda dapat melihatnya dalam tindakan di contoh Chat Gambar Gemini di katalog Contoh AI Android dan membaca selengkapnya di dokumentasi Android.

Kesimpulan

Imagen dan Gemini 2.5 Flash Image menawarkan kemampuan yang canggih, yang memungkinkan Anda memilih model pembuatan gambar yang ideal untuk mempersonalisasi aplikasi dan meningkatkan interaksi pengguna, bergantung pada kasus penggunaan tertentu.

Ditulis oleh:

Thomas Ezan

Senior Developer Relations Engineer

read_more Lihat profil
Mozart Louis

Developer Relations Engineer

read_more Lihat profil

Lanjutkan membaca

17 April 2026

17 April 2026

Berita Produk

Inferensi hibrida eksperimental dan model Gemini baru untuk Android

arrow_forward

Jika Anda adalah developer Android yang ingin menerapkan fitur AI inovatif ke dalam aplikasi, kami baru-baru ini meluncurkan update baru yang canggih.
Thomas Ezan • Waktu baca: 3 menit
17 Desember 2025

17 Desember 2025

Berita Produk

Membangun aplikasi yang lebih cerdas dengan Gemini 3 Flash

arrow_forward

Hari ini, kami memperluas keluarga model Gemini 3 dengan merilis Gemini 3 Flash, kecerdasan terdepan yang dibuat untuk kecepatan dengan biaya yang lebih rendah.
Thomas Ezan • Waktu baca: 2 menit
08 Juli 2026

08 Juli 2026

Berita Produk

Mengembangkan cara LLM diukur untuk Android: era Android Bench berikutnya

arrow_forward

Pada bulan Maret lalu, kami memperkenalkan Android Bench—papan peringkat LLM untuk tugas pengembangan Android dunia nyata. Sejak saat itu, kami telah meningkatkan tolok ukur berdasarkan masukan Anda, termasuk mengevaluasi model open-weight dan menambahkan dimensi biaya dan efisiensi ke papan peringkat.
Zoe Lopez-Latorre • Waktu baca: 3 menit
- #Pengembangan Android Agentic

Thomas Ezan

Senior Developer Relations Engineer

Mozart Louis

Developer Relations Engineer

Inferensi hibrida eksperimental dan model Gemini baru untuk Android

Membangun aplikasi yang lebih cerdas dengan Gemini 3 Flash

Mengembangkan cara LLM diukur untuk Android: era Android Bench berikutnya