Menambahkan gambar kustom ke aplikasi Anda dapat meningkatkan dan mempersonalisasi pengalaman pengguna secara signifikan serta meningkatkan interaksi pengguna. Postingan ini membahas dua kemampuan baru untuk pembuatan gambar dengan Firebase AI Logic: fitur pengeditan Imagen khusus, yang saat ini dalam pratinjau, dan ketersediaan umum Gemini 2.5 Flash Image (alias "Nano Banana"), yang dirancang untuk pembuatan gambar kontekstual atau percakapan.
Meningkatkan interaksi pengguna dengan gambar yang dibuat melalui Firebase AI Logic
Model pembuatan gambar dapat digunakan untuk membuat avatar profil pengguna kustom atau untuk mengintegrasikan aset visual yang dipersonalisasi langsung ke dalam alur layar utama.
Misalnya, Imagen menawarkan fitur pengeditan baru (dalam pratinjau developer). Sekarang Anda dapat menggambar mask dan menggunakan inpainting untuk membuat piksel dalam area yang diberi mask. Selain itu, outpainting tersedia untuk membuat piksel di luar mask.
Imagen mendukung inpainting, sehingga memungkinkan pembuatan hanya sebagian gambar.
Atau, Gemini 2.5 Flash Image (alias Nano Banana), dapat menggunakan pengetahuan umum yang lebih luas dan kemampuan penalaran model Gemini untuk membuat gambar yang relevan secara kontekstual, yang ideal untuk membuat ilustrasi dinamis yang selaras dengan pengalaman dalam aplikasi pengguna saat ini.
Gunakan Gemini 2.5 Flash Image untuk membuat ilustrasi dinamis yang relevan secara kontekstual dengan aplikasi Anda.
Terakhir, kemampuan untuk mengedit gambar secara percakapan dan berulang memungkinkan pengguna mengedit foto menggunakan bahasa alami.
Gunakan Gemini 2.5 Flash Image untuk mengedit gambar menggunakan bahasa alami.
Saat mulai mengintegrasikan AI ke aplikasi Anda, penting untuk mempelajari keamanan AI. Anda harus menilai risiko keamanan aplikasi Anda, mempertimbangkan penyesuaian untuk mengurangi risiko keamanan, melakukan pengujian keamanan yang sesuai dengan kasus penggunaan Anda, serta meminta masukan pengguna dan memantau konten.
Imagen atau Gemini: Pilihan ada di tangan Anda
Perbedaan antara Gemini 2.5 Flash Image ("Nano Banana") dan Imagen terletak pada fokus utama dan kemampuan tingkat lanjutnya. Gemini 2.5 Flash Image, sebagai model gambar dalam rangkaian model Gemini yang lebih besar, unggul dalam pengeditan gambar percakapan, mempertahankan konteks dan konsistensi subjek di beberapa iterasi, serta memanfaatkan "pengetahuan dan penalaran umum" untuk membuat visual yang relevan secara kontekstual atau menyematkan visual yang akurat dalam urutan teks yang panjang.
Imagen adalah model pembuatan gambar khusus Google, yang dirancang untuk kontrol kreatif yang lebih besar, yang mengkhususkan diri dalam output yang sangat fotorealistik, detail artistik, gaya tertentu, dan memberikan kontrol eksplisit untuk menentukan rasio aspek atau format gambar yang dihasilkan.
| Gambar Gemini 2.5 Flash (Nano Banana 🍌) | Imagen |
🌎 pengetahuan dan penalaran dunia untuk gambar yang lebih relevan secara kontekstual 💬 mengedit gambar secara percakapan sambil mempertahankan konteks 📖 menyematkan visual yang akurat dalam urutan teks yang panjang | 📐 menentukan rasio aspek atau format gambar yang dihasilkan
🖌️Dukungan pengeditan berbasis mask untuk in-painting dan out-painting.
🎚️ kontrol yang lebih besar atas detail gambar yang dihasilkan (kualitas, detail artistik, dan gaya tertentu) |
Mari kita lihat cara menggunakannya di aplikasi Anda.
Rekonstruksi dengan Imagen
Beberapa bulan lalu, kami merilis fitur pengeditan baru untuk Imagen. Meskipun Imagen kini siap untuk produksi pembuatan gambar, fitur pengeditan masih dalam pratinjau developer.
Fitur pengeditan Imagen mencakup inpainting dan outpainting, fitur pengeditan gambar berbasis mask. Kemampuan baru ini memungkinkan pengguna mengubah area tertentu pada gambar tanpa membuat ulang seluruh gambar. Artinya, Anda dapat mempertahankan bagian terbaik gambar dan hanya mengubah bagian yang ingin Anda ubah.
Menggunakan fitur pengeditan Imagen untuk melakukan perubahan yang ditargetkan secara presisi pada gambar dan menjamin integritas gambar lainnya
Perubahan ini dilakukan dengan tetap mempertahankan elemen inti dan integritas keseluruhan gambar asli serta hanya mengubah area dalam mask.
Untuk menerapkan inpainting dengan Imagen, inisialisasi imagen-3.0-capability-001 model Imagen tertentu yang mendukung fitur pengeditan terlebih dahulu:
// Copyright 2025 Google LLC. // SPDX-License-Identifier: Apache-2.0 val editingModel = Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel( "imagen-3.0-capability-001", generationConfig = ImagenGenerationConfig( numberOfImages = 1, aspectRatio = ImagenAspectRatio.SQUARE_1x1, imageFormat = ImagenImageFormat.jpeg(compressionQuality = 75), ), )
Dari sana, tentukan fungsi inpainting:
// Copyright 2025 Google LLC. // SPDX-License-Identifier: Apache-2.0 val prompt = "remove the pancakes and make it an omelet instead" suspend fun inpaintImageWithMask(sourceImage: Bitmap, maskImage: Bitmap, prompt: String, editSteps: Int = 50): Bitmap { val imageResponse = editingModel.editImage( referenceImages = listOf( ImagenRawImage(sourceImage.toImagenInlineImage()), ImagenRawMask(maskImage.toImagenInlineImage()), ), prompt = prompt, config = ImagenEditingConfig( editMode = ImagenEditMode.INPAINT_INSERTION, editSteps = editSteps, ), ) return imageResponse.images.first().asBitmap() }
Anda memberikan sourceImage, maskImage, dan perintah untuk pengeditan serta jumlah langkah pengeditan yang akan dilakukan.
Anda dapat melihat cara kerjanya di Contoh Pengeditan Imagen dalam katalog Contoh AI Android.
Selain itu, Imagen mendukung outpainting yang memungkinkan Anda membiarkan model menghasilkan piksel di luar mask. Anda juga dapat menggunakan kemampuan Penyesuaian gambar Imagen untuk mengubah gaya gambar atau memperbarui subjek dalam gambar. Baca selengkapnya di dokumentasi developer Android.
Pembuatan gambar berbasis percakapan dengan Gemini 2.5 Flash Image
Salah satu cara untuk mengedit gambar dengan Gemini 2.5 Flash Image adalah dengan menggunakan kemampuan chat multi-turn model.
Pertama, lakukan inisialisasi model:
// Copyright 2025 Google LLC. // SPDX-License-Identifier: Apache-2.0 val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel( modelName = "gemini-2.5-flash-image", // Configure the model to respond with text and images (required) generationConfig = generationConfig { responseModalities = listOf(ResponseModality.TEXT, ResponseModality.IMAGE) } )
Untuk mencapai hasil yang serupa dengan metode Imagen berbasis mask yang dijelaskan di atas, kita dapat menggunakan chat API untuk memulai percakapan dengan Gemini 2.5 Flash Image.
// Copyright 2025 Google LLC. // SPDX-License-Identifier: Apache-2.0 // Initialize the chat val chat = model.startChat() // Load a bitmap val source = ImageDecoder.createSource(context.contentResolver, uri) val bitmap = ImageDecoder.decodeBitmap(source) // Create the initial prompt instructing the model to edit the image val prompt = content { image(bitmap) text("remove the pancakes and add an omelet") } // To generate an initial response, send a user message with the image and text prompt var response = chat.sendMessage(prompt) // Inspect the returned image var generatedImageAsBitmap = response .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image // Follow up requests do not need to specify the image again response = chat.sendMessage("Now, center the omelet in the pan") generatedImageAsBitmap = response .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image
Anda dapat melihat cara kerjanya di contoh Gemini Image Chat dalam katalog Contoh AI Android dan membaca selengkapnya di dokumentasi Android.
Kesimpulan
Imagen dan Gemini 2.5 Flash Image menawarkan kemampuan yang canggih, sehingga Anda dapat memilih model pembuatan gambar yang ideal untuk mempersonalisasi aplikasi dan meningkatkan engagement pengguna, bergantung pada kasus penggunaan spesifik Anda.
Lanjutkan membaca
-
Berita Produk
Hari ini, kami memperluas rangkaian model Gemini 3 dengan merilis Gemini 3 Flash, kecerdasan terdepan yang dibuat untuk bekerja cepat dengan biaya yang lebih rendah.
Thomas Ezan • Waktu baca: 2 menit
-
Berita Produk
Setiap developer memiliki alur kerja dan kebutuhan AI yang unik, dan penting untuk dapat memilih cara AI membantu pengembangan Anda. Pada bulan Januari, kami memperkenalkan kemampuan untuk memilih model AI lokal atau jarak jauh guna mendukung fungsi AI di Android Studio
Matthew Warner • Waktu baca: 2 menit
-
Berita Produk
Android Studio Panda 3 kini stabil dan siap digunakan dalam produksi. Rilis ini memberi Anda lebih banyak kontrol dan penyesuaian atas alur kerja yang didukung AI, sehingga mempermudah pembuatan aplikasi Android berkualitas tinggi.
Matt Dyor • Waktu baca 3 menit
Terus dapatkan informasi
Dapatkan insight pengembangan Android terbaru yang dikirim ke kotak masuk Anda setiap minggu.