Menambahkan gambar kustom ke aplikasi dapat meningkatkan dan mempersonalisasi pengalaman pengguna secara signifikan serta meningkatkan interaksi pengguna. Postingan ini membahas dua kemampuan baru untuk pembuatan gambar dengan Firebase AI Logic: fitur pengeditan Imagen khusus, yang saat ini dalam pratinjau, dan ketersediaan umum Gemini 2.5 Flash Image (alias "Nano Banana"), yang dirancang untuk pembuatan gambar kontekstual atau percakapan.
Meningkatkan interaksi pengguna dengan gambar yang dibuat melalui Firebase AI Logic
Model pembuatan gambar dapat digunakan untuk membuat avatar profil pengguna kustom atau mengintegrasikan aset visual yang dipersonalisasi langsung ke dalam alur layar utama.
Misalnya, Imagen menawarkan fitur pengeditan baru (dalam pratinjau developer). Sekarang Anda dapat menggambar mask dan menggunakan inpainting untuk membuat piksel dalam area yang di-mask. Selain itu, outpainting tersedia untuk membuat piksel di luar mask.
Imagen mendukung inpainting, yang memungkinkan pembuatan hanya sebagian gambar.
Atau, Gemini 2.5 Flash Image (alias Nano Banana), dapat menggunakan pengetahuan umum yang diperluas dan kemampuan penalaran model Gemini untuk membuat gambar yang relevan secara kontekstual, yang ideal untuk membuat ilustrasi dinamis yang selaras dengan pengalaman dalam aplikasi pengguna saat ini.
Gunakan Gemini 2.5 Flash Image untuk membuat ilustrasi dinamis yang relevan secara kontekstual dengan aplikasi Anda.
Terakhir, kemampuan untuk mengedit gambar secara percakapan dan berulang memungkinkan pengguna mengedit foto menggunakan bahasa alami.
Gunakan Gemini 2.5 Flash Image untuk mengedit gambar menggunakan bahasa alami.
Saat mulai mengintegrasikan AI ke aplikasi, penting untuk mempelajari tentang keamanan AI. Secara khusus, penting untuk menilai risiko keamanan aplikasi Anda, mempertimbangkan penyesuaian untuk mengurangi risiko keamanan, melakukan pengujian keamanan yang sesuai dengan kasus penggunaan Anda, serta meminta masukan pengguna dan memantau konten.
Imagen atau Gemini: Pilihan ada di tangan Anda
Perbedaan antara Gemini 2.5 Flash Image ("Nano Banana") dan Imagen terletak pada fokus utama dan kemampuan canggihnya. Gemini 2.5 Flash Image, sebagai model gambar dalam keluarga Gemini yang lebih besar, unggul dalam pengeditan gambar percakapan, mempertahankan konteks dan konsistensi subjek di beberapa iterasi, serta memanfaatkan "pengetahuan umum dan penalaran" untuk membuat visual yang relevan secara kontekstual atau menyematkan visual yang akurat dalam urutan teks yang panjang.
Imagen adalah model pembuatan gambar khusus Google, yang dirancang untuk kontrol kreatif yang lebih besar, yang mengkhususkan diri dalam output yang sangat fotorealistis, detail artistik, gaya tertentu, dan memberikan kontrol eksplisit untuk menentukan rasio aspek atau format gambar yang dibuat.
| Gemini 2.5 Flash Images (Nano Banana 🍌) | Imagen |
🌎 pengetahuan umum dan penalaran untuk gambar yang lebih relevan secara kontekstual 💬 mengedit gambar secara percakapan sambil mempertahankan konteks 📖 menyematkan visual yang akurat dalam urutan teks yang panjang | 📐 menentukan rasio aspek atau format gambar yang dibuat
🖌️Dukungan pengeditan berbasis mask untuk in-painting dan out-painting.
🎚️ kontrol yang lebih besar atas detail gambar yang dibuat (kualitas, detail artistik, dan gaya tertentu) |
Mari kita lihat cara menggunakannya di aplikasi Anda.
Inpainting dengan Imagen
Beberapa bulan lalu, kami merilis fitur pengeditan baru untuk Imagen. Meskipun Imagen kini siap untuk produksi pembuatan gambar, fitur pengeditan masih dalam pratinjau developer.
Fitur pengeditan Imagen mencakup inpainting dan outpainting, fitur pengeditan gambar berbasis mask. Kemampuan baru ini memungkinkan pengguna mengubah area tertentu dari gambar tanpa membuat ulang seluruh gambar. Artinya, Anda dapat mempertahankan bagian terbaik dari gambar dan hanya mengubah bagian yang ingin Anda ubah.
Gunakan fitur pengeditan Imagen untuk membuat perubahan yang ditargetkan secara presisi dalam gambar dan menjamin integritas gambar lainnya
Perubahan ini dilakukan dengan mempertahankan elemen inti dan integritas keseluruhan gambar asli serta hanya mengubah area dalam mask.
Untuk menerapkan inpainting dengan Imagen, pertama-tama lakukan inisialisasi imagen-3.0-capability-001, model Imagen tertentu yang mendukung fitur pengeditan:
// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
"imagen-3.0-capability-001",
generationConfig = ImagenGenerationConfig(
numberOfImages = 1,
aspectRatio = ImagenAspectRatio.SQUARE_1x1,
imageFormat = ImagenImageFormat.jpeg(compressionQuality = 75),
),
)Dari sana, tentukan fungsi inpainting:
// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val prompt = "remove the pancakes and make it an omelet instead"
suspend fun inpaintImageWithMask(sourceImage: Bitmap, maskImage: Bitmap, prompt: String, editSteps: Int = 50): Bitmap {
val imageResponse = editingModel.editImage(
referenceImages = listOf(
ImagenRawImage(sourceImage.toImagenInlineImage()),
ImagenRawMask(maskImage.toImagenInlineImage()),
),
prompt = prompt,
config = ImagenEditingConfig(
editMode = ImagenEditMode.INPAINT_INSERTION,
editSteps = editSteps,
),
)
return imageResponse.images.first().asBitmap()
}Anda memberikan sourceImage, maskImage, dan perintah untuk pengeditan serta jumlah langkah pengeditan yang akan dilakukan.
Anda dapat melihatnya dalam tindakan di Contoh Pengeditan Imagen di katalog Contoh AI Android.
Imagen juga mendukung outpainting yang memungkinkan Anda mengizinkan model membuat piksel di luar mask. Anda juga dapat menggunakan kemampuan Penyesuaian gambar Imagen untuk mengubah gaya gambar atau memperbarui subjek dalam gambar. Baca selengkapnya di dokumentasi developer Android.
Pembuatan gambar percakapan dengan Gemini 2.5 Flash Image
Salah satu cara untuk mengedit gambar dengan Gemini 2.5 Flash Image adalah dengan menggunakan kemampuan chat multi-turn model.
Pertama, lakukan inisialisasi model:
// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
modelName = "gemini-2.5-flash-image",
// Configure the model to respond with text and images (required)
generationConfig = generationConfig {
responseModalities = listOf(ResponseModality.TEXT,
ResponseModality.IMAGE)
}
)
Untuk mencapai hasil yang serupa dengan metode Imagen berbasis mask yang dijelaskan di atas, kita dapat menggunakan chat API untuk memulai percakapan dengan Gemini 2.5 Flash Image.
// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
// Initialize the chat
val chat = model.startChat()
// Load a bitmap
val source = ImageDecoder.createSource(context.contentResolver, uri)
val bitmap = ImageDecoder.decodeBitmap(source)
// Create the initial prompt instructing the model to edit the image
val prompt = content {
image(bitmap)
text("remove the pancakes and add an omelet")
}
// To generate an initial response, send a user message with the image and text prompt
var response = chat.sendMessage(prompt)
// Inspect the returned image
var generatedImageAsBitmap = response
.candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image
// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response
.candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image
Anda dapat melihatnya dalam tindakan di contoh Chat Gambar Gemini di katalog Contoh AI Android dan membaca selengkapnya di dokumentasi Android.
Kesimpulan
Imagen dan Gemini 2.5 Flash Image menawarkan kemampuan yang canggih, yang memungkinkan Anda memilih model pembuatan gambar yang ideal untuk mempersonalisasi aplikasi dan meningkatkan interaksi pengguna, bergantung pada kasus penggunaan tertentu.
Lanjutkan membaca
-
Berita Produk
Jika Anda adalah developer Android yang ingin menerapkan fitur AI inovatif ke dalam aplikasi, kami baru-baru ini meluncurkan update baru yang canggih.
Thomas Ezan • Waktu baca: 3 menit
-
Berita Produk
Hari ini, kami memperluas keluarga model Gemini 3 dengan merilis Gemini 3 Flash, kecerdasan terdepan yang dibuat untuk kecepatan dengan biaya yang lebih rendah.
Thomas Ezan • Waktu baca: 2 menit
-
Berita Produk
Di Google I/O 2026, kami memperkenalkan perubahan Android dari sistem operasi menjadi sistem kecerdasan. Kami juga menunjukkan cara membangun pengalaman cerdas secara native dengan sistem dan menghadirkan kecanggihan AI Google ke dalam aplikasi Anda.
Jingyu Shi • Waktu baca: 2 menit
Terus dapatkan informasi
Dapatkan insight pengembangan Android terbaru yang dikirim ke kotak masuk Anda setiap minggu.