Berita Produk

Meningkatkan interaksi pengguna dengan Pembuatan Gambar AI

Waktu baca: 5 menit

Menambahkan gambar kustom ke aplikasi dapat meningkatkan dan mempersonalisasi pengalaman pengguna secara signifikan serta meningkatkan interaksi pengguna. Postingan ini membahas dua kemampuan baru untuk pembuatan gambar dengan Firebase AI Logic: fitur pengeditan Imagen khusus, yang saat ini dalam pratinjau, dan ketersediaan umum Gemini 2.5 Flash Image (alias "Nano Banana"), yang dirancang untuk pembuatan gambar kontekstual atau percakapan.

Meningkatkan interaksi pengguna dengan gambar yang dibuat melalui Firebase AI Logic

Model pembuatan gambar dapat digunakan untuk membuat avatar profil pengguna kustom atau mengintegrasikan aset visual yang dipersonalisasi langsung ke dalam alur layar utama.  

Misalnya, Imagen menawarkan fitur pengeditan baru (dalam pratinjau developer). Sekarang Anda dapat menggambar mask dan menggunakan inpainting untuk membuat piksel dalam area yang di-mask. Selain itu, outpainting tersedia untuk membuat piksel di luar mask.   

Rekonstruksi gambar Imagen.png

Imagen mendukung inpainting, yang memungkinkan pembuatan hanya sebagian gambar. 

Atau, Gemini 2.5 Flash Image (alias Nano Banana), dapat menggunakan pengetahuan umum yang diperluas dan kemampuan penalaran model Gemini untuk membuat gambar yang relevan secara kontekstual, yang ideal untuk membuat ilustrasi dinamis yang selaras dengan pengalaman dalam aplikasi pengguna saat ini.   

 

Ilustrasi nano banana dalam konteks.png

Gunakan Gemini 2.5 Flash Image untuk membuat ilustrasi dinamis yang relevan secara kontekstual dengan aplikasi Anda.

Terakhir, kemampuan untuk mengedit gambar secara percakapan dan berulang memungkinkan pengguna mengedit foto menggunakan bahasa alami.

 

photo edit natural language.png

Gunakan Gemini 2.5 Flash Image untuk mengedit gambar menggunakan bahasa alami.

Saat mulai mengintegrasikan AI ke aplikasi, penting untuk mempelajari tentang keamanan AI. Secara khusus, penting untuk menilai risiko keamanan aplikasi Anda, mempertimbangkan penyesuaian untuk mengurangi risiko keamanan, melakukan pengujian keamanan yang sesuai dengan kasus penggunaan Anda, serta meminta masukan pengguna dan memantau konten.

Imagen atau Gemini: Pilihan ada di tangan Anda

Perbedaan antara Gemini 2.5 Flash Image ("Nano Banana") dan Imagen terletak pada fokus utama dan kemampuan canggihnya. Gemini 2.5 Flash Image, sebagai model gambar dalam keluarga Gemini yang lebih besar, unggul dalam pengeditan gambar percakapan, mempertahankan konteks dan konsistensi subjek di beberapa iterasi, serta memanfaatkan "pengetahuan umum dan penalaran" untuk membuat visual yang relevan secara kontekstual atau menyematkan visual yang akurat dalam urutan teks yang panjang. 

Imagen adalah model pembuatan gambar khusus Google, yang dirancang untuk kontrol kreatif yang lebih besar, yang mengkhususkan diri dalam output yang sangat fotorealistis, detail artistik, gaya tertentu, dan memberikan kontrol eksplisit untuk menentukan rasio aspek atau format gambar yang dibuat.

Gemini 2.5 Flash Images 
(Nano Banana 🍌)
Imagen

🌎 pengetahuan umum dan penalaran untuk gambar yang lebih relevan secara kontekstual

💬 mengedit gambar secara percakapan sambil mempertahankan konteks

📖 menyematkan visual yang akurat dalam urutan teks yang panjang

📐 menentukan rasio aspek atau format gambar yang dibuat

 

🖌️Dukungan pengeditan berbasis mask untuk in-painting dan out-painting. 

 

🎚️ kontrol yang lebih besar atas detail gambar yang dibuat (kualitas, detail artistik, dan gaya tertentu)

Mari kita lihat cara menggunakannya di aplikasi Anda.

Inpainting dengan Imagen

Beberapa bulan lalu, kami merilis fitur pengeditan baru untuk Imagen. Meskipun Imagen kini siap untuk produksi pembuatan gambar, fitur pengeditan masih dalam pratinjau developer.

Fitur pengeditan Imagen mencakup inpainting dan outpainting, fitur pengeditan gambar berbasis mask. Kemampuan baru ini memungkinkan pengguna mengubah area tertentu dari gambar tanpa membuat ulang seluruh gambar. Artinya, Anda dapat mempertahankan bagian terbaik dari gambar dan hanya mengubah bagian yang ingin Anda ubah.

Imagen inpainting dog.png

Gunakan fitur pengeditan Imagen untuk membuat perubahan yang ditargetkan secara presisi dalam gambar dan menjamin integritas gambar lainnya

Perubahan ini dilakukan dengan mempertahankan elemen inti dan integritas keseluruhan gambar asli serta hanya mengubah area dalam mask.

Untuk menerapkan inpainting dengan Imagen, pertama-tama lakukan inisialisasi imagen-3.0-capability-001, model Imagen tertentu yang mendukung fitur pengeditan:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
        Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
            "imagen-3.0-capability-001",
            generationConfig = ImagenGenerationConfig(
                numberOfImages = 1,
                aspectRatio = ImagenAspectRatio.SQUARE_1x1,
                imageFormat = ImagenImageFormat.jpeg(compressionQuality = 75),
            ),
        )

Dari sana, tentukan fungsi inpainting:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val prompt = "remove the pancakes and make it an omelet instead"

suspend fun inpaintImageWithMask(sourceImage: Bitmap, maskImage: Bitmap, prompt: String, editSteps: Int = 50): Bitmap {
        val imageResponse = editingModel.editImage(
            referenceImages = listOf(
                ImagenRawImage(sourceImage.toImagenInlineImage()),
                ImagenRawMask(maskImage.toImagenInlineImage()),
            ),
            prompt = prompt,
            config = ImagenEditingConfig(
                editMode = ImagenEditMode.INPAINT_INSERTION,
                editSteps = editSteps,
            ),
        )
        return imageResponse.images.first().asBitmap()
    }

Anda memberikan sourceImage, maskImage, dan perintah untuk pengeditan serta jumlah langkah pengeditan yang akan dilakukan.

Anda dapat melihatnya dalam tindakan di Contoh Pengeditan Imagen di katalog Contoh AI Android.

Imagen juga mendukung outpainting yang memungkinkan Anda mengizinkan model membuat piksel di luar mask. Anda juga dapat menggunakan kemampuan Penyesuaian gambar Imagen untuk mengubah gaya gambar atau memperbarui subjek dalam gambar. Baca selengkapnya di dokumentasi developer Android.

Pembuatan gambar percakapan dengan Gemini 2.5 Flash Image

Salah satu cara untuk mengedit gambar dengan Gemini 2.5 Flash Image adalah dengan menggunakan kemampuan chat multi-turn model.

Pertama, lakukan inisialisasi model:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
    modelName = "gemini-2.5-flash-image",
    // Configure the model to respond with text and images (required)
    generationConfig = generationConfig {
        responseModalities = listOf(ResponseModality.TEXT,
        ResponseModality.IMAGE)
    }
)

Untuk mencapai hasil yang serupa dengan metode Imagen berbasis mask yang dijelaskan di atas, kita dapat menggunakan chat API untuk memulai percakapan dengan Gemini 2.5 Flash Image.

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

// Initialize the chat
val chat = model.startChat()


// Load a bitmap
val source = ImageDecoder.createSource(context.contentResolver, uri)
val bitmap = ImageDecoder.decodeBitmap(source)


// Create the initial prompt instructing the model to edit the image
val prompt = content {
    image(bitmap)
    text("remove the pancakes and add an omelet")
}

// To generate an initial response, send a user message with the image and text prompt
var response = chat.sendMessage(prompt)

// Inspect the returned image
var generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

Anda dapat melihatnya dalam tindakan di contoh Chat Gambar Gemini di katalog Contoh AI Android dan membaca selengkapnya di dokumentasi Android.

Kesimpulan

Imagen dan Gemini 2.5 Flash Image menawarkan kemampuan yang canggih, yang memungkinkan Anda memilih model pembuatan gambar yang ideal untuk mempersonalisasi aplikasi dan meningkatkan interaksi pengguna, bergantung pada kasus penggunaan tertentu.

Ditulis oleh:

Lanjutkan membaca