Wiadomości o usługach

Interfejs Prompt API w ML Kit: odblokuj niestandardowe funkcje Gemini Nano na urządzeniu

Czas czytania: 2 min

30 października 2025

3 Autorzy

Caren Chang, Chengji Yan, Penny Li

AI ułatwia tworzenie spersonalizowanych aplikacji, które przekształcają treści w odpowiedni format dla użytkowników. Wcześniej umożliwiliśmy deweloperom integrację z Gemini Nano za pomocą interfejsów ML Kit GenAI API dostosowanych do konkretnych zastosowań, takich jak podsumowywanie i opisywanie obrazów.

Dziś osiągamy ważny kamień milowy w rozwoju generatywnej AI na urządzeniach z Androidem. Ogłaszamy wersję alfa interfejsu ML Kit GenAI Prompt API. Ten interfejs API umożliwia wysyłanie do Gemini Nano żądań w języku naturalnym i multimodalnych, co odpowiada na zapotrzebowanie na większą kontrolę i elastyczność podczas tworzenia z użyciem modeli generatywnych.

Partnerzy tacy jak Kakao już korzystają z interfejsu Prompt API, tworząc unikalne rozwiązania, które mają realny wpływ na świat. Już dziś możesz wypróbować zaawansowane funkcje interfejsu Prompt API przy użyciu minimalnej ilości kodu.

Przejście od gotowych do niestandardowych funkcji generatywnej AI na urządzeniu

Interfejs Prompt API wykracza poza gotowe funkcje i obsługuje niestandardowe przypadki użycia generatywnej AI w aplikacjach. Umożliwia tworzenie unikalnych funkcji ze złożonym przekształcaniem danych. Interfejs Prompt API korzysta z modelu Gemini Nano na urządzeniu, aby przetwarzać dane lokalnie, co umożliwia działanie offline i zwiększa prywatność użytkowników.

Główne przypadki użycia interfejsu Prompt API:

Interfejs Prompt API umożliwia tworzenie wysoce spersonalizowanych przypadków użycia GenAI. Oto kilka przykładów:

Rozpoznawanie obrazów: analizowanie zdjęć pod kątem klasyfikacji (np. tworzenie wersji roboczej posta w mediach społecznościowych lub identyfikowanie tagów takich jak „zwierzęta”, „jedzenie” czy „podróże”).
Inteligentne skanowanie dokumentów: użycie tradycyjnego modelu ML do wyodrębniania tekstu z paragonu, a następnie kategoryzowanie każdego elementu za pomocą interfejsu Prompt API.
Przekształcanie danych na potrzeby interfejsu: analizowanie długich treści w celu utworzenia krótkiego, angażującego tytułu powiadomienia.
Podpowiadanie treści: sugerowanie tematów nowych wpisów w dzienniku na podstawie preferencji użytkownika dotyczących motywów.
Analiza treści: klasyfikowanie opinii klientów jako pozytywnych, neutralnych lub negatywnych.
Wyodrębnianie informacji: wyodrębnianie ważnych szczegółów dotyczących nadchodzącego wydarzenia z wątku e-mail.

Implementacja
Interfejs Prompt API umożliwia tworzenie niestandardowych promptów i ustawianie opcjonalnych parametrów generowania za pomocą zaledwie kilku linii kodu:

Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

Bardziej szczegółowe przykłady implementacji interfejsu Prompt API znajdziesz w oficjalnej dokumentacji i przykładzie na GitHubie.

Gemini Nano, wydajność i prototypowanie

Interfejs Prompt API działa obecnie najlepiej na urządzeniach z serii Pixel 10, które korzystają z najnowszej wersji Gemini Nano (nano-v3). Ta wersja Gemini Nano jest oparta na tej samej architekturze co Gemma 3n, czyli model, który po raz pierwszy udostępniliśmy społeczności modeli otwartych podczas konferencji I/O.

Wspólna podstawa modeli Gemma 3n i nano-v3 ułatwia programistom tworzenie prototypów funkcji. Jeśli nie masz Pixela 10, możesz już dziś zacząć eksperymentować z promptami, tworząc prototypy lokalnie za pomocą modelu Gemma 3n.

Pełną listę urządzeń obsługujących interfejsy API generatywnej AI znajdziesz w naszej dokumentacji dotyczącej obsługi urządzeń.

Więcej informacji

Zacznij wdrażać interfejs Prompt API w aplikacjach na Androida już dziś, korzystając z naszej oficjalnej dokumentacji i przykładowego kodu na GitHubie.

Autor:

Caren Chang

Inżynier ds. relacji z deweloperami

read_more Wyświetl profil
Chengji Yan

Inżynier oprogramowania

read_more Wyświetl profil
Penny Li

Inżynier oprogramowania

read_more Wyświetl profil

Czytaj dalej

02 Kwi 2026

02 Kwi 2026

Wiadomości o usługach

Przedstawiamy model Gemma 4 w przedpremierowej wersji AICore dla programistów

arrow_forward

W Google dokładamy wszelkich starań, aby udostępniać najbardziej zaawansowane modele AI bezpośrednio na urządzeniach z Androidem, które masz w kieszeni. Z przyjemnością ogłaszamy wprowadzenie naszego najnowszego, zaawansowanego otwartego modelu: Gemma 4.
Caren Chang, David Chou • Czas czytania: 3 minuty
4 Autorzy

28 Sty 2026

28 Sty 2026

Wiadomości o usługach

Jak automatyczna optymalizacja promptów zwiększa jakość interfejsu GenAI Prompt API w ML Kit

arrow_forward

Aby jeszcze bardziej ułatwić Ci wdrażanie w środowisku produkcyjnym przypadków użycia interfejsu ML Kit Prompt API, z przyjemnością ogłaszamy automatyczną optymalizację promptów (APO) kierowaną na modele na urządzeniu w Vertex AI. Automatyczna optymalizacja promptów to narzędzie, które pomaga automatycznie znajdować optymalne prompty do Twoich przypadków użycia.
Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang • Czas czytania: 3 minuty
12 maja 2026

12 maja 2026

Wiadomości o usługach

Tworzenie aplikacji dla systemu Intelligence na Androidzie

arrow_forward

Ogłoszono to dziś podczas programu The Android Show. Android przechodzi z systemu operacyjnego w system inteligentny, co stwarza więcej możliwości interakcji z Twoimi aplikacjami.
Matthew McCullough • Czas czytania: 4 minuty
- #Android

Autor:

Inżynier ds. relacji z deweloperami

Inżynier oprogramowania

Inżynier oprogramowania

Czytaj dalej

Caren Chang, David Chou • Czas czytania: 3 minuty

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang • Czas czytania: 3 minuty

Matthew McCullough • Czas czytania: 4 minuty

Bądź na bieżąco