Nowości dotyczące produktów

Jak automatyczna optymalizacja podpowiedzi zwiększa jakość interfejsu ML Kit GenAI Prompt API

3 minuty czytania

28 stycznia 2026 r.

4 autorów

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

Automatyczna optymalizacja podpowiedzi (APO)

Aby jeszcze bardziej ułatwić wdrażanie w środowisku produkcyjnym przypadków użycia interfejsu ML Kit Prompt API, z przyjemnością ogłaszamy automatyczną optymalizację podpowiedzi (APO) kierowaną na modele na urządzeniu w Vertex AI. Automatyczna optymalizacja podpowiedzi to narzędzie, które pomaga automatycznie znajdować optymalne podpowiedzi w Twoich przypadkach użycia.

Era AI na urządzeniu nie jest już obietnicą – to rzeczywistość produkcyjna. Wraz z wprowadzeniem Gemini Nano v3 udostępniamy użytkownikom bezprecedensowe możliwości rozumienia języka i multimodalne. Dzięki rodzinie modeli Gemini Nano mamy szeroki zakres obsługiwanych urządzeń w ekosystemie Androida. Jednak dla deweloperów tworzących aplikacje inteligentne nowej generacji dostęp do zaawansowanego modelu to dopiero pierwszy krok. Prawdziwym wyzwaniem jest dostosowanie: jak dostosować model podstawowy do wydajności na poziomie eksperta w konkretnym przypadku użycia bez naruszania ograniczeń sprzętu mobilnego?

W przypadku po stronie serwera większe modele LLM są zwykle bardzo wydajne i wymagają mniejszego dostosowania do domeny. W razie potrzeby można też stosować bardziej zaawansowane opcje, takie jak dostrajanie LoRA (adaptacja o niskim rzędzie). Jednak unikalna architektura Androida AICore traktuje priorytetowo wspólny, wydajny pod względem pamięci model systemu. Oznacza to, że wdrażanie niestandardowych adapterów LoRA w każdej aplikacji wiąże się z wyzwaniami w przypadku tych wspólnych usług systemowych.

Istnieje jednak alternatywna ścieżka, która może być równie skuteczna. Dzięki wykorzystaniu automatycznej optymalizacji podpowiedzi (APO) w Vertex AI deweloperzy mogą osiągnąć jakość zbliżoną do dostrajania, a jednocześnie płynnie pracować w natywnym środowisku wykonawczym Androida. Dzięki skupieniu się na lepszych instrukcjach systemowych APO umożliwia deweloperom dostosowywanie zachowania modelu z większą niezawodnością i skalowalnością niż tradycyjne rozwiązania do dostrajania.

Uwaga: Gemini Nano V3 to zoptymalizowana pod kątem jakości wersja wysoko ocenianego modelu Gemma 3N. Wszystkie optymalizacje podpowiedzi wprowadzone w modelu Gemma 3N o otwartym kodzie źródłowym będą też stosowane w Gemini Nano V3. Na obsługiwanych urządzeniach interfejsy ML Kit GenAI API wykorzystują model nano-v3, aby zmaksymalizować jakość dla deweloperów Androida.

APO traktuje podpowiedź nie jako statyczny tekst, ale jako programowalną powierzchnię, którą można zoptymalizować. Wykorzystuje modele po stronie serwera (takie jak Gemini Pro i Flash) do proponowania podpowiedzi, oceniania wariantów i znajdowania optymalnego rozwiązania dla konkretnego zadania. Ten proces wykorzystuje 3 konkretne mechanizmy techniczne, aby zmaksymalizować wydajność:

Automatyczna analiza błędów: APO analizuje wzorce błędów z danych treningowych, aby automatycznie identyfikować konkretne słabe punkty w początkowej podpowiedzi.
Destylacja instrukcji semantycznych: analizuje ogromne przykłady treningowe, aby wydestylować „prawdziwy cel” zadania, tworząc instrukcje, które dokładniej odzwierciedlają rzeczywisty rozkład danych.
Równoległe testowanie kandydatów: zamiast testować po jednym pomyśle, APO generuje i testuje równolegle wiele kandydatów na podpowiedzi, aby zidentyfikować globalne maksimum jakości.

Dlaczego APO może zbliżyć się do jakości dostrajania

Powszechnie uważa się, że dostrajanie zawsze daje lepszą jakość niż podpowiedzi. W przypadku nowoczesnych modeli podstawowych, takich jak Gemini Nano v3, inżynieria podpowiedzi może być sama w sobie skuteczna:

Zachowanie ogólnych możliwości: dostrajanie ( PEFT/LoRA) wymusza na modelu nadmierne indeksowanie wagi w określonym rozkładzie danych. Często prowadzi to do „katastrofalnego zapominania”, w którym model lepiej radzi sobie z konkretną składnią, ale gorzej z ogólną logiką i bezpieczeństwem. APO nie zmienia wagi, zachowując możliwości modelu podstawowego.
Wykonywanie instrukcji i odkrywanie strategii: Gemini Nano v3 został dokładnie wytrenowany pod kątem wykonywania złożonych instrukcji systemowych. APO wykorzystuje to, znajdując dokładną strukturę instrukcji, która odblokowuje ukryte możliwości modelu, często odkrywając strategie, które mogą być trudne do znalezienia dla inżynierów.

Aby zweryfikować to podejście, przeprowadziliśmy ocenę APO w różnych zbiorach zadań produkcyjnych. Nasza weryfikacja wykazała stały wzrost dokładności o 5–8% w różnych przypadkach użycia.W przypadku wielu wdrożonych funkcji na urządzeniu APO zapewniło znaczną poprawę jakości.

Przypadek użycia	Typ zadania	Opis zadania	Wskaźnik	Ulepszenie APO
Klasyfikacja tematu	Klasyfikacja tekstu	Klasyfikowanie artykułu informacyjnego według tematów, takich jak finanse, sport itp.	Dokładność	+5%
Klasyfikacja intencji	Klasyfikacja tekstu	Klasyfikowanie zapytania do obsługi klienta według intencji	Dokładność	+8,0%
Tłumaczenie strony internetowej	Tłumaczenie tekstu	Tłumaczenie strony internetowej z angielskiego na język lokalny	BLEU	+8,57%

Płynny przepływ pracy dewelopera

Zachowanie ogólnych możliwości: dostrajanie ( PEFT/LoRA) wymusza na modelu nadmierne indeksowanie wagi w określonym rozkładzie danych. Często prowadzi to do „katastrofalnego zapominania”, w którym model lepiej radzi sobie z konkretną składnią, ale gorzej z ogólną logiką i bezpieczeństwem. APO nie zmienia wagi, zachowując możliwości modelu podstawowego.
Wykonywanie instrukcji i odkrywanie strategii: Gemini Nano v3 został dokładnie wytrenowany pod kątem wykonywania złożonych instrukcji systemowych. APO wykorzystuje to, znajdując dokładną strukturę instrukcji, która odblokowuje ukryte możliwości modelu, często odkrywając strategie, które mogą być trudne do znalezienia dla inżynierów.

Podsumowanie

Wprowadzenie automatycznej optymalizacji podpowiedzi (APO) to punkt zwrotny w rozwoju generatywnej AI na urządzeniu. Dzięki zmniejszeniu różnicy między modelami podstawowymi a wydajnością na poziomie eksperta dajemy deweloperom narzędzia do tworzenia bardziej niezawodnych aplikacji mobilnych. Niezależnie od tego, czy dopiero zaczynasz korzystać z optymalizacji bez przykładów , czy skalujesz się do produkcji za pomocą dostrajania opartego na danych , ścieżka do wysokiej jakości inteligencji na urządzeniu jest teraz jaśniejsza. Już dziś możesz wdrożyć w środowisku produkcyjnym przypadki użycia na urządzeniu za pomocą interfejsu ML Kit Prompt API i automatycznej optymalizacji podpowiedzi w Vertex AI.

Przydatne linki:

Autorzy:

Chetan Tekur

Menedżer produktu

read_more Wyświetl profil
Chao Zhao

Programista

read_more Wyświetl profil
Paul Zhou

Starszy programista

read_more Wyświetl profil
Caren Chang

Inżynier ds. relacji z deweloperami

read_more Wyświetl profil

Czytaj dalej

2 kwietnia 2026 r.

2 kwietnia 2026 r.

Nowości dotyczące produktów

Ogłaszamy Gemma 4 w przedpremierowej wersji AICore dla programistów

arrow_forward

W Google dokładamy wszelkich starań, aby udostępniać najbardziej zaawansowane modele AI bezpośrednio na urządzeniach z Androidem. Z przyjemnością ogłaszamy dziś wprowadzenie naszego najnowszego, najnowocześniejszego modelu o otwartym kodzie źródłowym: Gemma 4.
Caren Chang, David Chou • 3 minuty czytania
3 autorów

30 października 2025 r.

30 października 2025 r.

Nowości dotyczące produktów

ML Kit Prompt API: odblokowywanie niestandardowych funkcji Gemini Nano na urządzeniu

arrow_forward

AI ułatwia tworzenie spersonalizowanych funkcji aplikacji, które przekształcają treści w odpowiedni format dla użytkowników. Wcześniej umożliwiliśmy deweloperom integrację z Gemini Nano za pomocą interfejsów ML Kit GenAI API dostosowanych do konkretnych przypadków użycia, takich jak podsumowywanie i opisywanie obrazów.
Caren Chang, Chengji Yan, Penny Li • 2 minuty czytania
12 maja 2026 r.

12 maja 2026 r.

Nowości dotyczące produktów

Tworzenie na potrzeby systemu inteligencji w Androidzie

arrow_forward

Ogłoszono dziś podczas The Android Show, że Android przechodzi z systemu operacyjnego do systemu inteligencji, co stwarza więcej możliwości interakcji z Twoimi aplikacjami.
Matthew McCullough • 4 minuty czytania
- #Android