Produktneuheiten

Prompt API von ML Kit: Individuelle Gemini Nano-Erlebnisse auf dem Gerät

Lesezeit: 2 Minuten

Mit KI lassen sich personalisierte App-Erlebnisse einfacher erstellen, bei denen Inhalte in das richtige Format für die Nutzer umgewandelt werden. Bisher konnten Entwickler Gemini Nano über ML Kit GenAI APIs einbinden, die auf bestimmte Anwendungsfälle wie Zusammenfassungen und Bildbeschreibungen zugeschnitten waren.

Heute ist ein wichtiger Meilenstein für generative KI auf Android-Geräten. Wir kündigen die Alpha-Version der ML Kit GenAI Prompt API an. Mit dieser API können Sie Anfragen in natürlicher Sprache und multimodale Anfragen an Gemini Nano senden. So wird der Bedarf an mehr Kontrolle und Flexibilität bei der Entwicklung mit generativen Modellen gedeckt.

Partner wie Kakao entwickeln bereits mit der Prompt API und schaffen einzigartige Erlebnisse mit realen Auswirkungen. Sie können die leistungsstarken Funktionen der Prompt API schon heute mit minimalem Code testen.

 

 

Von vordefinierten zu benutzerdefinierten GenAI-Lösungen auf dem Gerät

Die Prompt API bietet mehr als nur vordefinierte Funktionen. Sie unterstützt auch benutzerdefinierte, app-spezifische GenAI-Anwendungsfälle, mit denen Sie einzigartige Funktionen mit komplexer Datentransformation erstellen können. Die Prompt API verwendet Gemini Nano auf dem Gerät, um Daten lokal zu verarbeiten. So sind Offline-Funktionen möglich und der Datenschutz für Nutzer wird verbessert.

Wichtige Anwendungsfälle für die Prompt API

Die Prompt API ermöglicht hochgradig angepasste GenAI-Anwendungsfälle. Hier sind einige empfohlene Beispiele: 

  • Bildverständnis: Analysieren von Fotos zur Klassifizierung (z.B. Erstellen eines Entwurfs für einen Social-Media-Beitrag oder Identifizieren von Tags wie „Haustiere“, „Essen“ oder „Reisen“).
  • Intelligentes Scannen von Dokumenten: Verwenden eines herkömmlichen ML-Modells, um Text aus einer Quittung zu extrahieren, und anschließendes Kategorisieren der einzelnen Elemente mit der Prompt API.
  • Daten für die Benutzeroberfläche umwandeln: Analysieren von langen Inhalten, um einen kurzen, ansprechenden Benachrichtigungstitel zu erstellen.
  • Inhalte vorschlagen: Themen für neue Tagebucheinträge basierend auf den Vorlieben eines Nutzers für bestimmte Themen vorschlagen.
  • Inhaltsanalyse: Kundenrezensionen in eine positive, neutrale oder negative Kategorie einordnen.
  • Informationen extrahieren: Wichtige Details zu einem bevorstehenden Ereignis aus einem E‑Mail-Thread extrahieren.

Implementierung
Mit der Prompt API können Sie mit nur wenigen Codezeilen benutzerdefinierte Prompts erstellen und optionale Parameter für die Generierung festlegen:

Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

Weitere Beispiele für die Implementierung der Prompt API finden Sie in der offiziellen Dokumentation und im Beispiel auf GitHub.

Gemini Nano, Leistung und Prototyping

Die Prompt API funktioniert derzeit am besten auf Geräten der Pixel 10-Serie, auf denen die neueste Version von Gemini Nano (nano-v3) ausgeführt wird. Diese Version von Gemini Nano basiert auf derselben Architektur wie Gemma 3n, das Modell, das wir der Open-Source-Community auf der I/O vorgestellt haben.

Die gemeinsame Grundlage von Gemma 3n und nano-v3 ermöglicht Entwicklern, Funktionen einfacher zu prototypisieren. Wenn Sie kein Pixel 10-Gerät haben, können Sie schon heute mit Prompts experimentieren, indem Sie Gemma 3n lokal prototypisieren.

Eine vollständige Liste der Geräte, die GenAI APIs unterstützen, finden Sie in unserer Dokumentation zur Geräteunterstützung.

Weitere Informationen

Beginnen Sie noch heute mit der Implementierung der Prompt API in Ihren Android-Apps. Unsere offizielle Dokumentation und das Beispiel auf GitHub helfen Ihnen dabei.

Verfasst von:

Weiterlesen