產品新訊

ML Kit 的提示 API:解鎖自訂裝置端 Gemini Nano 體驗

2 分鐘閱讀
3 作者
Caren Chang, Chengji Yan, Penny Li

AI 可協助您輕鬆打造個人化應用程式體驗,將內容轉換為適合使用者的格式。我們先前已推出 ML Kit GenAI API,讓開發人員整合 Gemini Nano,用於摘要和圖片描述等特定用途。

今天,Android 裝置端生成式 AI 達成重大里程碑。我們很高興宣布 ML Kit GenAI Prompt API Alpha 版正式推出。透過這項 API,您可以將自然語言和多模態要求傳送至 Gemini Nano,滿足使用生成模型建構應用程式時,對更多控制權和彈性的需求。

Kakao 等合作夥伴已開始使用 Prompt API 建構應用程式,打造獨特體驗,發揮實際影響力。您現在可以透過極少的程式碼,試用 Prompt API 的強大功能。

 

 

從預先建構的裝置端生成式 AI 轉向自訂

提示 API 不僅提供預先建構的功能,還支援自訂的應用程式專屬 GenAI 用途,讓您建立獨特的功能,並進行複雜的資料轉換。Prompt API 會使用裝置端的 Gemini Nano 在本機處理資料,提供離線功能並提升使用者隱私。

Prompt API 的主要用途:

Prompt API 可用於高度自訂的生成式 AI 用途。以下列舉幾個建議範例:

  • 圖像解讀:分析相片以進行分類 (例如草擬社群媒體貼文,或辨識「寵物」、「食物」或「旅遊」等標籤)。
  • 智慧型文件掃描:使用傳統機器學習模型從收據中擷取文字,然後使用 Prompt API 將每個項目分類。
  • 轉換 UI 的資料:分析長篇內容,製作簡短吸睛的通知標題。
  • 內容提示:根據使用者對主題的偏好,建議新的日記條目主題。
  • 內容分析:將顧客評論歸類為正面、中立或負面。
  • 資訊擷取:從電子郵件討論串擷取即將到來活動的重要詳細資料。

實作
您只需幾行程式碼,就能使用提示 API 建立自訂提示,並設定選用的生成參數:

Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

如需 Prompt API 的詳細實作範例,請參閱官方文件Github 範例

Gemini Nano、效能和原型設計

目前,Prompt API 在 Pixel 10 系列裝置上的效能最佳,因為這些裝置搭載最新版 Gemini Nano (nano-v3)。這個版本的 Gemini Nano 與 Gemma 3n 採用相同架構,而 Gemma 3n 是我們在 I/O 大會上首次向開放模型社群發布的模型。

Gemma 3n 和 nano-v3 採用相同的基礎架構,因此開發人員可以更輕鬆地製作功能原型。如果沒有 Pixel 10 裝置,您今天就能開始使用 Gemma 3n 在本機製作原型,試驗提示。

如需支援 GenAI API 的裝置完整清單,請參閱裝置支援說明文件

瞭解詳情

如要開始在 Android 應用程式中導入 Prompt API,請參閱官方文件Github 上的範例

繼續閱讀