產品新訊

自動最佳化提示詞如何提升 ML Kit GenAI 提示詞 API 的品質

3 分鐘小故事

28 1 月 2026 年

4 作者

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

自動最佳化提示詞 (APO)

為進一步協助您將 ML Kit Prompt API 用途帶入正式環境，我們很高興宣布推出 Vertex AI 裝置端模型適用的自動提示最佳化 (APO) 功能。自動最佳化提示詞工具可協助您自動找出最適合用途的提示。

裝置端 AI 時代已然來臨，不再只是空談。隨著 Gemini Nano v3 的推出，我們將前所未有的語言理解和多模態功能直接帶到使用者手中。透過 Gemini Nano 系列模型，我們在 Android 生態系統中支援的裝置涵蓋範圍廣泛。但對於打造新一代智慧型應用程式的開發人員來說，存取強大模型只是第一步。真正的挑戰在於自訂：如何在不違反行動裝置硬體限制的情況下，針對特定用途調整基礎模型，達到專家級效能？

在伺服器端，大型 LLM 通常功能強大，且較不需要進行網域調整。即使需要，LoRA (低秩適應) 微調等進階選項也是可行的選擇。不過，Android AICore 的獨特架構會優先採用共用且節省記憶體的系統模型。也就是說，為每個應用程式部署自訂 LoRA 轉換器時，這些共用系統服務會面臨挑戰。

但還有另一種同樣有效的方法。開發人員可以運用 Vertex AI 上的自動提示最佳化 (APO)，在原生 Android 執行環境中順暢作業，同時達到接近微調的品質。APO 著重於提供優異的系統指令，因此開發人員能以比傳統微調解決方案更穩健且可擴充的方式，調整模型行為。

注意： Gemini Nano V3 是備受好評的 Gemma 3N 模型，經過最佳化後品質更上一層樓。在開放原始碼 Gemma 3N 模型上進行的任何提示最佳化作業，也會套用至 Gemini Nano V3。在支援的裝置上，ML Kit GenAI API 會運用 nano-v3 模型，盡可能為 Android 開發人員提供優質體驗

APO 會將提示視為可最佳化的可程式化介面，而非靜態文字。這項功能會運用伺服器端模型 (例如 Gemini Pro 和 Flash) 建議提示、評估變體，並找出最適合特定工作的提示。這項程序會採用三種特定技術機制，盡可能提升效能：

自動錯誤分析：APO 會分析訓練資料中的錯誤模式，自動找出初始提示的特定缺點。
語意指令蒸餾：分析大量訓練範例，從中提煉出工作的「真正意圖」，然後建立指令，更準確地反映實際資料分布。
平行候選測試：APO 不會一次測試一個構想，而是平行生成及測試多個提示候選項目，找出品質的全球最大值。

為什麼 APO 可以接近微調品質

一般人常誤以為微調的品質一定比提示工程好。但對於 Gemini Nano v3 等現代基礎模型，光是提示工程就能帶來顯著影響：

保留一般功能：微調 ( PEFT/LoRA) 會強制模型權重過度索引特定資料分布，這通常會導致「災難性遺忘」，也就是模型在特定語法方面表現更好，但在一般邏輯和安全性方面表現更差。APO 不會變更權重，因此可保留基礎模型的功能。
遵循指令和策略探索：Gemini Nano v3 經過嚴格訓練，可遵循複雜的系統指令。APO 會找出確切的指令結構，藉此發揮模型潛在能力，並探索人類工程師可能難以發現的策略。

為驗證這項方法，我們評估了各種生產工作負載的 APO。驗證結果顯示，各種用途的準確率都穩定提升 5% 至 8%。在多項已部署的裝置端功能中，APO 顯著提升了品質。

用途	工作類型	工作說明	指標	APO 改善
主題分類	文字分類	將新聞報導分類為財經、體育等主題	準確率	+5%
意圖分類	文字分類	將客戶服務查詢分類為意圖	準確率	+8.0%
網頁翻譯	文字翻譯	將網頁從英文翻譯成當地語言	BLEU	+8.57%

順暢無阻的端對端開發人員工作流程

一般人常誤以為微調的品質一定比提示工程好。但對於 Gemini Nano v3 等現代基礎模型，光是提示工程就能帶來顯著影響：

保留一般功能：微調 ( PEFT/LoRA) 會強制模型權重過度索引特定資料分布，這通常會導致「災難性遺忘」，也就是模型在特定語法方面表現更好，但在一般邏輯和安全性方面表現更差。APO 不會變更權重，因此可保留基礎模型的功能。
遵循指令和策略探索：Gemini Nano v3 經過嚴格訓練，可遵循複雜的系統指令。APO 會找出確切的指令結構，藉此發揮模型潛在能力，並探索人類工程師可能難以發現的策略。

結論

自動提示最佳化 (APO) 的推出，代表裝置端生成式 AI 邁向新里程碑。我們縮小了基礎模型與專家級效能之間的差距，讓開發人員能運用這些工具，建構更強大的行動應用程式。無論您是剛開始使用 Zero-Shot Optimization，還是要透過 Data-Driven 調整功能擴大規模，都能更清楚地瞭解如何取得高品質的裝置端智慧功能。現在，您可以使用 ML Kit 的 Prompt API 和 Vertex AI 的自動提示詞最佳化功能，在裝置上推出生成式 AI 用途的正式版應用程式。

相關連結：

撰寫者：

Chetan Tekur

產品經理

read_more 查看個人資料
Chao Zhao

軟體工程師

read_more 查看個人資料
Paul Zhou

資深軟體工程部門人員

read_more 查看個人資料
Caren Chang

開發人員關係工程師

read_more 查看個人資料

繼續閱讀

02 2026 年 4 月

02 2026 年 4 月

產品新訊

AICore 開發人員預覽版現已支援 Gemma 4

arrow_forward

Google 致力於將最強大的 AI 模型直接帶進你的 Android 裝置。我們很高興宣布推出最新的頂尖開放模型：Gemma 4。
Caren Chang, David Chou • 3 分鐘可讀完
3 作者

30 10 月 2025 年

30 10 月 2025 年

產品新訊

ML Kit 的 Prompt API：解鎖自訂裝置端 Gemini Nano 體驗

arrow_forward

AI 可協助開發人員輕鬆打造個人化應用程式體驗，將內容轉換為適合使用者的格式。我們先前已推出 ML Kit GenAI API，協助開發人員整合 Gemini Nano，針對特定用途 (例如摘要和圖片說明) 提供服務。
Caren Chang, Chengji Yan, Penny Li • 閱讀時間：2 分鐘
15 6 月 2026 年

15 6 月 2026 年

產品新訊

Android XR 最新動態：工具、引擎支援和生態系統更新

arrow_forward

從擴增疊加層到完全沉浸式環境，Android XR 生態系統正在迅速擴展，Samsung Galaxy XR 也已於今天上市。
Stevan Silva, Vinny DaSilva • 3 分鐘可讀完
- #Android XR
- #開發人員預覽版 4