Kakao Mobility 是韓國首屈一指的交通運輸公司,透過 Kakao T 應用程式提供一系列交通運輸和送貨服務,包括叫車、導航、自行車和滑板車共乘、停車和包裹遞送。Kakao Mobility 團隊透過 ML Kit 的 GenAI Prompt API 運用 Gemini Nano,為自行車共乘服務提供停車輔助功能,並改善導航和送貨服務的地址輸入體驗。
Kakao T 應用程式的總使用者人數超過 3, 000 萬,其中單車共享服務最受歡迎。但很遺憾,許多使用者在未使用完畢後,會隨意停放自行車或滑板車。這類行為導致違規停車和安全疑慮增加,引發民眾投訴,並造成罰款和拖吊。這些問題開始對 Kakao Mobility 和其單車共享服務的公眾觀感造成負面影響。
「我們運用 ML Kit 的 GenAI Prompt API 和 Gemini Nano,快速實作了可提升社會價值的功能,同時兼顧使用者體驗。Kakao Mobility 將持續積極採用裝置端 AI,提供更安全便利的行動服務。」 — 客戶開發部門主管 Ryu Wisuk
為解決這些問題,團隊最初設計了圖像辨識模型,可根據當地法律和安全標準,通知使用者自行車或滑板車是否停放正確。如果透過雲端執行這個模型,會產生高昂的伺服器費用。此外,使用者上傳的相片含有停車位置資訊,因此團隊希望避免任何隱私權或安全性疑慮。因此團隊需要尋找更可靠且符合成本效益的解決方案。
此外,團隊也希望改善 Kakao T 應用程式中包裹遞送服務的實體擷取體驗。先前,使用者可以在即時通訊介面上輕鬆下單遞送包裹,但司機必須手動在訂單表單中輸入地址,才能發起遞送訂單,這個過程既繁瑣又容易發生人為錯誤。因此團隊希望簡化這項程序,讓送貨人員能更快速且輕鬆地填寫訂單表單。
使用 ML Kit 的 GenAI Prompt API 提升使用者體驗
團隊測試並比較雲端式 Gemini 模型與 Gemini Nano,後者是透過 ML Kit 的 GenAI 提示詞 API 存取。Kakao Mobility 的 Android 應用程式開發人員 Jinwoo Park 表示:「在評估隱私權、費用、準確率和回覆速度後,我們發現 ML Kit 的生成式 AI 提示詞 API 顯然是最佳選擇。」
為解決自行車或電動滑板車違規停放的問題,團隊透過 ML Kit 生成式 AI API SDK 使用 Gemini Nano 的多模態功能,偵測自行車或電動滑板車是否停放在黃色觸覺鋪面,進而違反當地法規。他們透過精心設計的提示,評估了 200 多張標示停車位置的相片,同時不斷修正輸入內容。這項評估作業會透過準確率、精確度、召回率和 F1 分數等知名指標進行測量,確保這項功能符合生產等級的品質和穩定性標準。
現在使用者可以拍攝停放的自行車或滑板車,應用程式會告知是否停放妥當,或提供相關指引。整個過程會在裝置上進行,只需幾秒鐘,可保護使用者的位置和資訊。
為建立簡化的實體擷取功能,團隊再次使用 ML Kit 的 GenAI Prompt API,處理使用者以自然語言撰寫的送貨訂單。如果採用傳統機器學習,則需要大型學習資料集和機器學習專業知識。他們可以改為使用「從訊息中擷取收件者的姓名、地址和電話號碼」等提示。團隊準備了約 200 個高品質的評估範例,並透過多輪疊代評估提示,以獲得最佳結果。我們採用最有效的方法,也就是「少量樣本提示」技術,並仔細分析結果,確保輸出內容的幻覺程度降到最低。
「ML Kit 的提示 API 可減少開發人員的負擔,同時在裝置端提供強大的安全性和可靠性。這項功能可加快原型設計速度、降低基礎架構依附元件,且不會產生額外費用。沒有不推薦的理由。」 — Kakao Mobility Android 應用程式開發人員 Jinwoo Park
運用 ML Kit 的 GenAI Prompt API 締造優異成效
因此,即使輸入多個姓名和地址,實體擷取功能仍可正確識別每筆訂單的必要詳細資料。為盡量擴大這項功能的觸及範圍,並提供穩健的備援機制,團隊也使用 Gemini Flash 實作雲端路徑。
Kakao Mobility 團隊導入 ML Kit 的 GenAI Prompt API 後,改用裝置端 AI,大幅節省了成本。雖然自行車停車分析功能尚未推出,但地址輸入改善功能已帶來優異成效:
- 送貨訂單的完成時間縮短了 24%。
- 新使用者的轉換率提高了 45%,現有使用者則提高了 6%。
- 在銷售旺季,AI 輔助訂單的數量會增加超過 200%。
「特別是小型企業主,他們給予這項功能非常正面的評價,表示這項功能大幅提升工作效率,並顯著減輕壓力。」Wisuk 補充道。
自行車和輕型機車停車位圖像辨識功能推出後,Kakao Mobility 團隊將積極改善這項功能。都市停車環境可能很複雜,因此團隊正在探索如何從圖片中濾除不必要的區域。
Jinwoo 表示:「ML Kit 的 GenAI Prompt API 提供高品質功能,不會增加額外負擔。「這減少了開發人員的工作量、縮短了整體開發時間,並讓我們專注於提示調整,以獲得更高品質的結果。」
親自試用 ML Kit 的 GenAI Prompt API
使用 ML Kit 的 GenAI Prompt API,在應用程式中建構及部署裝置端 AI,充分發揮 Gemini Nano 的功能。
繼續閱讀
-
個案研究
Monzo 是英國數位銀行,目前有 1,500 萬名客戶,且人數持續增加中。隨著應用程式規模擴大,工程團隊發現應用程式啟動時間是需要改善的關鍵領域,但擔心這會需要大幅變更程式碼集。
Ben Weiss • 閱讀時間:2 分鐘
-
個案研究
TikTok 是全球知名的短片平台,擁有龐大的使用者群和創新功能。
Ben Trengrove, Ajesh Pai • 閱讀時間:2 分鐘
-
個案研究
在瞬息萬變的社群媒體世界中,使用者注意力稍縱即逝。Meta 應用程式 (Facebook 和 Instagram) 是全球最大的社群平台之一,為全球數十億使用者提供服務。
Mayuri Khinvasara Khabya • 4 分鐘可讀完
隨時掌握最新消息
每週透過電子郵件接收最新的 Android 開發洞察資訊。