Kakao Mobility は韓国を代表するモビリティ企業で、タクシー配車、ナビゲーション、自転車とスクーターのシェアリング、駐車場、宅配など、さまざまな輸送サービスと配送サービスを Kakao T アプリを通じて提供しています。Kakao Mobility のチームは、ML Kit の GenAI Prompt API を介して Gemini Nano を活用し、自転車シェアリング サービスの駐車支援機能と、ナビゲーション サービスと配送サービスの住所入力エクスペリエンスの改善を実現しました。
Kakao T アプリの総ユーザー数は 3, 000 万人を超え、自転車シェアリング サービスは最も人気のあるサービスの 1 つです。しかし残念ながら、多くのユーザーが使用していないときに自転車やスクーターを不適切に駐車していました。この行動により、駐車違反や安全上の懸念が急増し、苦情、罰金、レッカー移動が発生しました。これらの問題は、Kakao Mobility とその自転車シェアリング サービスの両方に対する世間の認識に悪影響を及ぼし始めました。
「ML Kit の GenAI Prompt API と Gemini Nano を活用することで、ユーザー エクスペリエンスを損なうことなく、社会的な価値を高める機能を迅速に実装できました。Kakao Mobility は、より安全で便利なモビリティ サービスを提供するために、オンデバイス AI の導入を積極的に進めていきます。」 __- Wisuk Ryu 氏(クライアント開発部門責任者)
これらの懸念に対処するため、チームは当初、自転車やスクーターが地域の法律や安全基準に従って正しく駐車されているかどうかをユーザーに通知する画像認識モデルを設計しました。このモデルをクラウドで実行すると、サーバー費用が大幅に発生します。また、ユーザーがアップロードした写真には駐車場所に関する情報が含まれているため、プライバシーやセキュリティに関する懸念を回避したいと考えていました。チームは、より信頼性が高く、費用対効果の高いソリューションを見つける必要がありました。
また、チームは Kakao T アプリ内の宅配サービスのエンティティ抽出エクスペリエンスの改善も目指していました。以前は、ユーザーはチャット インターフェースで簡単に宅配を注文できましたが、ドライバーは宅配注文を開始するために、注文フォームに住所を手動で入力する必要がありました。このプロセスは煩雑で、人為的ミスが発生しやすくなっていました。チームは、このプロセスを効率化し、注文フォームを迅速化して、配達員にとってストレスの少ないものにしたいと考えていました。
ML Kit の GenAI Prompt API によるユーザー エクスペリエンスの強化
チームは、ML Kit の GenAI Prompt API を介してアクセスしたクラウドベースの Gemini モデルと Gemini Nano をテストして比較しました。「プライバシー、費用、精度、応答速度を検討した結果、ML Kit の GenAI Prompt API が明らかに最適な選択肢でした」と、Kakao Mobility の Android アプリケーション デベロッパーである Jinwoo Park 氏は述べています。
自転車やスクーターの不適切な駐車の問題に対処するため、チームは ML Kit GenAI API SDK を介して Gemini Nano のマルチモーダル機能を使用し、自転車やスクーターが黄色の点字ブロックに駐車して地域の規制に違反しているかどうかを検出しました。慎重に作成されたプロンプトを使用して、駐車写真の 200 枚以上のラベル付き画像を評価し、入力を継続的に改善しました。この評価は、精度、適合率、再現率、F1 スコアなどのよく知られた指標で測定され、この機能が本番環境レベルの品質と信頼性の基準を満たしていることを確認しました。
ユーザーは駐車した自転車やスクーターの写真を撮影すると、正しく駐車されているかどうかをアプリが通知し、正しく駐車されていない場合はガイダンスを提供します。プロセス全体はデバイス上で数秒で完了し、ユーザーの位置情報と情報が保護されます。
エンティティ抽出機能を効率化するため、チームは ML Kit の GenAI Prompt API を使用して、自然言語で記述されたユーザーの宅配注文を処理しました。従来の機械学習を使用した場合、大規模な学習データセットと機械学習の特別な専門知識が必要になります。代わりに、「メッセージから受信者の名前、住所、電話番号を抽出する」などのプロンプトから簡単に始めることができます。チームは 200 件程度の高品質な評価例を用意し、最適な結果を得るために何度も反復してプロンプトを評価しました。最も効果的な方法は、少数ショット プロンプトと呼ばれる手法で、出力にハルシネーションが最小限に抑えられていることを確認するために、結果を慎重に分析しました。
「ML Kit の Prompt API は、デベロッパーのオーバーヘッドを削減しながら、オンデバイスで強力なセキュリティと信頼性を提供します。プロトタイピングを迅速化し、インフラストラクチャへの依存度を下げ、追加費用は発生しません。おすすめしない理由はありません。」 — Jinwoo Park 氏(Kakao Mobility の Android アプリケーション デベロッパー)
ML Kit の GenAI Prompt API で大きな成果を実現
その結果、複数の名前と住所が入力された場合でも、エンティティ抽出機能は各注文に必要な詳細情報を正しく識別します。この機能のリーチを最大化し、堅牢なフォールバックを提供するために、チームは Gemini Flash を使用してクラウドベースのパスも実装しました。
ML Kit の GenAI Prompt API を実装することで、オンデバイス AI に移行した Kakao Mobility チームは大幅なコスト削減を実現しました。自転車の駐車分析機能はまだリリースされていませんが、住所入力の改善はすでに優れた成果を上げています。
- 宅配注文の完了時間が 24% 短縮されました。
- 新規ユーザーのコンバージョン率は 45%、既存ユーザーのコンバージョン率は 6% 増加しました。
- 繁忙期には、AI を活用した注文が 200% 以上増加します。
「特に中小企業の経営者からは、この機能によって業務が大幅に効率化され、ストレスが大幅に軽減されたという非常に肯定的なフィードバックが寄せられています」と Wisuk 氏は付け加えています。
自転車とスクーターの駐車に関する画像認識機能のリリース後、Kakao Mobility チームはさらなる改善を目指しています。都市部の駐車場環境は難しい場合があるため、チームは画像から不要な領域を除外する方法を検討しています。
「ML Kit の GenAI Prompt API は、追加のオーバーヘッドなしで高品質な機能を提供します」と Jinwoo 氏は述べています。「これにより、デベロッパーの作業が軽減され、開発期間全体が短縮され、より高品質な結果を得るためのプロンプト チューニングに集中できるようになりました。」
ML Kit の GenAI Prompt API を試してみる
ML Kit の GenAI Prompt API を使用して、アプリにオンデバイス AI を構築してデプロイし、Gemini Nano の機能を活用しましょう。
-
事例紹介Karrot は、地域密着型のコミュニティ主導のピアツーピア マーケットプレイス アプリで、ユーザーは他の確認済みユーザーと商品を売買できます。2015 年に韓国でリリースされて以来、このプラットフォームはグローバル市場に拡大し、登録ユーザー数は 4,300 万人を超えています。
Thomas Ezan, Tracy Agyemang • 所要時間: 2 分 -
事例紹介Monzo は英国のデジタルバンクで、顧客数は 1,500 万人に達し、増加しています。アプリの規模が拡大するにつれて、エンジニアリング チームはアプリの起動時間を改善すべき重要な領域として特定しましたが、コードベースに大幅な変更が必要になることを懸念していました。
Ben Weiss, Tracy Agyemang • 所要時間: 2 分 -
事例紹介ソーシャル メディアの世界は変化が速く、ユーザーの関心はすぐに失われます。Meta アプリ(Facebook と Instagram)は世界最大級のソーシャル プラットフォームであり、世界中で数十億人のユーザーに利用されています。
Mayuri Khinvasara Khabya, Tracy Agyemang • 所要時間: 4 分
Android 開発に関する最新の分析情報を毎週メールでお届けします。