事例紹介

Kakao Mobility は、デバイス上の Gemini Nano を使用してコストを削減し、通話コンバージョンのコンバージョン率を 45% 向上

所要時間: 4 分

Kakao Mobility は、韓国を代表するモビリティ ビジネス企業です。Kakao T アプリを通じて、タクシー配車、ナビゲーション、自転車とスクーターのシェアリング、駐車場、荷物配送など、さまざまな交通手段と配送サービスを提供しています。Kakao Mobility のチームは、ML Kit の GenAI Prompt API を介して Gemini Nano を活用し、自転車シェアリング サービスの駐車支援機能や、ナビゲーション サービスと配送サービスの住所入力機能の改善を実現しました。

Kakao T アプリのユーザー数は 3, 000 万人を超え、自転車シェアリング サービスは最も人気のあるサービスの 1 つです。しかし、残念ながら、多くのユーザーが使用していないときに自転車やスクーターを不適切に駐車していました。この行為により、駐車違反や安全上の懸念が急増し、一般からの苦情、罰金、レッカー移動が発生しました。これらの問題は、Kakao Mobility とその自転車シェアリング サービスに対する世間の認識に悪影響を及ぼし始めました。

wisuk.png

「ML Kit の GenAI Prompt API と Gemini Nano を活用することで、ユーザー エクスペリエンスを損なうことなく、社会的価値を高める機能を迅速に実装できました。Kakao Mobility は、オンデバイス AI を積極的に導入し、より安全で便利なモビリティ サービスを提供していきます。」  - Wisuk Ryu 氏、クライアント開発部門責任者

こうした懸念に対応するため、チームは当初、自転車やスクーターが地域の法律や安全基準に沿って正しく駐車されているかどうかをユーザーに通知する画像認識モデルを設計しました。このモデルをクラウドで実行すると、サーバー費用が大幅に発生します。また、ユーザーがアップロードした写真には駐車場所に関する情報が含まれていたため、プライバシーやセキュリティに関する懸念を回避したいと考えていました。チームは、より信頼性が高く費用対効果の高いソリューションを見つける必要がありました。

また、Kakao T アプリ内の宅配サービスでエンティティ抽出の利便性を高めることも目指していました。以前は、ユーザーはチャット インターフェースで簡単に宅配を注文できましたが、配達員は配達注文を開始するために注文フォームに手動で住所を入力する必要がありました。このプロセスは面倒で、人為的なミスが発生しやすくなっていました。チームは、このプロセスを効率化し、注文フォームをより迅速に、配達員にとってストレスの少ないものにすることを目指しました。

ML Kit の GenAI Prompt API でユーザー エクスペリエンスを向上させる

チームは、ML Kit の GenAI Prompt API を介してアクセスしたクラウドベースの Gemini モデルと Gemini Nano をテストして比較しました。Kakao Mobility の Android アプリケーション デベロッパーである Jinwoo Park 氏は、「プライバシー、費用、精度、応答速度を検討した結果、ML Kit の GenAI Prompt API が明らかに最適な選択肢でした」と述べています。

自転車やスクーターの不適切な駐輪の問題に対処するため、チームは ML Kit 生成 AI API SDK を介して Gemini Nano のマルチモーダル機能を使用し、自転車やスクーターが黄色い点字ブロックに駐輪して地域の規制に違反しているかどうかを検出しました。プロンプトを慎重に作成することで、入力内容を継続的に調整しながら、200 枚以上のラベル付きの駐車写真画像を評価することができました。この評価は、精度、適合率、再現率、F1 スコアなどのよく知られた指標で測定され、この機能が本番環境レベルの品質と信頼性の基準を満たしていることを確認しました。

ユーザーは、駐車した自転車やスクーターの写真を撮影できます。アプリは、正しく駐車されているかどうかをユーザーに通知し、正しく駐車されていない場合はガイダンスを提供します。このプロセスはデバイス上で数秒で完了し、ユーザーの位置情報と個人情報が保護されます。

bike.jpg

チームは、エンティティ抽出機能を効率化するために、ML Kit の GenAI Prompt API を使用して、自然言語で記述されたユーザーの配達注文を処理しました。従来の機械学習を使用していた場合、大規模なデータセットと機械学習の専門知識が必要になります。代わりに、「メッセージから受信者の名前、住所、電話番号を抽出して」のようなプロンプトから始めることができます。チームは約 200 個の高品質な評価例を用意し、最適な結果を得るために、プロンプトを何度も繰り返し評価しました。最も効果的な方法は、少数ショット プロンプトと呼ばれる手法でした。出力にハルシネーションが最小限に抑えられるように、結果は慎重に分析されました。

jinwoo.png


「ML Kit の Prompt API は、デベロッパーのオーバーヘッドを削減しながら、オンデバイスで強力なセキュリティと信頼性を提供します。これにより、迅速なプロトタイピングが可能になり、インフラストラクチャへの依存関係が低下し、追加費用が発生しません。おすすめしない理由はありません。」 — Kakao Mobility の Android アプリケーション デベロッパー、Jinwoo Park 氏

ML Kit の生成 AI プロンプト API で大きな成果を達成する

これにより、複数の名前と住所が入力された場合でも、エンティティ抽出機能は各注文に必要な詳細情報を正しく識別します。この機能のリーチを最大化し、堅牢なフォールバックを提供するため、チームは Gemini Flash を使用したクラウドベースのパスも実装しました。

ML Kit の GenAI Prompt API を実装することで、Kakao Mobility チームはオンデバイス AI に移行し、大幅なコスト削減を実現しました。自転車駐車場の分析機能はまだリリースされていませんが、住所入力の改善はすでに優れた成果を上げています。

  • 配達注文の完了時間が 24% 短縮されました。
  • 新規ユーザーのコンバージョン率は 45%、既存ユーザーのコンバージョン率は 6% 増加しました。
  • 繁忙期には、AI を活用した注文が 200% 以上増加します。

「特に小規模ビジネスのオーナーからは、この機能によって作業効率が大幅に向上し、ストレスが大幅に軽減されたという非常に肯定的なフィードバックが寄せられています」と Wisuk 氏は述べています。

自転車とスクーターの駐車場所を認識する機能のリリース後、Kakao Mobility チームはさらなる改善に意欲的に取り組んでいます。都市部の駐車環境は複雑なため、チームは画像から不要な領域を除外する方法を検討しています。

「ML Kit の GenAI プロンプト API は、追加のオーバーヘッドなしで高品質の機能を提供します」と Jinwoo 氏は述べています。これにより、開発者の労力が軽減され、開発期間全体が短縮され、高品質な結果を得るためのプロンプト チューニングに集中できるようになりました。」

ML Kit の GenAI Prompt API を試す

ML Kit の GenAI Prompt API を使用して、アプリにオンデバイス AI を構築してデプロイし、Gemini Nano の機能を活用します。

作成者:

続きを読む