Études de cas
Kakao Mobility utilise Gemini Nano sur l'appareil pour réduire les coûts et augmenter le taux de conversion des appels de 45 %
Temps de lecture : 4 min
Kakao Mobility est le leader sud-coréen de la mobilité. Son application Kakao T propose une gamme de services de transport et de livraison, y compris la réservation de taxis, la navigation, le partage de vélos et de trottinettes, le stationnement et la livraison de colis. L'équipe de Kakao Mobility a utilisé Gemini Nano via l' API GenAI Prompt de ML Kit pour proposer une assistance au stationnement pour son service de partage de vélos et améliorer l'expérience de saisie d'adresse pour ses services de navigation et de livraison.
L'application Kakao T compte plus de 30 millions d'utilisateurs au total, et son service de partage de vélos est l'un de ses plus populaires. Malheureusement, de nombreux utilisateurs ne stationnaient pas correctement les vélos ou les trottinettes lorsqu'ils ne les utilisaient pas. Ce comportement a entraîné une augmentation des infractions de stationnement et des problèmes de sécurité, ce qui a donné lieu à des plaintes du public, à des amendes et à des mises en fourrière. Ces problèmes ont commencé à nuire à la perception du public de Kakao Mobility et de ses services de partage de vélos.
"En exploitant l'API GenAI Prompt de ML Kit et Gemini Nano, nous avons pu implémenter rapidement des fonctionnalités qui améliorent la valeur sociale sans compromettre l'expérience utilisateur. Kakao Mobility continuera d'adopter activement l'IA sur l'appareil pour fournir des services de mobilité plus sûrs et plus pratiques." — Wisuk Ryu, responsable de la division Développement client
Pour résoudre ces problèmes, l'équipe a d'abord conçu un modèle de reconnaissance d'images afin d'informer les utilisateurs si leur vélo ou leur trottinette était correctement stationné conformément aux lois locales et aux normes de sécurité. L'exécution de ce modèle dans le cloud aurait entraîné des coûts de serveur importants. De plus, les photos mises en ligne par les utilisateurs contenaient des informations sur leur lieu de stationnement. L'équipe souhaitait donc éviter tout problème de confidentialité ou de sécurité. Elle devait trouver une solution plus fiable et plus rentable.
L'équipe souhaitait également améliorer l'expérience d'extraction d'entités pour le service de livraison de colis dans l'application Kakao T. Auparavant, les utilisateurs pouvaient facilement commander une livraison de colis sur une interface de chat, mais les chauffeurs devaient saisir manuellement l'adresse dans un formulaire de commande pour lancer la commande de livraison. Ce processus était fastidieux et sujet aux erreurs humaines. L'équipe a cherché à simplifier ce processus, en rendant les formulaires de commande plus rapides et moins frustrants pour le personnel de livraison.
Améliorer l'expérience utilisateur avec l'API GenAI Prompt de ML Kit
L'équipe a testé et comparé les modèles Gemini basés sur le cloud à Gemini Nano, accessibles via l'API GenAI Prompt de ML Kit. "Après avoir examiné la confidentialité, le coût, la précision et la vitesse de réponse, l'API GenAI Prompt de ML Kit s'est clairement avérée le choix optimal", a déclaré Jinwoo Park, développeur d'applications Android chez Kakao Mobility.
Pour résoudre le problème des vélos ou des trottinettes mal stationnés, l'équipe a utilisé la fonctionnalité multimodale de Gemini Nano via le SDK de l'API GenAI de ML Kit pour détecter quand un vélo ou une trottinette enfreint les réglementations locales en se garant sur un revêtement tactile jaune. Grâce à une requête soigneusement conçue, elle a pu évaluer plus de 200 images de stationnement étiquetées tout en affinant continuellement les entrées. Cette évaluation, mesurée à l'aide de métriques bien connues telles que la précision, la justesse, le rappel et le score F1, a permis de s'assurer que la fonctionnalité répondait aux normes de qualité et de fiabilité de niveau production.
Les utilisateurs peuvent désormais prendre une photo de leur vélo ou de leur trottinette stationné, et l'application les informe s'il est correctement garé ou leur fournit des conseils dans le cas contraire. L'ensemble du processus se déroule en quelques secondes sur l'appareil, ce qui protège la position et les informations de l'utilisateur.
Pour créer une fonctionnalité d'extraction d'entités simplifiée, l'équipe a de nouveau utilisé l'API GenAI Prompt de ML Kit pour traiter les commandes de livraison des utilisateurs rédigées en langage naturel. Si elle avait utilisé le machine learning traditionnel, elle aurait eu besoin d'un grand ensemble de données d'apprentissage et d'une expertise particulière en machine learning. Au lieu de cela, elle a pu simplement commencer par une requête telle que "Extraire le nom, l'adresse et le numéro de téléphone du destinataire du message". L'équipe a préparé environ 200 exemples d'évaluation de haute qualité et a évalué sa requête au cours de nombreuses itérations pour obtenir le meilleur résultat. La méthode la plus efficace utilisée était une technique appelée "few-shot prompting", et les résultats ont été soigneusement analysés pour s'assurer que la sortie contenait un minimum d'hallucinations.
L'API Prompt de ML Kit réduit la surcharge des développeurs tout en offrant une sécurité et une fiabilité élevées sur l'appareil. Elle permet de prototyper rapidement, réduit la dépendance à l'infrastructure et n'entraîne aucun coût supplémentaire. Il n'y a aucune raison de ne pas la recommander." — Jinwoo Park, développeur d'applications Android chez Kakao Mobility
Obtenir des résultats importants avec l'API GenAI Prompt de ML Kit
Par conséquent, la fonctionnalité d'extraction d'entités identifie correctement les informations nécessaires pour chaque commande, même lorsque plusieurs noms et adresses sont saisis. Pour maximiser la portée de la fonctionnalité et fournir une solution de secours robuste, l'équipe a également implémenté un chemin basé sur le cloud à l'aide de Gemini Flash.
L'implémentation de l'API GenAI Prompt de ML Kit a permis à l'équipe de Kakao Mobility de réaliser d'importantes économies en passant à l'IA sur l'appareil. Bien que la fonctionnalité d'analyse du stationnement des vélos n'ait pas encore été lancée, l'amélioration de la saisie d'adresse a déjà donné d'excellents résultats :
- Le délai de traitement des commandes de livraison a été réduit de 24 %.
- Le taux de conversion a augmenté de 45 % pour les nouveaux utilisateurs et de 6 % pour les utilisateurs existants.
- Pendant les périodes de pointe, les commandes optimisées par l'IA augmentent de plus de 200 %.
"Les propriétaires de petites entreprises, en particulier, ont fait des commentaires très positifs, affirmant que cette fonctionnalité avait rendu leur travail beaucoup plus efficace et réduit considérablement leur stress", a ajouté Wisuk.
Une fois la fonctionnalité de reconnaissance d'images pour le stationnement des vélos et des trottinettes lancée, l'équipe de Kakao Mobility est impatiente de l'améliorer davantage. Les environnements de stationnement urbain peuvent être difficiles, et l'équipe étudie des moyens de filtrer les régions inutiles des images.
"L'API GenAI Prompt de ML Kit offre des fonctionnalités de haute qualité sans surcharge supplémentaire", a déclaré Jinwoo. "Cela a réduit les efforts des développeurs, raccourci le délai de développement global et nous a permis de nous concentrer sur l'ajustement des requêtes pour obtenir des résultats de meilleure qualité."
Essayez vous-même l'API GenAI Prompt de ML Kit
Créez et déployez l'IA sur l'appareil dans votre application avec l'API GenAI Prompt de ML Kit pour exploiter les fonctionnalités de Gemini Nano.
Lire la suite
-
Études de cas
Monzo est une banque numérique britannique qui compte 15 millions de clients et qui est en pleine croissance. Au fur et à mesure que l'application évoluait, l'équipe d'ingénierie a identifié le temps de démarrage de l'application comme un domaine essentiel à améliorer, mais craignait que cela ne nécessite des modifications importantes de sa base de code.
Ben Weiss • Temps de lecture : 2 min
-
Études de cas
TikTok est une plate-forme mondiale de vidéos courtes connue pour son énorme base d'utilisateurs et ses fonctionnalités innovantes.
Ben Trengrove, Ajesh Pai • Temps de lecture : 2 min
-
Études de cas
Dans le monde dynamique des réseaux sociaux, l'attention des utilisateurs est rapidement gagnée ou perdue. Les applications Meta (Facebook et Instagram) font partie des plus grandes plates-formes sociales au monde et sont utilisées par des milliards d'utilisateurs dans le monde entier.
Mayuri Khinvasara Khabya • Temps de lecture : 4 min
Restez informé
Recevez chaque semaine les dernières informations sur le développement Android directement dans votre boîte de réception.