Case study

Kakao Mobility utilizza Gemini Nano sul dispositivo per ridurre i costi e aumentare del 45% la conversione di chiamata

Lettura di 4 minuti

Kakao Mobility è la principale azienda di mobilità della Corea del Sud, che offre una gamma di servizi di trasporto e consegna, tra cui prenotazione di taxi, navigazione, bike e scooter sharing, parcheggio e consegna di pacchi, tramite la sua app Kakao T. Il team di Kakao Mobility ha utilizzato Gemini Nano tramite l'API GenAI Prompt di ML Kit per offrire assistenza al parcheggio per il suo servizio di bike sharing e un'esperienza di inserimento degli indirizzi migliorata per i suoi servizi di navigazione e consegna.

L'app Kakao T serve oltre 30 milioni di utenti totali e il suo servizio di bike sharing è uno dei più popolari. Purtroppo, molti utenti parcheggiavano in modo improprio le biciclette o i monopattini quando non erano in uso. Questo comportamento ha portato a un afflusso di violazioni del parcheggio e problemi di sicurezza, con conseguenti reclami pubblici, multe e rimozione dei veicoli. Questi problemi hanno iniziato a influire negativamente sulla percezione pubblica sia di Kakao Mobility sia dei suoi servizi di bike sharing.

wisuk.png

"Sfruttando l'API GenAI Prompt di ML Kit e Gemini Nano, siamo riusciti a implementare rapidamente funzionalità che migliorano il valore sociale senza compromettere l'esperienza utente. Kakao Mobility continuerà ad adottare attivamente l'AI on-device per fornire servizi di mobilità più sicuri e convenienti". — Wisuk Ryu, Head of Client Development Div

Per rispondere a queste preoccupazioni, il team ha inizialmente progettato un modello di riconoscimento delle immagini per avvisare gli utenti se la loro bicicletta o il loro scooter era parcheggiato correttamente in base alle leggi locali e agli standard di sicurezza. L'esecuzione di questo modello tramite il cloud avrebbe comportato costi del server significativi. Inoltre, le foto caricate dagli utenti contenevano informazioni sulla posizione del parcheggio, quindi il team voleva evitare problemi di privacy o sicurezza. Il team doveva trovare una soluzione più affidabile ed economica.

Il team voleva anche migliorare l'esperienza di estrazione delle entità per il servizio di consegna dei pacchi all'interno dell'app Kakao T. In precedenza, gli utenti potevano ordinare facilmente la consegna dei pacchi su un'interfaccia di chat, ma i conducenti dovevano inserire manualmente l'indirizzo in un modulo d'ordine per avviare l'ordine di consegna, un processo macchinoso e soggetto a errori umani. Il team ha cercato di semplificare questa procedura, rendendo i moduli d'ordine più veloci e meno frustranti per il personale addetto alle consegne.

Migliorare l'esperienza utente con l'API GenAI Prompt di ML Kit

Il team ha testato e confrontato i modelli Gemini basati su cloud con Gemini Nano, a cui si accede tramite l'API GenAI Prompt di ML Kit. "Dopo aver esaminato privacy, costi, accuratezza e velocità di risposta, l'API GenAI Prompt di ML Kit è stata chiaramente la scelta ottimale", ha affermato Jinwoo Park, sviluppatore di app per Android presso Kakao Mobility. 

Per risolvere il problema delle biciclette o dei monopattini parcheggiati in modo improprio, il team ha utilizzato la funzionalità multimodale di Gemini Nano tramite l'SDK API ML Kit AI generativa per rilevare quando una bicicletta o un monopattino viola le normative locali parcheggiando su una pavimentazione tattile gialla. Con un prompt creato con cura, è stato possibile valutare più di 200 immagini etichettate di foto di parcheggi perfezionando continuamente gli input. Questa valutazione, misurata tramite metriche ben note come accuratezza, precisione, richiamo e punteggio F1, ha garantito che la funzionalità soddisfacesse gli standard di qualità e affidabilità a livello di produzione.

Ora gli utenti possono scattare una foto della bici o dello scooter parcheggiati e l'app li informerà se il parcheggio è corretto o fornirà indicazioni in caso contrario. L'intero processo avviene in pochi secondi sul dispositivo, proteggendo la posizione e le informazioni dell'utente. 

bike.jpg

Per creare una funzionalità di estrazione delle entità semplificata, il team ha utilizzato di nuovo l'API GenAI Prompt di ML Kit per elaborare gli ordini di consegna degli utenti scritti in linguaggio naturale. Se avessero utilizzato il machine learning tradizionale, avrebbero avuto bisogno di un ampio set di dati di apprendimento e di competenze speciali nel machine learning. Potrebbe invece iniziare con un prompt come "Estrai il nome, l'indirizzo e il numero di telefono del destinatario dal messaggio". Il team ha preparato circa 200 esempi di valutazione di alta qualità e ha valutato il prompt in molti cicli di iterazione per ottenere il miglior risultato. Il metodo più efficace utilizzato è una tecnica chiamata prompting few-shot e i risultati sono stati analizzati attentamente per garantire che l'output contenesse un numero minimo di allucinazioni.

jinwoo.png


"L'API Prompt di ML Kit riduce l'overhead per gli sviluppatori e offre al contempo sicurezza e affidabilità sul dispositivo. Consente la prototipazione rapida, riduce la dipendenza dall'infrastruttura e non comporta costi aggiuntivi. Non c'è motivo per non consigliarlo." - Jinwoo Park, sviluppatore di app per Android presso Kakao Mobility

Ottenere risultati eccezionali con l'API GenAI Prompt di ML Kit

Di conseguenza, la funzionalità di estrazione delle entità identifica correttamente i dettagli necessari di ogni ordine, anche quando vengono inseriti più nomi e indirizzi. Per massimizzare la copertura della funzionalità e fornire un fallback efficace, il team ha implementato anche un percorso basato sul cloud utilizzando Gemini Flash.

L'implementazione dell'API GenAI Prompt di ML Kit ha consentito al team di Kakao Mobility di ottenere un notevole risparmio sui costi grazie al passaggio all'AI on-device. Sebbene la funzionalità di analisi del parcheggio delle biciclette non sia ancora stata lanciata, il miglioramento dell'inserimento dell'indirizzo ha già prodotto risultati eccellenti: 

  • Il tempo di completamento degli ordini con consegna è stato ridotto del 24%.
  • Il tasso di conversione è aumentato del 45% per i nuovi utenti e del 6% per gli utenti esistenti.
  • Durante le stagioni di picco, gli ordini basati sull'AI aumentano di oltre il 200%. 

"In particolare, i proprietari di piccole imprese hanno condiviso feedback molto positivi, affermando che la funzionalità ha reso il loro lavoro molto più efficiente e ha ridotto significativamente lo stress", ha aggiunto Wisuk.

Dopo il lancio della funzionalità di riconoscimento delle immagini per il parcheggio di biciclette e scooter, il team di Kakao Mobility è ansioso di migliorarla ulteriormente. Gli ambienti di parcheggio urbani possono essere difficili e il team sta esplorando modi per filtrare le regioni non necessarie dalle immagini. 

"L'API GenAI Prompt di ML Kit offre funzionalità di alta qualità senza costi aggiuntivi", ha affermato Jinwoo. "Ciò ha ridotto l'impegno degli sviluppatori, abbreviato i tempi di sviluppo complessivi e ci ha permesso di concentrarci sull'ottimizzazione dei prompt per ottenere risultati di qualità superiore".

Prova l'API GenAI Prompt di ML Kit

Crea ed esegui il deployment dell'AI on-device nella tua app con l'API GenAI Prompt di ML Kit per sfruttare le funzionalità di Gemini Nano.

Scritto da:

Continua a leggere