Estudos de caso

A Kakao Mobility usa o Gemini Nano no dispositivo para reduzir custos e aumentar a conversão de chamadas em 45%

Leitura de 4 minutos

A Kakao Mobility é a principal empresa de mobilidade da Coreia do Sul, oferecendo uma variedade de serviços de transporte e entrega, incluindo solicitação de táxi, navegação, compartilhamento de bicicletas e scooters, estacionamento e entrega de encomendas, pelo app Kakao T. A equipe da Kakao Mobility usou o Gemini Nano pela API GenAI Prompt do ML Kit para oferecer assistência de estacionamento para o serviço de compartilhamento de bicicletas e uma experiência aprimorada de entrada de endereço para os serviços de navegação e entrega.

O app Kakao T atende a mais de 30 milhões de usuários, e o serviço de compartilhamento de bicicletas é um dos mais usados. Mas, infelizmente, muitos usuários estacionavam as bicicletas ou scooters de forma inadequada quando não estavam em uso. Esse comportamento levou a um aumento nas violações de estacionamento e preocupações com a segurança, resultando em reclamações públicas, multas e reboques. Esses problemas começaram a afetar negativamente a percepção pública da Kakao Mobility e dos serviços de compartilhamento de bicicletas.

wisuk.png

"Ao aproveitar a API GenAI Prompt do ML Kit e o Gemini Nano, conseguimos implementar rapidamente recursos que melhoram o valor social sem comprometer a experiência do usuário. A Kakao Mobility vai continuar adotando ativamente a IA no dispositivo para oferecer serviços de mobilidade mais seguros e convenientes". — Wisuk Ryu, chefe da Divisão de Desenvolvimento de Clientes

Para resolver esses problemas, a equipe inicialmente projetou um modelo de reconhecimento de imagem para notificar os usuários se a bicicleta ou o scooter estava estacionado corretamente de acordo com as leis locais e os padrões de segurança. Executar esse modelo na nuvem teria gerado custos significativos de servidor. Além disso, as fotos enviadas pelos usuários continham informações sobre o local de estacionamento, então a equipe queria evitar problemas de privacidade ou segurança. A equipe precisava encontrar uma solução mais confiável e econômica.

A equipe também queria melhorar a experiência de extração de entidades para o serviço de entrega de encomendas no app Kakao T. Antes, os usuários podiam pedir facilmente a entrega de encomendas em uma interface de chat, mas os motoristas precisavam inserir o endereço em um formulário de pedido manualmente para iniciar o pedido de entrega. Esse processo era complicado e propenso a erros humanos. A equipe buscou simplificar esse processo, tornando os formulários de pedido mais rápidos e menos frustrantes para os funcionários de entrega.

Melhorar a experiência do usuário com a API GenAI Prompt do Kit de ML

A equipe testou e comparou modelos do Gemini baseados na nuvem com o Gemini Nano, acessado pela API GenAI Prompt do ML Kit. "Depois de analisar privacidade, custo, acurácia e velocidade de resposta, a API GenAI Prompt do ML Kit foi claramente a melhor opção", disse Jinwoo Park, desenvolvedor de aplicativos Android na Kakao Mobility. 

Para resolver o problema de bicicletas ou scooters estacionadas de maneira inadequada, a equipe usou a capacidade multimodal do Gemini Nano pela API GenAI do SDK do Kit de ML para detectar quando uma bicicleta ou scooter viola as regulamentações locais ao estacionar em um piso tátil amarelo. Com um comando cuidadosamente elaborado, eles conseguiram avaliar mais de 200 imagens rotuladas de fotos de estacionamentos enquanto refinavam continuamente as entradas. Essa avaliação, medida por métricas conhecidas como acurácia, precisão, recall e pontuação F1, garantiu que o recurso atendesse aos padrões de qualidade e confiabilidade de nível de produção.

Agora, os usuários podem tirar uma foto da bicicleta ou do scooter estacionado, e o app vai informar se o veículo está estacionado corretamente ou dar orientações se não estiver. Todo o processo acontece em segundos no dispositivo, protegendo a localização e as informações do usuário. 

bike.jpg

Para criar um recurso simplificado de extração de entidades, a equipe usou novamente a API GenAI Prompt do ML Kit para processar os pedidos de entrega dos usuários escritos em linguagem natural. Se eles tivessem usado o machine learning tradicional, seria necessário um grande conjunto de dados de aprendizado e experiência especial em machine learning. Em vez disso, eles podem simplesmente começar com um comando como "Extraia o nome, o endereço e o número de telefone do destinatário da mensagem". A equipe preparou cerca de 200 exemplos de avaliação de alta qualidade e avaliou o comando em várias rodadas de iteração para conseguir o melhor resultado. O método mais eficaz usado foi uma técnica chamada "criação de comandos de poucos disparos", e os resultados foram analisados com cuidado para garantir que a saída contivesse o mínimo de alucinações.

jinwoo.png


"A API Prompt do ML Kit reduz a sobrecarga do desenvolvedor e oferece segurança e confiabilidade no dispositivo. Ele permite a prototipagem rápida, reduz a dependência de infraestrutura e não gera custos extras. Não há motivo para não recomendar.” — Jinwoo Park, desenvolvedor de app Android na Kakao Mobility

Como alcançar grandes resultados com a API GenAI Prompt do Kit de ML

Como resultado, o recurso de extração de entidades identifica corretamente os detalhes necessários de cada pedido, mesmo quando vários nomes e endereços são inseridos. Para maximizar o alcance do recurso e oferecer um fallback robusto, a equipe também implementou um caminho baseado na nuvem usando o Gemini Flash.

A implementação da API GenAI Prompt do ML Kit gerou uma economia significativa para a equipe da Kakao Mobility ao mudar para a IA no dispositivo. Embora o recurso de análise de estacionamento de bicicletas ainda não tenha sido lançado, a melhoria na entrada de endereços já trouxe excelentes resultados: 

  • O tempo de conclusão dos pedidos de entrega foi reduzido em 24%.
  • A taxa de conversão aumentou 45% para novos usuários e 6% para usuários atuais.
  • Durante as temporadas de pico, os pedidos com tecnologia de IA aumentam mais de 200%. 

"Os proprietários de pequenas empresas, em particular, compartilharam um feedback muito positivo, dizendo que o recurso tornou o trabalho muito mais eficiente e reduziu significativamente o estresse", acrescentou Wisuk.

Depois do lançamento do recurso de reconhecimento de imagens para estacionamento de bicicletas e scooters, a equipe da Kakao Mobility quer melhorar ainda mais. Os ambientes de estacionamento urbano podem ser desafiadores, e a equipe está explorando maneiras de filtrar regiões desnecessárias das imagens. 

"A API GenAI Prompt do ML Kit oferece recursos de alta qualidade sem sobrecarga adicional", disse Jinwoo. "Isso reduziu o esforço dos desenvolvedores, diminuiu o tempo geral de desenvolvimento e permitiu que nos concentrássemos no ajuste de comandos para resultados de maior qualidade."

Teste a API GenAI Prompt do Kit de ML

Crie e implante a IA no dispositivo no seu app com a API GenAI Prompt do Kit de ML para aproveitar os recursos do Gemini Nano.

Escrito por:

Continuar lendo