Case Studies
Kakao Mobility używa Gemini Nano na urządzeniu, aby obniżyć koszty i zwiększyć liczbę konwersji telefonicznych o 45%
Czas czytania: 4 minuty
Kakao Mobility to wiodąca firma w Korei Południowej oferująca usługi transportowe i dostawy, w tym zamawianie taksówek, nawigację, wypożyczanie rowerów i skuterów, parkowanie oraz dostarczanie paczek za pomocą aplikacji Kakao T. Zespół Kakao Mobility wykorzystał Gemini Nano za pomocą interfejsu GenAI Prompt API w ML Kit, aby oferować pomoc w parkowaniu w ramach usługi wypożyczania rowerów publicznych oraz ulepszyć wprowadzanie adresu w usługach nawigacji i dostawy.
Aplikacja Kakao T ma ponad 30 milionów użytkowników, a usługa wypożyczania rowerów jest jedną z najpopularniejszych. Niestety wielu użytkowników parkowało rowery lub skutery w nieprawidłowy sposób, gdy nie były używane. Takie zachowanie doprowadziło do wzrostu liczby naruszeń przepisów dotyczących parkowania i obaw o bezpieczeństwo, co spowodowało skargi publiczne, grzywny i odholowywanie pojazdów. Te problemy zaczęły negatywnie wpływać na postrzeganie zarówno Kakao Mobility, jak i jej usług wypożyczania rowerów.
„Dzięki wykorzystaniu interfejsu GenAI Prompt API w ML Kit i Gemini Nano udało nam się szybko wdrożyć funkcje, które zwiększają wartość społeczną bez pogorszenia komfortu użytkowników. Kakao Mobility będzie nadal aktywnie wdrażać AI na urządzeniu, aby zapewniać bezpieczniejsze i wygodniejsze usługi transportowe” – Wisuk Ryu, szef działu rozwoju klienta
Aby rozwiązać te problemy, zespół początkowo zaprojektował model rozpoznawania obrazów, który informował użytkowników, czy ich rower lub skuter jest zaparkowany prawidłowo zgodnie z lokalnymi przepisami i standardami bezpieczeństwa. Uruchomienie tego modelu w chmurze wiązałoby się ze znacznymi kosztami serwera. Ponadto przesłane przez użytkowników zdjęcia zawierały informacje o lokalizacji parkowania, dlatego zespół chciał uniknąć wszelkich obaw związanych z prywatnością i bezpieczeństwem. Zespół musiał znaleźć bardziej niezawodne i opłacalne rozwiązanie.
Zespół chciał też ulepszyć funkcję wyodrębniania encji w usłudze dostarczania paczek w aplikacji Kakao T. Wcześniej użytkownicy mogli łatwo zamówić dostawę paczki w interfejsie czatu, ale kierowcy musieli ręcznie wpisać adres w formularzu zamówienia, aby rozpocząć dostawę. Był to proces uciążliwy i podatny na błędy. Zespół chciał usprawnić ten proces, aby formularze zamówień były szybsze i mniej frustrujące dla dostawców.
Ulepszanie komfortu użytkowników za pomocą interfejsu GenAI Prompt API w ML Kit
Zespół przetestował i porównał modele Gemini w chmurze z Gemini Nano, do którego dostęp uzyskano za pomocą interfejsu GenAI Prompt API w ML Kit. „Po przeanalizowaniu prywatności, kosztów, dokładności i szybkości reakcji interfejs GenAI Prompt API w ML Kit okazał się optymalnym wyborem” – powiedział Jinwoo Park, deweloper aplikacji na Androida w Kakao Mobility.
Aby rozwiązać problem nieprawidłowo zaparkowanych rowerów lub skuterów, zespół użył funkcji multimodalnej Gemini Nano za pomocą pakietu ML Kit GenAI API SDK, aby wykrywać, kiedy rower lub skuter narusza lokalne przepisy, parkując na żółtej nawierzchni dotykowej. Dzięki starannie opracowanemu promptowi udało im się ocenić ponad 200 oznaczonych zdjęć zaparkowanych pojazdów, jednocześnie stale udoskonalając dane wejściowe. Ta ocena, mierzona za pomocą dobrze znanych wskaźników, takich jak dokładność, precyzja, czułość i wynik F1, zapewniła, że funkcja spełnia standardy jakości i niezawodności na poziomie produkcyjnym.
Teraz użytkownicy mogą zrobić zdjęcie zaparkowanego roweru lub skutera, a aplikacja poinformuje ich, czy jest on zaparkowany prawidłowo, lub udzieli wskazówek, jeśli nie jest. Cały proces trwa kilka sekund na urządzeniu, chroniąc lokalizację i informacje użytkownika.
Aby utworzyć uproszczoną funkcję wyodrębniania encji, zespół ponownie użył interfejsu GenAI Prompt API w ML Kit do przetwarzania zamówień dostawy użytkowników napisanych w języku naturalnym. Gdyby zastosowali tradycyjne uczenie maszynowe, wymagałoby to dużego zbioru danych do uczenia i specjalistycznej wiedzy w tej dziedzinie. Zamiast tego mogli po prostu zacząć od prompta takiego jak „Wyodrębnij z wiadomości imię i nazwisko, adres i numer telefonu odbiorcy”. Zespół przygotował około 200 wysokiej jakości przykładów do oceny i ocenił prompt w wielu iteracjach, aby uzyskać najlepszy wynik. Najskuteczniejszą metodą było użycie tworzenia promptów few-shot. Wyniki zostały starannie przeanalizowane, aby zapewnić minimalną liczbę halucynacji.
„Interfejs Prompt API w ML Kit zmniejsza obciążenie deweloperów, zapewniając jednocześnie wysoki poziom bezpieczeństwa i niezawodności na urządzeniu. Umożliwia szybkie tworzenie prototypów, zmniejsza zależność od infrastruktury i nie wiąże się z dodatkowymi kosztami. Nie ma powodu, aby go nie polecać” — Jinwoo Park, deweloper aplikacji na Androida w Kakao Mobility
Osiąganie świetnych wyników dzięki interfejsowi GenAI Prompt API w ML Kit
Dzięki temu funkcja wyodrębniania encji prawidłowo identyfikuje niezbędne szczegóły każdego zamówienia, nawet jeśli wpisano wiele imion i nazwisk oraz adresów. Aby zmaksymalizować zasięg funkcji i zapewnić niezawodne rozwiązanie rezerwowe, zespół wdrożył też ścieżkę działającą w chmurze za pomocą Gemini Flash.
Wdrożenie interfejsu GenAI Prompt API w ML Kit pozwoliło zespołowi Kakao Mobility znacznie obniżyć koszty dzięki przejściu na AI na urządzeniu. Funkcja analizy parkowania rowerów nie została jeszcze uruchomiona, ale ulepszenie wprowadzania adresu przyniosło już doskonałe rezultaty:
- Czas realizacji zamówień dostawy skrócił się o 24%.
- Współczynnik konwersji wzrósł o 45% w przypadku nowych użytkowników i o 6% w przypadku obecnych.
- W szczycie sezonu liczba zamówień obsługiwanych przez AI wzrasta o ponad 200%.
„Szczególnie właściciele małych firm przekazali bardzo pozytywne opinie, mówiąc, że ta funkcja znacznie zwiększyła wydajność ich pracy i zmniejszyła stres” – dodał Wisuk.
Po uruchomieniu funkcji rozpoznawania obrazów do parkowania rowerów i skuterów zespół Kakao Mobility chce ją jeszcze ulepszyć. Parkowanie w miastach może być trudne, dlatego zespół szuka sposobów na odfiltrowanie niepotrzebnych obszarów z obrazów.
„Interfejs GenAI Prompt API w ML Kit oferuje wysokiej jakości funkcje bez dodatkowych kosztów” – powiedział Jinwoo. „Dzięki temu deweloperzy muszą się mniej napracować, a ogólny czas tworzenia jest krótszy. Możemy się skupić na dostrajaniu promptów, aby uzyskać lepsze wyniki”.
Wypróbuj interfejs GenAI Prompt API w ML Kit
Twórz i wdrażaj AI na urządzeniu w swojej aplikacji za pomocą interfejsu GenAI Prompt API w ML Kit, aby wykorzystać możliwości Gemini Nano.
Czytaj dalej
-
Case Studies
Karrot to hiperlokalna aplikacja społecznościowa typu peer-to-peer, która umożliwia użytkownikom kupowanie, sprzedawanie i wymienianie przedmiotów z innymi zweryfikowanymi użytkownikami. Od czasu uruchomienia w Korei Południowej w 2015 r. platforma rozszerzyła się na rynki globalne, zdobywając ponad 43 miliony zarejestrowanych użytkowników.
Thomas Ezan, Tracy Agyemang • Czas czytania: 2 minuty
-
Case Studies
Monzo to brytyjski bank cyfrowy, który ma 15 milionów klientów i stale się rozwija. W miarę skalowania aplikacji zespół inżynierów uznał czas uruchamiania aplikacji za kluczowy obszar do poprawy, ale obawiał się, że będzie to wymagało znacznych zmian w bazie kodu.
Ben Weiss, Tracy Agyemang • Czas czytania: 2 minuty
-
Case Studies
W dynamicznym świecie mediów społecznościowych uwaga użytkowników jest szybko zdobywana lub tracona. Aplikacje Meta (Facebook i Instagram) należą do największych platform społecznościowych na świecie i obsługują miliardy użytkowników na całym świecie.
Mayuri Khinvasara Khabya, Tracy Agyemang • Czas czytania: 4 minuty
Bądź na bieżąco
Otrzymuj co tydzień najnowsze informacje o tworzeniu aplikacji na Androida na swoją skrzynkę odbiorczą.