카카오모빌리티는 대한민국 최고의 모빌리티 비즈니스로, 카카오 T 앱을 통해 택시 호출, 내비게이션, 자전거 및 스쿠터 공유, 주차, 소포 배송 등 다양한 교통 및 배송 서비스를 제공합니다. 카카오모빌리티의 팀은 Gemini Nano를 ML Kit의 생성형 AI 프롬프트 API를 통해 활용하여 자전거 공유 서비스의 주차 지원과 내비게이션 및 배송 서비스의 개선된 주소 입력 환경을 제공했습니다.
카카오 T 앱은 총 3,000만 명 이상의 사용자에게 서비스를 제공하며, 자전거 공유 서비스는 가장 인기 있는 서비스 중 하나입니다. 하지만 많은 사용자가 사용하지 않을 때 자전거나 스쿠터를 부적절하게 주차했습니다. 이러한 행동으로 인해 주차 위반이 급증하고 안전 문제가 발생하여 대중의 불만, 벌금, 견인으로 이어졌습니다. 이러한 문제는 카카오모빌리티와 자전거 공유 서비스에 대한 대중의 인식에 부정적인 영향을 미치기 시작했습니다.
'ML Kit의 생성형 AI 프롬프트 API와 Gemini Nano를 활용하여 사용자 경험을 저해하지 않고 사회적 가치를 개선하는 기능을 빠르게 구현할 수 있었습니다. Kakao Mobility는 더 안전하고 편리한 모빌리티 서비스를 제공하기 위해 온디바이스 AI를 적극적으로 도입할 것입니다.” — 류위숙, 클라이언트 개발팀장
이러한 우려사항을 해결하기 위해 팀은 처음에는 지역 법규 및 안전 표준에 따라 자전거 또는 스쿠터가 올바르게 주차되었는지 사용자에게 알리는 이미지 인식 모델을 설계했습니다. 클라우드를 통해 이 모델을 실행하면 상당한 서버 비용이 발생했을 것입니다. 또한 사용자가 업로드한 사진에는 주차 위치에 관한 정보가 포함되어 있어 개인 정보 보호 또는 보안 문제가 발생하지 않도록 하고 싶었습니다. 팀은 더 안정적이고 비용 효율적인 솔루션을 찾아야 했습니다.
또한 카카오 T 앱 내 택배 서비스의 항목 추출 환경을 개선하고자 했습니다. 이전에는 사용자가 채팅 인터페이스에서 택배를 쉽게 주문할 수 있었지만, 운전자는 배송 주문을 시작하기 위해 주문 양식에 주소를 수동으로 입력해야 했습니다. 이 과정은 번거롭고 인적 오류가 발생하기 쉬웠습니다. 팀은 이 프로세스를 간소화하여 주문 양식을 더 빠르게 작성하고 배송 직원의 불편함을 줄이려고 노력했습니다.
ML Kit의 생성형 AI 프롬프트 API를 사용한 사용자 환경 개선
이 팀은 ML Kit의 GenAI Prompt API를 통해 액세스한 클라우드 기반 Gemini 모델을 Gemini Nano와 비교하고 테스트했습니다. 카카오모빌리티의 Android 애플리케이션 개발자인 박진우는 '개인 정보 보호, 비용, 정확성, 응답 속도를 검토한 결과 ML Kit의 생성형 AI 프롬프트 API가 최적의 선택임이 분명했습니다'라고 말했습니다.
잘못 주차된 자전거 또는 스쿠터 문제를 해결하기 위해 팀은 ML Kit GenAI API SDK를 통해 Gemini Nano의 멀티모달 기능을 사용하여 자전거 또는 스쿠터가 노란색 점자 블록에 주차되어 현지 규정을 위반하는 경우를 감지했습니다. 신중하게 작성된 프롬프트를 사용하여 입력값을 지속적으로 개선하면서 200개가 넘는 라벨이 지정된 주차 사진 이미지를 평가할 수 있었습니다. 정확성, 정밀도, 재현율, F1 점수와 같은 잘 알려진 측정항목을 통해 측정된 이 평가를 통해 기능이 프로덕션 수준의 품질 및 안정성 표준을 충족하는지 확인했습니다.
이제 사용자가 주차된 자전거 또는 스쿠터의 사진을 찍으면 앱에서 올바르게 주차되었는지 알려주고, 올바르게 주차되지 않은 경우 안내를 제공합니다. 전체 프로세스는 기기에서 몇 초 만에 이루어지며 사용자의 위치와 정보를 보호합니다.
팀은 간소화된 엔티티 추출 기능을 만들기 위해 ML Kit의 생성형 AI 프롬프트 API를 다시 사용하여 자연어로 작성된 사용자의 배송 주문을 처리했습니다. 기존 머신러닝을 사용했다면 대규모 학습 데이터 세트와 머신러닝에 관한 전문 지식이 필요했을 것입니다. 대신 '메일에서 수신자의 이름, 주소, 전화번호를 추출해 줘'와 같은 프롬프트로 시작할 수 있습니다. 이 팀은 약 200개의 고품질 평가 예시를 준비하고 여러 차례의 반복을 통해 프롬프트를 평가하여 최상의 결과를 얻었습니다. 가장 효과적인 방법은 퓨샷 프롬프팅이라는 기술이었으며, 출력에 할루시네이션이 최소화되도록 결과를 신중하게 분석했습니다.
'ML Kit의 프롬프트 API는 개발자 오버헤드를 줄이면서도 기기에서 강력한 보안과 안정성을 제공합니다. 이를 통해 신속한 프로토타입 제작이 가능하고 인프라 종속성이 낮아지며 추가 비용이 발생하지 않습니다. 추천하지 않을 이유가 없습니다." — 박진우, 카카오모빌리티 Android 애플리케이션 개발자
ML Kit의 생성형 AI 프롬프트 API로 큰 성과 달성하기
따라서 여러 이름과 주소를 입력해도 엔티티 추출 기능이 각 주문의 필수 세부정보를 올바르게 식별합니다. 이 기능의 도달범위를 극대화하고 강력한 대체 기능을 제공하기 위해 팀은 Gemini Flash를 사용하는 클라우드 기반 경로도 구현했습니다.
ML Kit의 생성형 AI 프롬프트 API를 구현한 결과, 기기 내 AI로 전환하여 Kakao Mobility팀의 비용이 크게 절감되었습니다. 자전거 주차 분석 기능은 아직 출시되지 않았지만 주소 입력 개선을 통해 이미 우수한 결과를 얻었습니다.
- 배송 주문의 주문 완료 시간이 24% 단축되었습니다.
- 신규 사용자의 전환율은 45%, 기존 사용자의 전환율은 6% 증가했습니다.
- 성수기에는 AI 기반 주문이 200% 이상 증가합니다.
위숙은 '특히 소규모 비즈니스 소유자들은 이 기능 덕분에 업무가 훨씬 효율적으로 처리되고 스트레스가 크게 줄었다는 매우 긍정적인 의견을 전해왔습니다'라고 덧붙였습니다.
자전거 및 스쿠터 주차용 이미지 인식 기능이 출시된 후 Kakao Mobility팀은 이 기능을 더욱 개선하기 위해 노력하고 있습니다. 도심 주차 환경은 어려울 수 있으므로 팀에서는 이미지에서 불필요한 영역을 필터링하는 방법을 모색하고 있습니다.
진우는 'ML Kit의 생성형 AI 프롬프트 API는 추가 오버헤드 없이 고품질 기능을 제공합니다'라고 말했습니다. '이로 인해 개발자 노력이 줄고 전체 개발 시간이 단축되었으며 고품질 결과를 위한 프롬프트 조정에 집중할 수 있었습니다.'
ML Kit의 생성형 AI 프롬프트 API 직접 사용해 보기
ML Kit의 생성형 AI 프롬프트 API를 사용하여 앱에서 온디바이스 AI를 빌드하고 배포하여 Gemini Nano의 기능을 활용하세요.
계속 읽기
-
우수사례
Monzo는 1,500만 명의 고객을 보유한 영국의 디지털 은행으로, 고객 수가 계속 증가하고 있습니다. 앱이 확장되면서 엔지니어링팀은 앱 시작 시간이 개선이 필요한 중요한 영역이라고 판단했지만 코드베이스를 크게 변경해야 할까 봐 걱정했습니다.
Ben Weiss • 전문 길이: 2분
-
우수사례
TikTok은 방대한 사용자층과 혁신적인 기능으로 유명한 글로벌 숏폼 동영상 플랫폼입니다.
Ben Trengrove, Ajesh Pai • 전문 길이: 2분
-
우수사례
소셜 미디어의 역동적인 세계에서는 사용자의 관심을 빠르게 얻거나 잃습니다. Meta 앱 (Facebook 및 Instagram)은 세계 최대 규모의 소셜 플랫폼 중 하나이며 전 세계 수십억 명의 사용자에게 서비스를 제공합니다.
Mayuri Khinvasara Khabya • 읽는 데 4분 소요
소식 받아 보기
Android 개발 관련 최신 정보를 이메일로 받아 보세요.