Nghiên cứu điển hình

Kakao Mobility sử dụng Gemini Nano trên thiết bị để giảm chi phí và tăng lượt chuyển đổi dẫn đến cuộc gọi lên 45%

Đọc trong 4 phút

Kakao Mobility là doanh nghiệp hàng đầu về dịch vụ di chuyển tại Hàn Quốc, cung cấp nhiều dịch vụ vận chuyển và giao hàng, bao gồm cả dịch vụ gọi taxi, chỉ đường, chia sẻ xe đạp và xe tay ga, đỗ xe và giao bưu kiện thông qua ứng dụng Kakao T. Nhóm tại Kakao Mobility đã sử dụng Gemini Nano thông qua GenAI Prompt API của ML Kit để cung cấp dịch vụ hỗ trợ đỗ xe cho dịch vụ chia sẻ xe đạp và cải thiện trải nghiệm nhập địa chỉ cho dịch vụ chỉ đường và giao hàng.

Ứng dụng Kakao T phục vụ tổng cộng hơn 30 triệu người dùng và dịch vụ chia sẻ xe đạp là một trong những dịch vụ phổ biến nhất của ứng dụng này. Nhưng không may là nhiều người dùng đã đỗ xe đạp hoặc xe tay ga không đúng cách khi không sử dụng. Hành vi này dẫn đến việc gia tăng các lỗi vi phạm quy định về đỗ xe và các vấn đề về an toàn, khiến người dân khiếu nại, bị phạt và bị kéo xe. Những vấn đề này bắt đầu ảnh hưởng tiêu cực đến nhận thức của công chúng về cả Kakao Mobility và dịch vụ chia sẻ xe đạp của công ty này.

wisuk.png

"Bằng cách tận dụng GenAI Prompt API và Gemini Nano của Bộ công cụ học máy, chúng tôi có thể nhanh chóng triển khai các tính năng giúp cải thiện giá trị xã hội mà vẫn đảm bảo trải nghiệm người dùng. Kakao Mobility sẽ tiếp tục tích cực áp dụng AI trên thiết bị để cung cấp các dịch vụ di chuyển an toàn và thuận tiện hơn.” – Wisuk Ryu, Trưởng bộ phận Phát triển khách hàng

Để giải quyết những lo ngại này, ban đầu, nhóm đã thiết kế một mô hình nhận dạng hình ảnh để thông báo cho người dùng nếu xe đạp hoặc xe tay ga của họ được đỗ đúng cách theo luật pháp địa phương và tiêu chuẩn an toàn. Việc chạy mô hình này thông qua đám mây sẽ phát sinh chi phí đáng kể cho máy chủ. Ngoài ra, ảnh mà người dùng tải lên có chứa thông tin về vị trí đỗ xe của họ, vì vậy, nhóm muốn tránh mọi lo ngại về quyền riêng tư hoặc tính bảo mật. Nhóm này cần tìm một giải pháp đáng tin cậy và tiết kiệm chi phí hơn.

Nhóm cũng muốn cải thiện trải nghiệm trích xuất thực thể cho dịch vụ giao hàng bưu kiện trong ứng dụng Kakao T. Trước đây, người dùng có thể dễ dàng đặt dịch vụ giao hàng trên giao diện trò chuyện, nhưng người lái xe cần nhập địa chỉ vào biểu mẫu đặt hàng theo cách thủ công để bắt đầu đơn đặt hàng giao hàng. Đây là một quy trình rườm rà và dễ xảy ra lỗi do con người. Nhóm này đã tìm cách đơn giản hoá quy trình này, giúp biểu mẫu đặt hàng nhanh hơn và ít gây khó chịu hơn cho nhân viên giao hàng.

Nâng cao trải nghiệm người dùng bằng GenAI Prompt API của Bộ công cụ học máy

Nhóm đã kiểm thử và so sánh các mô hình Gemini dựa trên đám mây với Gemini Nano thông qua GenAI Prompt API của Bộ công cụ học máy. Jinwoo Park, nhà phát triển ứng dụng Android tại Kakao Mobility cho biết: "Sau khi xem xét quyền riêng tư, chi phí, độ chính xác và tốc độ phản hồi, rõ ràng GenAI Prompt API của ML Kit là lựa chọn tối ưu". 

Để giải quyết vấn đề xe đạp hoặc xe tay ga đỗ không đúng cách, nhóm đã sử dụng khả năng đa phương thức của Gemini Nano thông qua Bộ công cụ học máy GenAI API SDK để phát hiện khi xe đạp hoặc xe tay ga vi phạm quy định của địa phương bằng cách đỗ xe trên vỉa hè có gạch lát màu vàng. Với câu lệnh được soạn thảo cẩn thận, họ có thể đánh giá hơn 200 hình ảnh được gắn nhãn về ảnh bãi đỗ xe trong khi liên tục tinh chỉnh dữ liệu đầu vào. Việc đánh giá này (được đo lường thông qua các chỉ số nổi tiếng như độ chính xác, độ chuẩn xác, độ bao phủ và điểm F1) đảm bảo tính năng này đáp ứng các tiêu chuẩn về chất lượng và độ tin cậy ở cấp độ sản xuất.

Giờ đây, người dùng có thể chụp ảnh xe đạp hoặc xe tay ga đang đỗ và ứng dụng sẽ thông báo cho họ biết xe có được đỗ đúng cách hay không, hoặc hướng dẫn nếu xe không được đỗ đúng cách. Toàn bộ quy trình này diễn ra trong vài giây trên thiết bị, giúp bảo vệ vị trí và thông tin của người dùng. 

bike.jpg

Để tạo một tính năng trích xuất thực thể tinh giản, nhóm này đã sử dụng lại GenAI Prompt API của ML Kit để xử lý đơn đặt hàng giao hàng của người dùng được viết bằng ngôn ngữ tự nhiên. Nếu sử dụng phương pháp học máy truyền thống, họ sẽ cần một tập dữ liệu học tập lớn và chuyên môn đặc biệt về học máy. Thay vào đó, họ có thể chỉ cần bắt đầu bằng một câu lệnh như "Trích xuất tên, địa chỉ và số điện thoại của người nhận từ tin nhắn." Nhóm đã chuẩn bị khoảng 200 ví dụ đánh giá chất lượng cao và đánh giá câu lệnh của họ qua nhiều vòng lặp để đạt được kết quả tốt nhất. Phương pháp hiệu quả nhất được sử dụng là một kỹ thuật gọi là đặt câu lệnh dựa trên một vài ví dụ và kết quả được phân tích cẩn thận để đảm bảo đầu ra chứa ít thông tin sai lệch nhất.

jinwoo.png


Prompt API của Bộ công cụ học máy giúp giảm mức hao tổn cho nhà phát triển, đồng thời mang lại khả năng bảo mật và độ tin cậy cao trên thiết bị. Điều này giúp bạn tạo mẫu nhanh, giảm sự phụ thuộc vào cơ sở hạ tầng và không phát sinh thêm chi phí. Không có lý do gì để không đề xuất công cụ này.” – Jinwoo Park, Nhà phát triển ứng dụng Android tại Kakao Mobility

Đạt được kết quả lớn nhờ GenAI Prompt API của Bộ công cụ học máy

Nhờ đó, tính năng trích xuất thực thể xác định chính xác các thông tin cần thiết của từng đơn đặt hàng, ngay cả khi bạn nhập nhiều tên và địa chỉ. Để tối đa hoá phạm vi tiếp cận của tính năng này và cung cấp một giải pháp dự phòng mạnh mẽ, nhóm cũng đã triển khai một đường dẫn dựa trên đám mây bằng Gemini Flash.

Việc triển khai GenAI Prompt API của Bộ công cụ học máy đã giúp nhóm Kakao Mobility tiết kiệm được một khoản chi phí đáng kể nhờ chuyển sang AI trên thiết bị. Mặc dù tính năng phân tích bãi đỗ xe đạp chưa ra mắt, nhưng tính năng cải thiện việc nhập địa chỉ đã mang lại kết quả xuất sắc: 

  • Thời gian hoàn tất đơn đặt hàng đối với đơn đặt hàng giao hàng đã giảm 24%.
  • Tỷ lệ chuyển đổi đã tăng 45% đối với người dùng mới và 6% đối với người dùng hiện tại.
  • Trong mùa cao điểm, số đơn đặt hàng dựa trên AI tăng hơn 200%. 

Wisuk cho biết: "Đặc biệt, các chủ doanh nghiệp nhỏ đã chia sẻ ý kiến phản hồi rất tích cực, cho biết tính năng này đã giúp họ làm việc hiệu quả hơn nhiều và giảm đáng kể căng thẳng".

Sau khi ra mắt tính năng nhận dạng hình ảnh cho bãi đỗ xe đạp và xe tay ga, nhóm Kakao Mobility rất mong muốn cải thiện tính năng này hơn nữa. Môi trường đỗ xe trong đô thị có thể gặp nhiều khó khăn và nhóm đang tìm cách lọc bỏ những khu vực không cần thiết khỏi hình ảnh. 

Jinwoo cho biết: "GenAI Prompt API của Bộ công cụ học máy cung cấp các tính năng chất lượng cao mà không tốn thêm chi phí". "Điều này giúp giảm bớt công sức của nhà phát triển, rút ngắn thời gian phát triển tổng thể và cho phép chúng tôi tập trung vào việc điều chỉnh câu lệnh để có kết quả chất lượng cao hơn."

Tự mình dùng thử GenAI Prompt API của Bộ công cụ học máy

Tạo và triển khai AI trên thiết bị trong ứng dụng của bạn bằng GenAI Prompt API của Bộ công cụ học máy để khai thác các chức năng của Gemini Nano.

Tác giả:

Tiếp tục đọc