Nghiên cứu điển hình

redBus sử dụng Gemini Flash thông qua Firebase AI Logic để tăng độ dài của bài đánh giá của khách hàng thêm 57%

Đọc trong 3 phút
Thomas Ezan
Kỹ sư cấp cao phụ trách mối quan hệ với nhà phát triển

Là nền tảng bán vé xe buýt trực tuyến lớn nhất thế giới, redBus phục vụ hàng triệu hành khách ở Ấn Độ, Đông Nam Á và Mỹ La-tinh. Dịch vụ này chủ yếu ưu tiên thiết bị di động, với hơn 90% tổng số lượt đặt phòng diễn ra thông qua ứng dụng của dịch vụ. Tuy nhiên, điều này gây ra một thách thức đáng kể trong việc thu thập ý kiến phản hồi hữu ích từ một cơ sở người dùng nói hàng chục ngôn ngữ khác nhau. Việc nhập bài đánh giá gây bất tiện cho nhiều người dùng, và ví dụ như một bài đánh giá bằng tiếng Tamil sẽ không có nhiều giá trị đối với một nhà điều hành xe buýt chỉ nói tiếng Hindi.

Để cải thiện chất lượng và số lượng ý kiến phản hồi của người dùng, các nhà phát triển tại redBus đã sử dụng Gemini Flash, một mô hình AI của Google có độ trễ thấp, để chép lời và dịch ngay lập tức các bản ghi âm giọng nói của người dùng. Để kết nối AI mạnh mẽ này với ứng dụng của họ mà không cần xử lý công việc phức tạp ở phần phụ trợ, họ đã sử dụng Firebase AI Logic. Tính năng mới này đã xoá bỏ rào cản ngôn ngữ và đơn giản hoá quy trình đánh giá, dẫn đến sự gia tăng đáng kể về mức độ tương tác của người dùng và chất lượng ý kiến phản hồi.

Đơn giản hoá ý kiến phản hồi của người dùng bằng phương pháp ưu tiên giọng nói

Trải nghiệm đánh giá trong ứng dụng trước đây trên redBus là dựa trên văn bản, điều này gây ra một số thách thức chính. Ở quy mô của chúng tôi, các bài đánh giá đáng tin cậy của người dùng là yếu tố quan trọng: chúng giúp xây dựng niềm tin cho khách du lịch và cung cấp thông tin chi tiết hữu ích cho các nhà điều hành. Mặc dù hệ thống dựa trên văn bản hiện tại của chúng tôi hoạt động hiệu quả, nhưng chúng tôi nhận thấy rằng khách hàng thường gặp khó khăn trong việc diễn đạt đầy đủ trải nghiệm của họ, dẫn đến việc ý kiến phản hồi của người dùng không có đủ thông tin chi tiết và số lượng cần thiết để chúng tôi mang lại giá trị tối đa cho cả khách du lịch và nhà điều hành. Hơn nữa, rào cản ngôn ngữ đã hạn chế tính hữu ích của các bài đánh giá, vì bài đánh giá bằng một ngôn ngữ không hữu ích cho người dùng hoặc nhà điều hành xe buýt nói ngôn ngữ khác. Abhi Muktheeswarar, trưởng nhóm kỹ thuật cấp cao về kỹ thuật di động tại redBus, cho biết: "Động lực chính của chúng tôi là tận dụng khả năng diễn đạt của giọng nói và vượt qua rào cản ngôn ngữ để thu thập ý kiến phản hồi chân thực và chi tiết hơn từ người dùng".

Nhóm nhà phát triển muốn tạo ra trải nghiệm liền mạch, ưu tiên giọng nói, vì vậy họ đã thiết kế một quy trình mới, trong đó người dùng chỉ cần nói bài đánh giá bằng ngôn ngữ mẹ đẻ của mình. Để khuyến khích người dùng sử dụng tính năng này, nhóm đã triển khai một nút micro nổi bật có hiệu ứng động, kèm theo văn bản đề cập đến: "Ý kiến của bạn rất quan trọng, hãy chia sẻ bài đánh giá bằng ngôn ngữ của riêng bạn". Nội dung này xuất hiện bằng ngôn ngữ mẹ đẻ của người dùng, nhất quán với chế độ cài đặt ngôn ngữ của ứng dụng.

ANDDM_redBus_02_mic_R2.gif

Bằng cách sử dụng Gemini Flash, ứng dụng sẽ xử lý bản ghi âm giọng nói của người dùng. Trước tiên, hệ thống sẽ chép lời lời nói thành văn bản, sau đó dịch văn bản đó sang tiếng Anh và cuối cùng là phân tích cảm xúc để tự động tạo mức phân loại bằng sao và dự đoán các thẻ có liên quan dựa trên nội dung đánh giá. Sau đó, tính năng này sẽ tạo một bản tóm tắt ngắn gọn và tự động điền nội dung đã tạo vào các trường trong biểu mẫu đánh giá.

Các nhà phát triển đã chọn Firebase AI Logic vì tính năng này cho phép họ xây dựng và phát hành tính năng mà không cần sự trợ giúp của nhóm phụ trợ, giúp giảm đáng kể thời gian và độ phức tạp của quá trình phát triển. Abhi giải thích: "Firebase AI SDK là một điểm khác biệt quan trọng vì đây là giải pháp duy nhất cho phép nhóm phụ trách giao diện người dùng của chúng tôi tự xây dựng và phát hành tính năng này". Cách tiếp cận này giúp nhóm chuyển từ ý tưởng sang ra mắt chỉ trong 30 ngày.

Trong quá trình triển khai, các kỹ sư đã sử dụng đầu ra có cấu trúc, cho phép mô hình Gemini Flash trả về các phản hồi JSON có cấu trúc rõ ràng, bao gồm cả bản chép lời, bản dịch, phân tích cảm xúc và (điểm) xếp hạng theo sao, giúp dễ dàng điền sẵn thông tin vào giao diện người dùng. Điều này giúp đảm bảo trải nghiệm liền mạch cho người dùng. Sau đó, người dùng sẽ thấy cả văn bản gốc được chép lời bằng ngôn ngữ của họ và bản dịch tóm tắt bằng tiếng Anh. Quan trọng nhất là người dùng có toàn quyền kiểm soát để xem xét và chỉnh sửa tất cả văn bản do AI tạo cũng như thay đổi mức phân loại bằng sao trước khi gửi bài đánh giá. Họ thậm chí có thể nói lại để thêm nội dung. 

abhi.png

Tăng mức độ tương tác và thu thập thông tin chi tiết chuyên sâu hơn về người dùng
Tính năng đánh giá bằng giọng nói dựa trên AI đã có tác động tích cực đáng kể đến mức độ tương tác của người dùng. Bằng cách cho phép người dùng nói bằng ngôn ngữ mẹ đẻ, redBus nhận thấy độ dài bài đánh giá tăng 57% và tổng số lượng bài đánh giá tăng đáng kể.


Tính năng mới đã thu hút thành công một phân khúc người dùng trước đây còn do dự khi nhập bài đánh giá. Kể từ khi triển khai, phản hồi của người dùng rất tích cực: khách hàng đánh giá cao độ chính xác của bản chép lời và bản dịch, đồng thời nhận thấy bản tóm tắt do AI tạo là thông tin tổng quan ngắn gọn về những bài đánh giá dài hơn và chi tiết hơn của họ.

Mặc dù được lưu trữ trên đám mây, nhưng Gemini Flash mang đến trải nghiệm người dùng có độ phản hồi cao. Abhi cho biết: "Các đối tác và bên liên quan thường nhận xét rằng tính năng AI mới của chúng tôi phản hồi nhanh chóng và liền mạch đến mức họ cảm thấy như AI đang chạy trực tiếp trên thiết bị". "Đây là minh chứng cho độ trễ thấp của mô hình Gemini Flash, một yếu tố quan trọng giúp mô hình này thành công."

abhi2.png

Cách dễ dàng hơn để xây dựng bằng AI

Đối với nhóm redBus, dự án này minh hoạ cách Firebase AI Logic và Gemini Flash giúp các nhà phát triển di động xây dựng những tính năng mà nếu không có thì sẽ cần phải triển khai phần phụ trợ. Điều này giúp giảm sự phụ thuộc vào các thay đổi phía máy chủ và cho phép nhà phát triển lặp lại nhanh chóng và độc lập.

Sau thành công của tính năng đánh giá bằng giọng nói, nhóm tại redBus đang khám phá các trường hợp sử dụng khác cho AI tạo sinh trên thiết bị để nâng cao hơn nữa ứng dụng của họ. Họ cũng có kế hoạch sử dụng Google AI Studio để thử nghiệm và lặp lại các câu lệnh trong tương lai. Đối với Abhi, bài học rất rõ ràng: "Giờ đây, vấn đề không còn là thiết lập phần phụ trợ phức tạp nữa", ông nói. Đó là việc tạo ra câu lệnh phù hợp để xây dựng tính năng cải tiến tiếp theo, giúp nâng cao trực tiếp trải nghiệm người dùng.

gemini2.png

Bắt đầu

Tìm hiểu thêm về cách bạn có thể dùng GeminiFirebase AI Logic để tạo các tính năng AI tạo sinh cho ứng dụng của riêng mình.

Tác giả:

Tiếp tục đọc