مطالعات موردی

کاکائو موبیلیتی با استفاده از جمینی نانو روی دستگاه، هزینه‌ها را کاهش و نرخ تبدیل تماس را ۴۵ درصد افزایش می‌دهد.

مطالعه ۴ دقیقه‌ای
Sa-ryong Kang و Caren Chang

کاکائو موبیلیتی (Kakao Mobility) کسب‌وکار پیشرو در حوزه حمل‌ونقل در کره جنوبی است که طیف وسیعی از خدمات حمل‌ونقل و تحویل، از جمله درخواست تاکسی، ناوبری، اشتراک دوچرخه و اسکوتر، پارکینگ و تحویل بسته را از طریق اپلیکیشن کاکائو تی (Kakao T ) خود ارائه می‌دهد. تیم کاکائو موبیلیتی از طریق رابط برنامه‌نویسی کاربردی GenAI Prompt در کیت ML، از جمینی نانو (Gemini Nano) برای ارائه کمک در پارکینگ برای سرویس اشتراک دوچرخه و بهبود تجربه ورود آدرس برای خدمات ناوبری و تحویل خود استفاده کرد .

اپلیکیشن Kakao T در مجموع به بیش از 30 میلیون کاربر خدمات ارائه می‌دهد و سرویس اشتراک دوچرخه آن یکی از محبوب‌ترین سرویس‌های آن است. اما متأسفانه، بسیاری از کاربران دوچرخه‌ها یا اسکوترها را در مواقع عدم استفاده به طور نامناسب پارک می‌کردند. این رفتار منجر به افزایش تخلفات پارکینگ و نگرانی‌های ایمنی شد که منجر به شکایات عمومی، جریمه‌ها و یدک‌کشی شد. این مسائل شروع به تأثیر منفی بر برداشت عمومی از Kakao Mobility و سرویس‌های اشتراک دوچرخه آن کرد.

wisuk.png

«با بهره‌گیری از رابط برنامه‌نویسی کاربردی GenAI Prompt در کیت ML و Gemini Nano، توانستیم به سرعت ویژگی‌هایی را پیاده‌سازی کنیم که ارزش اجتماعی را بدون به خطر انداختن تجربه کاربری بهبود می‌بخشند. Kakao Mobility به طور فعال به پذیرش هوش مصنوعی روی دستگاه ادامه خواهد داد تا خدمات حمل و نقل ایمن‌تر و راحت‌تری را ارائه دهد.» — ویسوک ریو، رئیس بخش توسعه مشتری

برای رفع این نگرانی‌ها، تیم در ابتدا یک مدل تشخیص تصویر طراحی کرد تا به کاربران اطلاع دهد که آیا دوچرخه یا اسکوتر آنها طبق قوانین محلی و استانداردهای ایمنی به درستی پارک شده است یا خیر. اجرای این مدل از طریق فضای ابری هزینه‌های سرور قابل توجهی را متحمل می‌شد. علاوه بر این، عکس‌های آپلود شده کاربران حاوی اطلاعاتی در مورد محل پارک آنها بود، بنابراین تیم می‌خواست از هرگونه نگرانی در مورد حریم خصوصی یا امنیت جلوگیری کند. تیم نیاز به یافتن یک راه‌حل مطمئن‌تر و مقرون‌به‌صرفه‌تر داشت.

این تیم همچنین می‌خواست تجربه استخراج موجودیت را برای سرویس تحویل بسته در برنامه Kakao T بهبود بخشد. پیش از این، کاربران می‌توانستند به راحتی سفارش تحویل بسته را در رابط چت ثبت کنند، اما رانندگان برای شروع سفارش تحویل باید آدرس را به صورت دستی در فرم سفارش وارد می‌کردند - فرآیندی که دست و پا گیر و مستعد خطای انسانی بود. این تیم به دنبال ساده‌سازی این فرآیند بود و فرم‌های سفارش را سریع‌تر و برای پرسنل تحویل کمتر ناامیدکننده می‌کرد.

بهبود تجربه کاربری با رابط برنامه‌نویسی کاربردی GenAI Prompt در کیت ML

این تیم مدل‌های مبتنی بر ابر Gemini را با Gemini Nano که از طریق GenAI Prompt API ML Kit قابل دسترسی بود، آزمایش و مقایسه کرد. جینوو پارک، توسعه‌دهنده برنامه‌های اندروید در Kakao Mobility، گفت: «پس از بررسی حریم خصوصی، هزینه، دقت و سرعت پاسخ، GenAI Prompt API ML Kit به وضوح انتخاب بهینه‌ای بود.»

برای رسیدگی به مشکل پارک نامناسب دوچرخه‌ها یا اسکوترها، این تیم از قابلیت چندوجهی Gemini Nano از طریق ML Kit GenAI API SDK استفاده کرد تا تشخیص دهد چه زمانی یک دوچرخه یا اسکوتر با پارک کردن روی سنگفرش‌های لمسی زرد، مقررات محلی را نقض می‌کند. با یک دستورالعمل دقیق، آنها توانستند بیش از ۲۰۰ تصویر برچسب‌گذاری شده از عکس‌های پارکینگ را ارزیابی کنند و همزمان ورودی‌ها را به طور مداوم اصلاح کنند. این ارزیابی که از طریق معیارهای شناخته‌شده‌ای مانند دقت، صحت، فراخوانی و امتیاز F1 اندازه‌گیری شد، تضمین کرد که این ویژگی با استانداردهای کیفیت و قابلیت اطمینان در سطح تولید مطابقت دارد.

اکنون کاربران می‌توانند از دوچرخه یا اسکوتر پارک شده خود عکس بگیرند و برنامه به آنها اطلاع می‌دهد که آیا به درستی پارک شده است یا خیر، یا اگر پارک نشده باشد، راهنمایی ارائه می‌دهد. کل این فرآیند در عرض چند ثانیه روی دستگاه اتفاق می‌افتد و از موقعیت مکانی و اطلاعات کاربر محافظت می‌کند.

دوچرخه.jpg

برای ایجاد یک ویژگی استخراج موجودیت ساده، تیم دوباره از رابط برنامه‌نویسی کاربردی GenAI Prompt در ML Kit برای پردازش سفارش‌های تحویل کاربران که به زبان طبیعی نوشته شده‌اند، استفاده کرد. اگر آنها از یادگیری ماشین سنتی استفاده می‌کردند، به یک مجموعه داده یادگیری بزرگ و تخصص ویژه در یادگیری ماشین نیاز داشتند. در عوض، آنها می‌توانستند به سادگی با یک دستور مانند «استخراج نام، آدرس و شماره تلفن گیرنده از پیام» شروع کنند. این تیم حدود ۲۰۰ نمونه ارزیابی با کیفیت بالا تهیه کرد و دستور خود را از طریق چندین دور تکرار ارزیابی کرد تا بهترین نتیجه را به دست آورد. موثرترین روش به کار رفته، تکنیکی به نام دستور چند مرحله‌ای بود و نتایج به دقت تجزیه و تحلیل شدند تا اطمینان حاصل شود که خروجی حاوی حداقل توهم است.

جینوو.png


«رابط برنامه‌نویسی کاربردی سریع (Prompt API) کیت ML، سربار توسعه‌دهندگان را کاهش می‌دهد و در عین حال امنیت و قابلیت اطمینان بالایی را روی دستگاه ارائه می‌دهد. این رابط امکان نمونه‌سازی سریع را فراهم می‌کند، وابستگی به زیرساخت را کاهش می‌دهد و هیچ هزینه اضافی ایجاد نمی‌کند. هیچ دلیلی برای توصیه نکردن آن وجود ندارد.» — جینوو پارک، توسعه‌دهنده اپلیکیشن اندروید در Kakao Mobility

ارائه نتایج بزرگ با GenAI Prompt API کیت ML

در نتیجه، ویژگی استخراج موجودیت، حتی زمانی که چندین نام و آدرس وارد شده باشد، جزئیات لازم هر سفارش را به درستی شناسایی می‌کند. برای به حداکثر رساندن دسترسی به این ویژگی و ارائه یک جایگزین قوی، تیم همچنین یک مسیر مبتنی بر ابر را با استفاده از Gemini Flash پیاده‌سازی کرد.

پیاده‌سازی رابط برنامه‌نویسی کاربردی GenAI Prompt در ML Kit با تغییر به سمت هوش مصنوعی روی دستگاه، صرفه‌جویی قابل توجهی در هزینه‌ها برای تیم Kakao Mobility به همراه داشته است. در حالی که ویژگی تحلیل پارکینگ دوچرخه هنوز راه‌اندازی نشده است، بهبود ورود آدرس در حال حاضر نتایج بسیار خوبی را به همراه داشته است:

  • زمان تکمیل سفارش برای سفارشات تحویلی ۲۴ درصد کاهش یافته است.
  • نرخ تبدیل برای کاربران جدید ۴۵ درصد و برای کاربران فعلی ۶ درصد افزایش یافته است.
  • در طول فصول اوج، سفارش‌های مبتنی بر هوش مصنوعی بیش از ۲۰۰ درصد افزایش می‌یابد.

ویسوک افزود: «به‌ویژه صاحبان کسب‌وکارهای کوچک بازخورد بسیار مثبتی را به اشتراک گذاشته‌اند و گفته‌اند که این ویژگی کارشان را بسیار کارآمدتر کرده و استرس را به میزان قابل توجهی کاهش داده است.»

پس از راه‌اندازی قابلیت تشخیص تصویر برای پارکینگ دوچرخه و اسکوتر، تیم Kakao Mobility مشتاق است تا آن را بیشتر بهبود بخشد. محیط‌های پارکینگ شهری می‌توانند چالش‌برانگیز باشند و این تیم در حال بررسی راه‌هایی برای فیلتر کردن مناطق غیرضروری از تصاویر است.

جینوو گفت: «رابط برنامه‌نویسی کاربردی GenAI Prompt در کیت ML، ویژگی‌های باکیفیتی را بدون سربار اضافی ارائه می‌دهد. این امر باعث کاهش تلاش توسعه‌دهنده، کوتاه شدن زمان کلی توسعه و تمرکز ما بر تنظیم سریع برای نتایج با کیفیت بالاتر شد.»

رابط برنامه‌نویسی کاربردی GenAI Prompt کیت ML را خودتان امتحان کنید

با استفاده از GenAI Prompt API کیت ML، هوش مصنوعی روی دستگاه خود را بسازید و مستقر کنید تا از قابلیت‌های Gemini Nano بهره‌مند شوید.

    نوشته شده توسط:

    ادامه مطلب