اخبار محصول

چگونه بهینه‌سازی خودکار اعلان، افزایش کیفیت را برای رابط برنامه‌نویسی کاربردی GenAI Prompt در کیت ML فراهم می‌کند؟

۳ دقیقه مطالعه
۴ نویسنده
Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

بهینه‌سازی سریع خودکار (APO)

برای کمک بیشتر به پیاده‌سازی موارد استفاده API Prompt از کیت یادگیری ماشین شما، مفتخریم که بهینه‌سازی خودکار Prompt (APO) را که مدل‌های روی دستگاه را در Vertex AI هدف قرار می‌دهد، معرفی کنیم. بهینه‌سازی خودکار Prompt ابزاری است که به شما کمک می‌کند تا به‌طور خودکار Prompt بهینه را برای موارد استفاده خود پیدا کنید.

دوران هوش مصنوعی روی دستگاه دیگر یک وعده نیست - این یک واقعیت تولیدی است. با انتشار Gemini Nano v3 ، ما قابلیت‌های بی‌سابقه‌ای در درک زبان و چندوجهی را مستقیماً در اختیار کاربران قرار می‌دهیم. از طریق خانواده مدل‌های Gemini Nano، ما پوشش گسترده‌ای از دستگاه‌های پشتیبانی‌شده در سراسر اکوسیستم اندروید داریم. اما برای توسعه‌دهندگانی که نسل بعدی برنامه‌های هوشمند را می‌سازند، دسترسی به یک مدل قدرتمند تنها گام اول است. چالش واقعی در سفارشی‌سازی نهفته است: چگونه یک مدل پایه را برای عملکرد سطح متخصص برای مورد استفاده خاص خود، بدون شکستن محدودیت‌های سخت‌افزار موبایل، تنظیم می‌کنید؟

در دنیای سمت سرور، LLM های بزرگتر معمولاً توانایی بالایی دارند و به تطبیق دامنه کمتری نیاز دارند. حتی در صورت نیاز، گزینه‌های پیشرفته‌تری مانند تنظیم دقیق LoRA (تطبیق با رتبه پایین) می‌توانند گزینه‌های عملی باشند. با این حال، معماری منحصر به فرد Android AICore یک مدل سیستم مشترک و با حافظه کارآمد را در اولویت قرار می‌دهد. این بدان معناست که استقرار آداپتورهای LoRA سفارشی برای هر برنامه جداگانه با چالش‌هایی در این سرویس‌های سیستم مشترک همراه است.

اما یک مسیر جایگزین وجود دارد که می‌تواند به همان اندازه تأثیرگذار باشد. با بهره‌گیری از بهینه‌سازی خودکار سریع (APO) در Vertex AI، توسعه‌دهندگان می‌توانند به تنظیم دقیق و با کیفیت دست یابند، در حالی که به طور یکپارچه در محیط اجرای بومی اندروید کار می‌کنند. APO با تمرکز بر دستورالعمل‌های برتر سیستم، توسعه‌دهندگان را قادر می‌سازد تا رفتار مدل را با استحکام و مقیاس‌پذیری بیشتری نسبت به راه‌حل‌های سنتی تنظیم دقیق، تنظیم کنند.

توجه: Gemini Nano V3 یک نسخه بهینه شده با کیفیت از مدل بسیار تحسین شده Gemma 3N است. هرگونه بهینه سازی سریع که روی مدل متن باز Gemma 3N انجام شود، برای Gemini Nano V3 نیز اعمال خواهد شد. در دستگاه‌های پشتیبانی شده ، APIهای ML Kit GenAI از مدل nano-v3 برای به حداکثر رساندن کیفیت برای توسعه دهندگان اندروید استفاده می‌کنند.

نمودار بلوکی APO.jpg

APO با اعلان نه به عنوان یک متن ثابت، بلکه به عنوان یک سطح قابل برنامه‌ریزی که می‌تواند بهینه شود، رفتار می‌کند. این سیستم از مدل‌های سمت سرور (مانند Gemini Pro و Flash) برای پیشنهاد اعلان‌ها، ارزیابی تغییرات و یافتن حالت بهینه برای کار خاص شما استفاده می‌کند. این فرآیند از سه مکانیسم فنی خاص برای به حداکثر رساندن عملکرد استفاده می‌کند:

  1. تحلیل خودکار خطا: APO الگوهای خطا را از داده‌های آموزشی تحلیل می‌کند تا به‌طور خودکار نقاط ضعف خاص را در درخواست اولیه شناسایی کند.
  2. خلاصه‌سازی دستورالعمل‌های معنایی: این روش، نمونه‌های آموزشی عظیم را تجزیه و تحلیل می‌کند تا «هدف واقعی» یک کار را استخراج کند و دستورالعمل‌هایی ایجاد کند که توزیع داده‌های واقعی را با دقت بیشتری منعکس کنند.
  3. آزمایش موازی کاندیداها: به جای آزمایش یک ایده در هر زمان، APO کاندیداهای سریع متعددی را به صورت موازی تولید و آزمایش می‌کند تا حداکثر کیفیت جهانی را شناسایی کند.

چرا APO می‌تواند به کیفیت تنظیم دقیق نزدیک شود؟

این یک تصور غلط رایج است که تنظیم دقیق همیشه کیفیت بهتری نسبت به تحریک (prompting) دارد. برای مدل‌های مدرن فونداسیون مانند Gemini Nano v3، مهندسی تحریک می‌تواند به خودی خود تأثیرگذار باشد:

  • حفظ قابلیت‌های عمومی: تنظیم دقیق (PEFT/LoRA) وزن‌های یک مدل را مجبور می‌کند تا بر اساس توزیع خاصی از داده‌ها، بیش از حد شاخص‌گذاری شوند. این اغلب منجر به "فراموشی فاجعه‌بار" می‌شود، که در آن مدل در سینتکس خاص شما بهتر می‌شود اما در منطق و ایمنی عمومی بدتر می‌شود. APO وزن‌ها را دست نخورده باقی می‌گذارد و قابلیت‌های مدل پایه را حفظ می‌کند.
  • دنبال کردن دستورالعمل‌ها و کشف استراتژی: Gemini Nano v3 به طور دقیق آموزش دیده است تا دستورالعمل‌های پیچیده سیستم را دنبال کند. APO با یافتن ساختار دقیق دستورالعمل‌هایی که قابلیت‌های نهفته مدل را آشکار می‌کند، از این امر بهره‌برداری می‌کند و اغلب استراتژی‌هایی را کشف می‌کند که یافتن آنها برای مهندسان انسانی دشوار است.

برای اعتبارسنجی این رویکرد، ما APO را در بارهای کاری تولیدی متنوع ارزیابی کردیم. اعتبارسنجی ما افزایش دقت 5 تا 8 درصدی را در موارد استفاده مختلف نشان داده است. در چندین ویژگی مستقر در دستگاه، APO افزایش کیفیت قابل توجهی را ارائه داد.

مورد استفاده نوع وظیفه شرح وظایف متریک بهبود APO
طبقه‌بندی موضوعی طبقه‌بندی متن یک مقاله خبری را به موضوعاتی مانند امور مالی، ورزش و غیره طبقه بندی کنید دقت +۵٪
طبقه‌بندی قصد طبقه‌بندی متن طبقه‌بندی یک پرس‌وجوی خدمات مشتری به اهداف (Intents) دقت +۸.۰٪
ترجمه صفحه وب ترجمه متن ترجمه یک صفحه وب از انگلیسی به زبان محلی آبی +۸.۵۷٪

گردش کار یکپارچه و جامع توسعه‌دهندگان

این یک تصور غلط رایج است که تنظیم دقیق همیشه کیفیت بهتری نسبت به تحریک (prompting) دارد. برای مدل‌های مدرن فونداسیون مانند Gemini Nano v3، مهندسی تحریک می‌تواند به خودی خود تأثیرگذار باشد:

  • حفظ قابلیت‌های عمومی: تنظیم دقیق (PEFT/LoRA) وزن‌های یک مدل را مجبور می‌کند تا بر اساس توزیع خاصی از داده‌ها، بیش از حد شاخص‌گذاری شوند. این اغلب منجر به "فراموشی فاجعه‌بار" می‌شود، که در آن مدل در سینتکس خاص شما بهتر می‌شود اما در منطق و ایمنی عمومی بدتر می‌شود. APO وزن‌ها را دست نخورده باقی می‌گذارد و قابلیت‌های مدل پایه را حفظ می‌کند.
  • دنبال کردن دستورالعمل‌ها و کشف استراتژی: Gemini Nano v3 به طور دقیق آموزش دیده است تا دستورالعمل‌های پیچیده سیستم را دنبال کند. APO با یافتن ساختار دقیق دستورالعمل‌هایی که قابلیت‌های نهفته مدل را آشکار می‌کند، از این امر بهره‌برداری می‌کند و اغلب استراتژی‌هایی را کشف می‌کند که یافتن آنها برای مهندسان انسانی دشوار است.

برای اعتبارسنجی این رویکرد، ما APO را در بارهای کاری تولیدی متنوع ارزیابی کردیم. اعتبارسنجی ما افزایش دقت 5 تا 8 درصدی را در موارد استفاده مختلف نشان داده است. در چندین ویژگی مستقر در دستگاه، APO افزایش کیفیت قابل توجهی را ارائه داد.

نتیجه‌گیری

انتشار بهینه‌سازی خودکار اعلان (APO) نقطه عطفی برای هوش مصنوعی مولد روی دستگاه است. با پر کردن شکاف بین مدل‌های پایه و عملکرد سطح متخصص، ما ابزارهایی را در اختیار توسعه‌دهندگان قرار می‌دهیم تا برنامه‌های موبایل قوی‌تری بسازند. چه تازه با بهینه‌سازی Zero-Shot شروع کرده باشید و چه با پالایش داده‌محور به مرحله تولید رسیده باشید، مسیر رسیدن به هوش روی دستگاه با کیفیت بالا اکنون واضح‌تر است. موارد استفاده روی دستگاه خود را همین امروز با API Prompt کیت ML و بهینه‌سازی خودکار اعلان Vertex AI به مرحله تولید برسانید.

لینک‌های مرتبط:

    نوشته شده توسط:

    ادامه مطلب