ข่าวสารเกี่ยวกับผลิตภัณฑ์
วิธีที่การเพิ่มประสิทธิภาพพรอมต์อัตโนมัติช่วยเพิ่มคุณภาพให้กับ ML Kit’s GenAI Prompt API
อ่าน 3 นาที
การเพิ่มประสิทธิภาพพรอมต์อัตโนมัติ (APO)
เรายินดีที่จะประกาศการเพิ่มประสิทธิภาพพรอมต์อัตโนมัติ (APO) ที่กำหนดเป้าหมายเป็นโมเดลในอุปกรณ์บน Vertex AI เพื่อช่วยให้คุณนำกรณีการใช้งาน ML Kit Prompt API ไปใช้จริงได้ การเพิ่มประสิทธิภาพพรอมต์อัตโนมัติเป็นเครื่องมือที่จะช่วยคุณค้นหาพรอมต์ที่เหมาะสมที่สุดสำหรับกรณีการใช้งานของคุณโดยอัตโนมัติ
ยุคของ AI ในอุปกรณ์ไม่ใช่เพียงคำสัญญาอีกต่อไป แต่เป็นความจริงที่เกิดขึ้นแล้ว การเปิดตัว Gemini Nano v3 ทำให้เราสามารถนำความสามารถด้านความเข้าใจภาษาและความสามารถหลายรูปแบบที่ไม่เคยมีมาก่อนมาไว้ในมือของผู้ใช้ได้โดยตรง โมเดลในตระกูล Gemini Nano ครอบคลุมอุปกรณ์ที่รองรับในระบบนิเวศของ Android อย่างกว้างขวาง แต่สำหรับนักพัฒนาแอปที่สร้างแอปอัจฉริยะรุ่นต่อไป การเข้าถึงโมเดลที่มีประสิทธิภาพสูงเป็นเพียงขั้นตอนแรกเท่านั้น ความท้าทายที่แท้จริงอยู่ที่การปรับแต่ง: คุณจะปรับแต่งโมเดลพื้นฐานให้มีประสิทธิภาพระดับผู้เชี่ยวชาญสำหรับกรณีการใช้งานที่เฉพาะเจาะจงได้อย่างไรโดยไม่ละเมิดข้อจำกัดของฮาร์ดแวร์อุปกรณ์เคลื่อนที่
ในโลกฝั่งเซิร์ฟเวอร์ LLM ที่ใหญ่กว่ามักจะมีความสามารถสูงและต้องมีการปรับให้เข้ากับโดเมนน้อยลง แม้ว่าจำเป็นต้องใช้ตัวเลือกขั้นสูงเพิ่มเติม เช่น การปรับแต่ง LoRA (Low-Rank Adaptation) ก็อาจเป็นตัวเลือกที่เป็นไปได้ อย่างไรก็ตาม สถาปัตยกรรมที่เป็นเอกลักษณ์ของ Android AICore ให้ความสำคัญกับโมเดลระบบที่ใช้ร่วมกันและประหยัดหน่วยความจำ ซึ่งหมายความว่าการติดตั้งใช้งานอะแดปเตอร์ LoRA ที่กำหนดเองสำหรับแอปแต่ละแอปจะมาพร้อมกับความท้าทายในบริการระบบที่ใช้ร่วมกันเหล่านี้
แต่ก็มีเส้นทางอื่นที่อาจมีประสิทธิภาพเท่ากัน การใช้ประโยชน์จากการเพิ่มประสิทธิภาพพรอมต์อัตโนมัติ (APO) บน Vertex AI ช่วยให้นักพัฒนาแอปได้รับคุณภาพที่ใกล้เคียงกับการปรับแต่งทั้งหมดในขณะที่ทำงานได้อย่างราบรื่นภายในสภาพแวดล้อมการดำเนินการ Android ดั้งเดิม APO มุ่งเน้นไปที่คำแนะนำระบบที่เหนือกว่า ซึ่งช่วยให้นักพัฒนาแอปปรับแต่งลักษณะการทำงานของโมเดลได้ด้วยความเสถียรและความสามารถในการปรับขนาดที่มากกว่าโซลูชันการปรับแต่งแบบดั้งเดิม
หมายเหตุ: Gemini Nano V3 เป็นโมเดล Gemma 3N เวอร์ชันที่ได้รับการปรับให้มีคุณภาพดีขึ้นและได้รับการยกย่องอย่างสูง การเพิ่มประสิทธิภาพพรอมต์ที่ทำในโมเดล Gemma 3N แบบโอเพนซอร์สจะมีผลกับ Gemini Nano V3 ด้วย ในอุปกรณ์ที่รองรับ ML Kit GenAI API จะใช้ประโยชน์จากโมเดล nano-v3 เพื่อเพิ่มคุณภาพสูงสุดสำหรับนักพัฒนาแอป Android
APO ไม่ได้มองว่าพรอมต์เป็นข้อความคงที่ แต่เป็นแพลตฟอร์มที่ตั้งโปรแกรมได้ซึ่งสามารถเพิ่มประสิทธิภาพได้ โดยใช้ประโยชน์จากโมเดลฝั่งเซิร์ฟเวอร์ (เช่น Gemini Pro และ Flash) เพื่อเสนอพรอมต์ ประเมินรูปแบบต่างๆ และค้นหาพรอมต์ที่เหมาะสมที่สุดสำหรับงานที่เฉพาะเจาะจง กระบวนการนี้ใช้กลไกทางเทคนิค 3 อย่างที่เฉพาะเจาะจงเพื่อเพิ่มประสิทธิภาพสูงสุด
- การวิเคราะห์ข้อผิดพลาดอัตโนมัติ: APO จะวิเคราะห์รูปแบบข้อผิดพลาดจากข้อมูลฝึกฝนเพื่อระบุจุดอ่อนที่เฉพาะเจาะจงในพรอมต์เริ่มต้นโดยอัตโนมัติ
- การกลั่นคำแนะนำเชิงความหมาย: เครื่องมือนี้จะวิเคราะห์ตัวอย่างการฝึกจำนวนมากเพื่อกลั่น "ความตั้งใจที่แท้จริง" ของงาน ซึ่งจะสร้างคำแนะนำที่แสดงถึงการกระจายข้อมูลจริงได้อย่างแม่นยำยิ่งขึ้น
- การทดสอบตัวเลือกแบบขนาน: แทนที่จะทดสอบแนวคิดทีละแนวคิด APO จะสร้างและทดสอบตัวเลือกพรอมต์จำนวนมากแบบขนานเพื่อระบุค่าสูงสุดทั่วโลกสำหรับคุณภาพ
เหตุผลที่ APO มีคุณภาพใกล้เคียงกับการปรับแต่ง
ความเข้าใจผิดที่พบบ่อยคือการปรับแต่งจะให้คุณภาพที่ดีกว่าการใช้พรอมต์เสมอ สำหรับโมเดลพื้นฐานที่ทันสมัย เช่น Gemini Nano v3 วิศวกรรมพรอมต์ (Prompt Engineering) อาจมีประสิทธิภาพในตัวของมันเอง
- การรักษาความสามารถทั่วไป: การปรับแต่ง ( PEFT/LoRA) บังคับให้น้ำหนักของโมเดลมีค่าดัชนีสูงเกินไปในการกระจายข้อมูลที่เฉพาะเจาะจง ซึ่งมักจะนำไปสู่ "การลืมแบบหายนะ" ซึ่งโมเดลจะเก่งขึ้นในไวยากรณ์ที่เฉพาะเจาะจงของคุณ แต่แย่ลงในตรรกะและความปลอดภัยทั่วไป APO จะไม่แตะต้องน้ำหนัก ซึ่งจะรักษาความสามารถของโมเดลพื้นฐานไว้
- การปฏิบัติตามคำแนะนำและการค้นหากลยุทธ์: Gemini Nano v3 ได้รับการฝึกอย่างเข้มงวดให้ปฏิบัติตามคำแนะนำระบบที่ซับซ้อน APO ใช้ประโยชน์จากสิ่งนี้โดยการค้นหาโครงสร้างคำแนะนำ ที่แน่นอน ซึ่งจะปลดล็อกความสามารถที่ซ่อนอยู่ของโมเดล และมักจะค้นพบกลยุทธ์ที่วิศวกรอาจค้นพบได้ยาก
เราประเมิน APO ในเวิร์กโหลดการใช้งานจริงที่หลากหลายเพื่อตรวจสอบแนวทางนี้ การตรวจสอบของเราแสดงให้เห็นถึงความแม่นยำที่เพิ่มขึ้น 5-8% อย่างสม่ำเสมอในกรณีการใช้งานต่างๆ และ APO ได้ปรับปรุงคุณภาพอย่างมากในฟีเจอร์ต่างๆ ที่ติดตั้งใช้งานในอุปกรณ์
| กรณีการใช้งาน | ประเภทงาน | คำอธิบายงาน | เมตริก | การปรับปรุงของ APO |
| การจัดประเภทหัวข้อ | การจัดประเภทข้อความ | จัดประเภทบทความข่าวเป็นหัวข้อต่างๆ เช่น การเงิน กีฬา ฯลฯ | ความแม่นยำ | +5% |
| การจัดประเภทความตั้งใจ | การจัดประเภทข้อความ | จัดประเภทคำถามจากฝ่ายบริการลูกค้าเป็นความตั้งใจ | ความแม่นยำ | +8.0% |
| การแปลหน้าเว็บ | การแปลข้อความ | แปลหน้าเว็บจากภาษาอังกฤษเป็นภาษาท้องถิ่น | BLEU | +8.57% |
เวิร์กโฟลว์ของนักพัฒนาแอปแบบครบวงจรที่ราบรื่น
ความเข้าใจผิดที่พบบ่อยคือการปรับแต่งจะให้คุณภาพที่ดีกว่าการใช้พรอมต์เสมอ สำหรับโมเดลพื้นฐานที่ทันสมัย เช่น Gemini Nano v3 วิศวกรรมพรอมต์ (Prompt Engineering) อาจมีประสิทธิภาพในตัวของมันเอง
- การรักษาความสามารถทั่วไป: การปรับแต่ง ( PEFT/LoRA) บังคับให้น้ำหนักของโมเดลมีค่าดัชนีสูงเกินไปในการกระจายข้อมูลที่เฉพาะเจาะจง ซึ่งมักจะนำไปสู่ "การลืมแบบหายนะ" ซึ่งโมเดลจะเก่งขึ้นในไวยากรณ์ที่เฉพาะเจาะจงของคุณ แต่แย่ลงในตรรกะและความปลอดภัยทั่วไป APO จะไม่แตะต้องน้ำหนัก ซึ่งจะรักษาความสามารถของโมเดลพื้นฐานไว้
- การปฏิบัติตามคำแนะนำและการค้นหากลยุทธ์: Gemini Nano v3 ได้รับการฝึกอย่างเข้มงวดให้ปฏิบัติตามคำแนะนำระบบที่ซับซ้อน APO ใช้ประโยชน์จากสิ่งนี้โดยการค้นหาโครงสร้างคำแนะนำ ที่แน่นอน ซึ่งจะปลดล็อกความสามารถที่ซ่อนอยู่ของโมเดล และมักจะค้นพบกลยุทธ์ที่วิศวกรอาจค้นพบได้ยาก
เราประเมิน APO ในเวิร์กโหลดการใช้งานจริงที่หลากหลายเพื่อตรวจสอบแนวทางนี้ การตรวจสอบของเราแสดงให้เห็นถึงความแม่นยำที่เพิ่มขึ้น 5-8% อย่างสม่ำเสมอในกรณีการใช้งานต่างๆ และ APO ได้ปรับปรุงคุณภาพอย่างมากในฟีเจอร์ต่างๆ ที่ติดตั้งใช้งานในอุปกรณ์
บทสรุป
การเปิดตัวการเพิ่มประสิทธิภาพพรอมต์อัตโนมัติ (APO) ถือเป็นจุดเปลี่ยนสำหรับ Generative AI ในอุปกรณ์ การลดช่องว่างระหว่างโมเดลพื้นฐานกับประสิทธิภาพระดับผู้เชี่ยวชาญช่วยให้เราสามารถมอบเครื่องมือให้นักพัฒนาแอปสร้างแอปพลิเคชันสำหรับอุปกรณ์เคลื่อนที่ที่เสถียรยิ่งขึ้น ไม่ว่าคุณจะเพิ่งเริ่มต้นด้วยการเพิ่มประสิทธิภาพแบบ Zero-Shot หรือขยายขนาดไปสู่การใช้งานจริงด้วยการปรับแต่งตามข้อมูล เส้นทางสู่ระบบอัจฉริยะคุณภาพสูงในอุปกรณ์ก็ชัดเจนขึ้นแล้ว เปิดตัวกรณีการใช้งานในอุปกรณ์ของคุณไปสู่การใช้งานจริงได้แล้ววันนี้ด้วย ML Kit’s Prompt API และการเพิ่มประสิทธิภาพพรอมต์อัตโนมัติของ Vertex AI
ลิงก์ที่เกี่ยวข้อง
อ่านต่อ
-
ข่าวสารเกี่ยวกับผลิตภัณฑ์
ที่ Google เรามุ่งมั่นที่จะนำโมเดล AI ที่มีความสามารถมากที่สุดมาไว้ในอุปกรณ์ Android ในกระเป๋าของคุณโดยตรง วันนี้ เรายินดีที่จะประกาศเปิดตัวโมเดลโอเพนซอร์สที่ล้ำสมัยที่สุดของเรา นั่นคือ Gemma 4
Caren Chang, David Chou • อ่าน 3 นาที
-
ข่าวสารเกี่ยวกับผลิตภัณฑ์
AI ช่วยให้การสร้างประสบการณ์การใช้งานแอปที่ปรับเปลี่ยนในแบบของคุณง่ายขึ้น ซึ่งจะแปลงเนื้อหาเป็นรูปแบบที่เหมาะสมสำหรับผู้ใช้ ก่อนหน้านี้ เราได้เปิดให้นักพัฒนาแอปผสานรวมกับ Gemini Nano ผ่าน ML Kit GenAI API ที่ปรับแต่งมาสำหรับกรณีการใช้งานที่เฉพาะเจาะจง เช่น การสรุปและการอธิบายรูปภาพ
Caren Chang, Chengji Yan, Penny Li • อ่าน 2 นาที
-
ข่าวสารเกี่ยวกับผลิตภัณฑ์
Android กำลังเปลี่ยนจากระบบปฏิบัติการไปเป็นระบบอัจฉริยะ ซึ่งจะสร้างโอกาสในการมีส่วนร่วมกับแอปของคุณมากขึ้น โดยมีการประกาศในงาน The Android Show วันนี้
Matthew McCullough • อ่าน 4 นาที
รับข่าวสาร
รับข้อมูลเชิงลึกล่าสุดเกี่ยวกับการพัฒนา Android ส่งตรงถึงกล่องจดหมายของคุณ ทุกสัปดาห์