ข่าวสารผลิตภัณฑ์

Prompt API ของ ML Kit: ปลดล็อกประสบการณ์การใช้งาน Gemini Nano ในอุปกรณ์ที่กำหนดเอง

ใช้เวลาอ่าน 2 นาที
3 ผู้เขียน
Caren Chang, Chengji Yan, Penny Li

AI ช่วยให้การสร้างประสบการณ์การใช้งานแอปที่ปรับเปลี่ยนในแบบของคุณง่ายขึ้น ซึ่งจะแปลงเนื้อหาเป็นรูปแบบที่เหมาะสมสำหรับผู้ใช้ ก่อนหน้านี้เราได้เปิดให้ผู้พัฒนาผสานรวมกับ Gemini Nano ผ่าน ML Kit GenAI API ที่ปรับแต่งมาสำหรับกรณีการใช้งานเฉพาะ เช่น การสรุปและคำอธิบายรูปภาพ

วันนี้เป็นก้าวสำคัญของ Generative AI ในอุปกรณ์ของ Android เราขอประกาศการเปิดตัว API พรอมต์ GenAI ของ ML Kit เวอร์ชันอัลฟ่า API นี้ช่วยให้คุณส่งคำขอภาษาธรรมชาติและคำขอแบบมัลติโมดัลไปยัง Gemini Nano ได้ ซึ่งตอบสนองความต้องการในการควบคุมและความยืดหยุ่นที่มากขึ้นเมื่อสร้างด้วยโมเดล Generative

พาร์ทเนอร์อย่าง Kakao กำลังสร้างแอปด้วย Prompt API เพื่อสร้างประสบการณ์ที่ไม่เหมือนใครซึ่งส่งผลกระทบต่อโลกแห่งความเป็นจริง คุณทดลองใช้ฟีเจอร์ที่มีประสิทธิภาพของ Prompt API ได้แล้ววันนี้ด้วยโค้ดเพียงเล็กน้อย

 

 

ก้าวข้าม GenAI ในอุปกรณ์ที่สร้างไว้ล่วงหน้าไปสู่ GenAI ในอุปกรณ์ที่กำหนดเอง

Prompt API ไม่ได้จำกัดอยู่แค่ฟังก์ชันการทำงานที่สร้างไว้ล่วงหน้า แต่ยังรองรับกรณีการใช้งาน GenAI ที่กำหนดเองและเฉพาะแอป ซึ่งช่วยให้คุณสร้างฟีเจอร์ที่ไม่ซ้ำใครด้วยการเปลี่ยนรูปแบบข้อมูลที่ซับซ้อนได้ Prompt API ใช้ Gemini Nano ในอุปกรณ์เพื่อประมวลผลข้อมูลในเครื่อง ซึ่งช่วยให้ใช้ฟีเจอร์แบบออฟไลน์และปรับปรุงความเป็นส่วนตัวของผู้ใช้ได้

กรณีการใช้งานหลักสำหรับ Prompt API

Prompt API ช่วยให้ใช้ GenAI ได้อย่างปรับแต่งสูง ตัวอย่างที่แนะนำมีดังนี้ 

  • การทำความเข้าใจรูปภาพ: วิเคราะห์รูปภาพเพื่อการจัดประเภท (เช่น การสร้างโพสต์โซเชียลมีเดียฉบับร่างหรือการระบุแท็ก เช่น "สัตว์เลี้ยง" "อาหาร" หรือ "การเดินทาง")
  • การสแกนเอกสารอัจฉริยะ: ใช้โมเดล ML แบบดั้งเดิมเพื่อดึงข้อความจากใบเสร็จ แล้วจัดหมวดหมู่สินค้าแต่ละรายการด้วย Prompt API
  • การเปลี่ยนรูปแบบข้อมูลสำหรับ UI: การวิเคราะห์เนื้อหาแบบยาวเพื่อสร้างชื่อการแจ้งเตือนที่สั้นและน่าสนใจ
  • การแจ้งเตือนเนื้อหา: แนะนำหัวข้อสำหรับบันทึกประจำวันใหม่โดยอิงตามค่ากำหนดของผู้ใช้สำหรับธีม
  • การวิเคราะห์เนื้อหา: จัดประเภทรีวิวของลูกค้าเป็นหมวดหมู่เชิงบวก กลาง หรือเชิงลบ
  • การดึงข้อมูล: ดึงรายละเอียดสำคัญเกี่ยวกับกิจกรรมที่กำลังจะเกิดขึ้นจากชุดข้อความอีเมล

การใช้งาน
Prompt API ช่วยให้คุณสร้างพรอมต์ที่กำหนดเองและตั้งค่าพารามิเตอร์การสร้างที่ไม่บังคับได้ด้วยโค้ดเพียงไม่กี่บรรทัด

Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

ดูตัวอย่างการใช้งาน Prompt API โดยละเอียดเพิ่มเติมได้ในเอกสารประกอบอย่างเป็นทางการและตัวอย่างใน Github

Gemini Nano, ประสิทธิภาพ และการสร้างต้นแบบ

ปัจจุบัน Prompt API ทำงานได้ดีที่สุดในอุปกรณ์ Pixel 10 Series ซึ่งใช้ Gemini Nano เวอร์ชันล่าสุด (nano-v3) Gemini Nano เวอร์ชันนี้สร้างขึ้นบนสถาปัตยกรรมเดียวกันกับ Gemma 3n ซึ่งเป็นโมเดลที่เราแชร์กับชุมชนโมเดลแบบเปิดเป็นครั้งแรกที่ I/O

รากฐานที่ใช้ร่วมกันระหว่าง Gemma 3n กับ nano-v3 ช่วยให้นักพัฒนาแอปสร้างต้นแบบฟีเจอร์ได้ง่ายขึ้น สำหรับผู้ที่ไม่มีอุปกรณ์ Pixel 10 คุณสามารถเริ่มทดลองใช้พรอมต์ได้แล้ววันนี้โดยการสร้างต้นแบบด้วย Gemma 3n ในเครื่อง

ดูรายการอุปกรณ์ทั้งหมดที่รองรับ GenAI API ได้ในเอกสารประกอบเกี่ยวกับการรองรับอุปกรณ์

ดูข้อมูลเพิ่มเติม

เริ่มใช้ Prompt API ในแอป Android ได้ตั้งแต่วันนี้โดยดูคำแนะนำจากเอกสารประกอบอย่างเป็นทางการและตัวอย่างใน Github

เขียนโดย

อ่านต่อ