Tin tức về sản phẩm

Cách tính năng Tối ưu hoá câu lệnh tự động giúp cải thiện chất lượng cho GenAI Prompt API của Bộ công cụ học máy

Đọc trong 3 phút

28 Tháng 1 2026

4 Tác giả

Chetan Tekur, Chao Zhao, Paul Zhou, Caren Chang

Tối ưu hoá câu lệnh tự động (APO)

Để hỗ trợ thêm cho các trường hợp sử dụng Prompt API của Bộ công cụ học máy trong quá trình phát hành công khai, chúng tôi rất vui mừng thông báo về tính năng Tối ưu hoá câu lệnh tự động (APO) nhắm đến các mô hình trên thiết bị trên Vertex AI. Tối ưu hoá câu lệnh tự động là một công cụ giúp bạn tự động tìm ra câu lệnh tối ưu cho các trường hợp sử dụng của mình.

Kỷ nguyên của AI trên thiết bị không còn là một lời hứa mà đã trở thành hiện thực. Với việc phát hành Gemini Nano phiên bản 3, chúng tôi đang cung cấp khả năng hiểu ngôn ngữ và đa phương thức chưa từng có cho người dùng. Thông qua nhóm mô hình Gemini Nano, chúng tôi có phạm vi hỗ trợ rộng rãi cho các thiết bị trong Hệ sinh thái Android. Nhưng đối với những nhà phát triển đang xây dựng thế hệ ứng dụng thông minh tiếp theo, việc có quyền truy cập vào một mô hình mạnh mẽ chỉ là bước đầu tiên. Thách thức thực sự nằm ở khả năng tùy chỉnh: Làm cách nào để điều chỉnh một mô hình cơ sở cho hiệu suất ở cấp độ chuyên gia cho trường hợp sử dụng cụ thể của bạn mà không vi phạm các hạn chế của phần cứng di động?

Trong thế giới phía máy chủ, các LLM lớn hơn có xu hướng có khả năng cao và ít cần điều chỉnh theo miền hơn. Ngay cả khi cần, các lựa chọn nâng cao hơn như tinh chỉnh LoRA (Thích ứng cấp thấp) cũng có thể là những lựa chọn khả thi. Tuy nhiên, cấu trúc riêng biệt của Android AICore ưu tiên một mô hình hệ thống dùng chung, tiết kiệm bộ nhớ. Điều này có nghĩa là việc triển khai các bộ điều hợp LoRA tuỳ chỉnh cho từng ứng dụng riêng lẻ sẽ gặp phải những thách thức đối với các dịch vụ hệ thống dùng chung này.

Tuy nhiên, có một cách khác cũng hiệu quả không kém. Bằng cách tận dụng tính năng Tối ưu hoá câu lệnh tự động (APO) trên Vertex AI, nhà phát triển có thể đạt được chất lượng gần bằng với chất lượng của việc tinh chỉnh, đồng thời làm việc liền mạch trong môi trường thực thi Android gốc. Bằng cách tập trung vào hướng dẫn hệ thống vượt trội, APO cho phép nhà phát triển điều chỉnh hành vi của mô hình với độ mạnh mẽ và khả năng mở rộng cao hơn so với các giải pháp tinh chỉnh truyền thống.

Lưu ý: Gemini Nano V3 là phiên bản được tối ưu hoá về chất lượng của mô hình Gemma 3N được đánh giá cao. Mọi hoạt động tối ưu hoá câu lệnh được thực hiện trên mô hình Gemma 3N nguồn mở cũng sẽ áp dụng cho Gemini Nano V3. Trên các thiết bị được hỗ trợ, các API GenAI của Bộ công cụ học máy tận dụng mô hình nano-v3 để tối đa hoá chất lượng cho Nhà phát triển Android

APO coi câu lệnh không phải là văn bản tĩnh mà là một nền tảng có thể lập trình và có thể được tối ưu hoá. Công cụ này tận dụng các mô hình phía máy chủ (như Gemini Pro và Flash) để đề xuất câu lệnh, đánh giá các biến thể và tìm ra câu lệnh tối ưu cho nhiệm vụ cụ thể của bạn. Quy trình này sử dụng 3 cơ chế kỹ thuật cụ thể để tối đa hoá hiệu suất:

Phân tích lỗi tự động: APO phân tích các mẫu lỗi từ dữ liệu huấn luyện để tự động xác định những điểm yếu cụ thể trong câu lệnh ban đầu.
Chưng cất hướng dẫn ngữ nghĩa: Phân tích vô số ví dụ huấn luyện để chưng cất "ý định thực sự" của một nhiệm vụ, tạo ra những hướng dẫn phản ánh chính xác hơn sự phân phối dữ liệu thực.
Thử nghiệm song song các đề xuất: Thay vì thử nghiệm từng ý tưởng một, APO sẽ tạo và thử nghiệm song song nhiều đề xuất để xác định chất lượng tối đa trên toàn cầu.

Lý do APO có thể tiếp cận chất lượng tinh chỉnh

Nhiều người thường lầm tưởng rằng tinh chỉnh luôn mang lại chất lượng tốt hơn so với việc đưa ra câu lệnh. Đối với các mô hình nền tảng hiện đại như Gemini Nano phiên bản 3, thiết kế câu lệnh có thể mang lại hiệu quả cao:

Duy trì các khả năng chung: Việc tinh chỉnh ( PEFT/LoRA) buộc trọng số của mô hình phải lập chỉ mục quá mức trên một phân phối dữ liệu cụ thể. Điều này thường dẫn đến hiện tượng "quên thảm hoạ", trong đó mô hình trở nên tốt hơn ở cú pháp cụ thể của bạn nhưng lại kém hơn ở logic và độ an toàn chung. APO không thay đổi trọng số, giữ nguyên các chức năng của mô hình cơ sở.
Tuân theo chỉ dẫn và khám phá chiến lược: Gemini Nano phiên bản 3 đã được huấn luyện kỹ lưỡng để tuân theo các chỉ dẫn phức tạp của hệ thống. APO khai thác điều này bằng cách tìm ra cấu trúc chỉ dẫn chính xác giúp mở khoá các khả năng tiềm ẩn của mô hình, thường khám phá ra những chiến lược mà các kỹ sư có thể khó tìm thấy.

Để xác thực phương pháp này, chúng tôi đã đánh giá APO trên nhiều khối lượng công việc sản xuất đa dạng. Quy trình xác thực của chúng tôi cho thấy độ chính xác tăng từ 5% đến 8% trong nhiều trường hợp sử dụng.Trong số nhiều tính năng được triển khai trên thiết bị, APO đã mang lại những cải thiện đáng kể về chất lượng.

Trường hợp sử dụng	Loại nhiệm vụ	Nội dung mô tả công việc	Chỉ số	Cải thiện APO
Phân loại chủ đề	Phân loại văn bản	Phân loại một tin bài thành các chủ đề như tài chính, thể thao, v.v.	Độ chính xác	Tăng 5%
Phân loại ý định	Phân loại văn bản	Phân loại câu hỏi của dịch vụ khách hàng thành các ý định	Độ chính xác	+8%
Dịch trang web	Dịch văn bản	Dịch một trang web từ tiếng Anh sang ngôn ngữ địa phương	BLEU	Tăng 8,57%

Quy trình làm việc liền mạch, toàn diện dành cho nhà phát triển

Duy trì các khả năng chung: Việc tinh chỉnh ( PEFT/LoRA) buộc trọng số của mô hình phải lập chỉ mục quá mức trên một phân phối dữ liệu cụ thể. Điều này thường dẫn đến hiện tượng "quên thảm hoạ", trong đó mô hình trở nên tốt hơn ở cú pháp cụ thể của bạn nhưng lại kém hơn ở logic và độ an toàn chung. APO không thay đổi trọng số, giữ nguyên các chức năng của mô hình cơ sở.
Tuân theo chỉ dẫn và khám phá chiến lược: Gemini Nano phiên bản 3 đã được huấn luyện kỹ lưỡng để tuân theo các chỉ dẫn phức tạp của hệ thống. APO khai thác điều này bằng cách tìm ra cấu trúc chỉ dẫn chính xác giúp mở khoá các khả năng tiềm ẩn của mô hình, thường khám phá ra những chiến lược mà các kỹ sư có thể khó tìm thấy.

Kết luận

Việc phát hành tính năng Tối ưu hoá câu lệnh tự động (APO) đánh dấu một bước ngoặt cho AI tạo sinh trên thiết bị. Bằng cách thu hẹp khoảng cách giữa các mô hình cơ sở và hiệu suất ở cấp độ chuyên gia, chúng tôi đang cung cấp cho nhà phát triển các công cụ để xây dựng các ứng dụng di động mạnh mẽ hơn. Cho dù bạn chỉ mới bắt đầu với Tối ưu hoá không cần dữ liệu hay mở rộng quy mô sản xuất bằng cách tinh chỉnh Dựa trên dữ liệu, giờ đây, con đường dẫn đến thông tin tình báo chất lượng cao trên thiết bị đã trở nên rõ ràng hơn. Triển khai các trường hợp sử dụng trên thiết bị vào quy trình sản xuất ngay hôm nay bằng Prompt API của Bộ công cụ học máy và tính năng Tối ưu hoá câu lệnh tự động của Vertex AI.

Đường liên kết có liên quan:

Tác giả:

Chetan Tekur

Giám đốc sản phẩm

read_more Xem hồ sơ
Chao Zhao

Kỹ sư phần mềm

read_more Xem hồ sơ
Paul Zhou

Kỹ sư phần mềm cấp cao

read_more Xem hồ sơ
Caren Chang

Kỹ sư Quan hệ với nhà phát triển

read_more Xem hồ sơ

Tiếp tục đọc

02 Tháng 4 2026

02 Tháng 4 2026

Tin tức về sản phẩm

Thông báo về Gemma 4 trong Bản dùng trước AICore cho nhà phát triển

arrow_forward

Tại Google, chúng tôi cam kết mang những mô hình AI mạnh mẽ nhất đến thẳng các thiết bị Android mà bạn đang dùng. Hôm nay, chúng tôi rất vui mừng thông báo về việc phát hành mô hình nguồn mở tiên tiến mới nhất của mình: Gemma 4.
Caren Chang, David Chou • Đọc trong 3 phút
3 Tác giả

30 Tháng 10 2025

30 Tháng 10 2025

Tin tức về sản phẩm

Prompt API của Bộ công cụ học máy: Khám phá trải nghiệm tuỳ chỉnh Gemini Nano trên thiết bị

arrow_forward

AI giúp bạn dễ dàng tạo ra trải nghiệm trong ứng dụng phù hợp cho từng người dùng bằng cách chuyển đổi nội dung sang định dạng phù hợp với người dùng. Trước đây, chúng tôi cho phép nhà phát triển tích hợp với Gemini Nano thông qua các API GenAI của Bộ công cụ học máy được điều chỉnh cho các trường hợp sử dụng cụ thể như tóm tắt và mô tả hình ảnh.
Caren Chang, Chengji Yan, Penny Li • Đọc trong 2 phút
26 Tháng 5 2026

26 Tháng 5 2026

Tin tức về sản phẩm

Các thông tin cập nhật hàng đầu về AI trên Android để xây dựng trải nghiệm thông minh tại Google I/O 2026

arrow_forward

Tại Google I/O 2026, chúng tôi đã giới thiệu sự thay đổi của Android từ một hệ điều hành thành một hệ thống thông minh. Chúng tôi cũng minh hoạ cách bạn có thể tạo trải nghiệm thông minh một cách tự nhiên bằng hệ thống và mang sức mạnh của AI của Google vào các ứng dụng của mình.
Jingyu Shi • Đọc trong 2 phút
- #Google I/O
- #Android
- #AppFunctions
- #Trên thiết bị
- +2 ↩