Notícias sobre produtos

API Prompt do ML Kit: desbloqueie experiências personalizadas do Gemini Nano no dispositivo

Leitura de 2 minutos

A IA está facilitando a criação de experiências personalizadas em apps que transformam o conteúdo no formato certo para os usuários. Antes, permitimos que os desenvolvedores fizessem a integração com o Gemini Nano usando as APIs GenAI do Kit de ML, que são personalizadas para casos de uso específicos, como resumo e descrição de imagens.

Hoje, marcamos um marco importante para a IA generativa no dispositivo do Android. Estamos anunciando o lançamento Alfa da API Prompt de IA generativa do Kit de ML. Com ela, é possível enviar solicitações em linguagem natural e multimodais para o Gemini Nano, atendendo à demanda por mais controle e flexibilidade ao criar com modelos generativos.

Parceiros como o Kakao já estão criando com a API Prompt, gerando experiências únicas com impacto no mundo real. Teste os recursos avançados da API de comandos hoje mesmo com o mínimo de código.

 

 

Vá além da IA generativa pré-criada e use uma personalizada no dispositivo

A API Prompt vai além da funcionalidade pré-criada para oferecer suporte a casos de uso personalizados e específicos do app de IA generativa, permitindo que você crie recursos exclusivos com transformação de dados complexa. A API Prompt usa o Gemini Nano no dispositivo para processar dados localmente, permitindo recursos off-line e melhorando a privacidade do usuário.

Principais casos de uso da API Prompt:

A API Prompt permite casos de uso de IA generativa altamente personalizados. Confira alguns exemplos recomendados: 

  • Compreensão de imagens: análise de fotos para classificação (por exemplo, criar um rascunho de postagem em redes sociais ou identificar tags como "animais de estimação", "comida" ou "viagem").
  • Digitalização inteligente de documentos: usa um modelo de ML tradicional para extrair texto de um recibo e categoriza cada item com a API Prompt.
  • Transformação de dados para a interface: análise de conteúdo longo para criar um título de notificação curto e envolvente.
  • Sugestão de conteúdo: sugerir temas para novas entradas de diário com base na preferência de temas de um usuário.
  • Análise de conteúdo: classificação das avaliações dos clientes em uma categoria positiva, neutra ou negativa.
  • Extração de informações: extrair detalhes importantes sobre um evento futuro de uma conversa por e-mail.

Implementação
A API Prompt permite criar comandos personalizados e definir parâmetros de geração opcionais com apenas algumas linhas de código:

Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

Para exemplos mais detalhados de implementação da API Prompt, confira a documentação oficial e o exemplo no GitHub.

Gemini Nano, desempenho e prototipagem

No momento, a API Prompt tem melhor desempenho na série de dispositivos Pixel 10, que executa a versão mais recente do Gemini Nano (nano-v3). Essa versão do Gemini Nano foi criada com a mesma arquitetura do Gemma 3n, o modelo que compartilhamos pela primeira vez com a comunidade de modelos abertos no I/O.

A base compartilhada entre o Gemma 3n e o nano-v3 permite que os desenvolvedores criem protótipos de recursos com mais facilidade. Se você não tiver um dispositivo Pixel 10, comece a testar comandos hoje mesmo criando protótipos com a Gemma 3n localmente.

Para conferir a lista completa de dispositivos compatíveis com as APIs de IA generativa, consulte nossa documentação de suporte a dispositivos.

Saiba mais

Comece a implementar a API Prompt nos seus apps Android hoje mesmo com a orientação da nossa documentação oficial e do exemplo no GitHub.

Escrito por:

Continuar lendo