API Gemini Live предоставляет комплексное решение для реализации диалоговых интерфейсов взаимодействия с пользователем. При разработке для Android XR вы можете интегрировать API Gemini Live через Firebase AI Logic . В отличие от использования преобразования текста в речь (TTS) и автоматического распознавания речи (ASR) , API Gemini Live обрабатывает как аудиовход, так и аудиовыход без каких-либо проблем. Однако API Gemini Live требует постоянного подключения к интернету, влечет за собой затраты, поддерживает ограниченное количество одновременных подключений на проект и может быть не идеален для обработки ошибок или других важных пользовательских взаимодействий, особенно на аудиоочках, поскольку у них нет дисплея.
Помимо поддержки аудиоинтерфейсов, вы также можете использовать API Gemini Live для создания интерактивных интерфейсов.
Чтобы начать работу с Gemini Live API, следуйте инструкциям, изложенным в руководстве по Gemini Live API . В нем описаны шаги по созданию и настройке LiveGenerativeModel , установлению LiveSession и созданию пользовательских экземпляров FunctionDeclaration , которые позволят вашему приложению обрабатывать запросы от Gemini.