오디오 글라스 및 디스플레이 글라스를 위해 Gemini Live API와 통합

해당 XR 기기
이 가이드에서는 이러한 유형의 XR 기기를 위한 환경을 빌드하는 방법을 설명합니다.
오디오 및
디스플레이 안경

Gemini Live API는 사용자와 대화형 인터페이스를 구현하기 위한 포괄적인 솔루션을 제공합니다. Android XR을 빌드할 때 Firebase AI Logic을 통해 Gemini Live API와 통합할 수 있습니다. TTS (텍스트 음성 변환)자동 음성 인식 (ASR)을 사용하는 것과 달리 Gemini Live API는 오디오 입력과 출력을 모두 원활하게 처리합니다. Gemini Live API는 지속적인 인터넷 연결이 필요하며 비용이 발생하고 프로젝트당 동시 연결 수를 제한적으로 지원하며 오류 조건 또는 기타 중요한 사용자 커뮤니케이션을 처리하는 데 적합하지 않을 수 있습니다. 특히 디스플레이가 없는 오디오 안경에서는 더욱 그렇습니다.

오디오 인터페이스를 지원하는 것 외에도 Gemini Live API를 사용하여 에이전트 환경을 빌드할 수 있습니다.

Gemini Live API를 시작하려면 Gemini Live API 가이드에 설명된 단계를 따르세요. LiveGenerativeModel을 인스턴스화하고 구성하고, LiveSession을 설정하고, 앱에서 Gemini의 요청을 처리할 수 있는 맞춤 FunctionDeclaration 인스턴스를 만드는 방법을 안내합니다.