
Tworzenie agentów głosowych w czasie rzeczywistym z GPT-Realtime-2
W tej sesji Build Hour zespół OpenAI prezentuje możliwości nowych modeli audio przeznaczonych do pracy w czasie rzeczywistym. GPT-Realtime-2 umożliwia tworzenie inteligentnych agentów głosowych charakteryzujących się niską latencją, co jest kluczowe dla naturalnych interakcji voice-to-voice. Szczególną uwagę poświęca się funkcjom takim jak preambuły i rozszerzony kontekst 128K, które pozwalają na bardziej zaawansowaną rozumienie i przetwarzanie mowy. Dodatkowo omawiane są GPT-Realtime-Translate do tłumaczenia živego mówienia oraz GPT-Realtime-Whisper do transkrypcji. Pokazane są praktyczne zastosowania, w tym obsługę aplikacji, rozumowanie pomiędzy narzędziami i tworzenie naturalnych interakcji głosowych. Warsztaty prowadzą eksperci z zespołów Product i Solutions Engineering, zapewniając zarówno wiedzę techniczną jak i praktyczne rady implementacyjne.