
OpenAI ha rilasciato tre nuovi modelli vocali in tempo reale, mettendo a disposizione degli sviluppatori tramite API un arsenale che punta a ridefinire il modo in cui le applicazioni interagiscono con la voce umana. Non si tratta di un semplice aggiornamento incrementale: i tre modelli - GPT-Realtime-2, GPT-Realtime-Translate e GPT-Realtime-Whisper - affrontano altrettante sfide distinte (ragionamento vocale, traduzione simultanea, trascrizione in streaming) e arrivano tutti attraverso la Realtime API. L'annuncio è stato condiviso su X da Greg Brockman, cofondatore dell'azienda. [continua..]
---
Cosa ne pensi? Lascia il tuo commento qui sotto.
