STT/TTS выбор, turn-taking, latency budget < 800ms, interruption handling, recovery от mishear, персона в голосе.