dmitrifriend продукты история общество магия самит CEO dmitrifriend

70 языков и нейросеть-актёр: чем удивил ElevenLabs v3 в новой версии своей TTS

В мире нейроозвучки случилось знаковое событие: ребята из ElevenLabs только что выкатили свою новую модель текст‑в‑речь — Eleven v3.

И это шаг к тому, чтобы окончательно стереть грань между синтетическим и натуральным голосом.Чем же так крута v3? Ну, представьте нейросеть, которая не просто проговаривает текст, а умеет:Менять интонацию на лету — от радостного возгласа к задумчивой грусти.Смеяться [laughs], вздыхать [sighs] или переходить на шепот [whispers] — да, прямо в тексте можно ставить такие аудиотеги.Озвучивать диалоги нескольких персонажей с разными характерами — идеально для аудиодрам, подкастов или игр.Звучать искренне, драматично, саркастично — в общем, передавать весь спектр эмоций.Легко менять акценты или тональность прямо посреди предложения.И даже петь. (Пока в альфе.)Всё это стало возможно благодаря совершенно новой архитектуре модели.

DMCA