Правильного ответа нет. Любой выбор приводит к жертвам, любое решение требует платы. | Лишь навык имеет значение.
Здравствуйте.
Дано: некоторый объём (976 треков) начитанного текста. С разными интонациями и разной направленности.
Необходимо: основываясь на данных треках сделать синтезатор речи. Чтобы тект набрать и тем голосом, что в треках, оно тебе читалось.
Собсно суть вопроса - с чего начать и с какой стороны к этому подступиться.
Просто с речевыми технологиями вообще не работал и поэтому даже не в курсе, с чего начать.
Заранее благодарю за консультацию.
upd: Звук и планируемый текст - на русском.
Дано: некоторый объём (976 треков) начитанного текста. С разными интонациями и разной направленности.
Необходимо: основываясь на данных треках сделать синтезатор речи. Чтобы тект набрать и тем голосом, что в треках, оно тебе читалось.
Собсно суть вопроса - с чего начать и с какой стороны к этому подступиться.
Просто с речевыми технологиями вообще не работал и поэтому даже не в курсе, с чего начать.
Заранее благодарю за консультацию.
upd: Звук и планируемый текст - на русском.
-
-
29.10.2012 в 14:37-
-
29.10.2012 в 15:31Далее добавить в БД варианты произношения в зависимости от положения слова в предложении, и от типа предложения. Плавающие ударения там, восходящий-нисходящий тон, интонации в вопросах, положительных и отрицательных ответах и т.д.
Далее понадобится движок, который будет текст анализировать и выбирать нужный вариант звучания.
Описание выглядит очень просто, но на самом деле задача архисложная, очень интересная... И судя по тому, что таких вещей ещё нет - очень ресурсоёмкая, в плане временных и денежных затрат.
-
-
29.10.2012 в 15:42"имеется некоторое водорода, подскажите, как мне организовать термоядерный синтез"
если вы хотите создать новый движок TTS, то хочу вас заверить, что всё, что вы сделаете, будет хуже десятков уже имеющихся движков
если вы хотите просто так, для фана, позаниматься данной увлекательной задачей, то непонятен смысл вашего обращения сюда, интерес же должен быть как раз в самостоятельной работе
-
-
29.10.2012 в 16:11И мне очень интересно, почему вы считаете, что ничего не получится?
-
-
29.10.2012 в 17:47я не говорил, что ничего не получится, я сказал всего лишь, что сильно сомневаюсь в возможности одного человека с наскоку создать с нуля TTS-движок, удовлетворительный в сравнению с популярными имеющимися решениями, в том числе и бесплатными
-
-
29.10.2012 в 18:26-
-
29.10.2012 в 18:43Нормально "читающих" накопал только парочку, но они привязаны к своему "голосу". Другой подставить не получается.
nio, О, это полезное замечание, спасибо.
Co0L, Не поверите, желательно чтобы оно вообще без сети работало и уж тем более, без браузера)))
-
-
29.10.2012 в 19:03В идеале же стоит отказаться от синтеза через набор готовых звуков, так как данный вид синтеза довольно ограничен. в частности идет ограничение на словарный набор и интонационный набор.
Синтез звука с нуля потребует знания высшей математики и умения моделировать колебательные системы.
Вобщем-то в любом случае задача нетривиальна. Могу порекомендовать покопаться в теории и видах речевых движков и поковырять опенсурс решения на предмет анализа кода.
А подстановка своего голоса в речевые движки, извините, просто так не делается. 6аверняка нужно подготовить звуковые данные в нужном виде и формате. Опять же, ковыряние чужого движка может помочь разобраться с этим вопросом.
-
-
30.10.2012 в 09:59-
-
30.10.2012 в 15:33Я пока больше склоняюсь к мысли о донесении до начальства всей глубины так сказать "проблемы". Авось оно и передумает.
-
-
30.10.2012 в 16:18-
-
30.10.2012 в 17:23Это да, но порой бывает очень интересно ^-^