Здравствуйте.

Дано: некоторый объём (976 треков) начитанного текста. С разными интонациями и разной направленности.
Необходимо: основываясь на данных треках сделать синтезатор речи. Чтобы тект набрать и тем голосом, что в треках, оно тебе читалось.

Собсно суть вопроса - с чего начать и с какой стороны к этому подступиться.
Просто с речевыми технологиями вообще не работал и поэтому даже не в курсе, с чего начать.

Заранее благодарю за консультацию.

upd: Звук и планируемый текст - на русском.