Цитата Сообщение от zukovick Посмотреть сообщение
Да, именно об этом я и говорю (генерирование волны на нужной частоте). Просто мой словарный запас, касательно музыки, оставляет желать лучшего.

Хм, то есть, сделать реалистичный голос в секвенсоре невозможно? :oh:
То о чем вы говорите, называется Тембр.

Те́мбр (фр. timbre) — окраска звука; один из признаков музыкального звука (наряду с высотой, громкостью и длительностью).

По тембрам отличают звуки одинаковой высоты и громкости, но исполненные или на разных инструментах, разными голосами, или на одном инструменте разными способами, штрихами.
Тембр определяется материалом, формой вибратора, условиями его колебаний, резонатором, акустикой помещения. В характеристике тембра большое значение имеют обертоны и их соотношение по высоте и громкости, шумовые призвуки, атака (начальный момент звука), форманты, вибрато и другие факторы.

При восприятии тембров обычно возникают различные ассоциации: тембровое качество звука сравнивают со органолептическими ощущениями от тех или иных предметов и явлений, например, звуки называют яркими, блестящими, матовыми, тёплыми, холодными, глубокими, полными, резкими, насыщенными, сочными, металлическими, стеклянными; применяются и собственно слуховые определения (например, звонкие, глухие, шумные).
Научно-обоснованная типология тембра ещё не сложилась. Установлено, что тембровый слух имеет зонную природу.

(Материал из Википедии)


Поидее, можно синтезировать речь, но таких плагинов или качественных программ я не встречал. Есть всякие программы для перевода текста в аудио. Нужно написать довольно сложный алгоритм, который будет динамически изменять тембр, высоту, громкость и длительность взависимости от указанной ему буквы, а так же её сочетание с другими буквами в словах. Для выразительности придётся писать алгоритм просчитывающий восклицание, вопрос и прочие состояния выражения, а так же значение слов в предложении (в плане произношения).

Причиной почему такие вещи не делают - т.к. нет смысла вкладывать средства в этот проект, ещё не изобретён в мире искуственный интелект на таком высоком уровне, что бы тербовалось реальное произношение. И люди обходятся банальной записью аудио для фильмов, для мультиков, для игр, для разных "говорящих" гаджетов, такие как часы, сигнализации, бытовая электроника и т.д.