Google продолжает свою работу над обучением компьютеров человеческой речи. Использование так называемой нейронной сети, технологии, которая пробует имитировать человеческий мозг, позволяет анализировать исходные формы звуковых волны и проектировать вполне вероятные модели.
Об этом сообщается на официальном сайте принадлежащей Google компании DeepMind.
Существующие системы компьютерного синтеза речи основаны на технологиях предыдущего века — утверждают авторы системы WaveNet.
Кроме того, создатели протестировали систему с музыкой, позволяющую генерировать короткие композиции на фортепиано на основе анализа традиционной музыки.
В отличие от обычных алгоритмов синтеза речи, которые построены на комбинировании заблаговременно записанных фонетических последовательностей, WaveNet синтезирует речь, анализируя звуковые волны и производя комплексные вычисления. Технология получила название WaveNet, и на этот момент не применяется в продуктах Google.
В настоящее время в искусственных синтезаторах голоса применяются аудиозаписи речи, из которых система компонует звуки на основе текстовых данных, повествует RNS.
По мнению разработчиков проекта, WaveNet приблизит население Земли к тому моменту, когда будет возможность общаться с компьютерами свободно. Технология дает возможность генерировать не только лишь человеческий голос, однако и остальные звуки.
Компания DeepMind специализируется на разработках в области искусственного интеллекта.
Бесплатная подписка на мониторинг на одно из направлений услуги Тематические новости «Торгово-административное строительство РФ» либо «Инвестиции в торговую недвижимость РФ» с 1 по 30 сентября!
— Контактные данные всех участников строительства.