Наука

Ученые научили нейросеть определять звучание каждого пикселя на видео

Ученые обучили нейросеть вычислять звучание каждого отдельного фрагмента аудиоряда в составе видео на «уровне пикселей». Она станет отделять звучание и картинку, что позволит улучшить первое: изменять громкость, тембр, добавлять фильтры и совершать другие операции.



Проект реализуют ученые из Массачусетского технологического института, которые ни разу не анонсировали собственную разработку. Проект изначально тестировали на порядка 60 часах видео. Искусственный интеллект выяснил и поменял инструменты на «уровне пикселей», затем отправил звуки, которые имеют отношение к различным инструментам.



Такое изобретение позволит значительно повысить качество звука. Искусственный интеллект сможет определять звуки свыше 20 распространенных инструментов. Программа поможет экспертам изменить качество аудиоряда с минимальным количеством усилий.

Автор: Валерий Антонов
Добавление комментария
Кликните на изображение чтобы обновить код, если он неразборчив
Последние новости