狗万登陆 >狗万登陆 >麻省理工学院正在开发一种可以调节视频图像仪器声音的AI系统“PixelPlayer” >

麻省理工学院正在开发一种可以调节视频图像仪器声音的AI系统“PixelPlayer”

2019-09-03 03:10:19 来源:环球网
A+ A-

在YouTube等上使用多种乐器观看表演视频时,您是否曾想更好地听到特定乐器的声音?

麻省理工学院(MIT)的计算机科学与人工智能研究所(CSAIL)正在开发一种能够实现这种愿望的技术。 它是一个AI系统“PixelPlayer”,可以使用深度学习区分乐器的声音并调整每个声音的音量。

·提取特定声音

例如,让我们看一下用单簧管和吉他演奏的视频。 如果您想清楚地听单簧管,请将光标放在PixelPlayer中的单簧管上并单击它。 反之亦然。

关键是可以在像素级别指定乐器的声音并且可以提取声音。

·在60小时的视频中学习

该系统使用自我监督的深度学习开发。 他说他已经“看到”大约60个小时的视频来学习声音和乐器。

因此,目前可以识别20种类型的仪器,但仍然难以识别类似的仪器。 但是,鉴于您在使用时学习,预计相应仪器的数量将增加,并且也可以进行高级区分。

总有一天,这项技术作为声音控制工具安装在YouTube上的那一天会来吗?

责任编辑:屈付 CN037