腾博会
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 营销型网站建设特征的具体表现是什么呢?

    2026-04-24 15:59

    随着互联网的不断向前发展,营销型网站建设,在各类型网站建设中异军突起,受到人们的青睐。营销型网站建设是有自己的特征的,那么它有什么具体的表现呢?一起看看下文的分析。1.网站结构清晰网站结构不

  • 排版的好坏决定网站开发的重要性

    2026-04-20 23:32

    2020年两股网站开发设计浪潮,极简主义和扁平化设计都是比较机选的简约设计风格,并且都聚焦于内容的呈现。其实有时候真的是很难去置信如此简单的一个网站却能获得庞大的成功,假设你的北京网站开发有

  • 中国航空“踏上”互联网大潮,将迎来爆发式增长

    2026-04-10 12:45

    “国内航空互联网行业处于爆发式增长阶段,在未来其发展潜力巨大”中国互联网行业蓄势待发,尽管前景看好,但是整日产业链参与者都各有痛点,造成行业发展速度距离和旅客体验预期尚有差距。今天腾博会

  • 信托频繁牵手互联网巨头—未来科技投入势在必行!

    2026-04-05 11:46

    随着互联网网站开发的迅猛发展,在传统业务发展受阻的时代,多家信托公司正通过牵手互联网巨头合作模式,谋求转向消费金融网站开发领域。据悉部分信托公司与蚂蚁金服、美团、京东等互联网巨头接洽,探索消

  • 互联网“数据服务”成为下沉市场“新宠”

    2026-04-03 12:49

    工信部7月2日发布新颖数据,今年1月至5月份,我国互联网相关服务企业完成业务收入4282亿元,同比增长19.4%。增速比去年同期回落4.5个百分点,从整体来看,北京网站建设互联网产业保持平稳

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-04-25 06:48
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。