相关新闻
-
钱柜QG777塑造出每个文人心中的“桃花源”
2026-05-07 08:57这是陶渊明心中的诗意栖居地,也是千百年来文人墨客的理想之所,如今“观唐艺术区”将此情此景的呈现在了世人的面前,领人叹为观止。观唐艺术园本次举办的“桃花朵朵”展览由北京华亚艺术基金会主办,点滴
-
未来“互联网+”如何打造工业互联网。助推数字制造
2026-05-06 11:13本届博览会以“工业互联、数字制造”为主题,由中国国际贸易促进委员会广东省委员会、汉诺威米兰展览(上海)有限公司主办。展会规模达到5.5万平米,设置“互联网+”前沿技术、数字化商业、数字化生活
-
为你详解钱柜QG777网站建设流程
2026-05-02 22:45钱柜QG777网站建设建设结构设计是网站设计的重要组成部分。在内容设计完成之后,网站建设的目标及内容主题等有关问题已经确定。网站结构设计要做的事情就是如何将内容划分为清晰合理的层次体系,比如栏目
-
网站设计怎样运用好颜色?
2026-04-15 18:07在做北京网站制作设计的时候,精心设计的配色往往能给人不同的感觉。很多网站制作设计师因此会片面的以为鲜艳的色彩就是好的色彩,其实不然。鲜艳的配色通常更加吸引人的注意力,更容易传递出积极的情绪。
-
小程序乱象丛生的背后“引人深思”
2026-04-12 19:01小程序因“用完即走”、不用下载和安装等特点,成为互联网新风口,同时也成为乱象高发地。近期一些小程序过度收集用户个人信息,一些商家利用小程序销售假货,甚至有一些“套路贷”通过小程序开发的形式“
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。
020-54623854
现在就想找顾问聊聊立即咨询