今天看到了一个关于语音识别的技术,现在收录过来。
CNET科技资讯网9月17日国际报道 今年7月份,谷歌推出了应用于网络应用的语音识别技术,目前这一项目Gaudi(谷歌音频索引)在Google Labs有一个正式界面。
网站的搜索框上有使用说明事例,如“搜索政治家的讲话”,就会在YouTube视频播放器旁边显示搜索结果,点击每一个结果,播放器就会显示讲话地点的一段视频显示结果不仅仅显示演讲,如果点击“绝路桥”,还可以看到一段由约翰·麦凯恩和莎拉·帕琳参加竞选的广告。
从视频中提取话语,将有助于谷歌轻易决定视频的内容,并在视频旁边配置最适宜的广告。今年通过YouTube赚钱是谷歌的头等大事。
语音与文本之间的转换还将有助于谷歌将相关视频混合到搜索结果中。目前最好的办法就是通过检查伴随的元数据理解视频中的内容,例如标题与说明,但其范围要比所说的语言范围小得多。
借助于谷歌的翻译工具,谷歌有可能将视频内容翻译成其它语言。显然,谷歌在语音识别技术方面有更大的雄心。谷歌在FAQ网页上谈论到谷歌音频索引项目时表示:“Google Labs上的谷歌音频索引项目应用范围将更广,美国竞选只是第一步。我们将把谷歌音频索引项目视作一个实验平台,通过这一平台,我们可以发现用户寻找网络演讲内容时获得最佳体验的一些功能。”
谷歌之所以选择政治家的信息,是因为政治家引起的关注更高,另外,政治家的语言往往比普通人的语言更简洁,语音识别技术的执行效果会更好。
【返回顶部】
AI游刃有余 | 告别运维焦虑,浪潮云海OS解锁智能运维快车道
-
2026年1月26日,浪潮云海在中国发布InCloud AIOS平台下的AI助手。该产品基于Agentic
AI范式,实现自然语言驱动资源检索、智能报表生成和多源数据巡检,解决传统运维复杂低效问题。浪潮云海AI助手通过三大智能引擎精准执行任务,显著提升企业云运维效率与准确性,引领行业向智能化转型。
6 hours ago

