今年7月份,谷歌推出了应用于网络应用的语音识别技术,目前这一项目Gaudi(谷歌音频索引)在GoogleLabs有一个正式界面。
网站的搜索框上有使用说明事例,如“搜索政治家的讲话”,就会在YouTube视频播放器旁边显示搜索结果,点击每一个结果,播放器就会显示讲话地点的一段视频。显示结果不仅仅显示演讲,如果点击“绝路桥”,还可以看到一段由约翰·麦凯恩和莎拉·帕琳参加竞选的广告。
从视频中提取话语,将有助于谷歌轻易决定视频的内容,并在视频旁边配置最适宜的广告。今年通过YouTube赚钱是谷歌的头等大事。
语音与文本之间的转换还将有助于谷歌将相关视频混合到搜索结果中。目前最好的办法就是通过检查伴随的元数据理解视频中的内容,例如标题与说明,但其范围要比所说的语言范围小得多。
借助于谷歌的翻译工具,谷歌有可能将视频内容翻译成其它语言。显然,谷歌在语音识别技术方面有更大的雄心。谷歌在FAQ网页上谈论到谷歌音频索引项目时表示:“Google Labs上的谷歌音频索引项目应用范围将更广,美国竞选只是第一步。我们将把谷歌音频索引项目视作一个实验平台,通过这一平台,我们可以发现用户寻找网络演讲内容时获得最佳体验的一些功能。”
谷歌之所以选择政治家的信息,是因为政治家引起的关注更高,另外,政治家的语言往往比普通人的语言更简洁,语音识别技术的执行效果会更好。