Google的语音识别技术是否有API?

我想尝试使用简单的语音命令(如“next”或“previous”)创建jQuery幻灯片。 有没有办法使用谷歌的语音识别? 我知道Chrome的x-webkit-speech,但是我必须单击一个按钮才能使用它。

我尝试了麻省理工学院的WAMI,但我发现它比谷歌的语音认知更慢,更准确。

截至今天,Chrome现已存在: http : //chrome.blogspot.co.uk/2013/01/hello-browser.html

( api doc )

有了使用JavaScript实现这一目标的简单方法,请查看annyang ,这是一个使语音识别非常容易处理的库。

问题在于捕获用户的语音并将其发送到语音服务器以进行处理。 x-webkit-speech内置于浏览器中,浏览器使用PC的声卡捕获语音。 仅浏览器中的Javascript / Jquery无法访问硬件设备。 我不知道Chrome是否在DOM中公开任何x-webkit-speech对象,因此您可以通过Javascript进行捕获。

也就是说,人们已经对Google语音api进行了逆向设计并从代码中使用了它。 有关示例,请参见http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ 。

我发现了这个,我没有亲自使用它我不知道它是否完全是你想要的但是看一看。

http://captico.com/introducing-speech-2-text-api-by-google/2011/03