TD-LTE R9定位技术研究
日期: 2017 年 7 月 19 日
语音识别商用开源代码与免费开放平台最全盘点分析
声学在线前几日盘点了语音识别业界相关的公司和技术,引起了众多朋友的关注。不少朋友都在咨询声学在线关于技术细节问题,因此,我们打算春节期间连续发布几篇深度文章,希望从语音识别领域的公司、技术、算法和专利的层面解读出语音识别的产生、发展、应用与瓶颈,以此提供给相关行业的朋友们作为参考。
目前朋友们最关心的就是当前有哪些语音识别开放平台,显然大家更担心被某个平台所绑架。为了促进语音识别的行业发展,我们更深入一步,不仅盘点当前的商业开放平台,也把这个领域的开源代码详细盘点一番,让更多的朋友了解这个行业。
语音识别领域的商用开源代码盘点
语音识别是一门交叉学科,其所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。但是随着深度学习技术的发展,云端的语音识别更多的偏向于计算机技术。显然,从事计算机技术研究的人员更加众多,这也是语音识别的快速发展的基础,因而也形成了语音识别的开源代码要比开放平台更多的现象。
提到语音识别的开源代码,首先就要提到三个非常著名的开源平台,即Kaldi、CMU Sphinx和Julius。笔者大概按其重要性做了以下排名,Sphinx、HTK之类曾经很红火,但是确实也有点太老了。而Kaldi是Apache licence,完全可以商用,美国和中国很多公司都是直接修改Kaldi生成的语音识别引擎。另外,很多巨头公司内部研究部门也是在用Kaldi做研发,关于这些欢迎留言讨论。
Ubuntu 16.04.3/14.04.5系统上修改Docker镜像的存储路径
最近在Ubuntu 16.04.3/14.04.5
系统上使用Docker
结果由于默认的镜像存储路径在系统分区上,而系统分区又不足够大,导致整个系统都不能正常工作了。
因此我们需要把Docker
的镜像存储目录移动到数据分区。
执行如下命令查询默认的存储路径
$ sudo docker info | grep "Docker Root Dir"
我们看到如下输出
Docker Root Dir: /var/lib/docker
比较简单的方法是通过软链接的方式来实现,具体命令如下:
$ sudo service docker stop #我的系统是用户分区足够大 $ sudo mv /var/lib/docker ~/.docker $ sudo ln -s ~/.docker /var/lib/docker $ sudo service docker start
参考链接
Ubuntu 14.04系统上安装部署OpenWhisk(本地CouchDB版本)
1.安装配置CouchDB
$ sudo apt-get install -V couchdb
校验CouchDB
是否工作正常
$ curl –k http://127.0.0.1:5984
看到如下输出即可
{"couchdb":"Welcome","uuid":"87586fee02b1149fa06dda7148450d4a","version":"1.5.0","vendor":{"name":"Ubuntu","version":"14.04"}}
2.编译配置OpenWhisk
下载OpenWhisk
的源代码
$ sudo apt-get install git $ cd ~ $ git clone https://github.com/apache/incubator-openwhisk.git
配置OpenWhisk
编译需要的环境
$ cd incubator-openwhisk # Install all required software $ cd tools/ubuntu-setup $ sudo ./all.sh
执行编译
#返会代码根目录 $ cd ../.. $ sudo ./gradlew distDocker
3.发布并运行OpenWhisk服务
配置运行环境
$ cd ~ $ cd incubator-openwhisk $ cd ansible #只在第一次初始化数据库的时候执行这句话 $ sudo ansible-playbook -i environments/local/ setup.yml $ sudo ansible-playbook -i environments/local/ openwhisk.yml
安装必备软件
#系统自带的版本太低,但是还是需要安装一下,用来解决依赖问题 $ cd ~ $ sudo apt-get install vagrant $ wget https://releases.hashicorp.com/vagrant/1.9.7/vagrant_1.9.7_x86_64.deb $ sudo dpkg -i vagrant*.deb $ sudo apt-get install virtualbox
运行测试Demo
$ cd ~/incubator-openwhisk/tools/vagrant $ ./hello
如过想查看刚刚通过vagrant
部署完成的镜像系统里面的内容,则执行如下命令:
$ cd ~/incubator-openwhisk/tools/vagrant $ sudo vagrant ssh
如果成功部署了OpenWhisk
,那么可以在Docker
机器中执行如下代码验证是否可以正常调用
$ cd ~/incubator-openwhisk/tools/vagrant $ sudo vagrant ssh $ wsk action invoke /whisk.system/utils/echo -p message hello --result #输出结果 { "message": "hello" } $ wsk package list /whisk.system #输出结果 packages /whisk.system/watson-textToSpeech shared /whisk.system/weather shared /whisk.system/watson-translator shared /whisk.system/combinators shared /whisk.system/samples shared /whisk.system/github shared /whisk.system/utils shared /whisk.system/websocket shared /whisk.system/slack shared /whisk.system/watson-speechToText shared
外部的机器访问则执行如下命令来验证
$ cd ~/incubator-openwhisk/bin/ #注意参数 -i --apihost 里指定的地址在部署镜像的时候vagrant脚本中指定的 $ ./wsk -i property set --apihost 192.168.33.13 --namespace guest --auth `cat ~/incubator-openwhisk/ansible/files/auth.guest` $ ./wsk -i action invoke /whisk.system/utils/echo -p message hello --result #输出结果 { "message": "hello" }
4.遇到的问题
最大的问题是在编译发布的过程中系统分区被消耗干净,导致编译发布失败。
解决方法如下
1.参照Ubuntu 16.04系统上修改Docker镜像的存储路径介绍的方法调整Docker
镜像的存储路径到合适的分区
2.如果使用sudo
的方式执行,那么可能会在/root
目录下生成虚拟机的镜像文件,同样导致系统分区被消耗,解决方法也是通过软链接的方式把/root
目录链接到合适的分区目录
如过执行中遇到如下错误,则增加-i
参数即可
$ ./wsk action invoke /whisk.system/utils/echo -p message hello --result error: Unable to invoke action 'utils/echo': Post https://192.168.33.13/api/v1/namespaces/whisk.system/actions/utils/echo?blocking=true&result=true: x509: cannot validate certificate for 192.168.33.13 because it doesn't contain any IP SANs Run 'wsk --help' for usage.