语音识别商用开源代码与免费开放平台最全盘点分析

声学在线前几日盘点了语音识别业界相关的公司和技术,引起了众多朋友的关注。不少朋友都在咨询声学在线关于技术细节问题,因此,我们打算春节期间连续发布几篇深度文章,希望从语音识别领域的公司、技术、算法和专利的层面解读出语音识别的产生、发展、应用与瓶颈,以此提供给相关行业的朋友们作为参考。

目前朋友们最关心的就是当前有哪些语音识别开放平台,显然大家更担心被某个平台所绑架。为了促进语音识别的行业发展,我们更深入一步,不仅盘点当前的商业开放平台,也把这个领域的开源代码详细盘点一番,让更多的朋友了解这个行业。

语音识别领域的商用开源代码盘点

语音识别是一门交叉学科,其所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。但是随着深度学习技术的发展,云端的语音识别更多的偏向于计算机技术。显然,从事计算机技术研究的人员更加众多,这也是语音识别的快速发展的基础,因而也形成了语音识别的开源代码要比开放平台更多的现象。

提到语音识别的开源代码,首先就要提到三个非常著名的开源平台,即Kaldi、CMU Sphinx和Julius。笔者大概按其重要性做了以下排名,Sphinx、HTK之类曾经很红火,但是确实也有点太老了。而Kaldi是Apache licence,完全可以商用,美国和中国很多公司都是直接修改Kaldi生成的语音识别引擎。另外,很多巨头公司内部研究部门也是在用Kaldi做研发,关于这些欢迎留言讨论。

继续阅读语音识别商用开源代码与免费开放平台最全盘点分析

Ubuntu 16.04.3/14.04.5系统上修改Docker镜像的存储路径

最近在Ubuntu 16.04.3/14.04.5系统上使用Docker结果由于默认的镜像存储路径在系统分区上,而系统分区又不足够大,导致整个系统都不能正常工作了。

因此我们需要把Docker的镜像存储目录移动到数据分区。

执行如下命令查询默认的存储路径

$ sudo docker info | grep "Docker Root Dir"

我们看到如下输出

Docker Root Dir: /var/lib/docker

比较简单的方法是通过软链接的方式来实现,具体命令如下:

$ sudo service docker stop

#我的系统是用户分区足够大
$ sudo mv /var/lib/docker ~/.docker

$ sudo ln -s ~/.docker /var/lib/docker

$ sudo service docker start

参考链接


Ubuntu 14.04系统上安装部署OpenWhisk(本地CouchDB版本)

1.安装配置CouchDB

$ sudo apt-get install -V couchdb

校验CouchDB是否工作正常

$ curl –k http://127.0.0.1:5984

看到如下输出即可

{"couchdb":"Welcome","uuid":"87586fee02b1149fa06dda7148450d4a","version":"1.5.0","vendor":{"name":"Ubuntu","version":"14.04"}}

2.编译配置OpenWhisk

下载OpenWhisk的源代码

$ sudo apt-get install git

$ cd  ~

$ git clone https://github.com/apache/incubator-openwhisk.git

配置OpenWhisk编译需要的环境

$ cd incubator-openwhisk

# Install all required software
$ cd tools/ubuntu-setup

$ sudo ./all.sh

执行编译

#返会代码根目录
$ cd ../..

$ sudo ./gradlew distDocker

3.发布并运行OpenWhisk服务

配置运行环境

$ cd ~

$ cd incubator-openwhisk

$ cd ansible

#只在第一次初始化数据库的时候执行这句话
$ sudo ansible-playbook -i environments/local/ setup.yml

$ sudo ansible-playbook -i environments/local/ openwhisk.yml

安装必备软件

#系统自带的版本太低,但是还是需要安装一下,用来解决依赖问题
$ cd ~
$ sudo apt-get install vagrant

$ wget https://releases.hashicorp.com/vagrant/1.9.7/vagrant_1.9.7_x86_64.deb

$ sudo dpkg -i vagrant*.deb

$ sudo apt-get install virtualbox

运行测试Demo

$ cd ~/incubator-openwhisk/tools/vagrant

$ ./hello

如过想查看刚刚通过vagrant部署完成的镜像系统里面的内容,则执行如下命令:

$ cd ~/incubator-openwhisk/tools/vagrant

$ sudo vagrant ssh

如果成功部署了OpenWhisk,那么可以在Docker机器中执行如下代码验证是否可以正常调用

$ cd ~/incubator-openwhisk/tools/vagrant

$ sudo vagrant ssh

$ wsk action invoke /whisk.system/utils/echo -p message hello --result
#输出结果
{
    "message": "hello"
}

$ wsk package list /whisk.system
#输出结果
packages
/whisk.system/watson-textToSpeech                                      shared
/whisk.system/weather                                                  shared
/whisk.system/watson-translator                                        shared
/whisk.system/combinators                                              shared
/whisk.system/samples                                                  shared
/whisk.system/github                                                   shared
/whisk.system/utils                                                    shared
/whisk.system/websocket                                                shared
/whisk.system/slack                                                    shared
/whisk.system/watson-speechToText                                      shared

外部的机器访问则执行如下命令来验证

$ cd ~/incubator-openwhisk/bin/

#注意参数 -i  --apihost 里指定的地址在部署镜像的时候vagrant脚本中指定的
$ ./wsk -i property set --apihost 192.168.33.13 --namespace guest --auth `cat ~/incubator-openwhisk/ansible/files/auth.guest`

$ ./wsk -i action invoke /whisk.system/utils/echo -p message hello --result
#输出结果 
{ 
"message": "hello" 
}

4.遇到的问题

最大的问题是在编译发布的过程中系统分区被消耗干净,导致编译发布失败。
解决方法如下
1.参照Ubuntu 16.04系统上修改Docker镜像的存储路径介绍的方法调整Docker镜像的存储路径到合适的分区
2.如果使用sudo的方式执行,那么可能会在/root目录下生成虚拟机的镜像文件,同样导致系统分区被消耗,解决方法也是通过软链接的方式把/root目录链接到合适的分区目录

如过执行中遇到如下错误,则增加-i参数即可

$ ./wsk action invoke /whisk.system/utils/echo -p message hello --result
error: Unable to invoke action 'utils/echo': Post https://192.168.33.13/api/v1/namespaces/whisk.system/actions/utils/echo?blocking=true&result=true: x509: cannot validate certificate for 192.168.33.13 because it doesn't contain any IP SANs
Run 'wsk --help' for usage.

参考链接