深海游弋的鱼 – 第 115 页 – 智障儿童欢乐多

语音识别商用开源代码与免费开放平台最全盘点分析

声学在线前几日盘点了语音识别业界相关的公司和技术，引起了众多朋友的关注。不少朋友都在咨询声学在线关于技术细节问题，因此，我们打算春节期间连续发布几篇深度文章，希望从语音识别领域的公司、技术、算法和专利的层面解读出语音识别的产生、发展、应用与瓶颈，以此提供给相关行业的朋友们作为参考。

目前朋友们最关心的就是当前有哪些语音识别开放平台，显然大家更担心被某个平台所绑架。为了促进语音识别的行业发展，我们更深入一步，不仅盘点当前的商业开放平台，也把这个领域的开源代码详细盘点一番，让更多的朋友了解这个行业。

语音识别领域的商用开源代码盘点

语音识别是一门交叉学科，其所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。但是随着深度学习技术的发展，云端的语音识别更多的偏向于计算机技术。显然，从事计算机技术研究的人员更加众多，这也是语音识别的快速发展的基础，因而也形成了语音识别的开源代码要比开放平台更多的现象。

提到语音识别的开源代码，首先就要提到三个非常著名的开源平台，即Kaldi、CMU Sphinx和Julius。笔者大概按其重要性做了以下排名，Sphinx、HTK之类曾经很红火，但是确实也有点太老了。而Kaldi是Apache licence，完全可以商用，美国和中国很多公司都是直接修改Kaldi生成的语音识别引擎。另外，很多巨头公司内部研究部门也是在用Kaldi做研发，关于这些欢迎留言讨论。

继续阅读语音识别商用开源代码与免费开放平台最全盘点分析

Ubuntu 16.04.3/14.04.5系统上修改Docker镜像的存储路径

最近在Ubuntu 16.04.3/14.04.5系统上使用Docker结果由于默认的镜像存储路径在系统分区上，而系统分区又不足够大，导致整个系统都不能正常工作了。

因此我们需要把Docker的镜像存储目录移动到数据分区。

执行如下命令查询默认的存储路径

$ sudo docker info | grep "Docker Root Dir"

1	$ sudo docker info \| grep "Docker Root Dir"

我们看到如下输出

Docker Root Dir: /var/lib/docker

1	Docker Root Dir: /var/lib/docker

比较简单的方法是通过软链接的方式来实现,具体命令如下：

$ sudo service docker stop

#我的系统是用户分区足够大
$ sudo mv /var/lib/docker ~/.docker

$ sudo ln -s ~/.docker /var/lib/docker

$ sudo service docker start

$ sudo service docker stop

#我的系统是用户分区足够大

$ sudo mv /var/lib/docker ~/.docker

$ sudo ln -s ~/.docker /var/lib/docker

$ sudo service docker start

参考链接

Ubuntu 14.04系统上安装部署OpenWhisk(本地CouchDB版本)

1.安装配置CouchDB

$ sudo apt-get install -V couchdb

1	$ sudo apt-get install -V couchdb

校验CouchDB是否工作正常

$ curl –k http://127.0.0.1:5984

1	$ curl –k http://127.0.0.1:5984

看到如下输出即可

{"couchdb":"Welcome","uuid":"87586fee02b1149fa06dda7148450d4a","version":"1.5.0","vendor":{"name":"Ubuntu","version":"14.04"}}

1	{"couchdb":"Welcome","uuid":"87586fee02b1149fa06dda7148450d4a","version":"1.5.0","vendor":{"name":"Ubuntu","version":"14.04"}}

2.编译配置OpenWhisk

下载OpenWhisk的源代码

$ sudo apt-get install git

$ cd  ~

$ git clone https://github.com/apache/incubator-openwhisk.git

$ sudo apt-get install git

$ cd ~

$ git clone https://github.com/apache/incubator-openwhisk.git

配置OpenWhisk编译需要的环境

$ cd incubator-openwhisk

# Install all required software
$ cd tools/ubuntu-setup

$ sudo ./all.sh

$ cd incubator-openwhisk

# Install all required software

$ cd tools/ubuntu-setup

$ sudo ./all.sh

执行编译

#返会代码根目录
$ cd ../..

$ sudo ./gradlew distDocker

#返会代码根目录

$ cd ../..

$ sudo ./gradlew distDocker

3.发布并运行OpenWhisk服务

配置运行环境

$ cd ~

$ cd incubator-openwhisk

$ cd ansible

#只在第一次初始化数据库的时候执行这句话
$ sudo ansible-playbook -i environments/local/ setup.yml

$ sudo ansible-playbook -i environments/local/ openwhisk.yml

$ cd ~

$ cd incubator-openwhisk

$ cd ansible

#只在第一次初始化数据库的时候执行这句话

$ sudo ansible-playbook -i environments/local/ setup.yml

$ sudo ansible-playbook -i environments/local/ openwhisk.yml

安装必备软件

#系统自带的版本太低，但是还是需要安装一下，用来解决依赖问题
$ cd ~
$ sudo apt-get install vagrant

$ wget https://releases.hashicorp.com/vagrant/1.9.7/vagrant_1.9.7_x86_64.deb

$ sudo dpkg -i vagrant*.deb

$ sudo apt-get install virtualbox

#系统自带的版本太低，但是还是需要安装一下，用来解决依赖问题

$ cd ~

$ sudo apt-get install vagrant

$ wget https://releases.hashicorp.com/vagrant/1.9.7/vagrant_1.9.7_x86_64.deb

$ sudo dpkg -i vagrant*.deb

$ sudo apt-get install virtualbox

运行测试Demo

$ cd ~/incubator-openwhisk/tools/vagrant

$ ./hello

$ cd ~/incubator-openwhisk/tools/vagrant

$ ./hello

如过想查看刚刚通过vagrant部署完成的镜像系统里面的内容，则执行如下命令:

$ cd ~/incubator-openwhisk/tools/vagrant

$ sudo vagrant ssh

$ cd ~/incubator-openwhisk/tools/vagrant

$ sudo vagrant ssh

如果成功部署了OpenWhisk，那么可以在Docker机器中执行如下代码验证是否可以正常调用

$ cd ~/incubator-openwhisk/tools/vagrant

$ sudo vagrant ssh

$ wsk action invoke /whisk.system/utils/echo -p message hello --result
#输出结果
{
    "message": "hello"
}

$ wsk package list /whisk.system
#输出结果
packages
/whisk.system/watson-textToSpeech                                      shared
/whisk.system/weather                                                  shared
/whisk.system/watson-translator                                        shared
/whisk.system/combinators                                              shared
/whisk.system/samples                                                  shared
/whisk.system/github                                                   shared
/whisk.system/utils                                                    shared
/whisk.system/websocket                                                shared
/whisk.system/slack                                                    shared
/whisk.system/watson-speechToText                                      shared

$ cd ~/incubator-openwhisk/tools/vagrant

$ sudo vagrant ssh

$ wsk action invoke /whisk.system/utils/echo -p message hello --result

#输出结果

{

"message": "hello"

}

$ wsk package list /whisk.system

#输出结果

packages

/whisk.system/watson-textToSpeech shared

/whisk.system/weather shared

/whisk.system/watson-translator shared

/whisk.system/combinators shared

/whisk.system/samples shared

/whisk.system/github shared

/whisk.system/utils shared

/whisk.system/websocket shared

/whisk.system/slack shared

/whisk.system/watson-speechToText shared

外部的机器访问则执行如下命令来验证

$ cd ~/incubator-openwhisk/bin/

#注意参数 -i  --apihost 里指定的地址在部署镜像的时候vagrant脚本中指定的
$ ./wsk -i property set --apihost 192.168.33.13 --namespace guest --auth `cat ~/incubator-openwhisk/ansible/files/auth.guest`

$ ./wsk -i action invoke /whisk.system/utils/echo -p message hello --result
#输出结果 
{ 
"message": "hello" 
}

$ cd ~/incubator-openwhisk/bin/

#注意参数 -i --apihost 里指定的地址在部署镜像的时候vagrant脚本中指定的

$ ./wsk -i property set --apihost 192.168.33.13 --namespace guest --auth `cat ~/incubator-openwhisk/ansible/files/auth.guest`

$ ./wsk -i action invoke /whisk.system/utils/echo -p message hello --result

#输出结果

{

"message": "hello"

}

4.遇到的问题

最大的问题是在编译发布的过程中系统分区被消耗干净，导致编译发布失败。
解决方法如下
1.参照Ubuntu 16.04系统上修改Docker镜像的存储路径介绍的方法调整Docker镜像的存储路径到合适的分区
2.如果使用sudo的方式执行，那么可能会在/root目录下生成虚拟机的镜像文件，同样导致系统分区被消耗，解决方法也是通过软链接的方式把/root目录链接到合适的分区目录

如过执行中遇到如下错误，则增加-i参数即可

$ ./wsk action invoke /whisk.system/utils/echo -p message hello --result
error: Unable to invoke action 'utils/echo': Post https://192.168.33.13/api/v1/namespaces/whisk.system/actions/utils/echo?blocking=true&result=true: x509: cannot validate certificate for 192.168.33.13 because it doesn't contain any IP SANs
Run 'wsk --help' for usage.

$ ./wsk action invoke /whisk.system/utils/echo -p message hello --result

error: Unable to invoke action 'utils/echo': Post https://192.168.33.13/api/v1/namespaces/whisk.system/actions/utils/echo?blocking=true&result=true: x509: cannot validate certificate for 192.168.33.13 because it doesn't contain any IP SANs

Run 'wsk --help' for usage.

参考链接

Ubuntu分析磁盘使用情况

Ubuntu系统上，由于某些原因导致磁盘空间不足，需要分析一下磁盘使用情况，看看是哪个目录或者应用占据了磁盘。

Ubuntu系统默认自带的磁盘分析工具是baobab，如果没有自动安装，可以执行如下命令来手动安装：

$ sudo apt-get install baobab

1	$ sudo apt-get install baobab

这个工具的问题在于，如果直接点击启动，会由于权限问题，无法完整的分析磁盘。

因此，需要在命令行下面用root权限去执行:

$ sudo baobab

1	$ sudo baobab

参考链接

获得ubuntu的版本与Codename

有时我们需要获取ubuntu系统的版本信息，尤其是Codename部分，某些包安装的时候会根据Codename来区分。

打印ubuntu系统的版本信息的命令如下：

$ lsb_release -a

1	$ lsb_release -a

命令输出的结果如下：

No LSB modules are available.
Distributor ID:	Ubuntu
Description:	Ubuntu 16.04.2 LTS
Release:	16.04
Codename:	xenial

No LSB modules are available.

Distributor ID: Ubuntu

Description: Ubuntu 16.04.2 LTS

Release: 16.04

Codename: xenial

提取Codename部分的字段的命令如下：

$ lsb_release -a 2>&1| grep Codename | awk '{print $2}'

1	$ lsb_release -a 2>&1\| grep Codename \| awk '{print $2}'

平台定位

AWS IoT是一款托管的云平台，使互联设备可以轻松安全地与云应用程序及其他设备交互。
AWS IoT可支持数十亿台设备和数万亿条消息，并且可以对这些消息进行处理并将其安全可靠地路由至 AWS 终端节点和其他设备。应用程序可以随时跟踪所有设备并与其通信，即使这些设备未处于连接状态也不例外。
使用AWS Lambda、Amazon Kinesis、Amazon S3、Amazon Machine Learning、Amazon DynamoDB、Amazon CloudWatch、AWS CloudTrail 和内置 Kibana 集成的 Amazon Elasticsearch Service 等AWS服务来构建IoT应用程序，以便收集、处理和分析互连设备生成的数据并对其执行操作，且无需管理任何基础设施。

继续阅读亚马逊AWS IoT

Ubuntu 16.04上查看dd命令的进度信息

在Ubuntu 16.04系统上执行如下命令

$ dd if=/dev/zero of=/tmp/zero.img bs=10M count=100000

1	$ dd if=/dev/zero of=/tmp/zero.img bs=10M count=100000

的时候，可能会非常耗时，这个时候，如果让dd命令输出执行进度信息，会非常有用。

重新打开一个Shell，然后执行如下命令即可每秒输出一次进度信息

$ watch -n 1 pkill -USR1 -x dd

1	$ watch -n 1 pkill -USR1 -x dd

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

默默的点滴

语音识别商用开源代码与免费开放平台最全盘点分析

Ubuntu 16.04.3/14.04.5系统上修改Docker镜像的存储路径

参考链接

Ubuntu 14.04系统上安装部署OpenWhisk(本地CouchDB版本)

1.安装配置CouchDB

2.编译配置OpenWhisk

3.发布并运行OpenWhisk服务

4.遇到的问题

参考链接

Ubuntu分析磁盘使用情况

参考链接

获得ubuntu的版本与Codename

LTEye: LTE Radio Analytics Made Easy and Accessible

SpotFi: Decimeter Level Localization Using WiFi

树莓派各版本发布时间和差异对照

亚马逊AWS IoT

平台定位

Ubuntu 16.04上查看dd命令的进度信息

参考链接