语音识别服务Html5客户端访问界面

服务端部署采用websocket协议，客户端可以支持html5网页访问，支持麦克风输入与文件输入，可以通过如下2种方式访问：

方式一：

html客户端直连，手动下载客户端（点击此处）至本地，打开index.html网页，输入wss地址与端口号
方式二：

html5服务端，自动下载客户端至本地，支持手机等端上访问

语音识别服务启动

支持python版本与c++版本服务部署，其中

python版本

直接部署python pipeline，支持流式实时语音识别模型，离线语音识别模型，流式离线一体化纠错模型，输出带标点文字。单个server，支持单个client。
c++版本

funasr-runtime-sdk，支持一键部署，0.1.0版本，支持离线文件转写。单个server，支持上百路client请求。

python版本服务启动

安装依赖环境

pip3 install -U modelscope funasr flask
# 中国大陆用户，如果遇到网络问题，可以通过下面指令安装：
# pip3 install -U modelscope funasr -i https://mirror.sjtu.edu.cn/pypi/web/simple
git clone https://github.com/alibaba/FunASR.git && cd FunASR

启动ASR服务

wss方式

cd funasr/runtime/python/websocket
python funasr_wss_server.py --port 10095

详细参数配置与解析（点击此处）

html5服务（可选）

如果需要使用上面所说的客户端方式二，进行访问，可以启动html5服务

h5Server.py [-h] [--host HOST] [--port PORT] [--certfile CERTFILE] [--keyfile KEYFILE]

例子如下，需要注意ip地址，如果从其他设备访问需求（例如手机端），需要将ip地址设为真实公网ip

cd funasr/runtime/html5
python h5Server.py --host 0.0.0.0 --port 1337

启动后，在浏览器中输入（https://127.0.0.1:1337/static/index.html）即可访问

c++ 版本服务启动

由于c++依赖环境较多，建议采用docker部署，支持一键启动服务

curl -O https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/shell/funasr-runtime-deploy-offline-cpu-zh.sh;
sudo bash funasr-runtime-deploy-offline-cpu-zh.sh install --workspace /root/funasr-runtime-resources

详细参数配置与解析（点击此处）

客户端测试

方式一

html客户端直连，手动下载客户端（点击此处）至本地，打开index.html网页，输入wss地址与端口号即可使用

方式二

html5服务端，自动下载客户端至本地，支持手机等端上访问，ip地址需要与html5 server保持一致，如果是本地机器，可以用127.0.0.1

https://127.0.0.1:1337/static/index.html

输入wss地址与端口号即可使用

Acknowledge

This project is maintained by FunASR community.
We acknowledge AiHealthx for contributing the html5 demo.

3.4 KiB Raw Blame History Unescape Escape