WaaS (JoJo transcription) 的自托管和使用

环境

  • Debian 11 (虚拟机)
    • Docker、Docker Compose
    • 无显卡

参考

步骤

搭建

准备运行环境

# 检查 python 版本,必须为 3.8 - 3.10,我的 Debian 11 自带 3.9,如果小于 3.8 需要自行升级
python3 -V
apt install python3-venv

获取 WaaS 源码

git clone https://github.com/schibsted/WAAS.git

准备 python 虚拟运行环境

cd WAAS
python3 -mvenv .venv
source .venv/bin/activate
pip install -r requirements.txt

新建环境变量

在 WAAS 项目根目录下新建环境变量文件 .envrc,写入以下内容

export BASE_URL=https://[IP or domain] # 如果不使用域名直接填写 IP 即可
export EMAIL_SENDER_ADDRESS=[Email] # 用于发送提取出的 txt/srt/jojo 文件链接
export EMAIL_SENDER_PASSWORD=[password] # 邮箱 SMTP 密码
export EMAIL_SENDER_HOST=smtp.example.com # 邮箱使用的 SMTP 服务地址,QQ 邮箱可以填写 smtp.qq.com

export DISCLAIMER='This is a <a href="[IP or domain]">disclaimer</a>'

启动容器

# 在 WAAS 项目根目录执行
docker-compose --env-file .envrc up

可以编辑 docker-compose.yml 更改监听端口等设置

启动完毕后即可在浏览器访问 IP:3000 开始使用,WAAS 也提供了 API: WAAS#api-documentation

使用

使用 ffmpeg 等工具准备一份 mp3 音频文件(也支持视频文件,视频文件较大所以这里转成音频文件)

点击 Upload File 上传音频文件,选择识别语言

之后会要求设置接收邮箱和使用的模型类型(这里使用 Tiny,每种模型有对应的 VRAM 要求,详情可见 openai/whisper#available-models-and-languages

上传后任务会进入队列,console 会显示当前执行的任务信息

任务完成后会收到包含下载链接的邮件,如果之前没有关闭页面,页面会直接提供下载选项

效果

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据