软件介绍:
可以一键自动识别视频的语音,并生成字幕的小工具!
这是开源的工具,详细使用可没那么简单,你需要先看看官方的文档!
这是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。
适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。
0.2.9 版本将会使用以下接口:
CLI(命令行)版本:https://github.com/wxbool/video-srt
软件帮助文档/使用教程看这个:https://www.yuque.com/viggo-t7cdi/videosrt
线上“字幕生成/字幕翻译”解决方案:字幕酱(付费)
软件截图:
接着就要进行各种配置,在菜单栏里可以找到设置->OSS对象存储设置
和新建->语音引擎、翻译引擎
阿里云OSS
首先注册一个阿里云账号,进入开通OSS服务:https://oss.console.aliyun.com/
在右侧找到创建Bucket
名称随便填(但不能和其他人的Bucket名一样),区域随便选,其他的默认,但读写权限要改成公共读
接着进入你刚刚创建好的Bucket,可以找到EndPoint
和Bucket域名
(即软件配置里的EndPoint
和BucketDomain
),而BucketName
就是你的Bucket名称。
至于AccessKeyId
和AccessKeySecret
,可以在右上角头像->AccessKey管理
中找到。
阿里云语音引擎
登录并开通语音引擎服务:https://nls-portal.console.aliyun.com/
接着在全部项目
中创建项目
,名字随便填
在场景
中勾选非电话、通用和多语言通用->英语
(当然下面也有日语)
发布之后可以在项目名称后面看到appkey
,至于AccessKeyId
和AccessKeySecret
,和上一步的一样。
百度翻译
当然你也可以使用腾讯翻译,只是我觉得百度的效果比较好。
登录百度翻译开放平台:https://fanyi-api.baidu.com/api/trans/product/desktop?req=developer
注册并开通翻译API服务(可以通过实名认证免费升级到高级版)
在开发者信息
中找到APP ID
和密匙
使用
没啥好说的,右上角打开某一视频文件,勾选相应选项,生成字幕
即可
看看效果:
实际使用下来,感觉影响翻译结果最大的因素是音频分隔方式,比如一段完整的话,本地可能会分割成多段上传识别翻译,这就大大影响了准确度。不过拿它当成辅助字幕生成软件还是不错的。
注意
关于费用:
阿里云OSS上传是免费的,存储的话,不超过40G是不收费的,因此一般这一块是不会产生费用的。
阿里云引擎试用版,录音文件识别每个自然日识别时长不超过2小时,免费试用期限为三个月。超过的话,会产生2.5元/h的费用。
百度云翻译,基础版免费,高级版每月前200万字符免费,超出后49元/百万字符。
下载地址:
github:https://github.com/wxbool/video-srt-windows
百度:https://pan.baidu.com/s/1OaRy8ViANxh1Sg47La-Mcg
提取码: vxdv
微云:https://share.weiyun.com/FWSem5uY
还没有评论,来说两句吧...