登录|注册
论坛 > 若闲小阁
发帖|看图模式| 收藏 |打赏
看2007|回2|收藏|打赏
1# 867258173 只看他
2025-10-8 23:55:36 No. 76692956
本帖最后由 867258173 于 2025-10-9 00:32 编辑

1.★★★★望言OCR★★★
MP4,AVI等内嵌硬字幕的神器
最快速度,几分钟把24分的视频生成SRT/ASS/TXT字幕, 可以自动识别字幕框,也可以一键像截图选择区域,双语都支持

专业版  每次新注册账号7天免费用,之后收费,识别率高
模型如下
PaddleOCR
PaddleOCR V5
忘言
忘言V2 这个内嵌视频空格也能识别出来,专业版用,但是注册账号有1周免费可用,过了后想再用收费

免费版
免费版能一直用,但是空格无法输出,需要后期校对
模型如下
PaddleOCR
忘言

Github
https://github.com/nhjydywd/SubtitleOCR

使用说明:
https://www.bilibili.com/video/BV1FUAHehEns/



2.★★★★★★★没有硬字幕版本,远古老番,小特典,CV声优对话可以用可以用这个★★★★★★
使用之前,先了解下缺点再决定是否用
1. 歌曲识别较差,有时OP能使用,有时ED就不识别…看运气
2. 对于音频特别小的支持率差, 无论音频还是视频100%识别失败
3. 对于同时对话,背景音识别率差
4. 时轴会略慢 <1秒左右
5. 重复翻译较多,如果有空白时时轴会一直保留有语音时
6.不要指望识别率能达到100%,不如说能达到1集能准确识别出95-98%就已经不错了 (运气好的情况下,视频音频码率不能低,越高越好)
7.以上情况都没碰到,正好识别出全部对话日文的话, 恭喜你中奖了,可以用AI翻译一键导出字幕了,再校对下就可以收藏用了

前提: 至少本人觉得不错了,whisper模型识别率, AI的进步已经比起以前语音识别生成文本强多了, 至少能一键用了,至于最后能否生成全对话字幕, 就是抽奖了,毕竟没生成完日文字幕,谁也不知道全不全, 正如「薛定谔的猫」,能否抽中, 这也是乐趣之一


① 音视频转文字字幕小工具V1.2,解压纯英文路径一键选择视频目录识别生成选中输出SRT字幕
自带whisper-large-V2和whisper-large-V3模型

使用说明:
https://www.bilibili.com/video/BV1d34y1F7qA/

PS: 不支持MKV格式,只支持MP4,AVI等格式, 可以选择中文一键翻译.也可以输出日文字幕, 根据② 后期用AiNiee搭配AI翻译

② WhisperDesktop音视频转换日文字幕 + AiNiee搭配AI本地Sakura模型不限制额度 或搭配在线AI的API额度翻译,支持自定义AI的接口和Token
多视频可以用批量那个exe,使用说明我也写在txt了

CPU: buff音视频转换日文字幕 + AiNiee翻译

PS: 若用本地Sakura翻译,将「sakura-launcher-cuda12-b2859」解压后,把模型放在解压根目录
双击「启动Sakura服务器-显卡.bat」
再启动AiNiee才能本地Sakura翻译

PS: AiNiee只支持SRT翻译,所以如果用望言OCR一键生成导出字幕,记得选SRT格式,不支持ASS格式翻译

通过网盘分享的文件:♥硬字幕视频OCR一键提取SRT字幕+音视频转换字幕+AI模型翻译♥
链接: https://pan.baidu.com/s/1p2Z-vYj0aBNooOMfXbJKHA?pwd=ANIM 提取码: ANIM


本人3060Ti显卡亲测以上皆可用, 更高的40系显卡理论更无压力

Whisper和Sakura翻译是需要显卡高速运转生成翻译,前者4-5分1个24分视频生成字幕,后者可能更花时间,这个是每次有多少字幕任务处理完才生成全部SRT字幕翻译,之前翻译35集字幕用了1小时左右







2# kavin 只看他
2025-10-9 02:09:51 No. 76693804
干货教学贴必须支持!留个言标记,慢慢学习!
3# Sakura_9900 只看他
2025-10-11 16:14:40 No. 76711979
望言真的很吃设备了,我的八年前的小破本,每次开望言,GPU都飚到95%,很伤……
第二个软件,如果就是基于whisper的话,感觉用SE其实也效果应该也一样吧?但不管哪个软件,音译都做不到100%准确,自己不懂日文的话,搞双语字幕还是蛮麻烦的

天使动漫论坛|手机版错误报错

字幕组★|手机客户端

Powered by Discuz! TSDM SP

首页|标准版|精简版|电脑版

Processed in 0.058397 second(s), 15 queries .