网站可能被墙,请记住以下域名:subhd.cc subhd.me
【分享】我的字幕方案
gyjian
2025年1月27日 02:44

下载的字幕版本时间轴不一定对得上,下载还要验证码之类太麻烦,某些翻译风格接受不了,所以基本上都是在 NAS 上搞个定时任务,使用 FFMPEG 导出英文字幕,调用翻译接口,做双语字幕

1. 第一个推荐的是网易见外,免费,上传英文字幕,稍等一会儿便能翻出中英文对照字幕,质量不错,能接受。手工操作还是麻烦。
2. 【不推荐】因为网易见外还是需要手工导出字幕,手工上传,手工下载,太麻烦。于是申请了百度翻译API,用代码一条条机翻出中英文双语字幕。自动化程序是可以了,但百度翻译的质量实在是太有限,聊胜于无。试过更换为微软的、谷歌的、DeepLX 的翻译接口,效果提升有限。
3. 现在的方案是AI翻译。自从出了语言大模型,以及四步反思翻译法,AI 翻译几乎能达到 90% 字幕组效果(牛是我吹的)。经验是:每次喂给大模型10个字幕块,然后插到对应的英文位置下面。这里面有插值的问题,例如给了10个字幕块,但因为使用中文表达后,翻译结果返回11个或者9个之类,需要一点算法把中文和英文的位置对应起来。

免费的AI接口推荐
1. 使用 google 的 gemini flash,接口的免费额度对于一般人的观影量肯定够用,不够用的多申请个 google 账号即可,翻译速度快(10个字幕块平均一次调用 5 秒),效果足够好,但要解决网络访问问题。
2. 另外一个免费的智谱 glm4 flash,免费管够,效果见仁见智。单个接口调用速度有点慢(10个字幕块平均一次调用 12 秒),但智谱对免费用户也只要求限制并发200路以下,每天调用次数不限制,通过代码同一个token就可以用多线程10个甚至100个并发一起翻译,整体速度非常可观

最近发现大模型降智了,gemini 2.0 flash 会在中文输出中夹着俄语,回退1.5就没问题。智谱glm4 flash更是不按要求格式输出,漏格式标签,要专门适配。

另外,使用带推理的AI(deepseek r1, 阿里的 QwQ 等)翻译,提示语就一句话,神奇。见:https://baoyu.io/blog/llm-translation-better-idiom
示例
请尊重原意,保持原有格式不变,用简体中文重写下面的内容:If she only knew...knew what you did to me.Stole me into your life.Disfigured me so that I would fit.Or maybe it's me who did that to you.It's so fucking hard to remember.Can I be here when you tell her?Or maybe I should just tell her myself.(yelps)(sighs)



发表留言 共 15 条

fpakui
找到个自动执行翻译的在线网站 gptsubtitler.com, 像是国外的,可以自由选择模型,自动执行翻译无需人工干预,免费版有时断开续不上。 包月是36/月,支持WX和ZFB付款,轻度体验感觉不戳,有兴趣的可以试试。
2025-4-12 14:30
fpakui
@gyjian:嗯,我是尝试了下,不过全自动还是比手动截取、合并修正强些。
2025-4-12 19:59
gyjian
付费是不可能的,哈哈哈 手工党用免费的网易见外就可以了。写代码国内有那么多免费的接口,练练手是非常不错的
2025-4-12 18:31

S
shangchiu
今天使用deepseek网页版v3,体验如下: 服务器一直繁忙,上传英文字幕要好久,导入英文字幕,翻译是一句一句出来,效率太慢,而且只给了前面一小段翻译还有漏译,后面就没有继续翻译,翻译的内容要复制粘贴到记事本,不能一键导出,不知道用API是不是也是这样
2025-3-31 17:46
gyjian
deepseek官方一直都很忙,所以大家都推荐使用第三方提供的 deepseek 服务,百度腾讯阿里都有。 用接口当然就不会是整个字幕文件上传让它翻译,做法在这个网页提到的所有链接
2025-3-31 19:01

gyjian
这些文章都值得一看: https://baoyu.io/blog/llm-translation-better-idiom https://baoyu.io/blog/prompt-engineering/translator-gpt-prompt-v2-1-improvement
2025-3-28 09:39

竹叶山人
不错的作法。
2025-3-9 17:28

Allion
请问你是把gemini接入到哪里用的?看到你回复中的fastgpt工作流貌似不支持调用自己的API
2025-2-17 14:29
gyjian
@Subscribe:要让你失望了,不打算开源,代码太乱,每天都在改
2025-2-24 17:28
S
Subscribe
@gyjian:楼主愿意分享一下代码仓库吗(想参考着写写)
2025-2-22 16:36
gyjian
只参考fastgpt提供的思路和提示词。自己写代码实现,没有使用工作流。
2025-2-17 15:16

Dex7er
2025-1-31 12:06

S
Subscribe
给楼主赞一个~顺便问一下Gemini接口的免费额度和速率大概有多少啊,还有就是用四步反思翻译法的prompt提示词会不会太长消耗额度过快?(或者楼主有好的提示词能分享一下吗)
2025-1-27 12:57
gyjian
@gyjian:提示词应该是这个页面,拉到最下面 https://doc.tryfastgpt.ai/docs/use-cases/app-cases/multi_turn_translation_bot/ # Role: 资深翻译专家 ## Background: 你是一位经验丰富的翻译专家,精通{{source_lang}}和{{target_lang}}互译,尤其擅长将{{source_lang}}文章译成流畅易懂的{{target_lang}}。你曾多次带领团队完成大型翻译项目,译文广受好评。 ## Attention: - 翻译过程中要始终坚持"信、达、雅"的原则,但"达"尤为重要 - 译文要符合{{target_lang}}的表达习惯,通俗易懂,连贯流畅 - 避免使用过于文绉绉的表达和晦涩难懂的典故引用 ## Constraints: - 必须严格遵循四轮翻译流程:直译、意译、校审、定稿 - 译文要忠实原文,准确无误,不能遗漏或曲解原意 ## Goals: - 通过四轮翻译流程,将{{source_lang}}原文译成高质量的{{target_lang}}译文 - 译文要准确传达原文意思,语言表达力求浅显易懂,朗朗上口 - 适度使用一些熟语俗语、流行网络用语等,增强译文的亲和力 - 在直译的基础上,提供至少2个不同风格的意译版本供选择 ## Skills: - 精通{{source_lang}} {{target_lang}}两种语言,具有扎实的语言功底和丰富的翻译经验 - 擅长将{{source_lang}}表达习惯转换为地道自然的{{target_lang}} - 对当代{{target_lang}}语言的发展变化有敏锐洞察,善于把握语言流行趋势 ## Workflow: 1. 第一轮直译:逐字逐句忠实原文,不遗漏任何信息 2. 第二轮意译:在直译的基础上用通俗流畅的{{target_lang}}意译原文,至少提供2个不同风格的版本 3. 第三轮校审:仔细审视译文,消除偏差和欠缺,使译文更加地道易懂 4. 第四轮定稿:择优选取,反复修改润色,最终定稿出一个简洁畅达、符合大众阅读习惯的译文 ## OutputFormat: - 只需要输出第四轮定稿的回答 ## Suggestions: - 直译时力求忠实原文,但不要过于拘泥逐字逐句 - 意译时在准确表达原意的基础上,用最朴实无华的{{target_lang}}来表达 - 校审环节重点关注译文是否符合{{target_lang}}表达习惯,是否通俗易懂 - 定稿时适度采用一些熟语谚语、网络流行语等,使译文更接地气- 善于利用{{target_lang}}的灵活性,用不同的表述方式展现同一内容,提高译文的可读性
2025-2-6 03:54
gyjian
gemini 1.5 flash 的免费额度: 15 RPM(每分钟请求数) 100 万个 TPM(每分钟令牌数) 1500 RPD(每日请求数) 我自己写的代码,翻译一部45分钟左右剧集,大概用 15万左右的token 提示词可以参考这个:https://doc.tryfastgpt.ai/docs/use-cases/app-cases/translate-subtitle-using-gpt/
2025-2-6 03:47

最新评论
SubHD 0.019