🚀 妙幕 / SmartSub

让每一帧画面都能美妙地表达

妙幕（SmartSub）是一款本地优先的桌面应用，帮你一站式完成「音视频转字幕 → 翻译 → 校对 → 合成」。所有转写都在本地完成，无需上传文件，隐私无忧；支持批量处理与 GPU 加速，可在 Windows / macOS / Linux 上运行。

✨ 3.0 重磅更新

3.0 是一次几乎重写的大版本，核心变化如下：

🧠 多转写引擎：从单一 whisper.cpp 扩展到 6 种可逐任务切换的引擎——内置 whisper.cpp、faster-whisper、FunASR、Qwen3-ASR、FireRedASR、以及本地 Whisper CLI。中文场景可直接选用 FunASR / FireRedASR 等专长模型。
⚡ GPU 加速全面重构：新增 Vulkan 后端，AMD / Intel 显卡也能在 Windows/Linux 上加速（此前仅支持 NVIDIA CUDA）；新增「自动 / 仅 GPU / 仅 CPU」加速模式，自动识别显卡、按需下载加速包、失败自动回退到 CPU。
🎬 视频合成（字幕烧录）：把字幕硬烧进画面，或软封装为可切换字幕轨；所见即所得预览，支持字体、字号、颜色、描边、阴影、九宫格位置与多种预设样式。
📝 字幕校对 + AI 润色：内置校对台，逐句对照视频检查修改，支持撤销/重做与 AI 一键润色。
🌐 17 个翻译服务：覆盖主流机器翻译与大模型 API，并支持 OpenAI 风格自定义接入与逐服务的自定义参数。
🖥️ 全新任务式界面：以「您想做什么？」为起点的启动台，任务、字幕校对、视频合成、引擎与模型、翻译服务分区清晰；内置新手引导、命令面板（⌘K / Ctrl+K）、快捷键与下载/任务活动中心。

💥 功能特性

🧠 字幕生成（转写）

支持多种视频/音频格式批量生成字幕
6 种转写引擎，可针对每个任务单独选择（详见转写引擎）
完全本地处理，无需联网上传，保护隐私的同时拥有更快的速度
支持简繁转换、自定义字幕文件名（方便不同播放器挂载识别）
可选中文字幕去标点，让烧录效果更干净
支持自定义并发任务数量，批量处理更高效

🌐 字幕翻译

对生成的字幕或导入的字幕进行翻译
17 个翻译服务：百度、谷歌、阿里云、火山引擎、豆包、小牛、腾讯、讯飞、DeepLX、Azure、Ollama（本地模型）、DeepSeek、Azure OpenAI、DeerAPI、Gemini、SiliconFlow、通义千问
兼容任意 OpenAI 风格 API，可接入 deepseek / azure 等自有服务
输出内容可选纯译文，或「原文 + 译文」双语字幕
🎯 自定义参数配置：无需改代码，直接在界面为每个 AI 服务配置请求头/请求体参数，并支持导出导入

📝 字幕校对

内置校对台，逐句检查与修改
视频对照预览，定位更准
支持撤销/重做与 AI 一键润色

🎬 视频合成

硬字幕烧录：把字幕永久烧进画面，任何播放器都能显示
软字幕封装：以流复制方式无损嵌入可切换字幕轨
丰富的样式控制：字体、字号、颜色、描边、阴影、九宫格位置，以及多种预设样式
所见即所得实时预览

⚡ 隐私与加速

本地化处理，文件不出本机
GPU 加速：NVIDIA CUDA、AMD/Intel Vulkan、Apple Core ML / Metal（详见 GPU 加速）
内置加速包管理，无需手动安装 CUDA Toolkit

📸 界面一览

视频合成（字幕烧录）	字幕校对

🧩 转写引擎

3.0 把「转写引擎」做成了可逐任务切换的能力，可在「引擎与模型」页面统一管理运行时与模型：

引擎	说明	运行方式
whisper.cpp（内置）	默认引擎，支持 ggml 量化模型与 GPU 加速	随应用内置，开箱即用
faster-whisper	基于 CTranslate2，速度更快，模型按需从 HuggingFace 下载	自包含 Python 运行时（应用内下载）
FunASR	SenseVoice（中/英/日/韩/粤多语）与 Paraformer-zh，中文表现优秀	内置 sherpa-onnx 原生库
Qwen3-ASR	通义千问语音识别（qwen3-asr-0.6b）	内置 sherpa-onnx 原生库
FireRedASR	FireRedASR-AED large（中英），中文表现优秀	内置 sherpa-onnx 原生库
本地 Whisper CLI	调用你自行安装的 whisper 兼容命令	使用系统已装命令

提示：FunASR / Qwen3-ASR / FireRedASR 均通过内置的 sherpa-onnx 原生库运行，无需额外环境；faster-whisper 会在应用内下载一个自包含运行时。

whisper 模型怎么选？

whisper.cpp / faster-whisper 使用的是 whisper 系列模型，模型越大越准、越慢、越吃显存：

低端设备或核显：推荐 tiny / base，速度快、占用小
普通电脑：从 small / base 起步，平衡精度与资源
高性能显卡/工作站：推荐 large 系列，精度最高
纯英文音视频：选带 en 的模型，专为英语优化
在意体积：可用 q5 / q8 量化版本，牺牲少量精度换取更小体积

⚡ GPU 加速

软件内置 GPU 加速包管理，无须手动安装 CUDA Toolkit。安装后进入「设置 → GPU 加速」，软件会自动检测显卡并推荐合适的加速方案。

平台	加速后端	说明
Windows / Linux + NVIDIA	CUDA	支持 CUDA 11.8.0 / 12.2.0 / 12.4.0 / 13.0.2，应用内下载对应加速包
Windows / Linux + AMD / Intel	Vulkan	3.0 新增，应用已内置 Vulkan 加速包
macOS（Apple 芯片）	Core ML / Metal	下载 mac arm64 版本后自动启用
任意平台	CPU	无可用 GPU 时自动回退

加速模式支持「自动 / 仅 GPU / 仅 CPU」，加载失败会自动降级到 CPU，并在诊断面板给出原因
如启用加速后出现闪退，可尝试切换其它版本的加速包，或切换为「仅 CPU」模式

翻译服务

本项目支持百度、火山引擎、阿里云、腾讯、讯飞、小牛、谷歌、DeepLX，以及 Ollama、DeepSeek、Gemini、通义千问、SiliconFlow、Azure OpenAI、DeerAPI 等大模型/聚合平台，共 17 个翻译服务。使用这些服务需要相应的 API 密钥或配置。

对于百度翻译、火山引擎等服务的 API 申请方法，可以参考 https://bobtranslate.com/service/ ，感谢 Bob 这款优秀的软件提供的信息。

对于 AI 翻译，翻译结果受模型和提示词的影响比较大，你可以尝试不同的模型和提示词，找到适合自己的组合。

自定义参数配置

SmartSub 支持为每个 AI 翻译服务配置自定义参数，让你精确控制模型行为：

灵活配置：直接在界面添加和管理自定义参数，无需修改代码
类型支持：String、Float、Boolean、Array、Object、Integer
实时验证：参数修改时实时校验，防止无效配置
导入导出：方便团队共享和备份
自动保存：沿用系统设计，任何修改自动保存

🔦 使用（普通用户）

请根据自己的电脑系统和芯片，选择下载对应安装包。GPU 加速包无须在下载时选择，安装软件后可在应用内下载。

系统	芯片	下载安装包	说明
Windows	x64	windows-x64	NVIDIA 用 CUDA，AMD/Intel 用 Vulkan，应用内下载
Mac	Apple	mac-arm64	自动启用 Core ML / Metal 加速
Mac	Intel	mac-x64	仅 CPU，不支持 GPU 加速
Linux	x64	linux-x64	NVIDIA 用 CUDA，AMD/Intel 用 Vulkan，应用内下载

macOS 用户通过 Homebrew 安装（推荐）

macOS 用户可以通过 Homebrew 快速安装，会自动根据芯片类型（Intel/Apple Silicon）下载对应版本：

# 添加 tap（只需执行一次）
brew tap buxuku/tap

# 安装
brew install --cask smartsub

升级和卸载：

# 升级到最新版本
brew upgrade --cask smartsub

# 卸载
brew uninstall --cask smartsub

手动下载安装

前往 release 页面根据自己的操作系统下载安装包
或者使用网盘夸克选择对应的版本进行下载
安装并运行程序
跟随新手引导，下载一个语音模型
在「翻译服务」中配置所需的翻译服务（可选）
在启动台选择任务，拖入音视频或字幕文件
设置相关参数（源语言、目标语言、引擎、模型等）
开始处理任务

🔦 使用（开发用户）

1️⃣ 克隆本项目在本地

git clone https://github.com/buxuku/SmartSub.git

2️⃣ 在项目中执行 yarn install 或者 npm install

cd SmartSub
yarn install
yarn sherpa:fetch # 下载 sherpa-onnx 原生库

如果是 windows / linux 平台，或者 Mac intel 平台，请前往 https://github.com/buxuku/whisper.cpp/releases/tag/latest 下载对应的 node 文件，并重命名为 addon.node , 覆盖放在 extraResources/addons/ 目录下。

3️⃣ 依赖包安装好之后，执行 yarn dev 或者 npm run dev 启动项目

yarn dev

手动下载和导入模型

因为模型文件比较大，如果通过该软件下载模型会存在难以下载的情况，可以手动下载模型并导入到应用中。以下是两个可用于下载 whisper 模型的链接：

国内镜像源（下载速度较快）： https://hf-mirror.com/ggerganov/whisper.cpp/tree/main
Hugging Face 官方源： https://huggingface.co/ggerganov/whisper.cpp/tree/main

如果是苹果芯片，需要同时下载模型对应的 encoder.mlmodelc 文件，并解压出来放在模型相同目录下。（如果是 q5 或者 q8 系列的模型，无须下载该文件）

下载完成后，您可以通过应用「引擎与模型」页面中的「导入模型」功能将下载的模型文件导入到应用中。或者直接复制到模型目录里面即可。

导入步骤：

在「引擎与模型」页面中，点击「导入模型」按钮。
在弹出的文件选择器中，选择您下载的模型文件。
确认导入后，模型将被添加到您的已安装模型列表中。

FunASR / Qwen3-ASR / FireRedASR 等引擎的模型，可在「引擎与模型」页面内按需下载（支持 ModelScope / GitHub 等多源）。

常见问题

1. 提示应用程序已损坏，无法打开。

在终端中执行以下命令：

sudo xattr -dr com.apple.quarantine /Applications/SmartSub.app

然后再次运行应用程序。

贡献

👏🏻 欢迎提交 Issue 和 Pull Request 来帮助改进这个项目！

支持

⭐ 如果您觉得这个项目对您有帮助，欢迎给我一个 star，或者请我喝一杯咖啡（请备注你的 github 账号）。

👨‍👨‍👦‍👦 如果您有任何使用问题，欢迎加入微信交流群，一起交流学习。

支付宝收款码	微信赞赏码	微信交流群

许可证

本项目采用 MIT 许可证。详情请见 LICENSE 文件。

Name		Name	Last commit message	Last commit date
Latest commit History 278 Commits
.cursor/rules		.cursor/rules
.github/workflows		.github/workflows
.husky		.husky
Changelog		Changelog
assets		assets
docs		docs
extraResources		extraResources
main		main
renderer		renderer
resources		resources
scripts		scripts
types		types
.gitignore		.gitignore
.npmrc		.npmrc
.prettierignore		.prettierignore
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
README_JA.md		README_JA.md
components.json		components.json
dev-app-update.yml		dev-app-update.yml
electron-builder.yml		electron-builder.yml
next-i18next.config.js		next-i18next.config.js
nextron.config.js		nextron.config.js
package-lock.json		package-lock.json
package.json		package.json
prettier.config.cjs		prettier.config.cjs
tsconfig.json		tsconfig.json
tsconfig.tsbuildinfo		tsconfig.tsbuildinfo
yarn.lock		yarn.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🚀 妙幕 / SmartSub

✨ 3.0 重磅更新

💥 功能特性

🧠 字幕生成（转写）

🌐 字幕翻译

📝 字幕校对

🎬 视频合成

⚡ 隐私与加速

📸 界面一览

🧩 转写引擎

whisper 模型怎么选？

⚡ GPU 加速

翻译服务

自定义参数配置

🔦 使用（普通用户）

macOS 用户通过 Homebrew 安装（推荐）

手动下载安装

🔦 使用（开发用户）

手动下载和导入模型

常见问题

1. 提示应用程序已损坏，无法打开。

贡献

支持

许可证

Star History

About

Uh oh!

Releases 56

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🚀 妙幕 / SmartSub

✨ 3.0 重磅更新

💥 功能特性

🧠 字幕生成（转写）

🌐 字幕翻译

📝 字幕校对

🎬 视频合成

⚡ 隐私与加速

📸 界面一览

🧩 转写引擎

whisper 模型怎么选？

⚡ GPU 加速

翻译服务

自定义参数配置

🔦 使用（普通用户）

macOS 用户通过 Homebrew 安装（推荐）

手动下载安装

🔦 使用（开发用户）

手动下载和导入模型

常见问题

1. 提示应用程序已损坏，无法打开。

贡献

支持

许可证

Star History

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 56

Uh oh!

Contributors

Uh oh!

Languages