Options tutorial series is live — start here

macOS · v1.0

Aloud

菜单栏语音输入。Fn 按一下开始说话,再按一下停,识别后的文字直接注入当前聚焦的输入框。识别后端是火山豆包流式 ASR,能听懂中英混和技术词,可选一层 LLM 只修明显口误、不改写。

Aloud 浮窗把识别文字实时输入到邮件撰写窗口
按 Fn 说话,文字实时落进当前输入框
Fn 切换

按一下 Fn 开始录音,再按一下停。90 秒硬上限兜底,松手即出字。

实时上字

胶囊浮窗逐字上字——说话的同时就看到识别结果,不用等录完才知道有没有听对。带实时波形,停后注入并恢复原剪贴板。

中英混识

火山豆包流式 ASR 2.0,自动中英混识,技术术语识别比系统听写准。

LLM 纠错

可选一层豆包 seed-lite,只修明显语音误识别,不润色、不改写。可关。

本地

凭证存本机,触发纯本地,识别直连火山,不经任何第三方中转。

系统要求

  • macOS 14 Sonoma 及以上
  • Apple Silicon(M 系列)
  • 火山引擎账号 — 自行开通豆包流式语音识别,AppID / Access Token 填入 App 设置
  • 麦克风 + 辅助功能权限(监听 Fn 键、注入文字必需)

当前版本未签名也未公证。首次打开 macOS 可能提示「已损坏」——这是 Gatekeeper 拦截未签名的网络下载,不是真的损坏。把 Aloud 拖进「应用程序」,在终端运行 xattr -dr com.apple.quarantine /Applications/Aloud.app 后正常打开即可。这是自用早期工具,无 CI、无代码签名、无自动更新。