跳转到内容

快速上手

Terminal window
systemctl --user enable --now vinput-daemon.service
fcitx5 -r

打开 Fcitx5 配置 → 附加组件 → 找到 Vinput → 启用。

打开 Vinput GUI(从应用菜单启动,或在终端运行 vinput-gui)。

进入 资源 → 模型,在可用模型列表中选择需要的模型,点击 下载 安装,然后点击 使用 激活。

vinput-gui 模型管理

也可以用 CLI:

Terminal window
vinput model list -a # 浏览可用模型
vinput model add <模型名> # 下载并安装
vinput model use <模型名> # 设置为当前模型

也可手动将模型目录放到 ~/.local/share/vinput/models/<模型名>/,目录内需包含:

  • vinput-model.json
  • model.int8.onnxmodel.onnx
  • tokens.txt
  • 短按 Alt_R 开始录音,再按一次停止并识别
  • 长按 Alt_R 录音,松开自动识别上屏(push-to-talk)

除了内置的本地模型,还可以安装云端 ASR 提供商,在速度、效果和成本之间灵活选择。

在 Vinput GUI 中进入 资源 → ASR 提供商,浏览可用提供商并点击 安装。或用 CLI:

vinput-gui ASR 提供商管理
Terminal window
vinput provider list -a # 列出可用远程 ASR 提供商
vinput provider add <id> # 从注册源安装
vinput provider use <id> # 切换当前 ASR 提供商

随时按 F8 打开 ASR 提供商 / 模型切换菜单,在运行时自由切换。

当前可用的云端 ASR 提供商:

提供商模式说明
豆包(非流式)非流式豆包语音 / 火山引擎录音文件极速版
ElevenLabs非流式 / 流式ElevenLabs speech-to-text API
阿里百炼非流式 / 流式Qwen3-ASR,OpenAI 兼容 / Realtime API
豆包(流式)流式火山引擎 AI Gateway Doubao ASR Realtime
豆包输入法(流式)流式非官方豆包输入法实时语音识别协议
OpenAI 兼容非流式 / 流式OpenAI /v1/audio/transcriptions 或 Realtime WebSocket
按键默认功能
触发键Alt_R短按切换录音;长按即说即停
命令键Control_R选中文本后按住,语音指令修改选中内容
ASR 菜单键F8打开 ASR 提供商 / 模型切换菜单
场景菜单键Shift_R打开场景切换菜单
翻页Page Up / Page Down候选列表翻页
移动 / 候选列表移动光标
确认Enter确认选中候选
取消Esc关闭菜单
快选19快速选择候选

所有按键均可在 Fcitx5 配置界面中自定义。

文件路径
Fcitx5 插件配置(按键等)~/.config/fcitx5/conf/vinput.conf
核心配置(模型、LLM、场景)~/.config/vinput/config.json
模型目录~/.local/share/vinput/models/
ASR 提供商脚本~/.local/share/vinput/providers/
LLM 适配器脚本~/.local/share/vinput/adapters/

Flatpak 安装下路径不同:

文件路径
Fcitx5 插件配置~/.var/app/org.fcitx.Fcitx5/config/fcitx5/conf/vinput.conf
核心配置~/.var/app/org.fcitx.Fcitx5/config/vinput/config.json
模型目录~/.var/app/org.fcitx.Fcitx5/data/vinput/models/
ASR 提供商脚本~/.var/app/org.fcitx.Fcitx5/data/vinput/providers/
LLM 适配器脚本~/.var/app/org.fcitx.Fcitx5/data/vinput/adapters/