当前位置: 首页
业界动态
开源AI语音输入法OpenLess 口语自动转结构化文本教程

开源AI语音输入法OpenLess 口语自动转结构化文本教程

热心网友 时间:2026-05-12
转载

在追求效率的今天,语音输入工具正成为许多人的生产力倍增器。然而,市面上主流的解决方案多为闭源订阅制,不仅存在隐私顾虑,其功能也往往局限于简单的语音转文字。今天要探讨的OpenLess,则是一款试图打破这一格局的开源利器。它不止于转录,更致力于将零散的口语,智能地转化为可直接使用的文本,甚至是为大模型量身定制的结构化指令。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

OpenLess是什么

简单来说,OpenLess是一款基于Rust + Tauri + React + TypeScript技术栈构建的、完全开源的跨平台语音输入应用。它支持macOS和Windows系统,其核心体验非常直观:按住一个全局快捷键说话,应用便会自动完成录音、语音识别(ASR)、AI润色等一系列操作,并将最终结果直接插入到你当前光标所在的位置。你可以将它视为Typeless、Wispr Flow、Lazy、Superwhisper等商业订阅制工具的开源替代品。

OpenLess的主要功能

这款工具的功能设计,紧紧围绕着“高效产出优质文本”这一目标展开:

  • 全局语音输入:无论是在ChatGPT、Claude、Cursor、Notion,还是在邮件客户端或聊天软件的输入框里,只需按下全局快捷键,即可开始录音,松开后自动处理并插入文本。
  • AI Prompt 模式:这是其核心差异化功能。它不仅仅是把语音转成文字,更能将零碎、随意的口语自动整理成结构清晰、带有约束条件和上下文的AI Prompt,你可以直接将其喂给ChatGPT、Claude或Cursor使用。
  • 多种输出模式:为了适应不同场景,它提供了「原文」、「轻度润色」、「清晰结构(AI Prompt 模式)」和「正式表达」四种模式供你随时切换。
  • 双模式录音:提供「切换式」和更符合直觉的「按住说话」两种录音方式,在任何阶段按下Esc键都可以取消当前操作。
  • 剪贴板兜底:一个非常实用的细节。如果目标应用阻止直接插入文本,处理结果会自动复制到系统剪贴板,确保你的内容不会丢失。
  • 词典与热词:支持自定义专有名词、产品名、人名等词典。这些词条会作为热词注入到语音识别过程中,并在后续的AI润色阶段进行语义修正,显著提升专有名词的识别准确率。
  • 应用内自动更新:通过Tauri的更新机制,客户端可以自动检查并下载安装新版本,保持体验的持续性。

如何使用OpenLess

上手OpenLess需要一些初始配置,但过程并不复杂:

  • 获取与安装:从GitHub Releases页面下载对应平台的安装包。macOS用户下载.dmg文件拖入/Applications即可;Windows用户则运行下载的.exe安装程序。
  • 权限配置:首次启动时,macOS用户需要依次授予「麦克风」和「辅助功能」权限,记得退出并重新打开应用以使辅助功能权限生效。Windows用户授予麦克风权限后,需在设置中确认全局快捷键监听已激活。
  • 关键设置:在应用设置中,你需要填入两套凭据:一是火山引擎流式ASR服务的APP ID、Access Token和Resource ID;二是用于润色的大模型API凭据,支持Ark、DeepSeek或任何兼容OpenAI格式的API(需要提供API Key、Model ID和Endpoint)。
  • 开始使用:将光标放入任意输入框,按下预设的全局快捷键开始录音。对着麦克风自然说话,OpenLess会实时完成录音与转写。松开按键后,自动进入AI润色阶段,并根据你选择的模式处理文本。
  • 结果交付:润色完成后,文本会自动插入当前光标位置。如果插入失败,则会自动降级复制到剪贴板。在整个流程的任何阶段(录音中、润色中、插入前),按Esc键即可取消任务。
  • 模式切换与词典管理:你可以在主窗口随时切换四种输出模式,以适应从草稿到正式文档的不同需求。在「词典」页面添加专有名词,能大幅提升特定领域词汇的识别和润色准确度。
  • 开发者构建:对于开发者,克隆项目仓库后,进入openless-all/app/目录,依次执行npm ci安装依赖和npm run tauri dev即可进入开发调试模式。

OpenLess的官网地址

  • 官网地址:https://openless.top/
  • Github仓库:https://github.com/appergb/openless

OpenLess的关键信息和使用要求

  • 定位:一款面向macOS和Windows的跨平台开源语音输入工具,旨在对标Typeless、Wispr Flow、Superwhisper等闭源订阅产品。
  • 核心流程:按住全局快捷键说话 → 录音 → ASR转写 → LLM润色 → 自动插入光标位置。其最突出的差异化在于AI Prompt模式,能将口语直接整理为结构化指令。
  • 技术栈:采用Tauri 2(Rust后端)搭配React与TypeScript构建,兼顾性能与现代前端体验。
  • 当前版本:v1.2版本,支持两种录音方式、四种输出模式,拥有中英双语UI,并支持应用内自动更新。
  • 凭据要求:需要用户自行准备火山引擎流式ASR服务以及Ark、DeepSeek或兼容OpenAI的Chat Completions服务的API凭据。
  • 开源协议:采用宽松的MIT License。

OpenLess的核心优势

与同类产品相比,OpenLess在设计和理念上有着鲜明的特点:

  • 完全开源、本地优先:所有代码在GitHub公开,所有数据(如词典、配置)默认存储在本地,不强制绑定任何特定的模型或服务商,给予了用户充分的控制权和透明度。
  • 自带云凭据,隐私可控:用户自行配置ASR和LLM服务,意味着音频和文本数据直接流向用户自己选择的服务商,避免了数据被单一商业产品收集的风险。
  • 专注文本整理,不会“越俎代庖”:其内置的润色模型只负责整理和优化文本结构、语法,不会自作主张地进行问答、任务执行或项目分析,确保了输出结果的可控性和预期性。
  • 中英双语UI:支持简体中文与英文界面切换,首次启动时会根据系统语言自动适配,对中文用户非常友好。

OpenLess的同类竞品对比

为了更清晰地定位OpenLess,我们可以将其与市场上两款主流竞品进行简要对比:

对比维度 OpenLess Typeless Wispr Flow
开源/闭源 完全开源(MIT License) 闭源商业软件 闭源商业软件
支持平台 macOS、Windows Mac、Windows、iOS、Android、Web Mac、Windows、iOS、Android
定价模式 免费 免费版 4,000–8,000 词/周;Pro $30/月 或 $144/年 免费版 2,000 词/周;Pro $15/月 或 $144/年;Teams $12/用户/月
ASR/LLM 处理方式 自备火山引擎流式 ASR + 兼容OpenAI的LLM 云端AI统一处理 云端处理(OpenAI、Meta等)
隐私架构 本地优先,数据存本地,无供应商锁仓 纯云端,音频上传至供应商服务器 纯云端;存在截取活动窗口截图传输至云端的行为(用于上下文感知),引发隐私争议
核心差异化功能 AI Prompt 模式:将口语自动整理为结构化Prompt;自定义词典热词注入;剪贴板兜底插入 跨平台覆盖最广;免费额度在同类中最慷慨 上下文感知格式化:根据应用自动调整语气;Command Mode语音编辑;Whisper Mode
离线能力 否(需联网调用ASR与LLM) 否(纯云端,断网即停止) 否(纯云端,无离线模式)
语言支持 中英双语UI 多语言自动检测 100+ 语言,支持代码切换
录音限制 无明确时长限制 单次录音上限6分钟 未明确公开时长限制

OpenLess的应用场景

那么,这样一款工具具体能在哪些场景中发挥作用呢?

  • 为AI工具生成结构化Prompt:面对AI助手时,无需费力构思Prompt。只需口述一个模糊的需求,OpenLess便能将其整理成带约束、有上下文的详细指令,直接插入对话框使用。
  • 起草邮件、需求文档:快速口述想法,让工具自动去除“嗯”、“啊”等口语填充词,修正标点符号,并重新组织段落逻辑,把随口说的话变成严谨的书面表达。
  • 编写代码注释、PR描述:在编程时,将脑海中的技术思路直接口述出来,转化为规范、简洁的文本,并自动插入到IDE或Git工具的光标处,提升文档效率。
  • 任何“不想打字但必须输出文字”的场景:无论是填写在线表单、撰写社交媒体帖子,还是做会议速记后的整理,只要需要产出文字,按住快捷键说话即可完成。
来源:https://ai-bot.cn/openless/

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
DeepSeek大模型价格全面下调使用成本降低

DeepSeek大模型价格全面下调使用成本降低

大模型普惠的边界,正在被重新定义。 4月26日,DeepSeek官方的一则API价格调整公告,在业内投下了一枚“深水冲击波”。其全系模型的输入缓存命中价格,直接降至首发价的十分之一。其中,面向企业级的DeepSeek-V4-Pro模型,更叠加了限时2 5折优惠,使得百万Tokens的输入缓存命中成本

时间:2026-05-12 08:29
AI技术如何重塑网络电影行业新生态

AI技术如何重塑网络电影行业新生态

2026年春天的网络院线,上演着一场奇特的“同场竞技”。 一边,是3月底刚刚定档的《寻龙诀·觅踪》——这部由张涵予、卢靖姗主演的奇幻大片,斥资近5亿,动员了2000多名工作人员,积压七年才得以面世,每一帧都对应着传统高概念大片的极限投入。另一边,是爱奇艺、优酷即将上线的一批网络电影,它们的制作成本可

时间:2026-05-12 08:29
龙鹰二号国产5nm芯片发布AI算力达200TOPS

龙鹰二号国产5nm芯片发布AI算力达200TOPS

2026年北京国际车展期间,国产高性能车规级芯片领域取得重大突破。芯擎科技正式推出其自主研发的5纳米制程车规级AI座舱芯片——“龙鹰二号”。这款芯片的发布,标志着国产高端车载芯片在先进工艺与跨域融合能力上迈入了全新阶段,为智能汽车核心算力平台的发展树立了重要里程碑。 性能表现是衡量芯片实力的核心标准

时间:2026-05-12 08:29
谷歌拟投资Anthropic 400亿美元加码人工智能竞赛

谷歌拟投资Anthropic 400亿美元加码人工智能竞赛

科技巨头在人工智能领域的战略布局再次迎来关键性升级。据多家权威财经媒体披露,谷歌正计划向知名AI研究公司Anthropic追加高达100亿美元的战略投资,而这笔交易可能仅是长期合作计划的第一步——未来总投资额或将达到300亿美元。此次投资将以Anthropic高达3500亿美元的估值进行,与该公司今

时间:2026-05-12 08:10
OpenAI CEO奥尔特曼发布AGI五大原则 致力于普惠全人类

OpenAI CEO奥尔特曼发布AGI五大原则 致力于普惠全人类

近日,OpenAI首席执行官萨姆・奥尔特曼(Sam Altman)发布了一份关于人工智能未来发展的纲领性声明,系统性地阐述了确保AI技术红利惠及全人类的五项核心原则。这份声明旨在明确AI发展的伦理方向,防止技术权力与成果被少数力量所垄断。 奥尔特曼强调,人工智能的变革潜力是划时代的,其影响力或将超越

时间:2026-05-12 08:10
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程