智谱清言GLM-4-Voice情感语音模型支持情绪表达与共鸣
智谱清言上线GLM-4-Voice端到端情感语音模型,能够理解情感、进行情绪表达并引发共鸣,声音可随语境切换喜怒哀惧,支持实时调速与打断,兼容中英文及多种方言。视频通话功能即将推出,同时升级AutoGLM模拟人类操作手机,模型已开源。
智谱刚刚放出了一枚重磅冲击波——GLM-4-Voice端到端情感语音模型正式上线。简单来说,这个模型不仅能听懂你说什么,还能感知你的情绪,并用相应的情绪回应你。官方给出的关键词是:理解情感、情绪表达、情感共鸣。听起来是不是有点像科幻片里的AI管家?
从功能列表来看,GLM-4-Voice这次确实做了不少功课。首先,它的声音不再是那种冷冰冰的机械音,而是可以根据语境切换喜怒哀惧——高兴时语调上扬,悲伤时低沉舒缓,甚至还能表现出害怕。其次,你可以在同一轮对话中直接让它“说快点”或“说慢点”,它就能实时调整语速。更贴心的是,它支持随时打断,你中途插话或者改变指令,它能立即响应,不需要等它把整段说完。
语言能力方面,GLM-4-Voice支持中英文以及多种中国方言,尤其擅长粤语、重庆话、北京话——这几个方言的难度系数可不低,能搞定说明背后下了不少功夫。另外,视频通话功能也即将上线,到时候模型就能“能看也能说”,结合视觉信息做出更自然的交互。
与此同时,智谱还升级了AutoGLM的phone use能力。你只需要给它一句简单的文字或语音指令,它就能像人一样操作手机——不是通过API调用,而是直接模拟人类点击、滑动、输入。这意味着用户不需要搭建复杂的工作流,它自己就能完成多步骤任务。
最后,GLM-4-Voice已经开源,代码仓库地址如下。对于开发者来说,这无疑是个好消息——端到端多模态模型的完整实现,可以直接拿来做二次开发。
代码仓库:
- https://github.com/THUDM/GLM-4-Voice
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:智谱清言GLM-4-Voice情感语音模型支持情绪表达与共鸣要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点在招聘这个行业中,数据录入的繁琐程度相信大家都有切身体会。每天需要从各类网页、社交平台、招聘站点中搜寻候选人信息,再手动一条条录入系统,既耗时费力又容易出错。今天要介绍的这款Kwal Chrome插件,正是为了彻底解决这一痛点而设计的。什么是 Kwal Chrome 扩展程序 插件?该插件的定位十分
网红经济正在进化——Twinning AI带来的玩法是:粉丝可以直接跟你的人工智能分身聊天,而你,每次互动都能收到真金白银。它集成了专业的声音克隆、文本和语音消息,以及数据分析能力,让粉丝互动变得既有趣又能变&现。 什么是Twinning AI? 简单来说,Twinning AI允许网红创建一个属于
在跨境电商和全球业务快速发展的今天,发票与财务管理工具的重要性日益凸显。AI技术的加入,让这些原本繁琐的流程实现了质的飞跃。Invoicemint 正是这样一款专注全球企业的智能发票与财务管理软件——它不只是一个简单的发票生成器,而是一套覆盖从开票、对账到税务合规、催款的全链路解决方案。 什么是In
想象一下,你随时都能找到一个倾听者——不带任何偏见,不会感到疲惫,而且完全匿名。这听起来像科幻小说里的情节,但现在已经成为现实。MyWhy 就是这样一款 AI 心理治疗应用,它将专业的情感支持装进你的口袋,让心理健康服务不再是奢侈品,而是像打开手机一样触手可及。什么是MyWhy?简单来说,MyWhy
- 日榜
- 周榜
- 月榜
热点快看
