京东数科AI虚拟数字人应用于招募客服等多场景
最近,京东数科在产业AI公开课上首次展示了自主研发的AI虚拟数字人——“AI主播”,这也是该产品的首次公开亮相。该技术方案融合2D与3D技术,结合传统方法与深度学习,仅需几分钟的人物视频素材,经过数小时训练即可生成写实风格的AI虚拟数字人。为实现文字到语音的流畅转换,京东数科自主研发了轻量级对抗语音
最近,京东数科在产业AI公开课上首次展示了自主研发的AI虚拟数字人——“AI主播”,这也是该产品的首次公开亮相。该技术方案融合2D与3D技术,结合传统方法与深度学习,仅需几分钟的人物视频素材,经过数小时训练即可生成写实风格的AI虚拟数字人。

为实现文字到语音的流畅转换,京东数科自主研发了轻量级对抗语音合成技术。该技术利用深度神经网络对多人数据进行个性化建模,从而生成丰富多样的音色与鲜明风格,甚至能够模拟人的呼吸与停顿,听感与真人相差无几。更值得注意的是,该对抗神经网络效率极高,合成1秒音频仅需0.07秒,时延仅为行业平均水平的1/3,足以支持多种场景下的实时语音合成需求。
在语音驱动视频生成环节,为让AI主播形象更加逼真,京东数科AI实验室采用对抗生成网络还原真实表情,并借助3D模型运动追踪技术确保口型准确、表情细腻、头部运动自然。为实现完美口型匹配,团队使用大量语音数据进行训练,并专门设计了鲁棒的语音特征——无论语音的音色、语言或语速如何变化,均能保持准确且连贯的口型同步。
最终,京东数科成功开发出高度还原真人形象的AI虚拟数字人“小妮”。在AI算法驱动下,只需输入文本内容,“小妮”即可根据语义实时主持,其表情、动作和语音表达均自然逼真,宛如真人。
京东数科AI实验室首席科学家薄列峰对此表示:“AI主播小妮的推出,是京东数科在多模态AI技术领域一次成功的落地应用。除了在客服、招聘等场景的应用外,我们将进一步服务内容创作者,借助AI虚拟数字人技术,将静态图文内容转化为由‘真人’讲解的短视频,满足用户对多样化呈现形式的需求,从而增强用户黏性和社区活跃度。”
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:京东数科AI虚拟数字人应用于招募客服等多场景要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点与AI高效协作这件事,最近有个挺有意思的切入点——谷歌和瑞士邮政旗下的Digitalidag联合办了一场提示词比赛,让选手们编写指令,比如让AI制定一份详细的学习计划。亚军得主Joakim Jardenberg赛后接受了专访,分享了不少实操心得。下面这几个核心判断,值得每一位与AI共事的人反复琢磨。
物联网已成为继智能手机热潮之后,半导体芯片领域最大的应用增长引擎。根据IDC的市场分析报告,中国物联网市场规模增长潜力巨大,预计2022年将超越美国,成为全球最大的物联网市场,占据世界物联网总规模的四分之一以上。按照这一趋势推算,到2025年中国物联网市场规模至少将达到3918亿美元。物联网的核心应
在生成式AI技术迅猛发展的背景下,Dify作为一款面向开发者的开源大语言模型应用开发平台,正在深刻改变AI应用的构建方式。它诞生于2023年前后,核心目标非常明确:通过低代码化与模块化设计,使开发者无需从零搭建复杂架构,即可快速部署生产级AI应用。随着大语言模型(LLM)技术的普及,Dify逐渐成为
这次咱们来拆解一个实际项目:如何基于 TypeScript 构建一个完整的 MCP 服务器。别担心,整个过程会一步步拆开揉碎了讲,从环境搭建到代码实现,再到集成 Claude Desktop 进行测试,一条龙说清楚。 为了不让这个教程显得太干,我们会用一个非常接地气的场景——**天气查询服务**——
- 日榜
- 周榜
- 月榜
热点快看
