一周AI大事件速览:5分钟掌握最新动态

体验完Vidu划时代的新功能,我觉得可以正式抛弃3D渲染了
最近在社交媒体上,一款2D动漫风格的AI生成视频引起了广泛关注,其表现力让人印象深刻。这也引出了本周AI领域的一系列重要更新,从全民级应用到专业工具,进展频频。
微信公众平台:AI音色克隆功能灰度测试
11月18日,微信公众平台悄然上线了一项AI音色克隆功能。该功能旨在模仿公众号作者的音色,为读者提供更具个人特色的文章朗读体验。
这实际上是“听全文”功能的升级。此前,该功能一直使用通用的机械男声。目前,新功能仍处于灰度测试阶段,仅对部分公众号开放。
用户可尝试更新“订阅号助手”APP至2.29.1版本,在设置中查看是否出现“朗读音色”选项。若未出现,则表明暂未获得测试资格。因此,当前点击文章内的“听全文”,听到的仍是标准机械音。
在各大平台AI功能激烈竞争的背景下,微信的步调显得尤为谨慎。正如行业观察者所言,微信作为国民级应用,其AI功能的每一次普及,都意味着技术更深一步地融入普通人的日常生活,其带来的影响将是广泛而深远的。
Suno:V4模型发布,音质显著提升
11月20日,AI音乐生成平台Suno发布了其最新的V4模型。此次更新重点在于音质优化,生成的音乐在清晰度和细腻度上均有明显进步。
一个突出的新功能是“Remaster”,能够对旧版模型生成的音乐进行音质升级。通过对比可以直观感受到差异:
Rainy Funk(V3模型生成):
Rainy Funk(V4模型生成):
可以听出,V4模型生成的音乐穿透力更强,细节更清晰。目前,V4模型仅面向订阅会员开放。普通用户若想体验其效果,可前往Suno官网聆听其他用户创作的音乐。
Suno成立于2022年,是一款强大的文本生成音乐工具,支持包括中文在内的多种风格,被誉为音乐界的“ChatGPT”,目前在领域内优势明显。对于影视从业者而言,它是生成背景音乐和音效的利器,订阅用户还可将生成内容用于商业场景,规避版权风险。普通用户每日享有50积分,约可生成10首歌曲。
Glif:新功能实现Logo与产品的惊艳融合
同样是11月20日,创意工具Glif上线了一项新功能,能够将任何Logo自然地“贴”到各类周边产品上,效果相当惊艳。
例如,上传小米Logo后,输入提示词“Silver can with water droplets”(带有水滴的银罐),即可生成Logo印在易拉罐上的图像。上传霸王茶姬Logo,输入“White T-shirt”(白色T恤),也能准确生成对应效果,甚至对中文提示词也有良好识别。
尝试将微信Logo“戴”在帽子上,输入“Black baseball cap”(黑色棒球帽),效果同样出色。
该功能基于阿里巴巴通义实验室推出的In-Context LoRA模型。该模型使用Flux算法训练,能在图像生成中保持人物、场景和风格的一致性,适用场景广泛。目前官方已开源10个针对不同场景的LoRA模型,用户可下载并在ComfyUI的Flux工作流中使用。
黑森林实验室:发布FLUX.1 Tools套件
11月21日,Black Forest Labs团队发布了FLUX.1 Tools,这是一套旨在增强FLUX.1模型控制和操作性的新模型。本次发布包含三个核心功能模型:
1. FLUX.1 Fill:用于修复与扩展
该模型提供了先进的修复(inpainting)功能,允许对图像进行无缝编辑,并能自然融入现有画面。此外,它还支持图像扩展(outpainting),可将画布延伸到原始边界之外。
2. FLUX.1 Canny / Depth:用于结构控制
通过边缘检测(Canny)或深度图(Depth)进行结构调节,能在文本引导的图像转换过程中,精确保持原始图像的构图与结构。该模型提供完整版和基于FLUX.1 [dev]的LoRA版本供选择。
3. FLUX.1 Redux:用于图像变体与重设计
这是一个适用于所有FLUX.1基础模型的适配器,用于生成图像变体。给定输入图像,它可以生成具有细微变化的版本,便于图像细化。结合提示词,可实现图像风格的重新设计。最新型号FLUX1.1 [pro] Ultra已支持此功能。
与此同时,ComfyUI官方已宣布支持这套新工具,包括Redux Adapter、Fill Model、ControlNet Models及相关LoRA。
InstantX团队:开源Flux IPadapter模型
11月22日,InstantX团队训练的Flux IPadapter模型正式开源。IP-Adapter的主要功能是通过图像提示来生成新图像,能够有效复制参考图像的风格、构图或人物特征。这为基于Flux架构的图像风格迁移与一致性生成提供了新的工具选择。
可灵AI:1.5模型功能升级,商业化势头迅猛
11月22日,可灵(Kling)AI视频模型升级至1.5版本,新增多项实用功能。
运动笔刷:在图生视频的高品质模式下,用户可使用笔刷工具涂抹图片中的特定元素(最多6个),并指定静止区域,从而实现对视频运动的精细控制。该功能支持横屏、竖屏、方屏等多种图片比例,可生成5秒视频。
运镜控制:同样在图生视频的高品质模式下,用户可设置六种运镜方式,包括水平/垂直移动、拉远/推进、水平/垂直摇镜以及旋转,生成带专业运镜效果的5秒视频。
人脸定制模型:用户可上传多段高清视频素材,训练专属的人脸模型,进而生成保持该人物一致性的视频。该功能目前面向钻石和铂金会员开放。
自今年6月发布以来,可灵AI发展迅速,用户数已超500万,累计生成视频超5100万个、图片超1.5亿张。其商业化进程同样亮眼,单月流水已突破千万元,展现出强劲的增长势头,已成为AI视频生成领域不可忽视的竞争者。
结语
以上便是本周值得关注的AI行业动态精选。从基础设施到应用创新,从音视频生成到图像控制,整个生态正在以惊人的速度迭代。选择以精简且有深度的方式呈现这些资讯,是希望能帮助读者在有限时间内,高效把握行业发展的关键脉搏。未来,这种信息过载与高效获取之间的矛盾将愈发突出,而筛选与解读的价值也将随之凸显。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI海外本地化人物打造指南 提升40%点击率规范手册
在营销活动中,视觉吸引力是撬动用户点击的关键杠杆。过去,我们习惯于用强品牌符号和轻质感设计向全球市场传递卖点,并针对不同市场的审美偏好进行差异化调整。 然而,一个持续萦绕的问题是:活动KV(视觉主图)对用户的吸引力,是否还有新的提升空间?为此,我们将目光投向了经典的“3B原则”。 一、为什么人物可以
高考数学大模型测评哪家强 第一名结果出乎意料
为了让大家对主流AI模型的数学能力有一个最直观的感受,我们组织了一场“满血版”的数学高考。目的很明确:看看在150分的满分下,这些模型究竟能拿多少分,谁又能在这场较量中拔得头筹。 由于解答题与选择题、填空题的评分方式不同,我们为此单独制定了一套规则: 1 数学大题通常包含多个小问,各小问分值不一。
零基础AI Agent工作流设计指南 高效应对BOSS需求
这个系列旨在拆解AI Agent的构建逻辑,总共分为三篇。上篇我们梳理了工作流的基础概念,而本篇,我们将以ComfyUI这个具体平台为例,复盘如何快速上手一个工作流工具。核心目的不是让你成为某个平台的专家,而是掌握一套通用的“破译”方法。掌握了这套方法,无论面对多么陌生的平台,你都能快速理清头绪,为
AI设计工作流改造指南提升效率技巧
节前和同事聊起一个话题:“AI到底能不能真正落地到交互设计的工作里?” 聊着聊着,一个念头突然清晰起来——其实,我和AI已经“共事”两年多了。 这可不是那种“输入一句话,生成一张图”的简单玩法,而是真正把它嵌入了整个产品设计流程:需求模糊时,让它帮忙起草PRD;用户调研资源紧张时,和它一起构建用户画
618选购AI电脑前必看的五大避坑指南
618大促又来了,一年一度的设备升级窗口期也随之开启。 这不,端午节刚过,就有好几位朋友来打听我的电脑配置。我通常就甩两张图过去。 结果呢,对方往往回我一个“地铁老人看手机”的表情包,然后直奔主题:想买台学AI的笔记本,有没有推荐? 每到这时,我总会先反问一句:学AI?具体想学什么? 得到的答案五花
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

