2024年AIGC行业十大里程碑事件深度解析

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI教程

2024年AIGC行业十大里程碑事件深度解析

热心网友时间：2026-05-25

转载

回望2024年，AIGC领域可谓风起云涌，重磅产品与新模型接连登场，几乎每个月都有改写行业格局的事件发生。接下来，就让我们一起按时间线，梳理这一年的关键节点。一月行业研究机构IDC与钉钉联合发布了《2024 AIGC应用层十大趋势白皮书》，为全年的技术发展和商业应用定下了基调，指明了方向。二月

2024 AIGC 行业重大事件回顾：可能改写历史的瞬间

回望2024年，AIGC领域可谓风起云涌，重磅产品与新模型接连登场，几乎每个月都有改写行业格局的事件发生。接下来，就让我们一起按时间线，梳理这一年的关键节点。

一月

行业研究机构IDC与钉钉联合发布了《2024 AIGC应用层十大趋势白皮书》，为全年的技术发展和商业应用定下了基调，指明了方向。

二月

这个月注定被载入史册。OpenAI正式发布了文生视频大模型Sora，它能够根据简短的文本提示，生成最长60秒、细节丰富且极具真实感的视频，瞬间点燃了全球对视频生成技术的无限想象。

在产品层面，字节跳动推出了面向开发者的AI Bot一站式开发平台「扣子」，旨在降低AI应用构建的门槛。

与此同时，谷歌也祭出了重器，将其Bard聊天机器人更名为Gemini，并发布了同名的强大语言模型系列。此举不仅统一了品牌，更彰显了其在对话AI和搜索引擎深度集成上的野心。

三月

三月的竞争同样白热化。Anthropic发布了Claude 3模型系列，包含Haiku、Sonnet和Opus三个版本。其中，顶级型号Opus在复杂推理任务上的表现，被认为超越了当时的GPT-4和Gemini Ultra，引发了业界对模型能力评估的新一轮讨论。

国内学术界与产业界联动，北京大学团队联合兔展智能发起了Open Sora计划，致力于复现并开源文生视频技术，提供了从数据处理到训练推理的完整方案。

李开复博士创立的零一万物，则发布了专注于代码与数学能力的Yi-9B模型。90亿的参数规模在消费级显卡上也能良好运行，为开发者和研究者提供了强大的实用工具。

图像生成领域，Stability AI推出了采用Diffusion Transformer架构的Stable Diffusion 3，在图像质量和文字渲染上取得显著进步，直指文生图技术的顶峰。

一向低调的苹果公司也在这个月展示了其AI实力，发布了拥有300亿参数、采用混合专家架构的多模态大模型MM1，预示着其在AIGC领域的深度布局。

四月

生数科技发布了视频生成大模型Vidu，它创新性地融合Diffusion与Transformer，提出钱-ViT架构，能够一键生成长达16秒的1080P高清视频，展现了国产模型在视频生成赛道上的强劲实力。

昆仑万维推出了“天工”音乐大模型，作为国内当时唯一公开可用的音乐AIGC模型，其在AI人声合成技术上的表现达到了业内领先水平。

微软研究院则另辟蹊径，发布了仅140亿参数的移动端模型Phi-4。这款“小模型”却在多项基准测试中表现惊艳，甚至超越了部分参数更大的模型，证明了在特定架构下，“小身材也能有大能量”。

五月

OpenAI再次成为焦点，发布了GPT-4的迭代版本GPT-4o，并宣布向所有用户免费开放。这一举措不仅极大提升了ChatGPT的用户体验和访问量，也直接促使全球范围内，特别是国内的大模型厂商开始重新审视其定价与服务策略。

阿里云在AI智领者峰会上重磅升级，发布了通义千问2.5版本，并在理解、推理、指令遵循和代码能力上实现了全面跃升。同时，开源了1100亿参数的Qwen1.5-110B模型，并拓展了文生图、智能编码等多项新功能。

此外，即梦AI等一批创新应用也在这个月正式上线，为用户提供了更直观的图片生成与创意工具。

六月

视频生成技术开始走向实用。可灵AI发布了可灵1.5模型，其产品已实际应用于电影拍摄，据悉已有九位导演使用该技术完成了影片制作，标志着AIGC从技术演示走向真正的生产力工具。

七月

可灵AI乘胜追击，宣布其国际版1.0全球上线，同时国内版本也完成了基础模型的升级，并全面开放内测，加速了其技术和产品的全球化步伐。

八月

图像生成领域迎来新的挑战者。Flux.1系列模型发布，包含专业版、开发者版和快速版。其专业版和开发者版在性能评测中击败了SD3-Ultra等主流模型，而快速版也超越了Midjourney v6.0和DALL·E 3，展示了其在效率与质量上的双重优势。

九月

阿里通义AI实验室预告，将在云栖大会推出一款融合“文生视频”与“图生视频”模式的创新大模型，并提前开放了预约通道，吊足了市场胃口。

十月

Flux模型迭代至1.1 Pro版本，并推出了Beta版的BFL API，进一步优化性能与易用性。

Stability AI则正式发布了Stable Diffusion 3.5系列，在图像的真实感、提示词遵循度和文字渲染质量上均比前代有显著提升，巩固了其在开源图像生成领域的地位。

十一月

超清图像生成成为新热点。FLUX1.1 Pro Ultra模型发布，支持高达4兆像素的分辨率，且生成速度大幅提升，将AI图像的细节表现推向了新的高度。

在工具层面，流行的AI工作流工具ComfyUI启用了全新的Beta UI作为默认界面，致力于提升用户的操作体验。

十二月

年末，OpenAI以一场史无前例、为期12天的“马拉松式”发布会震撼收尾。期间陆续发布了包括完全体o1推理模型、o1-mini、Sora Turbo视频生成版本、Canvas工作台、与Apple Intelligence的集成、高级语音模式、Projects项目管理功能、升级的搜索功能、开放的o1 API、以及新一代o3推理模型在内的十余项新产品与新功能。这场发布会不仅集中展示了其深厚的技术储备，更像是一份关于AI未来发展的宣言，为2024年画上了一个浓墨重彩的句号。

来源:https://www.uisdc.com/aigc-2024

上一篇： AI实训心得撰写指南：如何记录体验并规划职业未来

下一篇： Midjourney实战教程：用AI生成完整故事配图的步骤详解