各位好,这里是“AI新榜”的月更栏目:AIGC月刊。
你将在下文看到:
「AI大事件」为你盘点每月最值得关注的至少10条AI资讯
「AI创作」为你推荐每月值得一看的AI内容创作热门案例
「AI Talk」为你精选每月值得一读的AI领域访谈/演讲/报告等
「AI预告」为你搜罗下个月值得跟进的AI动态及产品发布(也欢迎AI同行联络爆料,完善信息,共创AI月刊,可联系微信zhangjie74510备注姓名公司)
希望能为你了解AIGC带来参考,也欢迎你在评论区交流每月使用/研究AI的感受心得~
🪐附AI产品榜,助你了解更多AI产品排名:https://www.newrank.cn/aiRank
💬附AI玩家进群方式:添加微信banggebangmei备注姓名公司,进群交流AI
2月AI大事件
1. DeepSeek成新晋流量密码
DeepSeek爆火以后,先是在社交媒体上掀起了新一轮AI应用热。
从“DeepSeek怎么用”到“DeepSeek出脚本+剪映/即梦出视频”等联动玩法走红,DeepSeek的出现被业界普遍评价为是国人的“ChatGPT时刻”。
凭借DeepSeek的流量热度,有人靠卖DeepSeek安装包收入百万。围绕如何下载使用DeepSeek、高阶指令和提示词、本地化部署、用DeepSeek做电商/自媒体/教育等内容,相关教程也在电商平台上大量出现。
随着DeepSeek爆火带来的需求溢出,从软件到硬件,从互联网产品到AI原生应用,厂商们纷纷抢着宣布“接入DeepSeek”。更有业内人士向“AI新榜”透露,近日腾讯元宝仅B站投放的信息流广告,单日消耗最高达到了50万元,投放素材基本与“接入DeepSeek”相关,内容导向产品下载。
近日,微信生活服务“九宫格”也对腾讯元宝提供了流量曝光,限时供应“元宝下载”,相关下载入口也标记着“满血DeepSeek”。
围绕DeepSeek,本月我们推出的系列选题包括:DeepSeek相关爆款内容梳理和创作公式总结、国产手机厂商接入DeepSeek流派盘点、接入DeepSeek的好用产品盘点以及DeepSeek使用途径和本地部署教程整理。
2. OpenAI发布最后一个非推理模型GPT-4.5
当地时间2月27日,OpenAI正式发布GPT-4.5,这是其迄今为止发布的最大的非推理模型。
据悉,GPT-4.5所使用的计算能力和数据量都超过了之前的版本。虽然它不是推理模型,但在无监督学习方面有显著提升,能够更好地识别模式、建立联系,并提供更自然的对话体验。与此同时,它还减少了“幻觉”(即生成虚假信息)的比例,相比GPT-4o和推理模型o1,其幻觉率更低。
而由于计算量极大,GPT-4.5的API调用成本高达75美元/百万tokens,是GPT-4o的30倍,是DeepSeek V3(输入)的280倍。
GPT-4.5目前以研究预览版的形式向ChatGPT Pro用户开放,未来一周将逐步推广到其他用户。
在推理模型逐渐成为大模型厂商标配的当下,GPT-4.5的发布不仅代表了OpenAI传统GPT系列的结束,还标志着AI技术发展正处于新旧交替的重要转折点。
3. 阿里、腾讯上线推理模型
2月25日,阿里巴巴宣布推出基于Qwen2.5-Max的推理模型QwQ-Max(预览版),支持思维链可视化与联网搜索。
目前QwQ-Max(预览版)可通过访问:https://chat.qwen.ai,或下载通义App进行体验。
除了阿里,腾讯、字节和百度也入局了这场由DeepSeek R1引发的推理模型争夺战。2月17日,腾讯混元具备深度思考的推理模型T1在腾讯元宝App中小范围灰度上线,目前已全量开放;
2月25日,字节被曝旗下AI助手豆包正在小范围测试深度思考模型,但接入的不是DeepSeek模型。
在多轮对话测试中,“AI新榜”发现豆包会根据不同类型问题调用深度思考模型,如果被灰度到,豆包生成的答复中会显示思维链;
2月28日,百度宣布文心大模型最新版4.5将于3月16日正式上线,不仅在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。
4. DeepSeek开源周
2月24日至28日,DeepSeek团队开源5个代码库,以完全透明的方式分享研究进展,“这里没有象牙塔,只有秉持纯粹的车库创业精神与社区驱动的创新理念。”DeepSeek的“硬核”宣言备受关注。
2月24日,DeepSeek开源第一个项目为FlashMLA,可以理解为专门为高性能显卡(Hopper GPU)设计的“AI加速工具”。
2月25日,DeepSeek开源代码库为DeepEP,它是首个用于MoE模型训练和推理的开源EP通信库。
2月26日,DeepSeek亮出了训练V3/R1背后的FP8 GEMM(通用矩阵乘法)库,它保持了“高性能+低成本”的特性,支持密集(dense)和混合专家(MoE)矩阵乘法运算。
2月27日,DeepSeek开源“三连发”,推出了创新的双向流水线并行算法DualPipe;用于MoE的负载均衡算法EPLB(Expert Parallelism Load Balancer);训练和推理框架的性能分析数据Profiling Data。
2月28日,DeepSeek开源能充分利用现代SSD和RDMA网络带宽的并行文件系统Fire-Flyer文件处理系统(3FS)
5. 通义万相视频生成大模型Wan2.1开源
国内AI圈有两个“源神”:一个DeepSeek,一个阿里通义。
2月25日,通义万相视频生成大模型Wan2.1正式开源,包括专业版14B和极速版1.3B两个版本。在权威评测集VBench中,万相以总分86.22%的成绩登上榜首位置,大幅领先Sora、Minimax、Luma、Gen3、Pika等国内外主流视频生成模型。
和谷歌最新开放公测的Veo2相比,可以明显看到Wan2.1在物理运动方面更胜一筹。
据介绍,Wan2.1在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面具有显著的优势,还支持中文字效生成。
AI视频方面,Pika仍然坚持“卷特效”路线,于2月7日发布Pikaddition功能,可以将任何物体(以图片形式上传)融合到视频中;
爱诗科技于2月24日上线AI视频生成模型PixVerse V4,在生成速度、生成画面和动作更加逼真自然等能力上获得很大提升;
字节即梦AI网页端内测对口型新功能“大师”。该功能可支持肖像、半身以及全身等不同尺寸的图片输入,并根据输入的音频,在视频中让人物生成与之匹配的动作。
6. 苹果AI国行将与百度阿里等合作,最快4月推出
2025年2月,经历近一年的多方博弈后,苹果最终确定与阿里巴巴和百度两家本土科技巨头合作,共同为国行iPhone用户开发AI功能,预计最快4月随iOS 18.4系统上线,5月全面开放服务。
预计苹果将采取“非排他性”合作框架:
阿里巴巴作为主要合作伙伴,负责核心AI模型的本土化适配与合规调整,依托其通义千问大模型的技术积累和阿里云的算力支撑。
百度则聚焦“视觉智能”场景,替代国际版中谷歌和OpenAI的功能模块,并升级中文版Siri的交互能力。
此外,苹果私有云运算部分将由云上贵州(中国境内iCloud服务商)承担,确保数据本地化处理。
7. 抖音试水AI分身,字节旗下AI智能体平台扣子已与抖音打通
2月19日消息,字节旗下AI智能体开发平台扣子(Coze)已与抖音打通,抖音创作者可在扣子智能体平台打造AI分身并发布,智能体创建成功后,创作者在直播中也可挂出对应智能体与用户互动。
目前,抖音AI分身功能正在内测中。
申请链接:
https://bytedance.larkoffice.com/share/base/form/shrcnc6975PeX49U1ae5eCJxPSc
据介绍,申请成为抖音AI分身内测用户,可获得抖音&扣子的流量扶持,官方也会同步提供技术支持。
官网申请地址:https://shuziren.douyin.com/
此前在旗下豆包App中,字节也曾试水智能体创建功能,但相对豆包APP中的智能体创建,扣子智能体允许创作者对AI分身进行更复杂设定,比如可以调用对应文档及数据源来回答用户问题,也允许添加工作流、大语言模型等实现旅行规划、报告分析等更复杂功能。
8. 谷歌发布Gemini 2.0系列大模型
2月6日,谷歌发布了新一代Gemini 2.0系列大模型。
Gemini 2.0 Pro实验版本:针对编码和复杂提示的最佳模型,具有200万上下文,可原生调用谷歌搜索、地图等工具。
Gemini 2.0 Flash: “高效主力模型”,图像生成和文本转语音功能即将推出。
Gemini 2.0 Flash Thinking:升级的推理模型,能直接访问YouTube、搜索、地图等应用。
Gemini 2.0 Flash - Lite: “最具性价比的模型”,支持100万上下文和多模态输入。
其中的Gemini 2.0 Pro是谷歌迄今为止在编码和复杂指令任务中表现最好的模型,支持200万tokens上下文窗口,支持调用谷歌搜索和代码执行等工具。
Gemini 2.0 Flash-Lite则是谷歌目前为止性价比最高的模型,针对大规模文本输出用例进行了成本优化。
9. 马斯克“地球上最聪明的AI” Grok 3发布
2月18日,马斯克AI公司xAI发布了号称“地球上最聪明的AI”的Grok 3系列大模型。
Grok-3(Beta):基于20万张H100 GPU集群训练,在数学、科学及编码基准测试中表现较好,通过融合自我批判机制与第一性原理思考范式实现复杂问题求解。
Grok-3 mini:轻量级版本,采用动态优化机制优先响应速度,能够在牺牲一定准确性的情况下更快地回答问题。
Grok-3 Reasoning(Beta):首个支持“思维链”的推理模型,通过测试时计算(Test-time Compute)延长思考时间提升准确率。
Grok-3 mini Reasoning:集成强化学习的推理优化版本。
DeepSearch:结合知识图谱与多模态分析技术,能够扫描互联网和X平台上的信息,并以摘要的形式回应用户查询。
根据官方公开的测试结果,Grok 3在包括AIME(评估模型在一系列数学问题上的表现)和GPQA(评估模型在博士级别的物理学、生物学和化学问题上的表现)等基准测试中,远超GPT-4o、Gemini-2 Pro、DeepSeek V3、Claude 3.5 Sonnet等大模型。
2月20日,马斯克宣布其Grok 3模型向所有用户开放,宣称“直到我们的服务器崩溃”为止。
10. Anthropic推出新一代混合推理模型Claude 3.7 Sonnet
2月25日,Anthropic发布了市场上首个混合推理模型Claude 3.7 Sonnet及代理编码工具Claude Code。
Claude 3.7 Sonnet拥有多种模式:
标准模式下Claude 3.7 Sonnet是前代Claude 3.5 Sonnet的升级版。
扩展思维模式下,它会在回答之前进行自我反思,从而提高其在数学、物理、指令遵循、编码和许多其他任务上的表现。
当通过API使用Claude 3.7 Sonnet时,用户还可以控制模型的思考预算。
Claude Code作为Anthropic推出的首款智能编码工具,可以搜索和阅读代码、编辑文件、编写和运行测试、提交和推送代码到 GitHub,以及使用命令行工具。
2月AI创作
1. 《哪吒2》掀起AI二创狂欢
随着《哪吒2》票房一路飙升,围绕电影的二创内容也在各大社交媒体平台爆发式传播。
其中,AI创作者们的脑洞尤为清奇。从《哪吒2》角色时装秀、花矶娘娘,到申公豹专列、会动的敖丙手办,点赞量动辄超几万甚至几十万。例如,小红书博主“Burn”用AI生成的结界兽冰淇淋,小红书获赞超23万。除了结界兽外,该博主还生成了哪吒、敖丙、海夜叉等角色的冰淇淋,都十分惟妙惟肖,让人难辨真假。
截至2月28日,《哪吒2》总票房已突破140亿。可以说,这些优质、有趣的二创作品对于推高《哪吒2》社媒声量功不可没,不仅有助于延长IP的热度周期,还可能反哺官方创作。
当然,这些AI二创作品的出现也要归功于AI绘画、AI视频工具的支持。例如,我们就借助的是Liblib AI上的LoRA模型为《哪吒2》画了百亿海报。
2. 民俗文化融入具身智能,宇树机器人登上春晚
DeepSeek爆火后,不少人将其与其他AI对比,从各方面展开了一场新的“赛博斗蛐蛐”之战。
有让DeepSeek和GPT对轰的,有让DeepSeek和ChatGPT下国际象棋的,也有组局让9款AI玩狼人杀的。这类创意整活在B站、抖音等平台上都获得了不错的流量,播放量从几十万到几百万不等。
例如,B站UP主“bili_2864911”让DeepSeek和GPT用“辛辣有针对性”的语言对话,视频在B站上播放量超300万,互动量超50万。
还有UP主“十月枫林尽染”让9款市面上的AI组局玩狼人杀,包括DeepSeek-R1、ChatGPT、豆包、Claude、Kimi、智谱清言等,发布了一系列视频。
在游戏过程中,这些AI玩家不仅能够遵循游戏规则,理解对手发言,分析对手策略,还表现出了伪装、欺骗、带节奏的“活人感”倾向,提高了视频的可看性和趣味性。
3. AI“发明”赛博黑暗料理,博主复刻引百万网友围观
最近, B站UP主“洛杉矶嬴政W”上传了一条标题为“用AI创造出了一道人类从未出现过的料理”的视频,获得了超过130万的播放量。
博主按照DeepSeek生成的教程一步一步制作出了这道“人类历史上第一道由AI设计的料理”。最后做出来的料理虽然卖相不好,但博主表示居然“真的超级好吃”😅。
专业美食博主“南翔不爱吃饭”也复刻了一道“龙吟四海·剑气鳜”,AI菜谱的不合理之初都被他一一化解,在抖音、快手、小红书、B站等平台都成了热门视频,单条最高获赞超71万。
看最终的成品对比,网友锐评“这就是宗门天骄和散修的区别”,还有人出主意——“8888块卖给上海人”。
4. 校园地标秒变毛绒玩偶,AI特效席卷全国
小红书博主“条条娱乐”发布的这条笔记获赞超11万。
许多高校和文旅账号利用可灵AI视频特效,将地标建筑变成可爱的毛绒玩偶,人均Jellycat设计师。
快手@微言教育
其实这样的变身视频用的是可灵AI的创意特效“快来惹毛我”,上传一张图片,点击生成即可,追求还原度的玩家可以先用AI图生图,得到满意的毛绒效果图后再转成视频。
5. 用AI还原刘慈欣最“反人类”的小说,B站播放量超195万
2月15日,B站UP主“扁豆看电影”用AI视频对刘慈欣经典科幻短篇小说《命运》进行了全新演绎,目前这条视频在B站已获超280万播放,10万点赞。
视频的故事背景设定在未来,人类掌握了时空跃迁的方法。一对夫妇在租用太空飞船到外太空度蜜月的过程中,将一颗撞向地球的小行星改变了轨道,使恐龙躲过灭绝的灾难。
当他们再次穿越虫洞回到地球时,发现恐龙进化成为了智能生物,人类成为了恐龙的食物、宠物、奴隶和动物园里面的观赏动物。
据UP本人表示,相比于纯文字描述,视频显然更有感官冲击力,读者可以更身临其境地体验刘慈欣笔下的科幻世界。
1月AI Talk
优先研究AI的意识,确保不会导致“虐待和痛苦”;
对发展具备意识的AI系统进行约束;
逐步推进AI系统的研发;
公开分享研究成果;
避免做出误导性或过于自信的声明,特别是创造具备意识的AI。
下月AI预告
1. ”阶跃星辰将在3月开源图生视频模型
2月22日消息,在2025全球开发者先锋大会上,阶跃星辰CEO姜大昕透露,阶跃星辰决定继续保持开源策略,将在3月份开源图生视频模型。
2. 腾讯ima知识库会尽快推出基于DeepSeek的联网搜索功能
3. 通义千问计划面向全球用户推出Qwen Chat App
2月25日,阿里通义千问团队表示在不久的将来会以Apache 2.0许可协议开源发布QwQ-Max以及Qwen2.5-Max,并计划在发布推理模型QwQ-Max正式版本(目前还是预览版本)的同时,面向全球用户推出Qwen Chat App,并开源更适合端侧的小尺寸推理模型。
4. ComfyUI全球首次官方会议将在上海举办
ComfyUI全球首次官方会议——ComfyCon将于3月29至30日在上海徐汇区举办。
据介绍,本次活动ComfyUI核心团队成员将首次齐聚上海,包括ComfyAnonymous(创始人)、Yoland Yan、Robin Huang等。会议旨在汇聚中国顶级开源开发者、创作者、优秀社区和行业伙伴,共同探讨AI开源及视觉生成的未来。
活动报名链接:https://lu.ma/ComfyCon
4. 3月20日至23日,2025中国家电及消费电子博览会(AWE2025)将在上海举办
AWE2025的主题为“AI科技、AI生活”。作为全球三大家电和消费电子领域展会之一,官方称本届展会吸引千余家全球领先的家电及消费电子企业参展(包括“春晚机器人”制造商宇树科技),将呈现全景生态的AI智慧生活方式和家电及消费电子领域的前沿成果,预计观众参观人次将超过36.5万次。
5. 英伟达GTC 2025大会将举行China AI Day
2月25日,英伟达宣布GTC 2025大会将举行China AI Day——云与互联网线上中文专场,计划于北京时间3月18日上午9:30开始直播。
据介绍,本次专场汇聚了国内多家云与互联网企业,包括字节跳动、火山引擎、阿里云、百度、蚂蚁集团、京东、美团、快手、百川智能、赖耶科技以及Votee AI,他们将分享在大语言模型、多模态大语言模型、数据科学和搜推广领域的前沿进展,展示如何采用软硬件协同优化方法实现生产级AI的性能和效率提升。
6. 苹果将于3月25日在上海举行开发者活动,与国行版Apple智能有关
苹果公司已向开发者发送邮件,宣布将于3月25日在上海举办一场主题为“利用Apple智能的力量”的开发者活动。外界普遍猜测,这或许意味着国行版本的Apple Intelligence(苹果智能)功能即将正式上线。
ps. 欢迎AI同行联络爆料,完善信息,共创AI月刊,可联系微信zhangjie74510(备注姓名公司)
「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
欢迎分享、点赞、在看 一起研究AI