各位好,这里是“AI新榜”的月更栏目:AIGC月刊。
你将在下文看到:
「AI大事件」为你盘点每月最值得关注的至少10条AI资讯
「AI创作」为你推荐每月值得一看的AI内容创作热门案例
「AI Talk」为你精选每月值得一读的AI领域访谈/演讲/报告等
「AI预告」为你搜罗下个月值得跟进的AI动态及产品发布(也欢迎AI同行联络爆料,完善信息,共创AI月刊,可联系微信zhangjie74510备注姓名公司)
希望能为你了解AIGC带来参考,也欢迎你在评论区交流每月使用/研究AI的感受心得~
🪐附AI产品榜,助你了解更多AI产品排名:https://www.newrank.cn/aiRank
💬附AI玩家进群方式:添加微信banggebangmei备注姓名公司,进群交流AI
11月AI大事件
1. 百度发布文生图技术iRAG和无代码工具秒哒
11月12日,百度世界大会上,李彦宏发布了两个新AI技术:检索增强的文生图技术iRAG,可以精准生成特定物品/人物与任意背景;无代码工具秒哒,不用写代码,通过多智能体协作和多工具调用,就能够实现任意想法。
不过秒哒现在还没有上线,百度预计明年第一季度正式发布。想用AI开发应用的玩家可以期待一下。
相关阅读:《今天的百度世界大会,比AI更吸引人的是奥运冠军》
2. 微软发布大量商用AI Agent
11月20日,微软在“Microsoftignite2024”全球开发者大会上推出了一系列全新的AI Agent产品,基于OpenAI的GPT-4o和GPT-o1模型,结合微软自身的云平台、365套件等产品,将为用户提供强大的智能助理服务,预计在未来一年内陆续上线商用。
紧接着,谷歌也宣布全力推广商用AI Agent,发布一系列激励活动和产品,包括AI Agent生态系统计划和AI Agent Space。
“智能体是AI应用的最主流形态,即将迎来它的爆发点。”正如李彦宏所说,未来AI行业的焦点是“智能体”(AI Agent),微软、谷歌、OpenAI、Anthropic等各大厂商都在积极抢占AI智能体市场。
据内部员工爆料,OpenAI正准备推出一款代号为“Operator”的全新AI Agent产品,可以自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等,该产品预计将在2025年1月发布。
3. ChatGPT搜索功能正式上线
ChatGPT终于加入了AI搜索的战场,与谷歌、Copilot和Perplexity等正面竞争。
11月1日,OpenAI宣布ChatGPT新增搜索功能,微调后的GPT-4o会根据用户的需求自动决定是否检索网络,能够快速提供最新信息,并附上相关的网页链接。ChatGPT Plus和Team用户可率先使用这一功能。
此外,AI搜索和知识库、写作等功能以及其他生态资源的整合也是一个发展方向。腾讯元宝2.0版本升级整合微信视频号、QQ音乐等信息资源,新推出的智能工作台产品ima还打通了微信公众号生态,提供全新的搜读写体验。
4. 即梦AI上线两款视频生成模型PixelDance和Seaweed
11月,AI视频生成领域依旧打得火热。国内生数科技推出Vidu 1.5模型,全球首发多主体一致性功能,视频生成更加可控;可灵AI 1.5模型(图生视频)支持运动笔刷和运镜,同时上线“人脸模型”定制功能;阶跃星辰内测“跃问视频”,支持文生视频,最长10秒。
11月15日,此前吊足外界胃口的视频生成模型PixelDance和Seaweed在即梦AI正式上线。新模型生成速度更快,可以通过小幅度、渐进式的提示词,以及时序提示词、长镜头等技巧,实现复杂的视频效果。
即梦AI:https://jimeng.jianying.com/
海外开源模型也有新突破,AI视频初创公司Lightricks发布LTX Video,这是基于DiT的视频生成模型,可在RTX 4090等消费级GPU上本地运行,只需要4秒就能生成5秒时长的24FPS视频,分辨率768x512。用户可在GitHub、Hugging Face和fal.ai上获取预览模型。
5. Sora视频生成模型遭泄漏
从年初开始预热的Sora迟迟还未正式发布,结果在11月底被内测玩家泄露了。
泄露者疑似部分参与Sora内测的艺术家,在HuggingFace上泄露了Sora的API,使其短暂开放了1小时左右。同时,艺术家们发布了集体控诉信,指责Open AI以极少的报酬让他们测试Sora。
Open AI回应称,Sora仍处于“研究预览”阶段,公司正在努力平衡创造力和更广泛使用的安全措施。看来到今年底,Sora也不一定能跟大家见面了。
6. Open AI安全副总裁翁荔离职
今年大模型领域人才流动频繁,核心技术人员从大厂离职创业更是不少。
在Open AI工作7年的翁荔(Lilian Weng)宣布卸任安全系统团队负责人,已于11月15日离职。有传闻猜测翁荔可能会回国工作,但她暂未公开新的职业动向。
此外,前Salesforce AI首席执行官史宗玮加入了Meta,将领导新业务AI团队,为企业构建AI工具,通过Meta旗下App来触达消费者。
11月底,腾讯混元大模型技术负责人之一刘威已离职,在新加坡开始AI视频生成领域的创业。商汤秒画负责人刘宇也离职创业了,正在招募团队。
7. 阿里通义代码模式正式上线
AI正在革命性地改变开发过程。AI编程工具Cursor爆火之后,Bolt.new进一步提供了一个完整的全栈开发环境,直接在浏览器中运行;Windsurf首创copilots和agents结合的新范式,能深度理解代码库,实时感知程序员的操作。
国内类似的AI编程工具也开始涌现。11月15日,阿里通义代码模式上线,基于Qwen2.5-Coder模型,即使用户不懂代码和编程,也可以用大白话让AI自动编码,包括网站、数据图表、小游戏、个人简历等等。
8. Kimi开放数学推理模型k0-math
OpenAI发布o1模型之后,大模型厂商都卷起了AI推理。
月之暗面创始人杨植麟认为,最适合让AI去锻炼思考能力的场景就是数学场景。11月16日,Kimi发布新一代数学推理模型k0-math,采用了全新的强化学习和思维链推理技术,基准测试显示,其数学能力可对标OpenAI o1-mini和o1-preview。用户在Kimi官网的左侧菜单栏即可找到该模型。
11月20日,DeepSeek发布推理模型DeepSeek-R1-Lite预览版,思维链长度可达数万字,目前仍处于迭代开发阶段,仅支持网页使用。官方称正式版DeepSeek-R1模型将完全开源,并公开技术报告和部署API服务。
11月27日,昆仑万维推出具有复杂思考推理能力的系列模型“天工大模型4.0”o1 版(Skywork o1),在模型输出上内生了思考、计划、反思等能力。
11月28日,阿里通义团队发布了推理大模型QwQ-32B-Preview,其在数学和编程领域表现出色,尤其在MATH-500测试集上,数学性能超越了o1-preview,但在其他领域仍有提升空间。
9. Suno v4音乐生成模型正式上线
AI音乐的玩法越来越多了。Suno近期频繁更新,从“一致性”功能“Persona”,到图生音乐功能“Scenes”,再到全新的v4模型,AI音频质量、歌词创作和整体歌曲结构等方面都有了较大提升。
Suno v4模型更新的最大亮点是“Remaster”功能。用户可以在Pro和Premier测试版中升级重制原有的AI音乐,来优化音质和唱词,主打一个“经典复刻”,实现AI音乐靠AI翻红。
相关阅读:《让Suno v4为<再见爱人>名场面写歌,AI还是太全面了》
10. 智谱AutoGLM升级,可跨App执行复杂任务
不到一个月,智谱在Agent OpenDay上又宣布了多项AI自动驾驶新进展:
手机端AutoGLM可以自主执行超过50步的长步骤操作,也可以跨App执行任务;Web端开启“全自动”上网新体验,支持数十个网站的无人驾驶,智谱清言插件已上线该功能;像人一样操作计算机的GLM-PC启动内测,基于视觉多模态模型实现通用Agent的技术探索。
虽然目前AutoGLM响应指令的准确度和操作速度还有待提高,但我们还是期待AI助手越来越智能,可以自动执行繁琐的日常任务。
11月AI创作
1. 新晋AI设计利器Recraft
近日,来自英国的AI初创公司Recraft推出了一款AI图像设计模型Recraft v3,其前身是10月底曾在HuggingFace文生图竞技场登顶第一的神秘模型“Red_Panda”(小熊猫)。
Recraft v3图像生成质量很高,可以通过框选控制文本、设计元素的位置大小,对长文本生成的处理能力也很突出,是Midjourney、Ideogram的强劲对手。
其中一款“Hard Flash”风格模型可以生成复古胶片照片,相关AI作品近期在小红书上迅速蹿红,引发了病毒式传播。
Recraft生成的图片
Recraft官网:https://www.recraft.ai/auth/login
相关阅读:《AI版“中式梦核”火爆小红书,网友:这谁还需要胶片相机啊》
2. 让AI假扮“知乎大V”
今年7月,开发者向劲宇专门打造了一个AI账号,“潜伏”在知乎,充当答主回复各类问题,和网友们互动,但似乎没有一个人发现它是AI。在AI账号发布的109条回答中,收获评论22条,赞同107次,浏览量超3万,创作分5422分。
我们和向劲宇探讨了这场AI社会实验背后的故事,以及如何在AI时代找到属于自己的机会。
相关阅读:《我让AI假扮“知乎大V”,回答了上百个问题无人发现》
3. 毒液AI变身特效走红
随着电影《毒液3:最后一舞》的上映,抖音上掀起了一股变身毒液的风潮,利用AI视频工具Pixverse的特效“毒液变身”即可一键生成。
继Pika的“万物皆可捏捏”特效后,AI视频生成赛道也开始卷特效玩法了。除了毒液变身,Pixverse还相继推出了蝙蝠侠、绿巨人、钢铁侠等超级英雄经典IP变身特效。
美图旗下Wink最近推出的一款“脑洞特效”也在小红书上走红,无论是短发秃头星人,还是猫狗、贝多芬、大卫都能瞬间长出飘逸的长发,评论区不少人询问制作教程和求代做。
这种通过打造创意AI特效模版和玩法,满足大众娱乐化需求,吸引大量UGC用户自发传播的操作,已经成为很多AI产品大众化的共识。
4. 可口可乐用AI制作圣诞广告引争议
圣诞将至,可口可乐近期与三家AI工作室合作发布了一系列圣诞广告短片,完全依托于AI技术创作,使用了可灵AI、海螺视频、Leonardo、Luma、Sora和Runway等AI模型来致敬经典。
有网友认为AI广告的视频效果有明显提升,但也有许多人不买账,认为这是对此前优秀广告的拙劣抄袭,也是对人类劳动的贬低,“缺乏创意和灵魂”。
圣诞节是家人团聚的温馨节日,此时AI技术应用很容易在情感传达和公众接受度方面遭遇挑战。
5. 用AI扩展视频整活
不光是AI扩图,现在我们可以用AI扩视频整活了。
11月23日,Runway推出了新功能“Expand Video”,输入文字提示或图片,即可将原画面扩展生成新的内容,调整为不同的宽高比,以新的构图创造故事。
X博主“Blaine Brown”就用Expand Video扩展了《指环王》名场面,视频播放近40万。
也有博主利用扩展功能演绎了不少梗图,比如“土拨鼠尖叫”的画面:
11月AI Talk
1. 前谷歌AI研究员Jakob Uszkoreit:ChatGPT原本可以更早出现的
2. Anthropic CEO Dario Amodei:Scaling Law仍然有效
3. 英伟达CEO黄仁勋:AI正掀起科学革命,机器人时代正在到来
4. 荣耀CEO赵明:2027年手机或搭载千亿参数大模型
5. 中国工程院院士邬贺铨:AI正在从模型层走向“智能体”
下月AI预告
1. 腾讯混元视频生成模型即将上线
近日,腾讯混元视频生成模型开始小范围内测,即将上线。首批内测用户可通过独立网页版体验混元文生视频能力。
2. 12月5日至6日,2024中国生成式AI大会将在上海举办
中国生成式AI大会首次登陆上海举办,由智一科技旗下智能产业第一媒体智东西、AI与硬科技知识分享社区智猩猩共同发起。主会场将进行大模型峰会、AI Infra峰会,分会场将进行端侧生成式AI、AI视频生成和具身智能三场技术研讨会。展览区有GMI、联汇科技、中昊芯英、VAST等14家企业带来最新技术产品展示。
中国生成式AI大会报名:https://genaicon.zhidx.com/2024shanghai/
3. 12月6日,人工智能安全与合规实务分享活动
玩家福利:在评论区分享你对AI相关的任一想法,点赞数排名前五位的玩家将获得一本新书《大模型安全、监管与合规》,截止时间为12月6日10点。
4. Google DevFest 2024大会
Google DevFest 2024是由Google开发者社区(GDG)组织的一系列全球性技术活动,今年重点关注负责任的人工智能(Responsible AI)。
2024 DevFest北京将于12月7日举行,包括Android/Kotlin和AI开发主题以及Workshop动手活动。DevFest上海将于12月8日举行,主题是“Empowering Developers with AI-Driven Innovation”(利用AI驱动创新赋能开发者)。
此外,南宁、河北、海口、广州、香港等地都有DevFest活动举行,感兴趣的玩家可以在官网查阅报名。
Google DevFest 2024官网:https://developers.google.com/community/devfest?hl=zh-cn
北京活动报名:https://mp.weixin.qq.com/s/54c5fD0s3fnPQl9vigZKjg
上海活动报名: https://www.huodongxing.com/event/8772556869800?td=5234073690314
5. 苹果iOS 18.2即将发布
苹果iOS 18.2正式版将于今年12月发布,届时,Apple Intelligence将正式接入ChatGPT。苹果用户不用创建账户就可以免费使用ChatGPT,Siri将利用ChatGPT的专业知识回答用户问题。
6. OpenAI或将推出下一代AI模型Orion
据The Verge此前报道,OpenAI计划在12月推出其下一代模型Orion,这款模型最初不会通过ChatGPT广泛发布,而是优先向与其密切合作的公司开放访问权限。Orion被内部视为GPT-4的继任者,其性能可能是GPT-4的100倍。
报道原文:https://www.theverge.com/2024/10/24/24278999/openai-plans-orion-ai-model-release-december
7. 据内部人士向“AI新榜”透露,12月,MiniMax将发布新模型和产品。
ps. 欢迎AI同行联络爆料,完善信息,共创AI月刊,可联系微信zhangjie74510(备注姓名公司)
「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
欢迎分享、点赞、在看 一起研究AI