登录/注册
扫描二维码
手机浏览

AIGC月刊:AI智能体会自动操作电脑和手机了;AI视频特效风靡全网;国产AI投放大战(24.10)

AI新榜
新榜独家AIGC


各位好,这里是“AI新榜”的月更栏目:AIGC月刊。


本期开始,我们准备对这个栏目的板块进行一些调整。比如,你将在下文看到:


「AI大事件」为你盘点每月最值得关注的至少10条AI资讯


「AI创作」为你推荐每月值得一看的AI内容创作热门案例


「AI Talk」为你精选每月值得一读的AI领域访谈/演讲/报告等


「AI预告」为你搜罗下个月值得跟进的AI动态及产品发布(也欢迎AI同行联络爆料,完善信息,共创AI月刊,可联系微信zhangjie74510备注姓名公司)


希望能为你了解AIGC带来参考,也欢迎你在评论区交流每月使用/研究AI的感受心得~


🪐附AI产品榜,助你了解更多AI产品排名:https://www.newrank.cn/aiRank


💬附AI玩家进群方式:添加微信banggebangmei备注姓名公司,进群交流AI




10月AI大事件


1. AI攻占诺贝尔奖


今年诺贝尔奖的化学奖和物理学奖都“爆冷”颁给了AI,成为10月AI领域的热点话题之一。


10月8日,2024年诺贝尔物理学奖授予美国普林斯顿大学的生命科学家霍普费尔德(John J. Hopfield)和加拿大多伦多大学的辛顿(Geoffrey E. Hinton),以表彰其通过人工神经网络实现机器学习的基础性发现和发明。


辛顿是深度学习的先驱,被认为是与Yoshua Bengio和Yann LeCun齐名的“AI教父”。辛顿本人在得知拿奖后的第一反应也是“完全没有想到”。


此外,2024年诺贝尔化学奖授予大卫·贝克(David Baker)、丹米斯·哈萨比斯(Demis Hassabis)和约翰·乔普(JohnM.Jumper),以表彰他们在蛋白质设计和蛋白质结构预测领域作出的贡献。后两位都来自谷歌DeepMind公司,其中丹米斯是DeepMind创始人兼CEO。


最近,图灵奖得主LeCun对此发表锐评,表示“今年诺贝尔奖颁给AI,是诺奖委员会感到压力的结果,需要承认深度学习的影响。但物理奖颁给Hinton和Hopefield,获奖成果玻尔兹曼机和Hopefield网络现在完全无用。”网友对此看法不一,有人认为不无道理也有人说他是“酸了”。


2. Adobe推出新AI工具Project Turntable


在10月举行的Adobe MAX 2024大会上,Adobe的推新也引起不少关注。


Adobe MAX 2024大会又被称为设计圈年会,今年Adobe在会上推出了多项生成式AI新功能,包括Project Turntable,可以将2D矢量图像像3D对象一样进行旋转,无需重新绘制,AI会即时生成图像所需的隐藏部分。比如,一篮面包的2D图像在旋转过程中,AI自动补全了原本不可见的背面。


网友瞬间炸锅:甲方永远是对的!十年前甲方:把那头大象转过来。



Adobe全家桶逐渐AI化,生产力简直爆炸,决定了评论区抽一人送我正版Ps


3. AI卷王们集中发力


10月23日凌晨,大洋彼岸的AI卷王们接连发布重磅炸弹,也成为10月AI领域的一大景观——


首先是Anthropic发布升级版Claude 3.5 Sonnet和新模型Claude 3.5 Haiku,其中新功能Computer Use(计算机使用)成为最大亮点,可以让Claude像人一样使用计算机,比如查看屏幕、移动光标、单击按钮和输入文本。


Claude官网:https://claude.ai/new


AI图像方面,Stability AI一口气带来了Stable Diffusion 3.5全家桶,包括Large、Large Turbo和Medium三个版本,可在消费级硬件上运行,年总收入100万美元以下可免费商用。官方称在多样性上做了优化,无需大量提示,就能生成不同肤色和特征的人像图片,同时支持3D、摄影、绘画等多种视觉风格。


Stable Diffusion 3.5在线使用:

https://huggingface.co/collections/stabilityai/stable-diffusion-35-671785cca799084f71fa2838


AI初创公司的节奏是真的快,刚成立2年的GenmoGenmo突然发布Mochi 1预览版,宣称是“最强开源视频生成模型”。测试数据显示,Mochi 1在高保真运动和提示遵从性上都超越了Pika、可灵、Runway、Luma等领先的封闭模型。


https://www.genmo.ai/play


目前Genmo仅放出了Mochi 1 480P基础版本,提供在线试用。完整版本包括Mochi 1 HD将在今年年底前发布。


4. 智谱发布AutoGLM功能,AI会自动操作手机


Claude刚刚发布Computer Use,智谱就紧接着推出AutoGLM,可以让AI像人一样使用手机。只需要说出简单的语音/文字指令,AutoGLM就可以帮你:


在微信上给老板的朋友圈点赞并写评论……

在淘宝上购买某一款历史订单产品……

在携程上预订酒店……

在12306上购买火车票……

在美团上点个外卖......


目前,AutoGLM Web已经通过智谱清言插件对外发布,可以根据用户指令在网站上自动完成高级检索、总结与内容生成。手机端AutoGLM已开启内测,暂时仅支持安卓系统。



5. 国产AI在投放上杀疯了


最近,三张体现国产AI产品广告投放金额的图片在AI圈引发热议。虽然据我们了解,表格中的数据真实性还有待考究,至少并不完全准确,但国产AI今年在投放上的力度相较往年着实大了不少。


除了投流,国产AI们在内容上重点投放的平台和账号都有哪些,这些预算究竟流向了哪些博主?借助新榜旗下海汇提供的数据,“AI新榜”重点拉取了近3个月国内15家头部AI产品在抖音、快手、B站、小红书、视频号、微博等6个平台的投放内容数量以及具体投放内容。



我们发现,从最近三个月的数据来看,kimi最爱投快手、夸克最爱小红书;头部和科技博主账号固然有机会,垂类低粉博主却更吃香,而且类型广泛涉及游戏健身、美食、美妆和短剧等泛生活娱乐场景的博主。


相关阅读:《国产AI在投放上杀疯了,这些巨款究竟流向了哪些博主?》


6. 字节大模型训练被实习生攻击,涉事者已被辞退


10月18日,有传闻称字节跳动的实习生因对团队资源分配不满,利用HuggingFace漏洞,在公司的共享模型里写入破坏代码,导致大模型训练效果不可靠,而且AML团队无法核查原因。


10月19日,字节跳动回应称,涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,已在8月被辞退,但这并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。网传“涉及8000多卡、损失上千万美元”严重夸大。



7. OpenAI推出新交互界面Canvas


10月4日,OpenAI推出了全新交互界面Canvas(画布)。这是一个在标准对话框旁开启的独立窗口,用户可以在其中与ChatGPT深度协作,编辑和改进AI的输出。比如你可以高亮标注出重点部分,告诉ChatGPT特别关注哪里,类似于一个文案编辑或代码审查员提供实时反馈和建议。



内测期间,OpenAI将向ChatGPT Plus和Team用户推出Canvas,Enterprise和Edu用户将陆续获得访问权限,内测结束后将向免费用户开放使用。


8. 字节豆包推出AI智能体耳机Ola Friend


10月,字节正式杀入AI硬件,通过AI耳机。


10月10日,字节跳动豆包发布了首款AI智能体耳机Ola Friend。这款耳机接入了豆包大模型,并与豆包App深度结合。用户戴上耳机后,无需打开手机,便能通过语音唤起豆包进行对话,适用于信息查询、旅游出行、英语学习及情感交流等场景。目前Ola Friend已在各大电商平台上架售卖,售价1199元。


“AI新榜”在第一时间对Ola Friend进行了评测,虽然现在AI耳机还无法满足我们的所有想象,但已经能起到“搭把手”的作用了,具体使用体验见下方视频。



9. Apple Intelligence与iOS 18.1同步上线


10月28日,苹果宣布首批Apple Intelligence功能现已面向iPhone、iPad和Mac用户推出,随iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1的发布同步上线。目前,Apple Intelligence功能有:写作工具、通知摘要、Siri的新视觉更新、照片增强功能等等。


苹果表示,到12月,写作工具将变得更强大,还将推出新的视觉智能体验,帮助用户迅速了解物体和地点。


10. Kimi内测语音通话功能


实时语音通话早已不是什么新奇功能,ChatGPT、智谱清言、字节豆包、百度文小言、讯飞星火等海内外友商陆续发布,只不过效果各有千秋。


随着GPT-4o高级语音模式于近期陆续放出,10月,Kimi智能助手App也在内测语音通话功能,支持更换声音和调节语速,用户可以克隆自己的声音,并分享给他人使用。


与其他AI助手不同的是,Kimi语音通话界面会实时显示对话字幕,提升交流效率。另外,Kimi还设置了两个特殊的场景模式:英语陪练和模拟面试,比如英语陪练模式支持单词跟读、语法纠错和练习。



在测试中,我们让Kimi和GPT-4o试着扮演对方的相亲对象尬聊,Kimi总体表现还算自然流畅,而且很会主动开启话题。


相关阅读:《让Kimi和GPT-4o用语音功能相亲,两个AI差点谈上了》



10月AI创作


1. 捏扁一切,一种很新的po图方式


10月,Pika的特效滤镜在海内外社交媒体上走红,被网友们玩出花来,创作出不少新鲜有趣的AI内容。


网友们通过“Pikaffect”——Pika(https://pika.art/)于10月3日推出全新1.5版本后更新的AI特效功能,上传一张图片,就可以用AI模拟爆炸、融化、粉碎、膨胀、溶解等10多种视频特效。随后,用AI把“照片里的自己”捏扁,这成了“一种很新的po图方式”。



类似的特效也可以通过海螺AI等视频生成工具实现。


2. 人间清醒的AI奶奶们集体出道


最近,一大批AI奶奶账号在小红书、抖音等社交平台上集体出道,成为一道风景。


这些账号的内容形式比较简单:一组由AI创作的动漫奶奶形象,搭配一段以治愈、成长为关键词的清醒语录,就成了一个获赞不低的AI奶奶账号。


通过AI绘图、AI文案生成等工具即可批量制造这类图文内容,目前AI奶奶们已经开始探索包括卖课、接商单、做情感咨询、卖书、卖老年服装等变现方式。


不久前“AI新榜”发文《批量生产的AI奶奶,正在小红书扮演人生导师》,我们还看到后台有朋友评论“那我去做个人间暴躁舅爷爷的营销号不知道有没有人看”。



3.靠AI 3D内容赚到第一桶金


AI创作不仅能带来流量还能帮创作者赚到钱,这样的案例又有更新。


最近UGC内容平台Roblox玩家“RG”使用Tripo生成的一顶粉色贝雷帽,在1小时内吸引了超3000名玩家涌入Tripo。


“RG”也靠售卖游戏配饰赚到了超过1亿Robux(Roblox内的代币,折合约35万美元,近250万元人民币)。



Tripo AI(https://www.tripo3d.ai/app)支持文生3D和图生3D,其团队表示尽管目前游戏中的主角、场景依旧需要精度更高、更复杂的模型,但在短视频、游戏配件领域,AI 3D内容已经有了用武之地。


据“AI新榜”观察,在TikTok、Roblox等内容平台上,已有不少通过AI 3D内容赚一波的创作者。大部分玩家会先使用AI 3D工具基础建模,再导入Blender、Comfy等工具中进行细节优化。


相关阅读:《一顶帽子带来近250万元收入,国产AI 3D工具开始帮创作者赚钱了》


4. Runway视频转绘功能带火AI二创


Runway视频转绘功能最近带火了AI二创。


背景是Runway(https://runwayml.com/)近期推出了V2V(视频生视频)功能,由Gen-3模型提供支持,用户可以通过文字提示词指挥AI做后期特效,包括改变视频氛围、色调和风格,甚至更改人物形象。


很快,各大社交媒体上涌现出了不少基于AI视频转绘的有趣玩法,例如《甄嬛传》的二创,抖音博主“赛博影业”发布的“印度甄嬛”系列有一条视频获得近40万转发。



相关阅读:《AI魔改《甄嬛传》,Runway带飞AI视频转绘,这下谁还能拦住网友搞二创啊》

5. “3A大作”《沙威玛传奇》风靡全网


最近,一款名叫《沙威玛传奇》的模拟经营游戏风靡全网,让无数网友和玩家为之上头,其中的游戏角色、中文主题曲和配音都成了热门二创素材,随之涌现出一些爆款内容。


由于使用了AI制作,这款游戏被称为真正的“3A大作”:AI作图、AI作曲、AI配音。



《沙威玛传奇》无疑是一款低成本高回报的游戏,用大量AI实现了14种语言支持,虽然制作粗糙,但也提供了网友二创、玩梗的空间,这为AIGC在游戏的应用上打开了一条新思路。


相关阅读:《“3A大作”《沙威玛传奇》风靡全网,懂AI都知道这里面的门道有多深》



10月AI Talk 


1. Anthropic CEO Dario Amodei:“强大AI”最早2026年到来,比诺贝尔奖获得者更聪明


原文:https://darioamodei.com/machines-of-loving-grace


10月13日,Anthropic CEO Dario Amodei发文《Machines of Loving Grace:How AI Coulf Transform the World for the Better(AI能如何改变世界,创造更美好的未来)》详细阐述了强大AI的定义及限制因素,并对其在生物与健康、神经科学与心理、经济发展与贫困、和平与治理、工作与意义这五个领域的积极影响进行了预测。


他表示自己谈论了很多关于强大的AI的风险,但他更想强调大多数人都低估了AI的好处,就像低估了风险可能有多严重。


在他看来,强大的AI在形式上可能类似于如今的大语言模型,在多个领域会比诺贝尔奖得主更聪明,它没有实体形态,并且具备所有可供人类进行虚拟工作的交互方式,包括文本、音频、视频、鼠标和键盘控制以及互联网访问,还能自主完成任务等。


“许多人对强大的AI是否会很快建成持怀疑态度,有些人则怀疑对它是否会建成。我认为它最早可能在2026年到来,尽管也有可能需要更长的时间。”


2. 新世相创始人张伟:AIGC浪潮会带来新的一批内容偶像


相关阅读:《上万年轻人用AI写遗嘱,新世相如何在AI时代制造流行?》


制造过“逃离北上广”等多个现象级事件的头部内容公司新世相,在2024年决定全面拥抱AI,并成立了AI创意厂牌“新世相AI”,打造了第一届AI艺术节(AIAF),还邀请1万个年轻人用AI写遗嘱。



在接受“AI新榜”访谈时,新世相联合创始人杨远骋表示,今天的AI虽然可以做很多事,但它最直接影响的其实是艺术创作、和各种各样的自媒体创作。


“AIGC领域很多活跃的创作者,都不是过去在图片/影像生产领域很活跃、甚至有影响力的那批人。AIGC浪潮会带来新的一批内容偶像,我觉得这件事在小圈子里已经发生了。”新世相创始人张伟认为,现阶段专业的AI内容团队并不存在,对内容公司来说,现在做AI需要的并不是技术能力,而是产品研发思维,以及用户理解、选题洞察、运营思维和传播思维等内容行业里最基本的能力。


3. Meta首席人工智能科学家杨立昆:AI威胁人类论是胡说八道


华尔街日报链接:https://www.wsj.com/tech/ai/yann-lecun-ai-meta-aa59e2f5?st=SYmYBM&reflink=desktopwebshare_permalink


Meta首席人工智能科学家杨立昆(Yann LeCun)近日接受《华尔街日报》采访时提到,AI威胁人类论“完全是胡说八道”。他认为,今天的语言大模型缺乏一些关键能力,如持久记忆、推理、规划和对物理世界的理解。现有模型只是证明了“你可以操纵语言,但并不聪明”,它们永远不会产生真正的通用人工智能(AGI)。


杨立昆曾获得图灵奖,他此前曾在社交媒体上表示,在担心控制超级智能AI之前,我们需要先弄清楚如何设计一个比家猫更聪明的系统。



4. 李彦宏:百度不会碰Sora类的视频生成


国内AI视频模型在近半年来一路狂奔,几乎把Sora甩在身后,但做不做视频生成模型,不同AI公司之间仍存在分歧。


据36氪,李彦宏在百度2024年第三季度总监会上提到,百度不碰Sora类的视频生成。ToB业务尽量不碰吃力不讨好的项目制,尽量推出标准化产品。而文心一言改名后的ToC新搜索应用“文小言”,在推广上则不会像字节跳动的豆包、月之暗面的Kimi那样激进。


5.《AI现状报告》:OpenAI相对于其它AI公司的领先优势已基本消失


完整报告:https://www.stateof.ai/


人工智能投资者Nathan Benaich和Air Street Capital近日发布了最新一期《State of AI(人工智能现状)》报告,发现OpenAI相对于其它AI公司的领先优势已基本消失。


Anthropic的Claude 3.5 Sonnet、Google的Gemini 1.5、X的Grok 2,Meta的Llama 3.1 4050亿参数开源模型,在部分基准测试中已与OpenAI的GPT-4o持平,部分测试甚至略胜。OpenAI最近发布的o1 Strawberry模型在推理任务中仍然保持着优势。


6. Runway CEO Cristobal Valenzuela:AI公司的时代已经结束了


原文:https://cvalenzuelab.com/newmedia?continueFlag=0f330e7b74d1c55481c53d0381543412


Runway CEO Cristobal Valenzuela近日发布公开信称:“我认为AI公司的时代已经结束了,因为AI正在成为像电力或互联网一样的基础设施。”


他表示,Runway不是一家AI公司,而是一家媒体和娱乐公司。AI只是一种工具,真正的变革不在于技术本身,而是在于它所实现的东西:新的表达形式、讲述故事的新方式、连接人类体验的新方法。


7. First Page Sage发布了10月份美国AI聊天机器人市场份额报告


相关链接:https://firstpagesage.com/reports/top-generative-ai-chatbots/


AI博主歸藏在公众号“歸藏的AI工具箱”中整理了中文版图片以及主要内容:


•ChatGPT依然是王者,但是份额在逐渐下降

•谷歌和微软在争夺老二的位置

•Perplexity和ClaudeAI高速增长

•Perplexity和ClaudeAI正在从ChatGPT和Gemini蚕食份额



下月AI预告


1. 11月12日,百度世界2024将在上海举办


以“应用来了(Applications Are Here)”为主题的百度世界2024将于11月12日在上海举办,目前公布的大会亮点包括:李彦宏年度演讲;100多个AI原生应用发布;4场主题分论坛和30多节公开课;超5000平方米的 “AI应用小镇” 科技展区等等。



百度世界官网:https://baiduworld.baidu.com/m/world/main/2024/index.html?lng=zh


2. 11月4日至5日,韩国SK AI峰会将在首尔举办


SK AI峰会是韩国SK集团每年的重要活动,今年扩展为全球论坛。OpenAI董事长兼总裁Greg Brockman、微软执行副总裁Rani Borkar、创新工场董事长兼首席执行官李开复等AI公司高管将出席。峰会将举办100场会议和50场展览,重点关注AI基础设施、半导体和服务。



SK AI峰会官网:https://skaisummit.com/


3.11月20日至22日,微软将举办Ignite 2024全球技术大会


北京时间11月20日至22日,微软Ignite 2024全球技术大会将在芝加哥举行,全球线上同步直播。今年大会将重点关注 “AI转型中的最新创新”,微软董事长兼首席执行官萨蒂亚·纳德拉 (Satya Nadella)将在11月20日12:00发表主题演讲。



微软Ignite 2024官网:https://ignite.microsoft.com/en-US/home


4. 11月,MiniMax将发布首款对标GPT-4o的实时语音对话API产品


有消息人士称,AI大模型领域的独角兽MiniMax将于11月发布对标GPT-4o的Realtime API服务。这是MiniMax推出的首款端到端实时语音对话产品,将提升端到端实时多模态处理能力,并带来更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交、直播、游戏等多种场景提供服务。


5. 11月,快手可灵即将上架独立App


在2024中国计算机大会上,快手可灵AI宣布其用户已超过360万,累计生成3700万个视频和超过一亿张图片,同时将内测视频人脸模型功能并于近期上架独立App。


另有爆料称,可灵1.5 Lora功能正在测试中,可以解决文生视频角色一致性的问题。


6. 11月,天工AI将升级高级搜索功能及发布新模型


昆仑万维旗下天工AI智能助手持续迭代更新,近期在网页端(tiangong.cn)新增了高级搜索模式、彩页和宝典,11月会升级高级搜索,以及发布新模型。



7. 据内部人士向“AI新榜”透露,11月,腾讯混元将宣布模型开源上的大进展。


ps. 欢迎AI同行联络爆料,完善信息,共创AI月刊,可联系微信zhangjie74510(备注姓名公司)


    

AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。

     
欢迎分享、点赞、在看
 一起研究AI
     

分享文章链接