上周五(11月22日),AI新榜「头号玩家沙龙」第一站来到了北京,我们邀请到五位「最会玩AI的人」,通过主题演讲和现场互动,分享探讨不同视角下AI内容创作的经验心得。
这次我们还在沙龙现场设置了「迷你AI画展」,展示了一些AI超级创作者的最新作品,有没有哪一幅令你眼前一亮呢?
其中有两幅作品来自演讲嘉宾闲人一坤和乔治-周士诚,对AI视频创作感兴趣的玩家可以扫码观看全集。
另外还有一些AI艺术系列作品来自创作者海辛Hyacinth、Simon阿文和土豆人。土豆人有一幅名为《伴心》的画作,是国内第二例法院判决有版权及著作权的AIGC数字作品。
没来到现场的朋友不用遗憾,以下是我们整理的嘉宾演讲精华,也期待在下一场和大家见面,让我们相约2025年1月10日的「头号玩家沙龙」上海站,继续探索AI的无限可能!
ps. 以下内容已经嘉宾确认,关注“AI新榜”公众号,后台回复关键词“北京站”,可查看嘉宾授权公开的PPT内容。
天工AI搜索技术负责人 @舒蛰
“信源的相关性、权威性和实时性,决定了AI搜索的天花板”
今天我对演讲形式做了些创新,没有制作PPT,我用的是天工最新的AIGC应用——彩页,来跟大家分享天工大模型及AI搜索技术应用。
All in AGI与AIGC一直是我们的愿景,从2023年2月发布天工1.0双千亿级大模型以来,我们陆续开源了Skywork-13B、Skywork3.0,Skywork-MoE等多个大模型,其中Skywork-13B是当时能够跟Llama2-13B匹敌的开源模型。
我们一直执着于通用大模型,比如去年我们自研了国内首款AI音乐大模型SOTA ——SkyMusic,支持以假乱真的人声生成、歌词控制和多种曲风,让不会唱歌的人实现原创音乐梦。
近期,我们发布了真正对标GPT-4o的Skywork 4o,可以跟它进行无时延语音交流,模拟各类角色,就像跟朋友对话,能在不断交互中记住你的偏好,大家可以试用。
关于大模型落地的核心应用,我们最正确的决策,就是在2023年8月推出了中国首款AI搜索引擎——天工AI搜索,目前已升级到4.0高级搜索模式。比如这个case,它已经懂得去分析MACD指标,知道均线、主力资金流动以及融资融券情况,也会搜一些公司最近新闻辅助决策。
那我们是怎么做到的?大家都知道AI搜索引擎技术的核心是RAG,但会经常忽略RAG中信源的重要性,很多场景下,信源的相关性、权威性及实时性,会决定答案的精度天花板。
其实天工AI应该是业界做AI应用里最重视信源的团队了,尤其对财经和学术两个很难的方向做了专门信源增强,索引了10亿+专业财报、研报和国内外学术论文,再把其中的文本、图片、图表、视频提取出来,作为大模型的输出,确保用户query能在这10亿+中找到非常专业精准的结果。
而在AI应用的下半场,我认为仅有搜索是不够的,突破性创新是必然,所以我们基于AIGC做了创新功能——彩页和宝典。现在大家看到的演示文稿就是我用彩页做的,它未来将会是款多模态内容生成产品,你可以一键生成自己感兴趣的内容。而宝典是一个AI时代的创新知识页面,我们希望用户在这里产生知识,围绕知识形成一些group,从而获得收益。
星贤文化创始人、AI IP《山海奇镜》制作人 @闲人一坤
最近双11我看到家里堆满了快递,我就用AI制作了一段视频《山海奇境之物欲物语》。过去,制作这样一个片子需要一个团队的协作,可能花费一周甚至十天的时间,而如今,借助AI的能力,我只用了大约半天的时间。
从500人天到0.5人天,这种效率提升100倍的飞跃,我称之为“AI的面包”,它代表了我们现在已经拥有的能力。我们每一个人都能够借助AI变成一个超级个体,AI就像钢铁侠的方舟反应堆。
我在传统影视行业做了20多年,很多时候我们会受到预算和时间的限制,无法实现更复杂的效果。但现在,AI的出现让我们能够快速验证创意的可行性,可能用1/10的时间、1/10的人力,就能实现20%~30%的效果。
在制作《山海奇境》的过程中,我们利用AI生成了所有镜头,而不再依赖传统线性的工作流程。例如,在策划阶段,我们就可以同时使用AI生成场景图和角色设计;在剧本完成后,AI可以立即开始生成视觉效果。这种并行的工作流程极大地提升了效率,让我们能够在创作过程中实时反馈和调整。
这种创作流程的变化会让AI IP的开发变成标配,借助AI的赋能,我们可以同时开发多种内容形态,如游戏、电影、电视剧等,形成一个IP矩阵。
我相信,未来是一个AI内容爆炸的时代。短视频出现后,我们的内容进入一个爆炸期,面对大量的内容冗余,我们需要找到更多的方式来吸引内容消费者的注意力,AI IP一定是一个必选项。
有了AI IP后,内容平台也会发生变革,不再是简单的内容展示平台,而是内容孵化平台。从猜你喜欢到生你喜欢,平台能够根据用户的喜好即时生成个性化的内容。
AI将为每个人打开一个平行宇宙,内容创作者不再只是写故事,而是在构建一个完整的世界。这一切都不是科幻,而是正在发生的现实。
B站UP主、专业级电影制作者 @乔治-周士诚
“AI广告和短视频应用相对成熟,但AI还不能完全替代专业影视制作”
我想和大家分享AI在视觉领域,特别是影视制作中的应用和发展历程。
从2022年底开始,AI图片生成技术已经非常成熟了,文生图、图生图等AI能力已广泛应用于Logo设计、字体设计、分镜故事板、家装设计、海报设计、电商模特换装、小说推文配图、风格模型训练等领域。例如,Midjourney在Logo设计和表情生成方面表现出色;用AI给电商模特换装可以节省成本,避免版权问题。
在视频生成领域,我总结了两个方向,AI广告和短视频这个方向的应用相对成熟,许多客户提出了用AI做广告的需求,但在电视剧和电影级别的视效领域,AI技术还不能完全替代传统制作。我曾在本地生成制作了一部致敬《沙丘》的AI作品,部分AI穿帮的镜头需要专业后期软件进行修正处理。
AI视频换脸已经取得了专业级别的应用。比如当明星遇到突发状况,我们可以通过训练明星的AI模型,在电视剧中实现无缝换脸。这需要大量的图像数据和长时间的训练,以及强大的后期团队,那些用单照片进行换脸的只是娱乐级的应用。
另外,AI动画和游戏方面的应用也在不断发展,包括道具和角色设计、立绘美宣、3D模型生成等。我预计明年AI 3D模型生成会成为重要的发展方向,用图片直接生成3D模型,应该是明年的一个爆发点。有了3D模型后,甚至能用一句话来生成三维角色的动画,可以导入到三维软件当中进行编辑制作,目前AI生成的动画角色和动作库正在逐步成熟。
随着AI技术的不断进步,数字环境和数字人的生成将更加逼真。我试着做了一个自己的数字人,即数字备份。也许就像电影《头号玩家》所呈现的那样,最终我们可以在虚拟世界生活,实现永生。
VAST 产品负责人 @Jack
VAST定位为一家3D AI大模型公司,我们的愿景是打造一个大众级别的3D内容创作工具,从而构建一个优质的3D内容平台。
今年年初,我们推出了一个数十亿参数级别的3D大模型Vast 1.0,能够在8秒内从文字或图片生成3D模型。9月,我们又推出了2.0版本,提升了模型的精细度和几何结构,生成结果在目前海内外的3D生成项目中保持领先。
我们的3D模型全都是通过Tripo生成的。Tripo支持从文字或图片生成模型、风格转绘、3D视频生成、场景生成等功能,应用场景涵盖室内建筑、游戏设计、动画制作等。
传统3D建模的成本和门槛非常高,全世界可能就几百万玩家,鉴于历史上内容生态爆发的经验,我们认为VAST的发展包括三个阶段:第一是3D静态资产生成,可应用于CG、游戏、动画、影视营销等,帮助传统建模师降本增效。第二是3D动态内容生成,用户通过prompt控制生成可以交互的动态内容。第三我们预测3D新型内容生态会迎来爆发,人人都零门槛创建3D世界和内容,并实现交互。
与技术发展对应,我们产品端也分为三个阶段:第一是模型开发和需求积累,保持技术前沿;第二是提供大众级别3D创作工具,衍生更多3D内容场景;第三是构建3D内容平台,实现UGC内容的交互和体验。
在应用场景上,我们已经与市面上前十大3D打印公司合作,普及并培育众多3D爱好者;并举办了社区比赛,通过3D+游戏吸引更多创作者。我们也在扩展更多商业场景,如与高砖合作发布全球首个AI 3D积木生成大模型。
我们希望实现一个完全由AI生成的3D内容世界,无需后期渲染,让用户自由畅游。
最后,我们正在扩张,欢迎有意向的同学加入VAST。
独立咨询顾问、新榜研究院AI高级讲师 @张佳
大多数人接触AI最多的场景还是文案创作,包括起标题、写公众号文章、私域转发语等。这当中要用好AI,提示词是关键,只有学会了控制AI,才能有效应用。
通过提示词的约束,你可以让AI按任何你想要的格式和样式输出。比如AI可以帮助我们将长文转换为小红书图文卡片,快速完成内容重构和视觉化。我们可以采用文案GPS大纲的方法论,引导AI逐步生成有说服力的文案。说不清楚要求的话,也可以给AI一个模板示例参考,它们比人强。
在和AI的交互中,短板其实是使用的人,人的表达能力上限,决定了AI的输出质量上限。不过这依然是AI的缺陷,哪怕是OpenAI的o1模型也没法推理出你到底想要什么。
而对于企业来说,引入AI并不是为了取代员工,而是提升工作效率。最好的办法是在具体的地方为员工提供具体的工具,而不是让他们学AI、给他们买AI。
例如,将AI集成到飞书等办公软件中,让员工在最顺手的地方使用AI。AI可以作为智能体提供编辑规划、选题建议、直播脚本等服务,员工可以直接在群里艾特机器人获取所需内容。
此外,还可以为企业开发特定业务需求的定制化智能体,例如让AI作为客服的支持工具,提供回复建议和培训。
最后,我想说用好AI需要有缘人,且要比以前更卷,即那些愿意探索和学习如何更好地利用AI的人。我总结了10个模式,包括提问学习、翻译转化、模仿等。我们可以根据工作的决策难度和复杂度来判断如何使用AI。
对于如何把AI落地到具体业务中,我的建议是:摸清使用模式、放在合适的位置、自己也要卷起来。
AI新榜「头号玩家沙龙」下一站将来到上海,2025年1月10日,我们上海见!
ps. 关注“AI新榜”公众号,后台回复关键词“北京站”,可查看嘉宾授权公开的PPT内容。
「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。