登录/注册
扫描二维码
手机浏览

​百度AI没有放弃争夺C位

AI新榜
新榜独家AIGC


作者 | 月山橘 阿虎
编辑 | 张洁

以为百度“躺平”了,但其实还在牌桌上。
 
3月16日,在文心一言两周年之际,百度发布文心大模型4.5及文心大模型X1,用户在文心一言官网即可免费使用。

据官方介绍,此次上线的文心大模型4.5提升了多模态理解能力,可以理解梗图、漫画、音乐、电影等内容。

作为深度思考模型,X1则重新定义了“性价比”,它的性能对标了DeepSeek-R1,调用价格却是R1的一半。同样,X1模型具备长思维链,还增加了多模态能力和多工具调用,能理解和生成图片。

两款模型一经上线,不少海外网友就纷纷在百度评论区求开源、求账号、求英文版。还有网友调侃“对OpenAI是个坏消息”、“OpenAI:禁了他们”。


最近,百度对AI大模型的动作频频,先是预告4月1日前文心大模型免费,再透露文心大模型4.5系列也将在6月30日正式开源,并在今年下半年发布文心大模型5.0。百度这次真“开挂”了?我们从逻辑推理、多模态内容理解和创作等方面,实测了两款新模型。

体验地址:https://yiyan.baidu.com



实测两款文心大模型,
洗脑神曲、短片、表情包轻松拿捏?

这年头,没有深度推理能力的AI,不是好AI,我们先来试试X1的逻辑推理能力。

青青草原上有100只狼和1只喜羊羊。狼可以吃草也可以吃羊,按照常理,狼当然更喜欢吃羊,但是,如果狼吃了羊,狼就会变成羊,从而可以被其他任意一只狼追上并吃掉。这些狼的奔跑速度各不同,都非常聪明,比起吃东西,它们更讨厌自己被吃掉。而且,这些狼都不愿意和其他人分享食物。那么喜羊羊会不会被狼吃掉?



X1进行了全面的思考,它的思考过程中首先明确了问题的关键点,然后通过理解这些关键点,再分析狼的不同逻辑、权衡利弊,最后给出了完整的答案——取决不同的博弈策略。

暂且不论X1的结论是否完全正确,但它努力“思考”的样子着实打动了我。当我进一步指出最终答案的逻辑漏洞时,X1也及时将我的质疑纳入了自己的推理考量中,并给出了更全面的答案。


我们再上点难度,比如,需要同时用到“图片识别”能力和“逻辑推理”能力的题:



可以看到,X1每一步的推理过程都很清晰,但最后一幅图的识别能力出现了问题。图片上是“狗+兔+猫”,但X1认为是“两只狗+兔+猫”😅。


除了逻辑推理能力之外,我们也试了试X1的复杂问题的分析规划能力,让X1响应“体重管理年”的号召,量身制定一个减重计划。


从思维链来看,X1的思考过程相对简单,输出内容也更像是将具体的思考步骤罗列出来,几乎可以直接复制成markdown格式来生成思维导图了。

我们同样比较了一下DeepSeek R1模型。R1在联网模式下无法上传图片文件,不过同一指令下,R1的思考过程会更复杂也更细致,整体的考虑维度和抓取内容也更广更深。

让DeepSeek R1制定“减重计划”

不过,让我们惊喜的是,相比其他深度思考模型,X1会根据用户不同的指令,来选择调用不同的工具。比如,我们让他辨别一下,这个男人是谁,又出自什么电影。


在“看图识人”的指令下,它主动调用了“图片理解”工具,“热梗搜索”的指令下,它选择了“联网功能”。也就是说,我们不用手动选择调用哪个工具,让X1自己动手就可以了。目前,X1上线的工具包括联网搜索、AI绘图、文档问答、图片链接、百度学术检索查询等功能。


我们进一步试试文心大模型4.5的多模态能力,看看它看视频、听音乐、识梗图的水平。


我们上传了最近很火的“oiiai猫”的二创视频,值得注意的是,目前,文心4.5支持单个20MB以内的视频文件。

可以看到,文心4.5能够看懂视频内容,它告诉我们:“视频中的猫猫站在绿色的屏幕前……整体形象也更为清晰立体。


遗憾的是,它无法识别出该视频模仿了最近很火的“oiiai猫”,包括背景音乐的辨认也出现了错误。它认为这首BGM是《Digital World》,但事实上是网友模仿音游《Friday night funkin》自创的旋律。

实测下来我们发现,如果让文心大模型4.5直接听音乐,它可以很快地听出神曲《来财》,同样也可以听懂视频里的人大喊“xx,过来坐下”,甚至可以识别出视频中的场景、画面、物品等细节信息,但让它进一步看懂视频和音乐中隐藏的“梗”,现在还是有些难度。



并且,它还是一如既往的“严格”:

无法识别点烟的doomer



百度AI没有放弃争夺C位

百度AI的起步并不算晚,两年前的3月16日,百度发布文心一言,彼时他是上市公司中第一个推出类ChatGPT应用的公司。

在2024年百度世界大会上,李彦宏展示了文心大模型“耀眼”的数据:其日均调用量从一年前的5000万次飙升至15亿次,增长约30倍。

但看似亮眼的增长背后,百度AI也面临着双重压力——口碑群嘲和行业竞争的白热化。

一方面,C端用户对AI的期待早已从“技术炫技”转向“真实价值”。模型好用与否,用户可以直接感知到,心中自有判断。不少网友经常诟病百度“起了个大早,赶了个晚集”,文心在模型表现上比不上后来的豆包、Kimi、元宝。

作为苹果最初选定的中国区AI合作伙伴,百度本有机会在全球科技巨头的AI生态中占据一席之地,然而,由于技术适配问题和隐私政策的严重分歧,双方合作进展陷入僵局。最终苹果转向与阿里、百度共同合作,为中国市场的iPhone嵌入Apple Intelligence,这在社交媒体引发了新一轮对百度的群嘲。


另一方面,开源生态的冲击不容小觑。DeepSeek的崛起对于百度AI是一个更现实的威胁,目前百度AI颇有夹在OpenAI、谷歌Gemini等国际巨头和国内AI新兴力量中间,骑虎难下之势。

李彦宏曾多次在公开场合表达对于闭源的坚持,强调闭源才能赚钱,“闭源才有竞争力,开源等于做慈善”,认为如果大模型都开源了,那企业就没办法靠AI技术形成护城河,会降低企业核心竞争力。

但开源模型正在改变AI市场的游戏规则,企业用户可以通过本地部署、微调模型更灵活自主地掌控AI能力,李彦宏的“闭源论”正在遭遇现实考验。而OpenAI、Ahthropic等闭源AI公司之所以能保持竞争力,是因为其技术优势足够强。也就是说,如果闭源没有绝对的技术优势,那就只剩下“不够开放”的负面影响了。

面对免费高质量开源模型的冲击,如果继续闭源,百度AI的企业市场势必会被开源生态挤压,B端市场份额进一步萎缩。所以,百度态度急转弯,毅然决然选择了将文心大模型开源。

同样的“举棋不定”也体现在百度AI的商业化上。此前,文心一言曾向C端用户收费,打响了国内AI应用收费第一枪。只不过,在DeepSeek等免费高质量AI模型的围攻下,百度又宣布从2025年4月起全面免费,重新抢占用户和市场份额。

从闭源到开源,从收费到免费,百度AI的战略选择可谓是一波三折,这种反复横跳的决策背后既是对市场趋势的妥协,也体现了百度在AI变现路径上的焦虑和不确定性。


总的来看,百度AI“依然能打,但还不够”。对百度AI来说,技术积累和本土化经验依然是其核心优势,但当行业竞争愈发激烈,身在其中的百度如何把握时机,争夺C位,这也影响着百度AI的最终走向。



     
     

AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。

      
      
欢迎分享、点赞、在看
 一起研究AI

分享文章链接