作者 | 月山橘阿虎

编辑 | 张洁

以为百度“躺平”了，但其实还在牌桌上。

3月16日，在文心一言两周年之际，百度发布文心大模型4.5及文心大模型X1，用户在文心一言官网即可免费使用。

据官方介绍，此次上线的文心大模型4.5提升了多模态理解能力，可以理解梗图、漫画、音乐、电影等内容。

作为深度思考模型，X1则重新定义了“性价比”，它的性能对标了DeepSeek-R1，调用价格却是R1的一半。同样，X1模型具备长思维链，还增加了多模态能力和多工具调用，能理解和生成图片。

两款模型一经上线，不少海外网友就纷纷在百度评论区求开源、求账号、求英文版。还有网友调侃“对OpenAI是个坏消息”、“OpenAI：禁了他们”。

最近，百度对AI大模型的动作频频，先是预告4月1日前文心大模型免费，再透露文心大模型4.5系列也将在6月30日正式开源，并在今年下半年发布文心大模型5.0。百度这次真“开挂”了？我们从逻辑推理、多模态内容理解和创作等方面，实测了两款新模型。

体验地址：https://yiyan.baidu.com

实测两款文心大模型，

洗脑神曲、短片、表情包轻松拿捏？

这年头，没有深度推理能力的AI，不是好AI，我们先来试试X1的逻辑推理能力。

青青草原上有100只狼和1只喜羊羊。狼可以吃草也可以吃羊，按照常理，狼当然更喜欢吃羊，但是，如果狼吃了羊，狼就会变成羊，从而可以被其他任意一只狼追上并吃掉。这些狼的奔跑速度各不同，都非常聪明，比起吃东西，它们更讨厌自己被吃掉。而且，这些狼都不愿意和其他人分享食物。那么喜羊羊会不会被狼吃掉？

X1进行了全面的思考，它的思考过程中首先明确了问题的关键点，然后通过理解这些关键点，再分析狼的不同逻辑、权衡利弊，最后给出了完整的答案——取决不同的博弈策略。

暂且不论X1的结论是否完全正确，但它努力“思考”的样子着实打动了我。当我进一步指出最终答案的逻辑漏洞时，X1也及时将我的质疑纳入了自己的推理考量中，并给出了更全面的答案。

我们再上点难度，比如，需要同时用到“图片识别”能力和“逻辑推理”能力的题：

可以看到，X1每一步的推理过程都很清晰，但最后一幅图的识别能力出现了问题。图片上是“狗+兔+猫”，但X1认为是“两只狗+兔+猫”😅。

除了逻辑推理能力之外，我们也试了试X1的复杂问题的分析规划能力，让X1响应“体重管理年”的号召，量身制定一个减重计划。

从思维链来看，X1的思考过程相对简单，输出内容也更像是将具体的思考步骤罗列出来，几乎可以直接复制成markdown格式来生成思维导图了。

我们同样比较了一下DeepSeek R1模型。R1在联网模式下无法上传图片文件，不过同一指令下，R1的思考过程会更复杂也更细致，整体的考虑维度和抓取内容也更广更深。

让DeepSeek R1制定“减重计划”

不过，让我们惊喜的是，相比其他深度思考模型，X1会根据用户不同的指令，来选择调用不同的工具。比如，我们让他辨别一下，这个男人是谁，又出自什么电影。

在“看图识人”的指令下，它主动调用了“图片理解”工具，“热梗搜索”的指令下，它选择了“联网功能”。也就是说，我们不用手动选择调用哪个工具，让X1自己动手就可以了。目前，X1上线的工具包括联网搜索、AI绘图、文档问答、图片链接、百度学术检索查询等功能。

我们进一步试试文心大模型4.5的多模态能力，看看它看视频、听音乐、识梗图的水平。

我们上传了最近很火的“oiiai猫”的二创视频，值得注意的是，目前，文心4.5支持单个20MB以内的视频文件。

可以看到，文心4.5能够看懂视频内容，它告诉我们：“视频中的猫猫站在绿色的屏幕前……整体形象也更为清晰立体。”

遗憾的是，它无法识别出该视频模仿了最近很火的“oiiai猫”，包括背景音乐的辨认也出现了错误。它认为这首BGM是《Digital World》，但事实上是网友模仿音游《Friday night funkin》自创的旋律。

实测下来我们发现，如果让文心大模型4.5直接听音乐，它可以很快地听出神曲《来财》，同样也可以听懂视频里的人大喊“xx，过来坐下”，甚至可以识别出视频中的场景、画面、物品等细节信息，但让它进一步看懂视频和音乐中隐藏的“梗”，现在还是有些难度。

并且，它还是一如既往的“严格”：

无法识别点烟的doomer

百度AI没有放弃争夺C位

百度AI的起步并不算晚，两年前的3月16日，百度发布文心一言，彼时他是上市公司中第一个推出类ChatGPT应用的公司。

在2024年百度世界大会上，李彦宏展示了文心大模型“耀眼”的数据：其日均调用量从一年前的5000万次飙升至15亿次，增长约30倍。

但看似亮眼的增长背后，百度AI也面临着双重压力——口碑群嘲和行业竞争的白热化。

一方面，C端用户对AI的期待早已从“技术炫技”转向“真实价值”。模型好用与否，用户可以直接感知到，心中自有判断。不少网友经常诟病百度“起了个大早，赶了个晚集”，文心在模型表现上比不上后来的豆包、Kimi、元宝。

作为苹果最初选定的中国区AI合作伙伴，百度本有机会在全球科技巨头的AI生态中占据一席之地，然而，由于技术适配问题和隐私政策的严重分歧，双方合作进展陷入僵局。最终苹果转向与阿里、百度共同合作，为中国市场的iPhone嵌入Apple Intelligence，这在社交媒体引发了新一轮对百度的群嘲。

另一方面，开源生态的冲击不容小觑。DeepSeek的崛起对于百度AI是一个更现实的威胁，目前百度AI颇有夹在OpenAI、谷歌Gemini等国际巨头和国内AI新兴力量中间，骑虎难下之势。

李彦宏曾多次在公开场合表达对于闭源的坚持，强调闭源才能赚钱，“闭源才有竞争力，开源等于做慈善”，认为如果大模型都开源了，那企业就没办法靠AI技术形成护城河，会降低企业核心竞争力。

但开源模型正在改变AI市场的游戏规则，企业用户可以通过本地部署、微调模型更灵活自主地掌控AI能力，李彦宏的“闭源论”正在遭遇现实考验。而OpenAI、Ahthropic等闭源AI公司之所以能保持竞争力，是因为其技术优势足够强。也就是说，如果闭源没有绝对的技术优势，那就只剩下“不够开放”的负面影响了。

面对免费高质量开源模型的冲击，如果继续闭源，百度AI的企业市场势必会被开源生态挤压，B端市场份额进一步萎缩。所以，百度态度急转弯，毅然决然选择了将文心大模型开源。

同样的“举棋不定”也体现在百度AI的商业化上。此前，文心一言曾向C端用户收费，打响了国内AI应用收费第一枪。只不过，在DeepSeek等免费高质量AI模型的围攻下，百度又宣布从2025年4月起全面免费，重新抢占用户和市场份额。

从闭源到开源，从收费到免费，百度AI的战略选择可谓是一波三折，这种反复横跳的决策背后既是对市场趋势的妥协，也体现了百度在AI变现路径上的焦虑和不确定性。

总的来看，百度AI“依然能打，但还不够”。对百度AI来说，技术积累和本土化经验依然是其核心优势，但当行业竞争愈发激烈，身在其中的百度如何把握时机，争夺C位，这也影响着百度AI的最终走向。

     
     
      
      
       
       
        
        
         
         

        
        
        
        
         「AI新榜交流群」进群方式：添加微信“banggebangmei”并备注姓名+职业/公司+进群，欢迎玩家们来群里交流，一起探索见证AI的进化。
        
        
        
        
         

        
        
       
       
      
      
     
     
      
      
        欢迎分享、点赞、在看
      
      
      
      
        一起研究AI

​百度AI没有放弃争夺C位

实测两款文心大模型， 洗脑神曲、短片、表情包轻松拿捏？

百度AI没有放弃争夺C位

百度AI没有放弃争夺C位

实测两款文心大模型，

洗脑神曲、短片、表情包轻松拿捏？