梁文锋的60条思考马化腾紧跟梁文锋
时间:2025-06-18阅读数:26
对DeepSeek的紧紧跟进,是因为元宝正在切切实实享受到这一策略带来的好处。在今年年初的民企座谈会上,和梁文锋做了回“同桌”,并排而坐。在那4天之前,2月13日,腾讯元宝宣布接入DeepSeek。
没有人想到,腾讯此举让元宝像坐上火箭,扶摇直上三千里,一度登上苹果应用商店中国区免费榜榜首。前不久的财报会上,腾讯总裁刘炽平透露元宝的日活激增超过20倍。
自此之后,“自研+开源”的融合模式成为腾讯最新的AI策略,即通过与自身丰富产品生态的融合,也通过不同模型之间的协同互补,达成用户侧的体验提升。
另一方面,从这次V3更新和混元T1正式版的上线,能看出来另一种“融合”的趋势,那就是推理模型和通用模型的互相靠近。
到了3月26日,元宝就已经接入了V3-0324,并且还同步接入了腾讯自研的混元T1。一个非推理模型,一个推理模型;一个外部模型,一个自研模型。元宝算是把组合玩明白了。
V3这次的更新说是“小版本更新”,悄无声息地突然在开源平台Hugging Face上线,其实是来了个大的,升级幅度并不小。朋友说“随便吃点”,你以为是速冻饺子,其实端上来个毛血旺。
最有意思的是,V3-0324虽然不是推理模型,但是有R1的味道。官方技术报告里点出的四大亮点“推理能力”“前端开发能力”“中文协作能力”“中文搜索”都落在了R1的优势范围内。
在实际测试中,V3-0324也比旧版本更倾向于输出更多文本。比如测试一个简单的指令“写一篇你自己的散文”,V3给出的有科技浪漫感的文本可以说是“很R1”了。
DeepSeek也在报告中透露,V3-0324和之前的V3使用的base模型相通,改进了后训练方法,并借鉴了R1推理模型训练过程中的强化学习技术。
从前推理模型和非推理模型在使用时,用户很明显的一个取舍是,非推理模型响应快,但精细和准确度上弱一些,推理模型则往往“思考”得更深入,还会给出详细的思维链,返回的结果更精确详细,但响应速度上比较慢。
腾讯新推出的混元T1模型也有这样的特点。元宝在26日同步接入了DeepSeek的V3-0324和自研的混元T1。
Transformer架构擅长捕捉复杂上下文,而Mamba特长在高效处理长序列。两相结合,模型在快与慢之间寻找平衡。
我们用经典的“鸡兔同笼”题分别向DeepSeek R1和混元T1提问,在关闭“联网搜索”的情况下,二者最终给出的答案无误,R1思考用时28秒,T1仅用14秒。
值得注意的是,混元T1每百万tokens 输出价格4元,这是DeepSeek R1标准时段输出价格的四分之一,与其优惠时段价格持平。
3月19日,腾讯总裁刘炽平在2024年年报电话会上提到了元宝的表现,2月到3月日活激增超过20倍,成为中国第三高的AI原生移动应用程序。
腾讯元宝去年5月30日发布,初期定位是集成腾讯混元大模型的智能助手,但是反响平平。1月DeepSeek的R1模型全球大火,次月腾讯就宣布将DeepSeek-R1满血版接入元宝,由此元宝也迎来了转折点。
在那之后,元宝高强度“日更”,35天里版本更新30次。用户也不断涌入,元宝一度登顶苹果中国区应用商店免费榜,超越DeepSeek。
不仅是元宝,腾讯在AI领域的发力突然按下加速键。其旗下核心应用如微信、QQ浏览器、、ima、腾讯文档等,都接入了DeepSeek模型,并同步支持自研混元大模型。
“自研+开源”的多模型策略还将继续。腾讯方面表示,腾讯元宝将继续坚持“双模”。投入继续加大,近半个月就投入近3个亿。在前不久的财报会上,刘炽平透露:“我们计划在2025年进一步加大资本支出,预计资本支出将占收入的十几个百分点。”
紧盯市场走向,快速跟进与创新结合,实现后发优势,这是腾讯擅长的。从腾讯“起家”的QICQ,到如今的元宝都是如此。
腾讯曾经饱受“抄袭”“模仿”的质疑。马化腾早在2010年就称“模仿也是一种尝新”,在2018年面对记者提问时,他的回答更加完整:“有时候为了创新而创新,反而会让创新动作变形。很多创新往往是自下而上的,总是在不经意的边缘地方出现。如果企业完全自上而下,给创新定好方向,这样往往没有活力,很僵化。”从与DeepSeek合作,与自研模型并行,并与内部应用融合来看,创新可以是自下而上的,也可以是从外向内的。
在AI的牌桌上,巨头要考虑的不仅仅是如何造出更好的模型,而是怎样发挥自身积累的产品优势,以及怎样让对AI的投入和自身战略相结合。
在接入DeepSeek之前,腾讯在整个2024年也已经广泛部署AI,并且从中“尝到了甜头”。腾讯内部已经有超过700个业务场景接入混元大模型与加入开源大模型。全年资本开支767亿元,同比增长221%,收入同比增长11%。其中腾讯会议收入增长40%,AI功能月活增长到1500万。而企业微信收入同比翻倍。
毋庸置疑的是,DeepSeek R1从今年初开始掀起了全球“推理模型热”。AI模型求“大”不再是公认唯一可行的路径,再经过DeepSeek对工具的不断开源,更让人们有意识追求“效率”的魅力。
这次DeepSeek对通用模型的更新,则显示出了“融合”的趋势。V3-3024融入了R1的强化学习推理优化方法,同时保留了通用模型的高效执行特性,是突破通用模型“平庸困境”的一种尝试。
腾讯的混元T1正式版也有异曲同工之妙,从架构层面融合,使得其作为推理模型反应速度显著提升,与此同时能更好地处理上下文。DeepSeek尝试让通用模型向推理模型的方向走了走,腾讯则让推理模型向通用模型的方向走了走,两端都在向中间靠拢。
此前OpenAI CEO山姆·奥特曼(Sam Altman)在谈及GPT-5的计划时就曾经透露,模型和产品功能太复杂,未来OpenAI将将其统一,o3模型不再单独发布,GPT-4.5也将是OpenAI最后一个非链式思维模型。
Anthropic抢先OpenAI一步,试图给出解决方法。在2月底发布了“全球首个混合模型”Claude 3.7 Sonnet。即在单一架构上整合实时应答(Fast Thinking)和深度思考(Slow Thinking)。不让用户去在不同的模型间进行切换,而是模型自行判断当前问题是否需要深度思考。
也许接下来的问题是融合的方式选择:是通过AI自动调配来实现“融合”(实际上是将不同模型藏在后台),还是在模型层面做融合(就像V3-3024和腾讯混元T1正式版的做法)。
所谓的“两条腿走路”,是并行开发分离的通用模型或者推理模型。那么如今的融合趋势,就是将两条腿变成了一个轮子,迈左脚还是右脚,别去操心了。
版权声明:本站严格遵守《信息网络传播权保护条例》,仅分享已标注来源的公开事实信息,不复制原创内容。若权利人认为内容侵权,请于30日内联系,我们将立即核实并删除。网站邮箱;yuzhibolangzi@gmail.com 通知邮箱谢谢!
猜你喜欢
-
AI时代不迷茫!看这位智慧班主任如何带学生深度探索,梁文锋的60条思考
在科技迅猛发展的时代,人工智能(AI)以前所未有的深度和广度融入我们的生活,这一变革性力量对初中生的成长影响深远。作为班主任,如何引导学生在AI...
2025-06-21热点反思 -
梁文锋的60条思考面对具身智能热潮泼冷水不见得是坏事
有人说朱啸虎在「看空」这个热门行业,但在笔者看来倒是有点冤枉他。从过去的ofo、滴滴,到如今的具身智能,朱啸虎只是做出一个成熟投资人应该做出的选...
2025-06-21热点反思 -
DeepSeek创始人梁文锋的60条思考:为通用人工智能铺路的底层逻辑
在人工智能技术日新月异的今天,DeepSeek作为一家备受瞩目的科技企业,其创始人梁文锋也被广泛关注。尽管梁文锋在公开场合的报道不多,但在202...
2025-06-19热点反思 -
中信建投:站在AI产业商业化加速的拐点?梁文锋的60条思考
AI产业链正面临从性能拐点到份额拐点、从技术价值到商业化价值双重变化的转折点,当前AI产业链硬件和软件同频共振,均呈现加速趋势,建议关注AI产业...
2025-06-19热点反思 -
没有KPI、极度扁平、极致创新……DeepSeek创始人梁文锋60条思考2025年6月19日
要知道,自2025年春节,DeepSeek凭借超预期的产品体验火爆出圈,超越一众国产大模型。很多人都十分好奇创始人梁文锋的背后故事。他的履历...
2025-06-19热点反思