当前位置:首页 > 热点反思 > 正文

深度探讨DeepSeek创始人梁文锋的60条思考揭示AI未来的无限可能!

时间:2025-06-18阅读数:25

  在2025年春节期间,DeepSeek无疑成为了整个科技界的焦点,其热度持续攀升。凭借超乎想象的产品体验,DeepSeek的口碑在短时间内实现了大范围的裂变,吸引了各方关注。尽管DeepSeek创始人梁文锋的公开报道并不算多,但在其产品取得巨大成功之前,他曾于2023年和2024年两度接受了36氪旗下《暗涌》专访。从中,我们能清晰地看到,梁文锋独特的技术洞察力与理想主义思维模式,成为DeepSeek从无到有、快速崛起的关键所在。为此,本文将汇总他最核心的60条思考,希望能够让读者更加直观地理解DeepSeek这家企业脱颖而出的底层逻辑。

  我们的发展方向与量化投资和金融并无直接联系。我们的目标是构建通用人工智能(AGI),并不拘泥于特定的应用场景。

  语言大模型是达成AGI的必由之路,且该技术目前已初步具备AGI的特点,因此我们选择从此入手。

  我们的关注点将始终在大模型本身,而不是过早设定基于模型的应用。随着时间推移,应用门槛将逐渐降低,任何初创公司在未来20年内均有机会参与竞争。

  我们认为,人类智慧的本质在于语言,而思维过程也是在脑海中编织语言。由此可见,语言大模型亦有可能催生出类人智慧的AGI。

  如果仅仅是复刻模型,可以依靠公开的研究成果与开源代码走捷径,但要进行深度研究,则必须不断进行实验与对比,这需要更高的算力及优秀的科研人员。

  我们希望大模型的应用能够以低成本普及,变量在于技术不应只掌握在少数大企业手中,避免形成市场垄断。与大厂捆绑的平台模式不同,我们高度包容技术应用场景。

  基础研究往往投资回报比低。然而,我们坚信只要有能力,在这个时间节点上,我们正是为此负责的最佳人选之一。

  从最早的1张卡开始,到2015年的100张卡,2019年的1000张卡,再到如今的10000张卡,很多人可能以为其中隐藏了商业逻辑,实际上这全是好奇心驱动对AI潜力的探索。

  对于行外人士而言,ChatGPT所带来的冲击非常剧烈;而对从业者而言,2012年AlexNet以其低错误率开创了一个新时代,是对技术的开创性变革。其后,我们积极部署算力以迎接未来的挑战。

  一件令人激动的事,无法简单用金钱来衡量,就像买钢琴不仅仅是因为能买得起,更因为有一群热爱音乐的人想在上面演奏。

  人工成本是对未来的投资,视为公司的最大资产。我们倾向招募那些具备好奇心的人,他们将在这里找到研究的机会。大企业多受业务需求驱动,不会单纯着眼于研究。

  招人时我们注重能力,而非经验。若追求快速目标,现成的人才无疑是洇,但长期看,基础能力与创造力才是核心。

  核心技术团队主要以应届与刚毕业的一两年工作的年轻人组成。经验丰富的人往往给出固定的答案,而年轻人则会积极探索问题的解决方法。

  促进创新需要尽可能少的干预与管理,让每个人都有发挥的空间,创新往往在无意中产生,非刻意安排。

  我们确保招募时价值观一致,依赖企业文化以确保一致行动,尽管没有成文的规定,但管理者的示范行为会成为准则。

  按照教科书的方法创业,在当前市场环境下难以生存。企业需具备快速适应变化的能力,而不是被既有经验所限制。

  创新往往伴随低效和浪费,经济发展达到一定阶段后,才会迎来创新。例如,OpenAI也消耗了大量成本才取得今天的成就。

  生活中存在许多无法用逻辑解释的事情,比如状态失重后的贡献精神。即便一身疲惫,满足感却是最大的驱动力。

  我们并不以抢占用户为主要目标,降价是我们探索新模型结构的必然结果,也是希望技术普及至每个人的愿望。

  若以应用为目标,简单而快速地推出产品则是合理选择,但我们追求的是AGI,因此必须对新模型结构进行深入研究,构建出更强的模型能力。

  随着经济发展,中国应当转变为技术的贡献者,而非仅仅跟随者。过往的技术浪潮是西方主导,我们需要积极参与其中。

  过去三十年里,我们关注赚取短期利润,然而对创新的投入则远远不足。创新不仅需要商业驱动,也需要内心的好奇与创造力。

  在颠覆性技术出现面前,闭源的护城河无法长久,即使OpenAI选择闭源,也无法阻挡他人的进步。

  开源与论文发布并非损失,而是对技术人员的一种荣誉。开源更像是一种文化行为,而非单纯的商业行为。

  当前阶段是技术创新的爆发期,而非应用的爆发期。最终希望形成公司使用DeepSeek的技术进行上下游的业务构建。

  大模型创业公司或仅能存活两到三家,到目前为止很多选择仍处于烧钱阶段。我对此持乐观态度,优秀的公司终将崭露头角。

  我们发布的模型大多为本土人才开发,尽管前50名顶尖人才或许不在国内,但我们能培养出优秀的团队。

  DeepSeek的团队建立在自下而上的基础上,我们一般不设固定分工,而是根据自身发展自然形成分工。

  我们致力于解决最复杂的课题,吸引大型科技人才。顶尖人才在中国受到低估,因为高水平的创新机会较少,未能被有效识别。

  AGI的实现时间难以具象,可是在我们有生之年定会到来,我们针对三个方向展开研究:数学与代码、多模态、自然语言。

  未来中国产业结构的调整将更依赖于硬核技术的创新,随着人们意识到过去的短期利益可能属于机遇,更多人会致力于创新。

  我们的发展方向与量化投资和金融并无直接联系。我们的目标是构建通用人工智能(AGI),并不拘泥于特定的应用场景。

  语言大模型是达成AGI的必由之路,且该技术目前已初步具备AGI的特点,因此我们选择从此入手。

  我们的关注点将始终在大模型本身,而不是过早设定基于模型的应用。随着时间推移,应用门槛将逐渐降低,任何初创公司在未来20年内均有机会参与竞争。

  我们认为,人类智慧的本质在于语言,而思维过程也是在脑海中编织语言。由此可见,语言大模型亦有可能催生出类人智慧的AGI。

  如果仅仅是复刻模型,可以依靠公开的研究成果与开源代码走捷径,但要进行深度研究,则必须不断进行实验与对比,这需要更高的算力及优秀的科研人员。

  我们希望大模型的应用能够以低成本普及,变量在于技术不应只掌握在少数大企业手中,避免形成市场垄断。与大厂捆绑的平台模式不同,我们高度包容技术应用场景。

  基础研究往往投资回报比低。然而,我们坚信只要有能力,在这个时间节点上,我们正是为此负责的最佳人选之一。

  从最早的1张卡开始,到2015年的100张卡,2019年的1000张卡,再到如今的10000张卡,很多人可能以为其中隐藏了商业逻辑,实际上这全是好奇心驱动对AI潜力的探索。

  对于行外人士而言,ChatGPT所带来的冲击非常剧烈;而对从业者而言,2012年AlexNet以其低错误率开创了一个新时代,是对技术的开创性变革。其后,我们积极部署算力以迎接未来的挑战。

  一件令人激动的事,无法简单用金钱来衡量,就像买钢琴不仅仅是因为能买得起,更因为有一群热爱音乐的人想在上面演奏。

  人工成本是对未来的投资,视为公司的最大资产。我们倾向招募那些具备好奇心的人,他们将在这里找到研究的机会。大企业多受业务需求驱动,不会单纯着眼于研究。

  招人时我们注重能力,而非经验。若追求快速目标,现成的人才无疑是洇,但长期看,基础能力与创造力才是核心。

  核心技术团队主要以应届与刚毕业的一两年工作的年轻人组成。经验丰富的人往往给出固定的答案,而年轻人则会积极探索问题的解决方法。

  促进创新需要尽可能少的干预与管理,让每个人都有发挥的空间,创新往往在无意中产生,非刻意安排。

  我们确保招募时价值观一致,依赖企业文化以确保一致行动,尽管没有成文的规定,但管理者的示范行为会成为准则。

  按照教科书的方法创业,在当前市场环境下难以生存。企业需具备快速适应变化的能力,而不是被既有经验所限制。

  创新往往伴随低效和浪费,经济发展达到一定阶段后,才会迎来创新。例如,OpenAI也消耗了大量成本才取得今天的成就。

  生活中存在许多无法用逻辑解释的事情,比如状态失重后的贡献精神。即便一身疲惫,满足感却是最大的驱动力。

  我们并不以抢占用户为主要目标,降价是我们探索新模型结构的必然结果,也是希望技术普及至每个人的愿望。

  若以应用为目标,简单而快速地推出产品则是合理选择,但我们追求的是AGI,因此必须对新模型结构进行深入研究,构建出更强的模型能力。

  随着经济发展,中国应当转变为技术的贡献者,而非仅仅跟随者。过往的技术浪潮是西方主导,我们需要积极参与其中。

  过去三十年里,我们关注赚取短期利润,然而对创新的投入则远远不足。创新不仅需要商业驱动,也需要内心的好奇与创造力。

  在颠覆性技术出现面前,闭源的护城河无法长久,即使OpenAI选择闭源,也无法阻挡他人的进步。

  开源与论文发布并非损失,而是对技术人员的一种荣誉。开源更像是一种文化行为,而非单纯的商业行为。

  当前阶段是技术创新的爆发期,而非应用的爆发期。最终希望形成公司使用DeepSeek的技术进行上下游的业务构建。

  大模型创业公司或仅能存活两到三家,到目前为止很多选择仍处于烧钱阶段。我对此持乐观态度,优秀的公司终将崭露头角。

  我们发布的模型大多为本土人才开发,尽管前50名顶尖人才或许不在国内,但我们能培养出优秀的团队。

  DeepSeek的团队建立在自下而上的基础上,我们一般不设固定分工,而是根据自身发展自然形成分工。

  我们致力于解决最复杂的课题,吸引大型科技人才。顶尖人才在中国受到低估,因为高水平的创新机会较少,未能被有效识别。

  AGI的实现时间难以具象,可是在我们有生之年定会到来,我们针对三个方向展开研究:数学与代码、多模态、自然语言。

  未来中国产业结构的调整将更依赖于硬核技术的创新,随着人们意识到过去的短期利益可能属于机遇,更多人会致力于创新。

梁文锋的60条思考

版权声明‌:本站严格遵守《信息网络传播权保护条例》,仅分享已标注来源的公开事实信息,不复制原创内容。若权利人认为内容侵权,请于30日内联系,我们将立即核实并删除。网站邮箱;yuzhibolangzi@gmail.com 通知邮箱谢谢!

猜你喜欢