传奇背地：DeepSeek开创人梁文锋的翻新认知

2025-02-03 08:47 361评论

导读 2025年开年之际，中国AI公司DeepSeek以远低于浩繁科技巨子的练习本钱、推翻性的底层架构翻新，一跃成为海内外无奈疏忽的人工智能“重生力气”，激发了寰球范畴内的普遍存眷。咱们留神到DeepSeek开创人梁文锋作为一个持续创业者，其企业运营治理教训、对翻新（技巧、生态、构造、人才等）的深度认知，在DeepSeek的异军崛起中施展了要害感化。一、深信人类智能与AGI之间并非弗成逾越 DeepSeek的出生，与开创人梁文锋十余年的创业阅历跟翻新思考严密相连。在浙江年夜学攻读电子工程及人工智能偏向时，梁文锋就深信人类智能与通用人工智能（AGI）之间并非弗成逾越。梁文锋对AGI的技巧寻求最开端表现在量化投资范畴。2008年，研讨量化对冲；2015年创建幻方量化（High-Flyer），应用AI驱动战略买卖，使幻方量化一度跻身海内量化私募四巨子之一。 2023年，梁文锋决议将多年在AI方面的研讨教训，从量化投资场景拓展至更辽阔的年夜模子范畴，并于7月正式建立DeepSeek，专一于年夜模子与通用人工智能研讨。在很多AI创业者急于将产物变现的情况下，梁文锋仍然保持以AGI为终极目的，他以为以后多种天生式AI利用产物的呈现，仅仅是迈向通用智能的过渡阶段，对DeepSeek来说，在这一退化过程中，对AGI的猎奇与摸索比贸易报答更具驱能源。他在采访中直言：“这一波年夜模子海潮只是起跑线，AGI并非高不可攀，咱们这代人很可能就能见证。”因而，DeepSeek从创建之初便抉择研讨优先，暂缓直接面向C真个利用产物落地，与“快变现、抢市场”的AI创业主流趋向构成赫然对照。二、重视技巧投入，勇于在竞争剧烈的市场当选择差别化技巧道路 DeepSeek以后获得的技巧冲破，离不开前多少年梁文锋创建幻方量化时在人工智能技巧上的巨额投入。据报道，幻方量化自2019年起连续加年夜在人工智能相干基本设备跟算力方面的投入：从最初搭载1000多块GPU、耗资近2亿元的“萤火一号”，到2021年领有上万块英伟达A100显卡、耗资逾10亿元的“萤火二号”，幻方量化由此成为海内多数领有年夜范围算力的金融机构。彼时外界对此尚不睬解，但梁文锋夸大：“AI的三年夜中心因素之一就是算力，越早投入，越能催生更多原创技巧火花。” 不只如斯，梁文锋对技巧翻新有其奇特的寻求，勇于在竞争剧烈的市场当选择差别化技巧道路，由此实现底层练习逻辑跟底层架构上的推翻性翻新。 DeepSeek在2024岁尾至2025年终宣布的R1系列模子，尤其是R1-Zero，初次年夜范围验证了纯强化进修在年夜模子练习中的可行性。差别于此前年夜模子对庞杂神经收集嘉奖、监视进修以及人类示例的高度依附，DeepSeek仅用极简的嘉奖规矩，就能让年夜模子在天然言语推理跟数学推理范畴经由过程自我博弈与原始赏罚旌旗灯号一直顿悟与自顺应调剂。美国艾伦人工智能研讨所研讨员Nathan Lambert称：“DeepSeek R1-Zero在推理层面开启了一个主要转机点，堪称纯RL推进年夜模子的‘开山之作’。” 除了推翻性的底层练习逻辑外，DeepSeek还在底层架构上首创了全新的MLA（多头潜伏留神力机制）跟DeepSeekMoESparse构造。只管留神力机制已提出多年，但很少有企业勇于在剧烈的市场竞争下年夜范围修改其中心架构，年夜少数企业偏向于相沿GPT、Llama等成熟架构停止持重迭代。而DeepSeek反其道而行之，抉择差别化底层架构道路，直接将显存占用紧缩至传统多头留神力（MHA）架构的个位数百分比，使推理本钱比竞品低了7至10余倍，胜利实现了年夜幅度的本钱增添，动员全部年夜模子工业链的效劳本钱敏捷下降。三、经由过程开源树立贸易生态影响力，打造翻新协力 OpenAI自GPT-4起一直强化闭源战略，海内不少年夜厂也偏向于将要害技巧封装进云效劳。与之相反，DeepSeek保持“开源 + 生态共建”战略，以极具竞争力的API订价让用户普遍受益。现在，海内很多云厂商、AI创业公司及中小企业都能以较低本钱应用DeepSeek推理模子，正如DeepSeek的愿景所说：“让更多人真正用得起AI”。DeepSeek也因开源在国际AI圈激发了极年夜存眷并取得了普遍的尊重。据相干报道，Meta、Anthropic等海内AI巨子团队都在研讨或鉴戒其局部架构翻新。乃至有美国粹者将“OGOpenAI.com”域名定向至DeepSeek，以表白对其开放精力的敬意。在梁文锋看来，闭源或者短期内能辅助企业构成竞争上风，但要在更长周期内激起社会层面的翻新协力，必需让更多研讨者跟创业者可能以低门槛应用底层年夜模子。固然，DeepSeek开源也并非“亏本赚呼喊”。经由过程供给范围化效劳，DeepSeek得以连续优化其底层构造，从而更好地为用户供给优质的年夜模子效劳，进而吸引更多的用户融入DeepSeek贸易生态，一直拓展DeepSeek贸易生态的界限。这不只确保了DeepSeek可能久长坚持可不雅收益，还增进了推进全部人工智能行业的提高与开展。四、信赖年青人，信任酷爱、猎奇与自在可能攻破教训的门路依附在激发寰球惊动后，DeepSeek的研发团队备受存眷。令人惊奇的是，其中心团队多少乎满是应届结业生跟任务两三年的研讨员。开创人梁文锋屡次表现：“外乡年青人才一样能够做到天下一流。” DeepSeek在开展进程中并不急于从海内聘任明星级专家，而是大批应聘应届生、博士生或结业未几的研讨员，为他们供给充分的资本与自力破项权。只有能证实思绪可行，任何员工都可变更海量GPU算力停止年夜范围练习，也能够跨小组自在组队攻关。一些新入职数月的年青人，就敏捷生长为名目技巧担任人，并在实际中爆发出全新的思绪。在梁文锋的率领下，DeepSeek信任纯洁的酷爱跟内涵猎奇心每每能攻破教训的门路依附。据外部员工流露，DeepSeek外部任务气氛“非常自在”，更少权要文明跟KPI 压力，更重视激励每团体“做本人想做的研讨”。正如梁文锋所言：“翻新每每不是被部署出来的，更不是KPI考察教出来的，而是源自自下而上的酷爱与奇思。” 别的，DeepSeek在构造层面多少乎不明白的行政层级。早在量化投资时代，团队就已构成“反层级”基因，在年夜模子阶段更是不部分界限：每团体既是工程师，也是研讨员；治理者的重要本能机能是在当一个Idea表现出潜力时，自上而下地去分配资本。而梁文锋作为老板仍旧逐日深刻一线，天天都在写代码、跑代码，乃至身边共事评估梁文锋：完整不像一个老板，而更像一个极客。小结 DeepSeek的呈现并非偶尔，凭仗梁文锋对AGI远景的动摇信念、对技巧翻新的尊敬、对贸易生态的懂得、对青年人才的信赖，其敏捷成为寰球AI界的核心。无论是低本钱高效力的技巧道路，仍是开源普惠的生态理念，都在激起行业对年夜模子新范式的再思考。DeepSeek的故事还在持续，留给外界的成绩是：中国AI是否借此契机迎来更多自发出现的硬核翻新，中国企业在0-1的成绩上是否获得更年夜的冲破？咱们刮目相待。新浪财经大众号 24小时转动播报最新的财经资讯跟视频，更多粉丝福利扫描二维码存眷（sinafinance）

请尊重我们的辛苦付出，未经允许，请不要转载金博体育入口网页版_金博体育在线官网的文章！

金博体育入口网页版_金博体育在线官网

相关文章