让硅谷震惊的中国大模型!
国际电子商情27日讯 过去一周,来自中国的DeepSeek R1模型“搅动”整个海外AI圈。pSuesmc
什么是DeepSeek?它为何在全球范围内引起轰动?与DeepSeek相关的公司有哪些?pSuesmc
公开资料显示,中国AI初创公司深度求索(DeepSeek)成立于2023年5月,是一家大模型创业公司。仅成立半年后,DeepSeek就推出了免费商用、完全开源的代码大模型DeepSeek Coder。2024年5月,该公司发布开源模型DeepSeek V2,将推理成本降低近百倍,一跃成名。pSuesmc
2024年12月27日,DeepSeek推出了开源模型DeepSeek-V3。pSuesmc
这款模型在多项基准测试表现优异,超越业内主流顶尖模型,特别是在知识问答、长文本处理、代码生成和数学能力等方面。例如,在MMLU、GPQA等知识类任务中,DeepSeek-V3的表现接近国际顶尖模型Claude-3.5-Sonnet。pSuesmc
在数学能力方面,更是在AIME 2024和CNMO 2024等测试中创造了新的记录,超越所有已知的开源和闭源模型。同时,其生成速度较上代提升了200%,达到60TPS,大幅改善了用户体验。pSuesmc
当时,在国外大模型排名Arena上,DeepSeek-V3在所有模型中排名第七,在开源模型排第一。而且,DeepSeek-V3是全球前十中性价比最高的模型。pSuesmc
pSuesmc
意料之外的是,在DeepSeek-V3发布不到1个月之后,更“炸街”的DeepSeek-R1来了!pSuesmc
2025年1月20日,DeepSeek正式开源R1推理模型。性能对齐OpenAI-o1,正式版DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。pSuesmc
目前普遍认为,DeepSeek的R1发布标志着推理模型研究的重要转折点,而在此之前推理模型一直是工业研究的重要领域,但缺乏一篇开创性的论文,就像AlphaGo使用强化学习下了无数盘围棋并优化其策略以获胜一样,DeepSeek正在使用相同的方法来提升其能力,因此2025年可能会成为强化学习的元年。pSuesmc
1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。而其竞技场得分达到1357分,略超OpenAI o1的1352分。pSuesmc
为何DeepSeek火爆出圈?一方面,它以较低的训练成本实现了媲美OpenAI o1性能的效果,诠释了中国在工程能力和规模创新上的优势;另一方面,它也秉持开源精神,热衷分享技术细节。pSuesmc
值得注意的是,据DeepSeek发布的技术报告显示,DeepSeek-R1的训练费用仅为OpenAI最新大模型的三十分之一。pSuesmc
DeepSeek-V3在仅使用2048块H800 GPU的情况下,完成了6710亿参数模型的训练,成本仅为557.6万美元,远低于其他顶级模型的训练成本。pSuesmc
作为参照,斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元。另外,第三方研究公司Gartner研究预测显示,到2028年Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将高达5000亿美元。pSuesmc
因此,不少业者认为,DeepSeek的低成本意味着,大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力。而英伟达等硬件商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生影响。pSuesmc
DeepSeek的另一个显著优势是“开源”。pSuesmc
在开源策略上,R1采用MIT License,给予用户最大程度的使用自由,支持模型蒸馏,可将推理能力蒸馏到更小的模型,如32B和70B模型在多项能力上实现了对标o1-mini的效果,开源力度甚至超越了此前一直被诟病的Meta。pSuesmc
Meta首席AI科学家Yann Lecun评价称,DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。pSuesmc
1月22日,美国媒体Business Insider报道称,DeepSeek-R1模型秉承开放精神,完全开源,为美国AI玩家带来了麻烦。开源的先进AI可能挑战那些试图通过出售技术赚取巨额利润的公司。pSuesmc
据不完全统计,目前DeepSeek的关联公司涵盖四类:股权关联方、算力基础设施供应商、垂直领域合作方、业务协同方。pSuesmc
(1)股权关联方pSuesmc
每日互动:幻方量化(Deepseek母公司)二股东,为DeepSeek提供海量用户行为语料数据等。pSuesmc
浙江东方:通过旗下杭州东方嘉富基金参投Deepseek天使轮。pSuesmc
华金资本:珠海国资旗下投资平台间接参与DeepSeekPre-A轮融资。pSuesmc
(2)算力基础设施供应商pSuesmc
中科曙光:承建DeepSeek杭州训练中心液冷系统。pSuesmc
浪潮信息:为Deepseek北京亦庄智算中心提供AI服务器集群及英伟达H800+自研AIStation管理平台。pSuesmc
润泽科技:廊坊数据中心为Deepseek提供3000+机柜资源。pSuesmc
航锦科技:旗下超擎数智为Deepseek提供光模块和交换机。pSuesmc
(3)垂直领域合作方pSuesmc
科大讯飞:在教育领域接入了DeepSeek-Math模型,并联合推出了AI数学辅导应用“星火助学”。pSuesmc
拓尔思:与Deepseek联合开发金融奥情大模型,已在中信证券等机构部署智能研报生成系统。pSuesmc
金山办公:WPS智能写作接入DeepSeek-Writer API,公文生成效率提升3倍,错误率下降90%。pSuesmc
卓创资讯:与幻方量化在金融语料库方面存在合作,其数据资源或用于Deepseek模型的训练和优化。pSuesmc
(4)业务协同方pSuesmc
并行科技:为DeepSeek提供多种计算技术手段,显著提升其计算能力。pSuesmc
竞业达:与DeepSeek大模型对接中。pSuesmc
可见,随着DeepSeek、Minimax等中国公司在AI领域的崛起,全球AI竟争格局正在发生微妙变化。如果中国公司能够以更低的成本实现同等或更好的性能开源大模型,海外开源和闭源模型或都受到挑战。此外应用端在字节豆包带动下持续对商业化场景展开探索,中国AI公司和开源模型或将持续推动大模型产业和相关AI应用的升级。pSuesmc
微信扫一扫,一键转发
关注“国际电子商情” 微信公众号
国际电子商情讯,3月17日晚间,深圳英集芯科技股份有限公司发布公告称,公司决定终止购买辉芒微电子(深圳)股份有限公司控制权,公司芯股票自2025年3月18日开市起复牌。
全球前十大IC设计公司全年营收合计达2498亿美元,同比激增49%。其中,英伟达以1243亿美元营收蝉联榜首,占据前十总份额的50%,与其他厂商形成断层式差距。
继宝马、奔驰裁员之后,奥迪也开始宣布裁员。
最近,国产存储领域出现了一个新进者——思远半导体。这家在智能穿戴、TWS耳机、移动电源、BMS等领域深耕十数年的电源管理芯片(PMIC)Fabless,如今把业务范围成功地扩展到了存储电源领域。
3月17日午间,华大九天发布公告称,正在筹划通过发行股份及支付现金等方式,购买芯和半导体的控股权,其股票自当日开市时起开始停牌,预计在不超过10个交易日的时间内披露本次交易方案。
近日,国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局联合发布《人工智能生成合成内容标识办法》(以下简称《标识办法》),该办法自 2025年9月1日起正式施行。
日前,美国国会众议院以口头表决的方式一致通过了编号H.R.1166的《与依赖外国对手电池脱钩法》,禁止美国国土安全部采购宁德时代、比亚迪、远景能源、亿纬锂能、海辰储能和国轩高科六家中国企业生产的电池。
2025年3月16日,中共中央办公厅、国务院办公厅印发《提振消费专项行动方案》并发出通知。其中涉及到“人工智能+”行动,促进“人工智能+消费”。
国际电子商情讯,据彭博社资深记者马克·古尔曼(Mark Gurman)最新爆料,苹果正秘密打造一款颠覆性产品——iPhone 17 Air,该机型将以“史上最薄iPhone”姿态冲击市场,该机型将无SIM卡槽,机身厚度仅5.5毫米,较现有iPhone薄约2毫米。
"以后只有用我们的鸿蒙PC了。”
国际电子商情讯,继闪迪、美光宣布涨价之后,业内也传出长江存储也将涨价。根据中国闪存市场报道,根据渠道反馈,长江存储零售品牌致态也将于4月起面向渠道上调提货价格,幅度或将超过10%。
“全国人民买得起、想不到的产品”
美通社消息,3月14日,“2025英飞凌消费、计算与通讯创新大会”(ICIC2025)在深圳举行。本届大会汇聚600多位业界精
近日,湖南省工信厅发布了《2025年湖南电子信息制造业重点项目名单》,涵盖先进计算、音视频、新一代半导体、人
3月15日,质鼎集团公众号消息,惠科东莞平板显示集群电子商务项目二期正式开工。
富士康、台积电、广达、华硕、联发科、友达光电等中国台湾20家电子企业2024年第四季度和全年财报汇总。
近年来,LED显示屏市场持续演进。回顾2024年,行业呈现出哪些发展态势?展望2025年及未来,市场又将面临哪些机遇与
近日,索尼正式发布新一代RGBLED背光技术系统,可实现4000尼特峰值亮度。索尼计划该系统将于2025年开始量产,并将
AI芯片是半导体最大的增长点,先进封装则是制造AI芯片的关键技术。此前英伟达H100成本约3000美元,而用先进封装
截止2024年底,17家欧美固态电池企业融资总额已突破42亿美元。
曾几何时,中国半导体几乎不断有大基金投资、大项目上马,以及美国制裁的新闻。长期处于聚光灯下,中国半导体成为
Dynabook在退出十年后宣布重返美国消费市场。
Canalys最新数据显示,受到消费需求激增8%的推动,2024年第四季度中国大陆的PC市场开始复苏,同比增长2%。
根据TrendForce集邦咨询最新调查,2024年第四季由于Apple(苹果)手机生产进入高峰,以及中国部分地方提供消费补贴
德州仪器近日推出了全球超小型 MCU,进一步扩展了品类齐全的 Arm® Cortex®-M0+ MSPM0 MCU 产品组合。
创新是企业持续发展最大的价值。
“闪迪(Sandisk)又回来了!”在3月12日的存储年度盛会CFMS MemoryS 2025上,闪迪公司全球产品副总裁Eric Spa
摩尔斯微电子推出合规的Wi-Fi HaLow片上系统(Soc),开启欧洲连接技术新纪元。超低功耗、远距离连接功能现已为
CFMS | MemoryS 2025已圆满落幕,期间包括三星电子、长江存储、铠侠、美光、闪迪、高通、Arm、慧荣科技、S
Hyperlux™ ID iToF 系列将深度测量距离提升至最远 30 米,提高工业环境中的生产效率和安全性
26TB大容量CMR HDD助力WD Red Pro与G-DRIVE/G-RAID系列专业级产品矩阵,赋能数据存储拓展与生产力跃升
全新一代MCU可以满足各种区域控制架构和电气化系统需求,助力汽车制造商向软件定义汽车(SDV)过渡。
将出色的高
聚洵半导体科技(上海)有限公司(Gainsil Semiconductor Technology)于2016年成立于上海张江科学城,是一家全球
领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCO
后量子加密技术帮助保护数字基础设施免受量子计算机在将来带来的潜在威胁。
英飞凌坚信低碳化和数字化是未来十年的关键驱动力,半导体在应对能源挑战和推动数字化转型中扮演着重要角色。
点击查看更多
北京科能广告有限公司深圳分公司 版权所有
分享到微信
分享到微博
分享到QQ空间
推荐使用浏览器内置分享
分享至朋友圈