CYL688.VIP 国产大模子恐惧国外,周鸿祎:齐全是中国AI产业发展的里程碑事件
CYL688.VIP
前几天中国六代战机曝光,外网龙套天了。这还不够,这两天中国大模子又出了新版块,甚至国外 AI 社区刷屏。
国内 AI 创业公司 DeepSeek发布了新的开源大模子,其参数目为6000多亿,性能赶上了 GPT - 4o和Facebook的羊驼,但查验本钱比它们缩小了10倍,价钱仅为它们的10%。
该模子推出后,彰着能嗅觉到国外 AI 技能东谈主才对中国 AI 技能的进步,处于半恐惧半懵景象。
网友指摘整皆齐整,都在问中国东谈主是奈何作念到的?Meta 的一位科学家咋舌,DeepSeek 的查验像是黑科技。OpenAI 的一位独创团队成员称,以前达到 DeepSeek 这种级别智商经常需16000个 GPU,而咫尺 DeepSeek 只用2000个 GPU,计较量减少了11倍,这解说 AI 算法还有很大优化空间。
大家可能不太了解 DeepSeek 这家公司,天然咱们有互助,但我对其了解不深,于是用纳米 AI 搜索查询了一下。
DeepSeek 汉文名为深度求索,如名字所示,该公司一直低调行事,却早著名气。在硅谷,DeepSeek 被称为来自东方的高明力量。
其背后是量化私募的巨头幻方公司,2021 年为作念量化交游囤了一万张英伟达 A100,其时 ChatGPT 尚未出现,大模子也未发布,如同 Meta 为搞元天地囤卡不异,都机缘正好赶上了 AI 海浪,是以在其他巨头闹卡荒时,DeepSeek 手中有卡心中不慌。
这家公司初度被东谈主记着是因其发布 2.0 开源模子时提供了史无先例的性价比,模子推理本钱降至每百万个 token 约一元,约为 LLaMA的1/7、GPT 的1/70,故而 DeepSeek 被称为 AI 界的拼多多,掀翻国产大模子价钱战,字节跨越、腾讯、百度、阿里纷纷降价。
如今斥地者能享大模子福利,DeepSeek 功不能没。
为何本日要说起此事?CYL688.VIP
曩昔我常说中好意思 AI 中枢差距不大,约半年傍边,主要差距在算力。因核默算法公开,多为工程化顺序,模子亦然开源的,差距实则不大,可好多东谈主不信,一些众人还带节律,称论 AI 实力好意思国起始,中国最多第二梯队,好意思国遥遥起始,我对此不敢苟同。
有东谈主咄咄逼人还让世东谈主抱怨,长他东谈主的志气灭我方的权威,对中国 AI 产业发展有害。
如今 DeepSeek 发布的模子有劲抵挡了这些言论。微软、脸书、谷歌都在野着10万卡集群作念大模子查验时,DeepSeek 仅用2000个 GPU,花消不到600万好意思金和两个月时辰,就作念出一个与全球顶尖大模子智商对皆的开源大模子。
有东谈主质疑说,新推的大模子是用国外模子常识蒸馏而来,但常识蒸馏顺序东谈主东谈主可用,为何他东谈主未作念到?
这次成果大幅提高,细目是在底层架构上有不同于其他巨头的转换,DeepSeek 定有不为东谈主知的查验顺序和工程履行顺序。
曩昔独一好意思国 AI 公司具备这种特有智商,如今中国公司也慢慢掌捏了。
有东谈主会说 DeepSeek 仅仅个例,短缺劝服力,能否说出更多先进国产大模子?天然不错。
比如阿里的通义千问,其推出的千问2.5系列大模子,其中的700亿参数版块,在视觉推理、数学和科学问题贯通上与国外大模子比拟绝不失容,慢想考智商也慢慢提高。
此外,王小川的百川智能近期推出的金融大模子在专科智商上越过了 GPT - 4o,这也确认了我之前对专科大模子的判断,彩娱乐网址CYL588.VIP即在通用大模子基础上并吞专科限度常识查验,专科大模子智商可超越通用大模子,咱们称之为限度增强。
360 在o1出现前就末端了慢想考智商,仅仅末端顺序略有不同,360 打造的安全行业大模子智商也遥遥起始于 GPT - 4o。
总之,但愿不雅看这篇著作的诸位顺服中国 AI 发展并不弱,不要被某些众人言论误导。曩昔咱们是师法者和扈从者,他东谈主擅长从零到一,咱们擅长从一到 n,如今情况正转变,中国科技限度原发性转换已让全寰球看到,曩昔是 “Copy to China”,以后可能是 “Copy from China”。
DeepSeek 公司贯通出色,开了个好头,今后我国 AI 转换定会愈加活跃。借 DeepSeek 这个版块,我谈几点大模子发展的观念。
第一,无需再争论开源与闭源好坏,DeepSeek 是开源的,开源模子正赶超闭源模子。在东谈主类技能发展趋势中,开源可使大模子技能不被少数巨头驾驭,唯有开源能力让大模子确实走入百行万企,让各级政府和企业低本钱在开源基座模子上打造行业行使,鼓吹坐褥力飞跃。是以 DeepSeek 的进步对鼓吹中国 AI 产业发展是极大利好。
更令东谈主昂然的是,中国正引颈全球大模子开源海浪,开源是互联网精神的径直体现,亦然好意思国科技发展的泉源与机制。
关系词,咫尺中国最强的两个模子通义千问和 DeepSeek 是开源的,好意思国最强的两个模子Claude和GPT 却是闭源的.可见好意思国走向闭源,中国走向开源,这预示着科技发展天平向中国歪斜,一朝中国开源生态缔造,这种转换机制将助力中国加快 AI 科技发展,掌捏先机,末端从追逐者到引颈者的丽都回身。
第二,DeepSeek 3.0版块用2000块卡作念到了万卡集群能力作念到的事,这标明咱们在一定进度上突破了西方对咱们的算力阻滞,号称古迹。面前好意思国想尽主义对咱们进行小院高墙式的阻滞,扼制中国 AI 产业发展,毒害高端算力芯片流入中国。
独一刚劲敌手能力逼出最强的我方,若针对中国 AI 芯片的禁令,最终使中国大模子在算力受限情况下找到更高效看管决策,那这种谩天大谎的末端影响将更庸俗。
此外,用这种极致查验顺序查验专科大模子,算力本钱会进一步缩小,促使中国 AI 在专科、垂直、场景、行业大模子上更快普及。
第三,有东谈主会问,如斯一来咱们是否还有必要建万卡集群?不要污蔑,我并非说中国 AI 发展不需要高端算力芯片,巨头们囤显卡建算力集群依旧必要,因为咫尺预查验算力需求八成没那么大,但像慢想考这类复杂推理模子对推理算力需求大,文生图、文生视频的行使也需消耗无数算力资源,巨头们提供 AI 云行状,构建弘大算力基础必不能少,这与 DeepSeek 缩小查验算力需求是两回事,两者并不矛盾。
建万卡集群践诺是个工程问题,作念过一次便一通百通,是以马斯克从 OpenAI 挖东谈主建十万卡集群,小米挖 DeepSeek 的天才仙女,都是为得到工程化的万卡集群查验决窍。
当作科技行业的从业者,看到 DeepSeek 推出如斯好坏的模子,中国 AI 公司凭借原发性技能转换恐惧寰球,让一经蔑视咱们的异邦斥地者同业张惶,诸位是否感到畅快、自重与感动?
这齐全是中国 AI 产业发展的里程碑事件CYL688.VIP,我顺服以后中国 AI 发展此类新闻会越来越多。大家应付中国 AI 产业发展充满信心。