这周是春节前最后一周了， Deepseek V4 会突袭吗？

春节

DeepSeek

86 条回复 • 2026-02-11 17:48:35 +08:00

1

mightybruce

2 月 9 日

6

没有必要关注 deepseek, 在达沃斯论坛上，谷歌和 anthropic 都没有正眼看过这个，它的成功可能轻易不会再来一次，国内字节和大模型公司如智谱才被认为最有潜力。

2

leegradyllljjjj

2 月 9 日 via iPhone

1

一鼓作气，再而衰，三而竭。

3

StephenHe

2 月 9 日

7

春节发布，然后打工人在家加班，跟打工人有仇吗

4

cloudyplain

2 月 9 日

别搞了，咱们节后再发。

5

cue

2 月 9 日

买每日互动了吧这么着急

6

VeteranCat

2 月 9 日

不会。而且未来体量小的组织是真的上不了 AI 这个餐桌了，现在的 AI 发展主要关注的是应用，豆包手机这种的，千问这种的，或者是其他的多模态方面的应用。上一次爆发已经是他们憋了很久的了，下一次爆发很难，估计要完整适配完 HW 的芯片之后的事情了，算子要重新整。

7

MIUIOS

2 月 9 日

这次过年老热闹了，GLM5 、minimax2.2 、ds4 都来了

8

qxmqh

2 月 9 日

能吊打克劳德 4.6 吗。

9

visper

2 月 9 日

可以炒一波，去年这么成功，搞得现在很多农村人都认为 AI 就是 deepseek 就是梁文锋。

10

qwwuyu

2 月 9 日

本来一直坚持 deepseek,后来老是断,改元宝了

11

rykinia

2 月 9 日

炒股的话没必要太关注。
产业趋势还是可以跟踪一下，他们用 hw 的卡折腾了很久，最终还是换回了 nv 的卡，可以看看进展如何。

12

NoNewWorld

2 月 9 日

没必要了，现在就两家了，其他不用关注了，就 a 社和 openai ，其他都落后很久，gemini 倒是还可以用用，听听他拍马屁。。不过如果还是开源的话，那有意义，这个世界还是需要开源的，闭源的未来太可怕了。

13

nealHuang

2 月 9 日

@rykinia ds 的发布不是可以利好一大批国内的 AI 板块企业吗

14

ZeroDu

2 月 9 日

文生视频、图，这块国内的那些都还不错的。ds 现在有点尴尬

15

iorilu

2 月 9 日

现在 ai 模型没啥秘密可言的

主要看迭代, 用户量, 数据量

你没有巨大的用户量, 没有巨大的实际使用数据, 不可能仅靠什么算法就能领先的

16

siriussilen

2 月 9 日

8

@mightybruce 哈哈，智谱

17

iorilu

2 月 9 日

2

不过国产那几个肯定要感谢 deepseek

在去年 deepseek r1 之前, 国产那几个基本没任何用, 可能 qwen 还稍微好点点

总从 r1 出来后, 国产那几个居然慢慢行了, 遗憾的是, 居然没人感谢 deepseek

18

xiangqiankan

2 月 9 日

10

评论区很多没入行 ai 的"懂王"对 deepseek 大放厥词，这么说吧，在国外眼里,deepseek 是中国第一名，顶级中国 ai 研究机构

19

yh7gdiaYW

2 月 9 日

@NoNewWorld 太贵了，尤其是 opus ，不好羊毛正经商用伤不起。这次 kimi 2.5 基本达到了 sonnet 水平，使用量一下子炸了，如果 v4 能进一步达到 opus 的水平，该考虑未来的是 claude

20

iorilu

2 月 9 日

3

@xiangqiankan 这是肯定的, deeepseek r1 开源在全世界 AI 都是极为重要的一个事件

无数模型基于这个都有巨大的提高

21

Meursau1T

2 月 9 日

别擅自期待太多，官方没说要发布，何必把人架在火上烤。这帖子又不是看不出来，很多人巴不得 Deepseek 消失呢。最好像当年 2.5 时代一样，低调做事，有成果再发，按自己的节奏来。

22

doudou555

2 月 9 日

我现在大量用豆包和通义，deepseek 现在唯一的优势就是便宜了

23

tonyqinatcmu

2 月 9 日

确实国内外差距还是挺大的，希望国产能够支棱起来

24

mogutouer

2 月 9 日

很多人都这样，表面上鄙视这个鄙视那个，实际做产品时又嫌三巨头 tokens 贵, $25/MTok ，随便接入问个问题 5000 tokens 就 8 毛人民币，我看你什么产品能把这个赚回来。

25

defaw

2 月 9 日

梁文峰就是搞股票出身的，炒股的别想从梁文峰身上赚钱好吧，每次发新东西都是周六，防着你提前拿消息埋伏他呢

26

uxstone

2 月 9 日

1

国外，Anthropic 、Google 、OpenAI
国内，Alibaba 、DeepSeek

27

mightybruce

2 月 9 日

@siriussilen 智谱能上市就能保证资金链没那么容易断，你认为大模型不需要关注商业，智谱自己披露出来的招股书不去看看，不少公司不出来上市的资本都根本撑不了半年，况且智谱还获得沙特基金 4 亿美元重仓，你自己认为？

28

siriussilen

2 月 9 日

@mightybruce
1. 模型的成功与否和能否上市关系不大。
2. 商业上的成功不等于技术上的成功。

29

SouthwestRiver

2 月 9 日

我很是期待，但不抱什么希望，免得失望

30

mightybruce

2 月 9 日

https://x.com/caixin/status/2016392042293952523

谷歌 deepmind 对手都承认字节是竞争者，看来某些人比 deepmind, anthropic 更懂 AI ，呵呵。

31

CynicalRose

2 月 9 日

这几天使用 Qwen3-Max ，体感降智严重，目前随便问一个数学问题，已经不如 DeepSeek 了。

32

2b5X607vRr3OB6ad

2 月 9 日

倒是可以关注下今年的彼尔德伯格会议将要讨论的主题

33

lovelive1024

2 月 9 日

大概率会发吧，效果咋样就先不要太期待了

34

jackyli1

2 月 9 日

@qxmqh 问就是能

35

zuosiruan

2 月 9 日 via iPhone

@mightybruce kimi2.5 不香吗

36

catazshadow

2 月 9 日

@xiangqiankan 你这句话是典型的诉诸权威逻辑谬误

一边喷别人不对，但你自己引用的是洋人的观点

37

Meursau1T

2 月 9 日

@catazshadow 假设这人回的是一楼，即：

没有必要关注 deepseek, 在达沃斯论坛上，谷歌和 anthropic 都没有正眼看过这个

这么一个论断，那么他用洋人的观点显然是在反驳前人的论点，何来诉诸权威？
小明说老师从来都不喜欢小李，小方说老师明明说过喜欢小李，小方诉诸权威了吗？
只有这个人说“我听说某某专家说了，谷歌很关注 deepseek”这才叫诉诸权威。

38

Meursau1T

2 月 9 日

@catazshadow 补充一下，你的回复是典型的“误判谬误类型”，fallacy fallacy 。

39

dreamwing

OP

2 月 9 日

@cue 被你发现了😂

40

Wkj1998

2 月 9 日 via Android

@qxmqh 编码方面应该还是吊打不了

41

NoNewWorld

2 月 9 日

@yh7gdiaYW 贵不是我们考虑的问题，是公司考虑的问题，公司只要认为使用的产出的价值比人高，那么再贵也是值得的。

42

catazshadow

2 月 9 日 via Android

@Meursau1T 洋人的观点在中文语境里就是权威，有什么问题？

43

Meursau1T

2 月 9 日

@catazshadow 显然，你的思维是“只要借洋人之口”就是说权威，然而现在争论的事实是洋人的态度，洋人到底是怎么说的。
如果你觉得只要讨论这个就是在诉诸权威，那么这是一楼的人做的事情，批评后面的人显然有失偏颇。
如果你觉得可以讨论洋人到底怎么看，那么后面的人说洋人的态度就只是在就事论事的反驳一楼而已。
倘若说你 @的人真有什么逻辑错误，只是没有实际举例罢了，不过一楼的举例也是以偏盖全，用一个论坛的情况来涵盖所有讨论，没什么高下之分。
看起来你喜欢做逻辑分析，归纳谬误，我建议你最好对所有人都做，别选择性忽略，也不要根据关键词做简单的正则匹配，看见个洋人就权威。

44

littlePP

2 月 9 日

感觉会诶，又想到去年春节的盛况了

45

fbu11

2 月 9 日

3

梁文峰的重点从来不是 deepseek ，他就不是靠这个赚钱的，发不发没那么重要的（除非上面给压力）。拿这个贴子来讲，一帮自认为懂技术的人脑子里只有 Claude 、Gemini 、ChatGPT 人家看不上国产的

46

stinkytofux

2 月 9 日

@siriussilen #16 你还真别说, glm4.7 还真是我的口粮模型.

47

sharpy

2 月 9 日

以本人使用 codex5.3 opus4.6 的经验来说
国内的模型生态是越发地欣欣向荣了
glm4.7 kimi2.5 用起来手感都还行

48

catazshadow

2 月 9 日 via Android

@Meursau1T 原来是爱国小将

天朝 AI 宇宙第一，大爆炸也是天朝 AI 推理出来的，告辞

49

mightybruce

2 月 9 日

@zuosiruan kimi 这次的亮点是 agent swarm ，这个还是有吸引点的。你可以体验体验。

50

Meursau1T

2 月 9 日

4

@catazshadow 刚刚不还在拿着手册学人讲逻辑，怎么突然就开始犯人身攻击谬误了，你的逻辑思维为何如此不堪一击，我的不爱国大将军

51

mightybruce

2 月 9 日

话说 openrouter 上的一个神秘模型 Pony Alpha 大家都在猜测中，其输出格式方式很像 GLM 。

52

zhonghao01

2 月 9 日

@mightybruce #1 我虽然现在用的智谱的模型。但是从股价来看甚至不如 minimax 。

53

dreamwing

OP

2 月 9 日

@zhonghao01 智谱今天涨了快 40%...

54

catazshadow

2 月 9 日 via Android

1

@Meursau1T 走在路边被狗咬了，你打算跟狗讲道理吗？

同理

55

mightybruce

2 月 9 日

@dreamwing 难道 pony alpha 模型被确认了。

56

sharpy

2 月 9 日

模型演化到一定的程度，智能上国模和御三家，从可用性来说已经没有什么差距了。
毕竟不是所有的任务都得用最强的模型，GLM4.7 已经足够我使用了。

至于说，把所有的一切，都交给 AI 来决策，来推进，那是另一个层面的事情，当下，我还是不会放弃自己的脑子。

57

Rickkkkkkk

2 月 9 日

ds 自己流量没接住啊，我一直都是用元宝里的 ds

58

dreamwing

OP

2 月 9 日

@mightybruce 好像是说是 GLM5 ，也有说是 Minimax M2 ，不过从今天智谱和 Minimax 的涨幅来看，感觉像是 GLM5😂

59

vipfts

2 月 9 日

1

@fbu11

我不在意，我只想看 ds 捅国外的 ai 泡沫，跟棍勇的烧火棍捅批得一样爽

60

kk58

2 月 9 日

1

筛选：
1.技术对等不是二流技术附庸；
2.训练效率显著高于美国同行；
3.私有数据闭环作为护城河

只剩 DeepSeek 阿里字节腾讯

61

ChaimeLonic

2 月 9 日

@Meursau1T #21 只是一波人擅自期待又擅自破防罢了，deepseek 没给承诺，每次发个模型微信群发个消息，官网上篇介绍就完事

62

ChaimeLonic

2 月 9 日

@kk58 GLM minimax kimi 看起来还是 claude 的附庸

63

BadAngel

2 月 9 日

hvv 知道，会发的

64

bwnjnOEI

2 月 10 日 via iPhone

国内就去年 ds 的 grpo 长脸了 rlhf 再也不需要 4 个模型了，之后都是源于做量化的底子在工程上的创新，今年的 mhc 还比较 demo 其他公司没有那么从 0 到 1 。未来国内看好字节。国内还没有 alphago zero fold 这种诺奖级别的原创这些你看他的论文很简单很清晰

65

germain

2 月 10 日

1

Deepseek 依然是目前我团队使用的投入产出比最高的模型，没有之一，大大超过市面上其他的 AI

66

Suger828

2 月 10 日

1

其实 ds 的影响力还是蛮大的,智谱和 kimi2.5 用的架构就是 DeepSeek 的

67

tairan2006

2 月 10 日 via Android

我支持 deepseek ，但是这玩意儿确实只是副产品

68

qiaobeier

2 月 10 日

@ZeroDu 视频这块字节的 Seedance2 简直牛逼 plus ，以前我还能分得清什么是 ai 视频，现在这玩意生成的真的分不清楚了。

69

wanttofly

2 月 10 日

2

实在没看懂楼上一些人自己破防骂别人、崇洋媚外、讲话毫无逻辑的人在那沾沾自喜、自以为是是什么道理？ deepseek 怎么看在大模型领域都不是路边一条，不说举足轻重至少不可忽视吧？

70

BlackSas

2 月 10 日

我们公司的欧洲的，跟总部开会人家都认为只有中国在 AI 上能跟上美国了。
deepseek moment 也是很了不起的。
正视差距可以，但也不要过分踩低。

71

bianYuX

2 月 10 日

@mightybruce 曾经我也认为智谱是中国最牛的大模型，但是我使用下来是他连代码完成度都没法保障，else 0 给我写成了 else ，这种错误实在太低级了

72

PC9528

2 月 10 日

其实要分别是不是国内模型很简单的，问一下国内模型不能回答的问题，国外模型可以回答的问题就可以了，显然 pony alpha 是国内模型

73

janda

2 月 10 日

1

人类不感谢 deepseek 、就像不感谢逻辑一样

74

littlebaozi

2 月 10 日

我在想在算力有限的情况下能有这些个 AI ，要是能有顶级算力加持，那还不起飞

75

viking602

2 月 10 日

倒是感觉 GLM 会在春节前突袭

76

sheepmon

2 月 10 日

看劳哥吵架要力竭了

77

pety

2 月 10 日

@dreamwing #58 据说是 glm5 的可能性最大

78

rick13

2 月 10 日

感觉可能会发点东西吧，这公司有毛病，之前也是过节发东西

79

maolon

2 月 10 日

把几个话题凑在一起谈那肯定就是吵架啊
1. ds 在工程上，学术上，以及大模型历史上的贡献大不大？非常大，而且现在依然很大
2. ds 的模型现在市场上还强吗？并不强，第二梯队都靠后了
3. ds 的模型还有没有用途？有没有性价比？有，有
4. 推不推荐用 ds ？不推荐，有很多更好的选择

80

FreeGuy

2 月 10 日

一年之后 deepseek 最后还是没起来，这个不怪他们，本质还是国内的算力基础设施过于薄弱了，毕竟技术大佬们都失业了。

81

FreeGuy

2 月 10 日

新闻媒体很搞笑，光鼓吹有毛用，你得实打实给人家资金支持，爆发富老板太多了，又不懂又喜欢乱指挥。

82

aloop

2 月 10 日 via Android

@rykinia 又换回 nv 的卡了吗

83

mizkan

2 月 10 日

真的吗！那发布之后会砸盘英伟达吗！很期待真的

84

wew3

2 月 10 日

openrouter 问他，他不回答。
用户问我和 GLM 4.7 有什么区别。我需要介绍一下我自己（ Pony Alpha ）以及与 GLM 4.7 的区别。

首先，我是 Pony Alpha ，一个来自 unknown provider 的大语言模型。GLM 4.7 是智谱 AI （ Zhipu AI ）开发的大语言模型，是 GLM 系列的一个版本。

我应该诚实地说明：

我来自一个"unknown provider"（未知的提供商）
GLM 4.7 是智谱 AI 的产品

关于具体的区别，我需要诚实地表示我可能不太清楚 GLM 4.7 的所有具体特性，因为我是不同的模型。

让我用中文回答用户的问题。
Collapse reasoning
Pony Alpha 与 GLM 4.7 的区别

感谢你的提问！以下是一些基本信息：
关于我 - Pony Alpha

开发者：来自一个未知的提供商（ Unknown Provider ）
定位：我是一个通用型大语言模型，可以协助回答问题、编写代码、进行对话等

关于 GLM 4.7

开发者：智谱 AI （ Zhipu AI ）
定位：GLM 系列是智谱 AI 开发的大语言模型家族

主要区别
方面 Pony Alpha GLM 4.7
开发团队未知提供商智谱 AI
模型架构未公开详细信息 GLM 架构
训练数据未公开智谱 AI 自有数据
具体能力侧重通用对话通用对话
诚实说明

坦白说，我对自己与 GLM 4.7 的具体技术差异了解有限，因为：

我对自己架构的详细信息公开有限
不同模型的内部工作机制通常不会完全公开

如果你有具体的使用场景，我可以帮你测试我的能力范围，看看是否能满足你的需求 😊

有什么具体问题想问吗？

85

cvbnt

2 月 11 日

这个模型的发布最大意义是提高国产大模型的能力下限

86

mrpzx001

2 月 11 日

deepseek 1m 上下文来了，app 上随便问一下，web 端也会有