今年春节 deepseek 的 deepseek 时刻会不会再次上演?
1
mightybruce 1 天前 没有必要关注 deepseek, 在达沃斯论坛上,谷歌和 anthropic 都没有正眼看过这个, 它的成功可能轻易不会再来一次, 国内字节和大模型公司如智谱才被认为最有潜力。
|
2
leegradyllljjjj 1 天前 via iPhone 一鼓作气,再而衰,三而竭。
|
3
StephenHe 1 天前 春节发布,然后打工人在家加班,跟打工人有仇吗
|
4
cloudyplain 1 天前
别搞了,咱们节后再发。
|
5
cue 1 天前
买每日互动了吧这么着急
|
6
VeteranCat 1 天前
不会。 而且未来体量小的组织是真的上不了 AI 这个餐桌了,现在的 AI 发展主要关注的是应用,豆包手机这种的,千问这种的, 或者是其他的多模态方面的应用。 上一次爆发已经是他们憋了很久的了,下一次爆发很难,估计要完整适配完 HW 的芯片之后的事情了,算子要重新整。
|
7
MIUIOS 1 天前
这次过年老热闹了,GLM5 、minimax2.2 、ds4 都来了
|
8
qxmqh 1 天前
能吊打克劳德 4.6 吗。
|
9
visper 1 天前
可以炒一波,去年这么成功,搞得现在很多农村人都认为 AI 就是 deepseek 就是梁文锋。
|
10
qwwuyu 1 天前
本来一直坚持 deepseek,后来老是断,改元宝了
|
11
rykinia 1 天前
炒股的话没必要太关注。
产业趋势还是可以跟踪一下,他们用 hw 的卡折腾了很久,最终还是换回了 nv 的卡,可以看看进展如何。 |
12
NoNewWorld 1 天前
没必要了,现在就两家了,其他不用关注了,就 a 社和 openai ,其他都落后很久,gemini 倒是还可以用用,听听他拍马屁。。不过如果还是开源的话,那有意义,这个世界还是需要开源的,闭源的未来太可怕了。
|
14
ZeroDu 1 天前
文生视频、图,这块国内的那些都还不错的。ds 现在有点尴尬
|
15
iorilu 1 天前
现在 ai 模型没啥秘密可言的
主要看迭代, 用户量, 数据量 你没有巨大的用户量, 没有巨大的实际使用数据, 不可能仅靠什么算法就能领先的 |
16
siriussilen 1 天前 @mightybruce 哈哈,智谱
|
17
iorilu 1 天前 不过国产那几个肯定要感谢 deepseek
在去年 deepseek r1 之前, 国产那几个基本没任何用, 可能 qwen 还稍微好点点 总从 r1 出来后, 国产那几个居然慢慢行了, 遗憾的是, 居然没人感谢 deepseek |
18
xiangqiankan 1 天前 评论区很多没入行 ai 的"懂王"对 deepseek 大放厥词,这么说吧,在国外眼里,deepseek 是中国第一名,顶级中国 ai 研究机构
|
19
yh7gdiaYW 1 天前
@NoNewWorld 太贵了,尤其是 opus ,不好羊毛正经商用伤不起。这次 kimi 2.5 基本达到了 sonnet 水平,使用量一下子炸了,如果 v4 能进一步达到 opus 的水平,该考虑未来的是 claude
|
20
iorilu 1 天前 |
21
Meursau1T 1 天前
别擅自期待太多,官方没说要发布,何必把人架在火上烤。这帖子又不是看不出来,很多人巴不得 Deepseek 消失呢。最好像当年 2.5 时代一样,低调做事,有成果再发,按自己的节奏来。
|
22
doudou555 1 天前
我现在大量用豆包和通义,deepseek 现在唯一的优势就是便宜了
|
23
tonyqinatcmu 1 天前
确实国内外差距还是挺大的,希望国产能够支棱起来
|
24
mogutouer 1 天前
很多人都这样,表面上鄙视这个鄙视那个,实际做产品时又嫌三巨头 tokens 贵, $25/MTok ,随便接入问个问题 5000 tokens 就 8 毛人民币,我看你什么产品能把这个赚回来。
|
25
defaw 1 天前
梁文峰就是搞股票出身的,炒股的别想从梁文峰身上赚钱好吧,每次发新东西都是周六,防着你提前拿消息埋伏他呢
|
26
uxstone 1 天前 国外,Anthropic 、Google 、OpenAI
国内,Alibaba 、DeepSeek |
27
mightybruce 1 天前
@siriussilen 智谱能上市就能保证资金链没那么容易断, 你认为大模型不需要关注商业, 智谱自己披露出来的招股书不去看看,不少公司不出来上市的资本都根本撑不了半年,况且智谱还获得沙特基金 4 亿美元重仓, 你自己认为?
|
28
siriussilen 1 天前
|
29
SouthwestRiver 1 天前
我很是期待,但不抱什么希望,免得失望
|
30
mightybruce 1 天前
https://x.com/caixin/status/2016392042293952523
谷歌 deepmind 对手都承认字节是竞争者,看来某些人比 deepmind, anthropic 更懂 AI ,呵呵。 |
31
CynicalRose 1 天前
这几天使用 Qwen3-Max ,体感降智严重,目前随便问一个数学问题,已经不如 DeepSeek 了。
|
32
gogo_tutu 1 天前
倒是可以关注下今年的彼尔德伯格会议将要讨论的主题
|
33
lovelive1024 1 天前
大概率会发吧,效果咋样就先不要太期待了
|
35
zuosiruan 1 天前 via iPhone
@mightybruce kimi2.5 不香吗
|
36
catazshadow 1 天前
|
37
Meursau1T 1 天前
@catazshadow 假设这人回的是一楼,即:
没有必要关注 deepseek, 在达沃斯论坛上,谷歌和 anthropic 都没有正眼看过这个 这么一个论断,那么他用洋人的观点显然是在反驳前人的论点,何来诉诸权威? 小明说老师从来都不喜欢小李,小方说老师明明说过喜欢小李,小方诉诸权威了吗? 只有这个人说“我听说某某专家说了,谷歌很关注 deepseek”这才叫诉诸权威。 |
38
Meursau1T 1 天前
@catazshadow 补充一下,你的回复是典型的“误判谬误类型”,fallacy fallacy 。
|
41
NoNewWorld 1 天前
@yh7gdiaYW 贵不是我们考虑的问题,是公司考虑的问题,公司只要认为使用的产出的价值比人高,那么再贵也是值得的。
|
42
catazshadow 1 天前 via Android
@Meursau1T 洋人的观点在中文语境里就是权威,有什么问题?
|
43
Meursau1T 1 天前
@catazshadow 显然,你的思维是“只要借洋人之口”就是说权威,然而现在争论的事实是洋人的态度,洋人到底是怎么说的。
如果你觉得只要讨论这个就是在诉诸权威,那么这是一楼的人做的事情,批评后面的人显然有失偏颇。 如果你觉得可以讨论洋人到底怎么看,那么后面的人说洋人的态度就只是在就事论事的反驳一楼而已。 倘若说你 @的人真有什么逻辑错误,只是没有实际举例罢了,不过一楼的举例也是以偏盖全,用一个论坛的情况来涵盖所有讨论,没什么高下之分。 看起来你喜欢做逻辑分析,归纳谬误,我建议你最好对所有人都做,别选择性忽略,也不要根据关键词做简单的正则匹配,看见个洋人就权威。 |
44
pengp0676 1 天前
感觉会诶,又想到去年春节的盛况了
|
45
fbu11 1 天前 梁文峰的重点从来不是 deepseek ,他就不是靠这个赚钱的,发不发没那么重要的(除非上面给压力)。拿这个贴子来讲,一帮自认为懂技术的人脑子里只有 Claude 、Gemini 、ChatGPT 人家看不上国产的
|
46
stinkytofux 1 天前
@siriussilen #16 你还真别说, glm4.7 还真是我的口粮模型.
|
47
sharpy 1 天前
以本人使用 codex5.3 opus4.6 的经验来说
国内的模型生态是越发地欣欣向荣了 glm4.7 kimi2.5 用起来手感都还行 |
48
catazshadow 1 天前 via Android
|
49
mightybruce 1 天前
@zuosiruan kimi 这次的亮点是 agent swarm , 这个还是有吸引点的。你可以体验体验。
|
50
Meursau1T 1 天前 @catazshadow 刚刚不还在拿着手册学人讲逻辑,怎么突然就开始犯人身攻击谬误了,你的逻辑思维为何如此不堪一击,我的不爱国大将军
|
51
mightybruce 1 天前
话说 openrouter 上的一个神秘模型 Pony Alpha 大家都在猜测中, 其输出格式方式很像 GLM 。
|
52
zhonghao01 1 天前
@mightybruce #1 我虽然现在用的智谱的模型。但是从股价来看甚至不如 minimax 。
|
53
dreamwing OP @zhonghao01 智谱今天涨了快 40%...
|
54
catazshadow 1 天前 via Android |
55
mightybruce 1 天前
@dreamwing 难道 pony alpha 模型被确认了。
|
56
sharpy 1 天前
模型演化到一定的程度,智能上国模和御三家,从可用性来说已经没有什么差距了。
毕竟不是所有的任务都得用最强的模型,GLM4.7 已经足够我使用了。 至于说,把所有的一切,都交给 AI 来决策,来推进,那是另一个层面的事情,当下,我还是不会放弃自己的脑子。 |
57
Rickkkkkkk 1 天前
ds 自己流量没接住啊,我一直都是用元宝里的 ds
|
58
dreamwing OP @mightybruce 好像是说是 GLM5 ,也有说是 Minimax M2 ,不过从今天智谱和 Minimax 的涨幅来看,感觉像是 GLM5😂
|
60
kk58 1 天前 筛选:
1.技术对等不是二流技术附庸; 2.训练效率显著高于美国同行; 3.私有数据闭环作为护城河 只剩 DeepSeek 阿里 字节 腾讯 |
61
ChaimeLonic 1 天前
@Meursau1T #21 只是一波人擅自期待又擅自破防罢了,deepseek 没给承诺,每次发个模型微信群发个消息,官网上篇介绍就完事
|
62
ChaimeLonic 1 天前
@kk58 GLM minimax kimi 看起来还是 claude 的附庸
|
63
BadAngel 22 小时 58 分钟前
hvv 知道,会发的
|
64
bwnjnOEI 18 小时 15 分钟前 via iPhone
国内就去年 ds 的 grpo 长脸了 rlhf 再也不需要 4 个模型了,之后都是源于做量化的底子在工程上的创新,今年的 mhc 还比较 demo 其他公司没有那么从 0 到 1 。 未来国内看好字节。国内还没有 alphago zero fold 这种诺奖级别的原创 这些你看他的论文很简单很清晰
|
65
germain 18 小时 6 分钟前 Deepseek 依然是目前我团队使用的投入产出比最高的模型,没有之一,大大超过市面上其他的 AI
|
66
Suger828 17 小时 55 分钟前 其实 ds 的影响力还是蛮大的,智谱和 kimi2.5 用的架构就是 DeepSeek 的
|
67
tairan2006 12 小时 53 分钟前 via Android
我支持 deepseek ,但是这玩意儿确实只是副产品
|
69
wanttofly 11 小时 37 分钟前 实在没看懂楼上一些人自己破防骂别人、崇洋媚外、讲话毫无逻辑的人在那沾沾自喜、自以为是是什么道理? deepseek 怎么看在大模型领域都不是路边一条,不说举足轻重至少不可忽视吧?
|
70
BlackSas 11 小时 8 分钟前
我们公司的欧洲的,跟总部开会人家都认为只有中国在 AI 上能跟上美国了。
deepseek moment 也是很了不起的。 正视差距可以,但也不要过分踩低。 |
71
bianYuX 11 小时 6 分钟前
@mightybruce 曾经我也认为智谱是中国最牛的大模型,但是我使用下来是他连代码完成度都没法保障,else 0 给我写成了 else ,这种错误实在太低级了
|
72
PC9528 11 小时 2 分钟前
其实要分别是不是国内模型很简单的,问一下国内模型不能回答的问题,国外模型可以回答的问题就可以了,显然 pony alpha 是国内模型
|
73
janda 10 小时 58 分钟前 人类不感谢 deepseek 、就像不感谢逻辑一样
|
74
littlebaozi 10 小时 55 分钟前
我在想在算力有限的情况下能有这些个 AI ,要是能有顶级算力加持,那还不起飞
|
75
viking602 10 小时 52 分钟前
倒是 感觉 GLM 会在春节前突袭
|
76
sheepmon 9 小时 34 分钟前
看劳哥吵架要力竭了
|
78
rick13 8 小时 42 分钟前
感觉可能会发点东西吧,这公司有毛病,之前也是过节发东西
|
79
maolon 8 小时 36 分钟前
把几个话题凑在一起谈那肯定就是吵架啊
1. ds 在工程上,学术上,以及大模型历史上的贡献大不大?非常大,而且现在依然很大 2. ds 的模型现在市场上还强吗?并不强,第二梯队都靠后了 3. ds 的模型还有没有用途?有没有性价比?有,有 4. 推不推荐用 ds ?不推荐,有很多更好的选择 |
80
FreeGuy 7 小时 21 分钟前
一年之后 deepseek 最后还是没起来,这个不怪他们,本质还是国内的算力基础设施过于薄弱了,毕竟技术大佬们都失业了。
|
81
FreeGuy 7 小时 17 分钟前
新闻媒体很搞笑,光鼓吹有毛用,你得实打实给人家资金支持,爆发富老板太多了,又不懂又喜欢乱指挥。
|
83
mizkan 4 小时 44 分钟前
真的吗!那发布之后会砸盘英伟达吗!很期待真的
|
84
wew3 3 小时 32 分钟前
openrouter 问他,他不回答。
用户问我和 GLM 4.7 有什么区别。我需要介绍一下我自己( Pony Alpha )以及与 GLM 4.7 的区别。 首先,我是 Pony Alpha ,一个来自 unknown provider 的大语言模型。GLM 4.7 是智谱 AI ( Zhipu AI )开发的大语言模型,是 GLM 系列的一个版本。 我应该诚实地说明: 我来自一个"unknown provider"(未知的提供商) GLM 4.7 是智谱 AI 的产品 关于具体的区别,我需要诚实地表示我可能不太清楚 GLM 4.7 的所有具体特性,因为我是不同的模型。 让我用中文回答用户的问题。 Collapse reasoning Pony Alpha 与 GLM 4.7 的区别 感谢你的提问!以下是一些基本信息: 关于我 - Pony Alpha 开发者:来自一个未知的提供商( Unknown Provider ) 定位:我是一个通用型大语言模型,可以协助回答问题、编写代码、进行对话等 关于 GLM 4.7 开发者:智谱 AI ( Zhipu AI ) 定位:GLM 系列是智谱 AI 开发的大语言模型家族 主要区别 方面 Pony Alpha GLM 4.7 开发团队 未知提供商 智谱 AI 模型架构 未公开详细信息 GLM 架构 训练数据 未公开 智谱 AI 自有数据 具体能力侧重 通用对话 通用对话 诚实说明 坦白说,我对自己与 GLM 4.7 的具体技术差异了解有限,因为: 我对自己架构的详细信息公开有限 不同模型的内部工作机制通常不会完全公开 如果你有具体的使用场景,我可以帮你测试我的能力范围,看看是否能满足你的需求 😊 有什么具体问题想问吗? |