V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
dreamwing
V2EX  ›  程序员

这周是春节前最后一周了, Deepseek V4 会突袭吗?

  •  
  •   dreamwing · 1 天前 · 8379 次点击

    今年春节 deepseek 的 deepseek 时刻会不会再次上演?

    84 条回复    2026-02-10 17:20:47 +08:00
    mightybruce
        1
    mightybruce  
       1 天前   ❤️ 6
    没有必要关注 deepseek, 在达沃斯论坛上,谷歌和 anthropic 都没有正眼看过这个, 它的成功可能轻易不会再来一次, 国内字节和大模型公司如智谱才被认为最有潜力。
    leegradyllljjjj
        2
    leegradyllljjjj  
       1 天前 via iPhone   ❤️ 1
    一鼓作气,再而衰,三而竭。
    StephenHe
        3
    StephenHe  
       1 天前   ❤️ 7
    春节发布,然后打工人在家加班,跟打工人有仇吗
    cloudyplain
        4
    cloudyplain  
       1 天前
    别搞了,咱们节后再发。
    cue
        5
    cue  
       1 天前
    买每日互动了吧这么着急
    VeteranCat
        6
    VeteranCat  
       1 天前
    不会。 而且未来体量小的组织是真的上不了 AI 这个餐桌了,现在的 AI 发展主要关注的是应用,豆包手机这种的,千问这种的, 或者是其他的多模态方面的应用。 上一次爆发已经是他们憋了很久的了,下一次爆发很难,估计要完整适配完 HW 的芯片之后的事情了,算子要重新整。
    MIUIOS
        7
    MIUIOS  
       1 天前
    这次过年老热闹了,GLM5 、minimax2.2 、ds4 都来了
    qxmqh
        8
    qxmqh  
       1 天前
    能吊打克劳德 4.6 吗。
    visper
        9
    visper  
       1 天前
    可以炒一波,去年这么成功,搞得现在很多农村人都认为 AI 就是 deepseek 就是梁文锋。
    qwwuyu
        10
    qwwuyu  
       1 天前
    本来一直坚持 deepseek,后来老是断,改元宝了
    rykinia
        11
    rykinia  
       1 天前
    炒股的话没必要太关注。
    产业趋势还是可以跟踪一下,他们用 hw 的卡折腾了很久,最终还是换回了 nv 的卡,可以看看进展如何。
    NoNewWorld
        12
    NoNewWorld  
       1 天前
    没必要了,现在就两家了,其他不用关注了,就 a 社和 openai ,其他都落后很久,gemini 倒是还可以用用,听听他拍马屁。。不过如果还是开源的话,那有意义,这个世界还是需要开源的,闭源的未来太可怕了。
    nealHuang
        13
    nealHuang  
       1 天前
    @rykinia ds 的发布不是可以利好一大批国内的 AI 板块企业吗
    ZeroDu
        14
    ZeroDu  
       1 天前
    文生视频、图,这块国内的那些都还不错的。ds 现在有点尴尬
    iorilu
        15
    iorilu  
       1 天前
    现在 ai 模型没啥秘密可言的

    主要看迭代, 用户量, 数据量

    你没有巨大的用户量, 没有巨大的实际使用数据, 不可能仅靠什么算法就能领先的
    siriussilen
        16
    siriussilen  
       1 天前   ❤️ 8
    @mightybruce 哈哈,智谱
    iorilu
        17
    iorilu  
       1 天前   ❤️ 2
    不过国产那几个肯定要感谢 deepseek

    在去年 deepseek r1 之前, 国产那几个基本没任何用, 可能 qwen 还稍微好点点

    总从 r1 出来后, 国产那几个居然慢慢行了, 遗憾的是, 居然没人感谢 deepseek
    xiangqiankan
        18
    xiangqiankan  
       1 天前   ❤️ 9
    评论区很多没入行 ai 的"懂王"对 deepseek 大放厥词,这么说吧,在国外眼里,deepseek 是中国第一名,顶级中国 ai 研究机构
    yh7gdiaYW
        19
    yh7gdiaYW  
       1 天前
    @NoNewWorld 太贵了,尤其是 opus ,不好羊毛正经商用伤不起。这次 kimi 2.5 基本达到了 sonnet 水平,使用量一下子炸了,如果 v4 能进一步达到 opus 的水平,该考虑未来的是 claude
    iorilu
        20
    iorilu  
       1 天前   ❤️ 3
    @xiangqiankan 这是肯定的, deeepseek r1 开源在全世界 AI 都是极为重要的一个事件

    无数模型基于这个都有巨大的提高
    Meursau1T
        21
    Meursau1T  
       1 天前
    别擅自期待太多,官方没说要发布,何必把人架在火上烤。这帖子又不是看不出来,很多人巴不得 Deepseek 消失呢。最好像当年 2.5 时代一样,低调做事,有成果再发,按自己的节奏来。
    doudou555
        22
    doudou555  
       1 天前
    我现在大量用豆包和通义,deepseek 现在唯一的优势就是便宜了
    tonyqinatcmu
        23
    tonyqinatcmu  
       1 天前
    确实国内外差距还是挺大的,希望国产能够支棱起来
    mogutouer
        24
    mogutouer  
       1 天前
    很多人都这样,表面上鄙视这个鄙视那个,实际做产品时又嫌三巨头 tokens 贵, $25/MTok ,随便接入问个问题 5000 tokens 就 8 毛人民币,我看你什么产品能把这个赚回来。
    defaw
        25
    defaw  
       1 天前
    梁文峰就是搞股票出身的,炒股的别想从梁文峰身上赚钱好吧,每次发新东西都是周六,防着你提前拿消息埋伏他呢
    uxstone
        26
    uxstone  
       1 天前   ❤️ 1
    国外,Anthropic 、Google 、OpenAI
    国内,Alibaba 、DeepSeek
    mightybruce
        27
    mightybruce  
       1 天前
    @siriussilen 智谱能上市就能保证资金链没那么容易断, 你认为大模型不需要关注商业, 智谱自己披露出来的招股书不去看看,不少公司不出来上市的资本都根本撑不了半年,况且智谱还获得沙特基金 4 亿美元重仓, 你自己认为?
    siriussilen
        28
    siriussilen  
       1 天前
    @mightybruce
    1. 模型的成功与否和能否上市关系不大。
    2. 商业上的成功不等于技术上的成功。
    SouthwestRiver
        29
    SouthwestRiver  
       1 天前
    我很是期待,但不抱什么希望,免得失望
    mightybruce
        30
    mightybruce  
       1 天前
    https://x.com/caixin/status/2016392042293952523

    谷歌 deepmind 对手都承认字节是竞争者,看来某些人比 deepmind, anthropic 更懂 AI ,呵呵。
    CynicalRose
        31
    CynicalRose  
       1 天前
    这几天使用 Qwen3-Max ,体感降智严重,目前随便问一个数学问题,已经不如 DeepSeek 了。
    gogo_tutu
        32
    gogo_tutu  
       1 天前
    倒是可以关注下今年的彼尔德伯格会议将要讨论的主题
    lovelive1024
        33
    lovelive1024  
       1 天前
    大概率会发吧,效果咋样就先不要太期待了
    jackyli1
        34
    jackyli1  
       1 天前
    @qxmqh 问就是能
    zuosiruan
        35
    zuosiruan  
       1 天前 via iPhone
    @mightybruce kimi2.5 不香吗
    catazshadow
        36
    catazshadow  
       1 天前
    @xiangqiankan 你这句话是典型的 诉诸权威 逻辑谬误

    一边喷别人不对,但你自己引用的是洋人的观点
    Meursau1T
        37
    Meursau1T  
       1 天前
    @catazshadow 假设这人回的是一楼,即:

    没有必要关注 deepseek, 在达沃斯论坛上,谷歌和 anthropic 都没有正眼看过这个

    这么一个论断,那么他用洋人的观点显然是在反驳前人的论点,何来诉诸权威?
    小明说老师从来都不喜欢小李,小方说老师明明说过喜欢小李,小方诉诸权威了吗?
    只有这个人说“我听说某某专家说了,谷歌很关注 deepseek”这才叫诉诸权威。
    Meursau1T
        38
    Meursau1T  
       1 天前
    @catazshadow 补充一下,你的回复是典型的“误判谬误类型”,fallacy fallacy 。
    dreamwing
        39
    dreamwing  
    OP
       1 天前
    @cue 被你发现了😂
    Wkj1998
        40
    Wkj1998  
       1 天前 via Android
    @qxmqh 编码方面应该还是吊打不了
    NoNewWorld
        41
    NoNewWorld  
       1 天前
    @yh7gdiaYW 贵不是我们考虑的问题,是公司考虑的问题,公司只要认为使用的产出的价值比人高,那么再贵也是值得的。
    catazshadow
        42
    catazshadow  
       1 天前 via Android
    @Meursau1T 洋人的观点在中文语境里就是权威,有什么问题?
    Meursau1T
        43
    Meursau1T  
       1 天前
    @catazshadow 显然,你的思维是“只要借洋人之口”就是说权威,然而现在争论的事实是洋人的态度,洋人到底是怎么说的。
    如果你觉得只要讨论这个就是在诉诸权威,那么这是一楼的人做的事情,批评后面的人显然有失偏颇。
    如果你觉得可以讨论洋人到底怎么看,那么后面的人说洋人的态度就只是在就事论事的反驳一楼而已。
    倘若说你 @的人真有什么逻辑错误,只是没有实际举例罢了,不过一楼的举例也是以偏盖全,用一个论坛的情况来涵盖所有讨论,没什么高下之分。
    看起来你喜欢做逻辑分析,归纳谬误,我建议你最好对所有人都做,别选择性忽略,也不要根据关键词做简单的正则匹配,看见个洋人就权威。
    pengp0676
        44
    pengp0676  
       1 天前
    感觉会诶,又想到去年春节的盛况了
    fbu11
        45
    fbu11  
       1 天前   ❤️ 3
    梁文峰的重点从来不是 deepseek ,他就不是靠这个赚钱的,发不发没那么重要的(除非上面给压力)。拿这个贴子来讲,一帮自认为懂技术的人脑子里只有 Claude 、Gemini 、ChatGPT 人家看不上国产的
    stinkytofux
        46
    stinkytofux  
       1 天前
    @siriussilen #16 你还真别说, glm4.7 还真是我的口粮模型.
    sharpy
        47
    sharpy  
       1 天前
    以本人使用 codex5.3 opus4.6 的经验来说
    国内的模型生态是越发地欣欣向荣了
    glm4.7 kimi2.5 用起来手感都还行
    catazshadow
        48
    catazshadow  
       1 天前 via Android
    @Meursau1T 原来是爱国小将

    天朝 AI 宇宙第一,大爆炸也是天朝 AI 推理出来的,告辞
    mightybruce
        49
    mightybruce  
       1 天前
    @zuosiruan kimi 这次的亮点是 agent swarm , 这个还是有吸引点的。你可以体验体验。
    Meursau1T
        50
    Meursau1T  
       1 天前   ❤️ 4
    @catazshadow 刚刚不还在拿着手册学人讲逻辑,怎么突然就开始犯人身攻击谬误了,你的逻辑思维为何如此不堪一击,我的不爱国大将军
    mightybruce
        51
    mightybruce  
       1 天前
    话说 openrouter 上的一个神秘模型 Pony Alpha 大家都在猜测中, 其输出格式方式很像 GLM 。
    zhonghao01
        52
    zhonghao01  
       1 天前
    @mightybruce #1 我虽然现在用的智谱的模型。但是从股价来看甚至不如 minimax 。
    dreamwing
        53
    dreamwing  
    OP
       1 天前
    @zhonghao01 智谱今天涨了快 40%...
    catazshadow
        54
    catazshadow  
       1 天前 via Android   ❤️ 1
    @Meursau1T 走在路边被狗咬了,你打算跟狗讲道理吗?

    同理
    mightybruce
        55
    mightybruce  
       1 天前
    @dreamwing 难道 pony alpha 模型被确认了。
    sharpy
        56
    sharpy  
       1 天前
    模型演化到一定的程度,智能上国模和御三家,从可用性来说已经没有什么差距了。
    毕竟不是所有的任务都得用最强的模型,GLM4.7 已经足够我使用了。

    至于说,把所有的一切,都交给 AI 来决策,来推进,那是另一个层面的事情,当下,我还是不会放弃自己的脑子。
    Rickkkkkkk
        57
    Rickkkkkkk  
       1 天前
    ds 自己流量没接住啊,我一直都是用元宝里的 ds
    dreamwing
        58
    dreamwing  
    OP
       1 天前
    @mightybruce 好像是说是 GLM5 ,也有说是 Minimax M2 ,不过从今天智谱和 Minimax 的涨幅来看,感觉像是 GLM5😂
    vipfts
        59
    vipfts  
       1 天前   ❤️ 1
    @fbu11 我不在意,我只想看 ds 捅国外的 ai 泡沫,跟棍勇的烧火棍捅批得一样爽
    kk58
        60
    kk58  
       1 天前   ❤️ 1
    筛选:
    1.技术对等不是二流技术附庸;
    2.训练效率显著高于美国同行;
    3.私有数据闭环作为护城河

    只剩 DeepSeek 阿里 字节 腾讯
    ChaimeLonic
        61
    ChaimeLonic  
       1 天前
    @Meursau1T #21 只是一波人擅自期待又擅自破防罢了,deepseek 没给承诺,每次发个模型微信群发个消息,官网上篇介绍就完事
    ChaimeLonic
        62
    ChaimeLonic  
       1 天前
    @kk58 GLM minimax kimi 看起来还是 claude 的附庸
    BadAngel
        63
    BadAngel  
       22 小时 58 分钟前
    hvv 知道,会发的
    bwnjnOEI
        64
    bwnjnOEI  
       18 小时 15 分钟前 via iPhone
    国内就去年 ds 的 grpo 长脸了 rlhf 再也不需要 4 个模型了,之后都是源于做量化的底子在工程上的创新,今年的 mhc 还比较 demo 其他公司没有那么从 0 到 1 。 未来国内看好字节。国内还没有 alphago zero fold 这种诺奖级别的原创 这些你看他的论文很简单很清晰
    germain
        65
    germain  
       18 小时 6 分钟前   ❤️ 1
    Deepseek 依然是目前我团队使用的投入产出比最高的模型,没有之一,大大超过市面上其他的 AI
    Suger828
        66
    Suger828  
       17 小时 55 分钟前   ❤️ 1
    其实 ds 的影响力还是蛮大的,智谱和 kimi2.5 用的架构就是 DeepSeek 的
    tairan2006
        67
    tairan2006  
       12 小时 53 分钟前 via Android
    我支持 deepseek ,但是这玩意儿确实只是副产品
    qiaobeier
        68
    qiaobeier  
       11 小时 38 分钟前
    @ZeroDu 视频这块字节的 Seedance2 简直牛逼 plus ,以前我还能分得清什么是 ai 视频,现在这玩意生成的真的分不清楚了。
    wanttofly
        69
    wanttofly  
       11 小时 37 分钟前   ❤️ 2
    实在没看懂楼上一些人自己破防骂别人、崇洋媚外、讲话毫无逻辑的人在那沾沾自喜、自以为是是什么道理? deepseek 怎么看在大模型领域都不是路边一条,不说举足轻重至少不可忽视吧?
    BlackSas
        70
    BlackSas  
       11 小时 8 分钟前
    我们公司的欧洲的,跟总部开会人家都认为只有中国在 AI 上能跟上美国了。
    deepseek moment 也是很了不起的。
    正视差距可以,但也不要过分踩低。
    bianYuX
        71
    bianYuX  
       11 小时 6 分钟前
    @mightybruce 曾经我也认为智谱是中国最牛的大模型,但是我使用下来是他连代码完成度都没法保障,else 0 给我写成了 else ,这种错误实在太低级了
    PC9528
        72
    PC9528  
       11 小时 2 分钟前
    其实要分别是不是国内模型很简单的,问一下国内模型不能回答的问题,国外模型可以回答的问题就可以了,显然 pony alpha 是国内模型
    janda
        73
    janda  
       10 小时 58 分钟前   ❤️ 1
    人类不感谢 deepseek 、就像不感谢逻辑一样
    littlebaozi
        74
    littlebaozi  
       10 小时 55 分钟前
    我在想在算力有限的情况下能有这些个 AI ,要是能有顶级算力加持,那还不起飞
    viking602
        75
    viking602  
       10 小时 52 分钟前
    倒是 感觉 GLM 会在春节前突袭
    sheepmon
        76
    sheepmon  
       9 小时 34 分钟前
    看劳哥吵架要力竭了
    pety
        77
    pety  
       9 小时 7 分钟前
    @dreamwing #58 据说是 glm5 的可能性最大
    rick13
        78
    rick13  
       8 小时 42 分钟前
    感觉可能会发点东西吧,这公司有毛病,之前也是过节发东西
    maolon
        79
    maolon  
       8 小时 36 分钟前
    把几个话题凑在一起谈那肯定就是吵架啊
    1. ds 在工程上,学术上,以及大模型历史上的贡献大不大?非常大,而且现在依然很大
    2. ds 的模型现在市场上还强吗?并不强,第二梯队都靠后了
    3. ds 的模型还有没有用途?有没有性价比?有,有
    4. 推不推荐用 ds ?不推荐,有很多更好的选择
    FreeGuy
        80
    FreeGuy  
       7 小时 21 分钟前
    一年之后 deepseek 最后还是没起来,这个不怪他们,本质还是国内的算力基础设施过于薄弱了,毕竟技术大佬们都失业了。
    FreeGuy
        81
    FreeGuy  
       7 小时 17 分钟前
    新闻媒体很搞笑,光鼓吹有毛用,你得实打实给人家资金支持,爆发富老板太多了,又不懂又喜欢乱指挥。
    aloop
        82
    aloop  
       7 小时 15 分钟前 via Android
    @rykinia 又换回 nv 的卡了吗
    mizkan
        83
    mizkan  
       4 小时 44 分钟前
    真的吗!那发布之后会砸盘英伟达吗!很期待真的
    wew3
        84
    wew3  
       3 小时 32 分钟前
    openrouter 问他,他不回答。
    用户问我和 GLM 4.7 有什么区别。我需要介绍一下我自己( Pony Alpha )以及与 GLM 4.7 的区别。

    首先,我是 Pony Alpha ,一个来自 unknown provider 的大语言模型。GLM 4.7 是智谱 AI ( Zhipu AI )开发的大语言模型,是 GLM 系列的一个版本。

    我应该诚实地说明:

    我来自一个"unknown provider"(未知的提供商)
    GLM 4.7 是智谱 AI 的产品

    关于具体的区别,我需要诚实地表示我可能不太清楚 GLM 4.7 的所有具体特性,因为我是不同的模型。

    让我用中文回答用户的问题。
    Collapse reasoning
    Pony Alpha 与 GLM 4.7 的区别

    感谢你的提问!以下是一些基本信息:
    关于我 - Pony Alpha

    开发者:来自一个未知的提供商( Unknown Provider )
    定位:我是一个通用型大语言模型,可以协助回答问题、编写代码、进行对话等

    关于 GLM 4.7

    开发者:智谱 AI ( Zhipu AI )
    定位:GLM 系列是智谱 AI 开发的大语言模型家族

    主要区别
    方面 Pony Alpha GLM 4.7
    开发团队 未知提供商 智谱 AI
    模型架构 未公开详细信息 GLM 架构
    训练数据 未公开 智谱 AI 自有数据
    具体能力侧重 通用对话 通用对话
    诚实说明

    坦白说,我对自己与 GLM 4.7 的具体技术差异了解有限,因为:

    我对自己架构的详细信息公开有限
    不同模型的内部工作机制通常不会完全公开

    如果你有具体的使用场景,我可以帮你测试我的能力范围,看看是否能满足你的需求 😊

    有什么具体问题想问吗?
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2135 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 51ms · UTC 12:53 · PVG 20:53 · LAX 04:53 · JFK 07:53
    ♥ Do have faith in what you're doing.