• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Cheez
V2EX  ›  程序员

阿里的 Qwen3.7-Max 比我想象中差

  •  
  •   Cheez ·
    PRO
    · 2 days ago · 3626 views
    21 replies    2026-06-08 17:29:21 +08:00
    Cheez
        1
    Cheez  
    OP
    PRO
       2 days ago
    说实话才一百多万而已,Qwen 就已经撑不住了。撑不住就算了,也不会自动压缩上下文。用 GLM 5.1 之后开始干活了,结果干到一半,Qoder 显示没额度了,也就是说一个月的额度,连一个最简单的 App (给定接口,进行显示统计信息)都没干完,就已经花光了。
    qxmqh
        2
    qxmqh  
       2 days ago
    Qoder 阿里系的 都是洪水,疯狂消耗,不知道他们这些产品 都是怎么搞的。
    foufoufm
        3
    foufoufm  
       2 days ago
    这段时间软文很多
    coderfee
        4
    coderfee  
       1 day ago via iPhone
    kimi 也这样,一直 read 文件,狂耗额度。
    ZX16815
        5
    ZX16815  
       1 day ago
    有没有可能,这是你本地 agent 调度出问题了,或者 ui 出 bug 了😀
    Cheez
        6
    Cheez  
    OP
    PRO
       1 day ago via Android   ❤️ 1
    @ZX16815 没听懂。Qoder 你用过吗?是阿里版本的 Cursor 。我登录并注册了 Qoder ,在里面输入我需要的,然后它的 Qwen 模型给我的是无限循环,换成 GLM 好了。这不就是它的锅吗?
    lmmlwen
        7
    lmmlwen  
       1 day ago   ❤️ 1
    用不了 codex 和 claude ,用 cursor composer2.5 秒杀这些国产的玩意儿
    MuyuQ
        8
    MuyuQ  
       1 day ago
    无限循环是 qwen 系列不得不品的一环。
    上上个月,我用 3.6Plus ,一会儿的功夫给我写了几 K 行循环代码。
    bowser1701
        9
    bowser1701  
       1 day ago
    这个跟模型没有关系吧?就算有问题,也是推理服务的问题。
    SilenceLL
        10
    SilenceLL  
       1 day ago
    我在 Qoder idea 插件里面用 qwen3.7 的模型,搞了一个小时没搞定的一个问题,用 Codex 两分多钟搞定。涉及输入输出 4K+行的 json 文件和一个 ERP 项目的前后端。最后逼急了他说是我改了数据导致两个接口返回不一致,不是代码问题,Codex 一下子就发现了前端渲染数据方式有问题。
    cpalead
        11
    cpalead  
       1 day ago
    我在 trae 中用 deepseekv4pro 的时候也这样,好几次它问我重复的问题,或者重复做一件事
    kennylam777
        12
    kennylam777  
       1 day ago   ❤️ 1
    @bowser1701 通常都跟模型有關, 長 context 是一種能力, Qwen 的收費版才有 1m context support, 但在 1m 觸發 compact 前就死循環那是長 context 能力不足了。

    雖然我在本地用 Qwen 3.6 27B/35B 都只限在 256k 甚至是 200k, 不太會死循環, 但如果把 Weight 或 KV 壓成 4bit/Q4 就更容易會出現類似錯誤。

    雖然在 inference 時的確能調 repeat penalty 去減少重覆回應, 但我測過能力弱的模型, 要死循環時你如何調也救不回來。
    jjx
        13
    jjx  
       1 day ago
    国内的这几个用下来还是 deepseek 最靠谱

    deepseek 需要快出自己的 agent code 工具
    xiangqiankan
        14
    xiangqiankan  
       1 day ago
    真实体验太差了,尤其是指令遵循是最差的,qwen 真的是跑分没输过,体验没赢过。阿里的东西和上次那个 happy-horse 一样说世界第一超越 seedance2.0 ,结果实测拉跨打脸
    benfafa
        15
    benfafa  
       1 day ago
    我周末一个小时送的 pro 的点数全用完了,
    收费也很离谱
    Tarek911
        16
    Tarek911  
       1 day ago
    200 块/月的 TokenPlan 额度,Qwen3.6 蹬了一周才蹬掉 20% ,换了 3.7Max 没到一周就清杯了,也就做了三五个小功能。
    DeepSeek 充了 100 块,库库蹬,比 tmQwen3.6 还省钱,虽然输出规范差了点意思,但胜在偏移能用,智能水平跟 3.6 不相上下,但感觉不如 3.7
    champaulmmc
        17
    champaulmmc  
       1 day ago   ❤️ 1
    这个是伪流式,一般是中转代理为了给不支持流式输出的模型嵌套的,就会出现一直疯狂打印某一个步骤,当然有的 agent 工具对模型适配不行也会这样
    0xD800
        18
    0xD800  
       1 day ago
    我相信做过 agent 开发的用户都遇到过无线循环的问题,通常 agent 会设置循环限制,不会无限循环(烧钱),很明显是模型能力不足以及客户端 Agent 不够完善导致。
    gloeaerris
        19
    gloeaerris  
       1 day ago
    @lmmlwen 确实,蒸馏的秒杀被蒸馏的。千问 code 确实是不行,跟 minimax 坐一桌,kimi 自己呆一桌或者跟 composer 坐一起,GLM 跟 DeepSeek 配合 claudecode 或者 codex 还算是可以,不过新版的 claudecode 针对 deepseek 负优化,用 codex+deepseek 或者 zed 编辑器+deepseek 效果好很多
    jimrok
        20
    jimrok  
       1 day ago
    deepseek 应该已经到达了可用的阶段,而且他们现在资费非常便宜,这样就收集了足够多的数据,每次你用 deepseek 解决完一个问题,他们就会把整个过程变成下一代产品的训练的养料,然后这个飞轮就能启动起来。一旦他们在代码编写上越来越能懂用户的心思,后续完成项目的速度就越快。最终那几个上不了桌的就转去蒸馏 deepseek 。
    yh7gdiaYW
        21
    yh7gdiaYW  
       1 day ago
    @Cheez 上周也有 Qoder 里的帖子里说过这个了,Qoder 里你的模型是个阉割版,自家的 qwen 一样阉割,跟 api 里拿到的超过 dsv4pro 水平的 3.7max 不是一个东西
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3884 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 67ms · UTC 10:24 · PVG 18:24 · LAX 03:24 · JFK 06:24
    ♥ Do have faith in what you're doing.