阿里的 Qwen3.7-Max 比我想象中差

qwen

阿里

差

21 replies • 2026-06-08 17:29:21 +08:00

1

Cheez

OP

PRO

2 days ago

说实话才一百多万而已，Qwen 就已经撑不住了。撑不住就算了，也不会自动压缩上下文。用 GLM 5.1 之后开始干活了，结果干到一半，Qoder 显示没额度了，也就是说一个月的额度，连一个最简单的 App （给定接口，进行显示统计信息）都没干完，就已经花光了。

2

qxmqh

2 days ago

Qoder 阿里系的都是洪水，疯狂消耗，不知道他们这些产品都是怎么搞的。

3

foufoufm

2 days ago

这段时间软文很多

4

coderfee

1 day ago via iPhone

kimi 也这样，一直 read 文件，狂耗额度。

5

ZX16815

1 day ago

有没有可能，这是你本地 agent 调度出问题了，或者 ui 出 bug 了😀

6

Cheez

OP

PRO

1 day ago via Android

1

@ZX16815 没听懂。Qoder 你用过吗？是阿里版本的 Cursor 。我登录并注册了 Qoder ，在里面输入我需要的，然后它的 Qwen 模型给我的是无限循环，换成 GLM 好了。这不就是它的锅吗？

7

lmmlwen

1 day ago

1

用不了 codex 和 claude ，用 cursor composer2.5 秒杀这些国产的玩意儿

8

MuyuQ

1 day ago

无限循环是 qwen 系列不得不品的一环。
上上个月，我用 3.6Plus ，一会儿的功夫给我写了几 K 行循环代码。

9

bowser1701

1 day ago

这个跟模型没有关系吧？就算有问题，也是推理服务的问题。

10

SilenceLL

1 day ago

我在 Qoder idea 插件里面用 qwen3.7 的模型，搞了一个小时没搞定的一个问题，用 Codex 两分多钟搞定。涉及输入输出 4K+行的 json 文件和一个 ERP 项目的前后端。最后逼急了他说是我改了数据导致两个接口返回不一致，不是代码问题，Codex 一下子就发现了前端渲染数据方式有问题。

11

cpalead

1 day ago

我在 trae 中用 deepseekv4pro 的时候也这样，好几次它问我重复的问题，或者重复做一件事

12

kennylam777

1 day ago

1

@bowser1701 通常都跟模型有關, 長 context 是一種能力, Qwen 的收費版才有 1m context support, 但在 1m 觸發 compact 前就死循環那是長 context 能力不足了。

雖然我在本地用 Qwen 3.6 27B/35B 都只限在 256k 甚至是 200k, 不太會死循環, 但如果把 Weight 或 KV 壓成 4bit/Q4 就更容易會出現類似錯誤。

雖然在 inference 時的確能調 repeat penalty 去減少重覆回應, 但我測過能力弱的模型, 要死循環時你如何調也救不回來。

13

jjx

1 day ago

国内的这几个用下来还是 deepseek 最靠谱

deepseek 需要快出自己的 agent code 工具

14

xiangqiankan

1 day ago

真实体验太差了，尤其是指令遵循是最差的，qwen 真的是跑分没输过，体验没赢过。阿里的东西和上次那个 happy-horse 一样说世界第一超越 seedance2.0 ，结果实测拉跨打脸

15

benfafa

1 day ago

我周末一个小时送的 pro 的点数全用完了，
收费也很离谱

16

Tarek911

1 day ago

200 块/月的 TokenPlan 额度，Qwen3.6 蹬了一周才蹬掉 20% ，换了 3.7Max 没到一周就清杯了，也就做了三五个小功能。
DeepSeek 充了 100 块，库库蹬，比 tmQwen3.6 还省钱，虽然输出规范差了点意思，但胜在偏移能用，智能水平跟 3.6 不相上下，但感觉不如 3.7

17

champaulmmc

1 day ago

1

这个是伪流式，一般是中转代理为了给不支持流式输出的模型嵌套的，就会出现一直疯狂打印某一个步骤，当然有的 agent 工具对模型适配不行也会这样

18

0xD800

1 day ago

我相信做过 agent 开发的用户都遇到过无线循环的问题，通常 agent 会设置循环限制，不会无限循环（烧钱），很明显是模型能力不足以及客户端 Agent 不够完善导致。

19

gloeaerris

1 day ago

@lmmlwen 确实，蒸馏的秒杀被蒸馏的。千问 code 确实是不行，跟 minimax 坐一桌，kimi 自己呆一桌或者跟 composer 坐一起，GLM 跟 DeepSeek 配合 claudecode 或者 codex 还算是可以，不过新版的 claudecode 针对 deepseek 负优化，用 codex+deepseek 或者 zed 编辑器+deepseek 效果好很多

20

jimrok

1 day ago

deepseek 应该已经到达了可用的阶段，而且他们现在资费非常便宜，这样就收集了足够多的数据，每次你用 deepseek 解决完一个问题，他们就会把整个过程变成下一代产品的训练的养料，然后这个飞轮就能启动起来。一旦他们在代码编写上越来越能懂用户的心思，后续完成项目的速度就越快。最终那几个上不了桌的就转去蒸馏 deepseek 。

21

yh7gdiaYW

1 day ago

@Cheez 上周也有 Qoder 里的帖子里说过这个了，Qoder 里你的模型是个阉割版，自家的 qwen 一样阉割，跟 api 里拿到的超过 dsv4pro 水平的 3.7max 不是一个东西