mingtdlb
V2EX  ›  Local LLM

现在大模型主流都用哪些 nVidia GPU?

  •  
  •   mingtdlb · 6 days ago · 3263 views

    不限于参数大小

    30 replies    2026-06-15 11:21:04 +08:00
    zzutmebwd
        1
    zzutmebwd  
       6 days ago   ❤️ 1
    没有 nvlink 的最强是 pro6000 ,下面是 5090/4090 48g/4090/4080 32g 。有 nvlink 的不了解。
    zzutmebwd
        2
    zzutmebwd  
       6 days ago
    你如果说千亿参数在线 api 的话,h100 h200 b200 等的群集。
    clemente
        3
    clemente  
       6 days ago
    b200
    zzutmebwd
        4
    zzutmebwd  
       6 days ago
    @zzutmebwd 对了,有个 pro6000d 84g ,合规阉割版,算力是不如 5090 的,但差不太多,如果四万多点能买到的话还是不错的,大显存省事儿很多。
    robyn87leonard
        5
    robyn87leonard  
       6 days ago
    l20
    raycool
        6
    raycool  
       6 days ago
    H200 B200 这些吧。
    不过我还在用 4090
    v2exgo
        7
    v2exgo  
       6 days ago
    b300
    mingtdlb
        8
    mingtdlb  
    OP
       6 days ago
    @zzutmebwd #4 4090 48g/4080 32g 都是魔改版?我看官方没有这个版本
    JmHappy
        9
    JmHappy  
       6 days ago
    B300 集群,有 FP4 模块的都行
    zzutmebwd
        10
    zzutmebwd  
       6 days ago via Android
    @mingtdlb 是的 消费级+大显存基本都是魔改的,所以还是建议 pro6000d
    oldAndy
        11
    oldAndy  
       6 days ago
    H100 H200 B200
    xiaomushen
        12
    xiaomushen  
       6 days ago
    pro6000 真的爽,本地做一些 bert 训练完全够用
    zzutmebwd
        13
    zzutmebwd  
       6 days ago
    @xiaomushen 10 万了哥,现在买不划算了
    xiaomushen
        14
    xiaomushen  
       6 days ago
    @zzutmebwd 我 7 万多买的
    zzutmebwd
        15
    zzutmebwd  
       6 days ago
    8000 刀才是合理价,我 6 万买的都嫌贵。
    @xiaomushen
    liuxyon
        16
    liuxyon  
       6 days ago
    哪里有合理价格卖
    coefu
        17
    coefu  
       6 days ago
    要是能买到,amd 的 mi 系列,可能会更好点。
    xiaomushen
        18
    xiaomushen  
       6 days ago
    @zzutmebwd 没办法呀,国内对公,只能吃这个价。现在都快 10 万了
    nrtEBH
        19
    nrtEBH  
       6 days ago
    最强当然是 GB200 GB300 组的大集群
    从行业内看各种尺寸的都有 还包括魔改显存的 4090 5090
    lifechan
        20
    lifechan  
       4 days ago via Android
    @zzutmebwd 國外能買了帶回來嗎
    mingtdlb
        21
    mingtdlb  
    OP
       11h 36m ago
    @zzutmebwd #4 pro6000d 84g 算力比 5090 强吧
    zzutmebwd
        22
    zzutmebwd  
       11h 14m ago
    @mingtdlb 又一个被骗的,这个卡就搜不到真实资料,我是差点买了,后面看了厂家图册直接退了(当时 pro6000d 4 万多点 pro6000 才 6w 我就直接买 pro6000 了),图册直接拿来和 L20 比,颇有拳打南山敬老院的意思,算力削的不像样子,fp16 只有 pro 6000 的 60%,fp4 只有 30%(应该是软件限制),带宽削的不多、显存又大,所以跑 llm 问题不大。比 5090 肯定比不了,5090 实际只比 pro6000 低 10%算力。
    但是以现在 5w 出头的价格,pro6000d 性价比就很高了。
    zzutmebwd
        23
    zzutmebwd  
       11h 14m ago
    @lifechan 和封禁没关系,国外也 1w 刀以上了,都贵。
    mingtdlb
        24
    mingtdlb  
    OP
       10h 59m ago
    @zzutmebwd #22 厂家图册能发一下不
    zzutmebwd
        25
    zzutmebwd  
       10h 57m ago
    d2VjaGF0OiBobnN5d2Q= base64 联系
    zzutmebwd
        27
    zzutmebwd  
       10h 37m ago
    您看一下:
    精度 RTX 5090 Pro 6000 D(特供) Pro 6000 Blackwell
    FP32 104.8 TFLOPS 74 TFLOPS 126 TFLOPS
    FP16 ~209.5 TFLOPS 148 TFLOPS ~252 TFLOPS
    FP4 ~1676 TFLOPS 593 TFLOPS ~2015 TFLOPS
    pro6000d 的算力值是从图册里抄的,目测是软件限制,全网都搜不到。
    zzutmebwd
        28
    zzutmebwd  
       10h 32m ago
    相比 pro6000d:
    fp32/16:5090 83% pro6000d 59%
    fp4: 5090 83% pro6000d 29%
    mingtdlb
        29
    mingtdlb  
    OP
       9h 40m ago
    @zzutmebwd #27 这个数据怎么整体偏低呀,RTX5090 FP16 不应该是 400 多 TFLOPS 么,rtx pro 6000 server FP16 500
    ![image.png]( https://wp-cdn.4ce.cn/v2/Av2TkaI.png)
    ![image.png]( https://wp-cdn.4ce.cn/v2/oUWf3Wq.png)
    zzutmebwd
        30
    zzutmebwd  
       9h 29m ago
    @mingtdlb 口径问题,你看的值除以 2 即可,现在 nv 的宣传话术眼花缭乱的,你看比值即可。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3197 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 57ms · UTC 12:50 · PVG 20:50 · LAX 05:50 · JFK 08:50
    ♥ Do have faith in what you're doing.