uprit

uprit

V2EX member #49924, joined on 2013-11-18 17:58:06 +08:00
Today's activity rank 11408
土区 iCloud 拼车,招 1 人。
拼车  •  uprit  •  Aug 17, 2025
土区 iCloud 拼车
iCloud  •  uprit  •  Sep 5, 2023  •  Lastly replied by xzheng
8
群晖刚刚出了个 C2
NAS  •  uprit  •  Aug 23, 2022  •  Lastly replied by serafin
10
win10 存储池的坑
问与答  •  uprit  •  Aug 2, 2022  •  Lastly replied by putaosi
17
关于早睡(不熬夜)大家有啥经验么?
问与答  •  uprit  •  Jun 24, 2022  •  Lastly replied by unregister
32
小米电视哪一款比较好?
小米  •  uprit  •  Sep 11, 2017  •  Lastly replied by Tee2mo
48
uprit's recent replies
泄露的渠道多了去了,京东淘宝甚至你家物业,都会卖你电话号码,信息还会被转卖好几道。陌生电话有啥好就纠结的。管它啥开头的,400 开头、9 开头的 5 位短号,不认识的一律当垃圾广告。
3 days ago
Replied to a topic by wcwcxiaobin 程序员 有没有比 whisper large v3 更准更强的
是挺神奇的,有时候 base 也比 large 准
正常啊,以前用手势比“打电话”,都是手比个“六”拇指放耳朵旁,小指放嘴巴旁。现在小孩子们用手势比“打电话”,都是手指并拢手掌直接贴耳朵上。
May 28
Replied to a topic by SteveRogers Local LLM 本地大模型最佳 Mac 配置选择
30B 左右的这个级别,本地只能干简单的活儿。比如翻译、写个 commit 文档什么的。
qwen3.6 27B 被传的那么邪乎,实际也就是比其他本地模型强一些。别抱太大期望。
俺试过用这个模型写代码,吭哧吭哧写两天,一大堆问题解决不了,换用线上 API ,结果俩小时搞定,架构还更简洁。
模型本身就接近 16GB 了,上下文本身就需要占用一部分显存的。-ngl 99 ,不能保证全部加载到 GPU 里,GPU 显存不够,自然会有些层数卸载到内存上。
你那个 devstral small2 24b q4_k_m ,肯定爆显存了,部分内容跑在内存里了,所以才这么慢。
一楼的方法可行。俺本地 Claude code ,接的就是自建的 newapi ,模型随便换。
你都用 claude code 了,不用本地模型先看下?别说 7w 了,一个请求十来万都正常。要不那么多人说他们每天用掉 1 亿以上 token 。1 亿 token ,要是在网页上问答,高强度用一个月都用不完。
1 楼已经说了。你那不是“偶然”发现的,那是人家精准触达了你。你想想你做的东西能触达几个人?
哪怕你先做出个小工具,能让 100 个人同时使用呢(注意,不是 100 用户)。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2750 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 05:32 · PVG 13:32 · LAX 22:32 · JFK 01:32
♥ Do have faith in what you're doing.