我司以前是在用 NLP 的文本分类能力, 给用户内容打标签, 然后根据标签给用户做个性化推荐, 最近准备切到大模型上, 但微调效果不尽人意, 请懂的朋友给指点下.
通过 chatgpt 获取 5k 条数据
给 chatgpt 的 prompt
你是数据分析师, 帮我从标签集中选择一个最适合文字内容的标签
文字内容: 1234
标签集: A, B, C
整理成微调所需数据, 开始微调
使用的chatglm-6b, 把给 gpt 的 prompt 和输出结果给他
{
"instruction": "你是数据分析师, 帮我从标签集中选择一个最适合文字内容的标签, 文字内容: 1234, 标签集: A, B, C",
"input": "",
"output": "购物"
}
把微调后的模型运行起来, 进行 api 访问
即把原来调 gpt 的接口改成微调后模型的, 同样的 prompt 调用
但发现回答的狗屁不是
请问哪里做的不对?
- 目前想到的是 xx-6b 能力太差, 和 gpt 千亿级的参数不可同日而语, 但我们也不要那么强的能力, 只需要根据文本内容进行分类即可
- qwen 也开源了 14b 的模型, 但我司的成本也就控制到了 4090 上, 所以加钱这个方案就继续用 NLP 就好了