省流版:
我是去年的今天,也就是 2024 年 12 月 31 号,从上家公司离职。我的上家公司是传统服装行业的外企,我在基础架构部门,工作不算多,且相对自由,23 年年末 AI 开始在 cn 大范围兴起,我本身的主力语言是 python ,天生契合 AI ,我开始在探索能不能在公司做一些 AI 项目,一年的时间我大概做了两个项目。
一个是通过 LLM 能力拦截垃圾邮件,没在传统公司工作过的人可能不知道,传统公司的员工平均素质,那家公司巅峰期有 6w 员工(算上编外,比如销售、工厂等),几乎每天都要收到很多垃圾邮件,每星期都能听到有员工被骗钱。他们当时的方案是遇到垃圾邮件,安全部门及时发信息预警,但是人力终究有限,所以我觉得可以用 LLM 能力帮他们做一个拦截工具。当时 qwen 系列,还没有大范围使用,效果比较好的开源还是 meta 的 llama 系列。我要了大概三千封邮件,通过 LoRA 微调了一个用来识别邮件的模型。结果是有效果,但是识别错误,偶有发生,现在想来,可能是训练数据太少了,模型本身的能力也不太行。
另一个项目是 RAG ,印象中是因为 RAG 非常火,大家都在炒这个概念,而传统公司的文档建设远不如互联网公司,所以我觉得 RAG 会比互联网公司更加的契合我的前公司,事实也是如此,这个项目效果非常好,远超上一个邮件识别。通过部门经理帮我推荐给了公司大 BOSS--一个老外,然后推广到了全公司。我离职的时候公司 2w+的员工或多或少都有不同程度的使用。
时间划到今年,我离职之后,爽玩半年之后,今年的六月份开始带着我的这两个 AI 项目找工作,我投的简历大部分都是 AI 应用开发相关的,也有部分是我觉得比较好的传统开发岗位。结果就是收到了好几个开发岗位的 offer ,而 AI 应用的 offer ,则是一个没有,前十个相关的面试没有通过的。一直到十个面试以后,才陆续接到了两个 AI 应用相关的 offer ,不过都是外包。我选了其中的一个薪资比较高的,然后甲方比较出名的外包,入职了,开始正式转到 agent 开发,这个比较新颖的行业。然后在今年的最后一天,我打算离开这家公司了。最大的原因是不喜欢外包,做外包,做的越久亏的越多,想攒的实战项目经验也积攒到了,所以趁年底了赶紧溜之大吉。
说一下大家可能比较关心的问题,agent 开发工作中都做什么 和 传统开发有啥区别吗?
从正式工作来看,区别非常大,agent 开发的主要工作分为两部分:微调模型+处理输出。微调模型这块,基本是以 PEFT 为主( 90%都是这个),主要技术 LoRA ,多 LoRA 。处理响应包括上下文、提示词、工具调用等等,详细了解可以参考我放在后面的那篇论文。传统开发我就不多说了,可能大家比我水平高。
从面试上来看,虽然说 agent 开发偏工程,但是面试官的问题,他不偏工程。基本所有的面试官都是更注重项目,他们会问你在项目里用了什么新技术?为什么用?有没有更好的做法?性能如何? badcase 如何处理的?面试官的问题五花八门,我没办法一一的描述完整。但是基本很少会涉及到八股的内容。
这里放一些我觉得比较实用的免费资料。
还有很多收藏是 有趣的、有用的论文,但是都是可看可不看的,就不一一列举了,有人感兴趣 wo 再发。
最后是我的开源项目,可以直接在这个裸露 IP 看 demo 。 http://101.43.255.23/
这个项目也是一个论文理解类的项目,主要功能是对话,基于强化学习思路的推理理解,相比于普通 RAG ,可以回答很复杂的问题。还附加了对照翻译等功能。也是今年年中找工作的时候做的,我给他改善了一下 UI ,如果有跟我一样需要通过论文学习的需求,可以直接在本地部署一下,部署也非常简单,支持 docker 一键启动。最后,请大家帮我点个 star !!! 这个很重要。

1
WithoutSugarMiao OP 别光收藏哇,没有回复,没热度吧。
|
2
JustToGo 1 月 4 日
agent 开发要求高吗?我现在是前端,想往这方面转
|
3
WithoutSugarMiao OP @JustToGo 没办法形容高不高,主要看面试官。agent 开发不太看前端还是后端,一般来说是需要前后端都做的。真想转的话,你可以看看我上面列的那些资料 会很有用,尤其是那四个链接。
|
4
leochenL 1 月 23 日
有没有比较基础一点的,目前水平是只会用,如果要开发一个 agent ,零基础有哪些教程可以看看啊,大佬
|
5
WithoutSugarMiao OP @leochenL 大佬不敢当,在文章里有个项目你可以看看,是阿里云出品的课程,讲的虽然比较浅,但是内容很全,还提供了测试用的机器。入门的话,非常推荐。
https://github.com/AlibabaCloudDocs/aliyun_acp_learning |
6
Zonecde 2 天前
好好好,大佬厉害,也是做 ai 应用的,本人略菜,我想问下应用 demo 都能做,就是落地上总是会考虑并发,sso ,安全,审计,权限控制这些,公司老是想做个独立应用,然后嵌入到企微或者 oa ,之前也没做过系统级的难受,很菜勿喷
|
7
WithoutSugarMiao OP @Zonecde 我也只能算小入门的阶段。项目实际落地中,审计、sso 、权限控制 包括包公 OA 的接入,这些都和传统项目没有太大区别。
在安全方面,因为 agent 会使用工具,所以比传统项目风险更高。可以在 agent 执行中间加入判断层,比如接下来的步骤是删除文件,属于高危操作就给用户确认后再执行,或者 agent 自主判断不执行,通过其他方式完成任务。 至于合规性安全方面,如果要求高可以硬编码,在最终输出的时候加入违规词过滤。或者在模型方面进行安全性微调。 并发方面,我一直是用的 python 做的,首先全异步是比较基础的,如果用 AI 写,那提示词中要有体现。然后是工程结构中的优化,给你几个我做过的方案: 1. 多模型并用,请求分层。比如 轻量级模型,做专门的意图识别,快速分析问题类型,是否需要 agent 深入处理。一般业务中,大部分问题其实都比较简单,是可以简单处理的,把大模型留给最复杂的那个 sub—agent 。 2. 缓存决策信息。可以节省非常多的 token ,比如我在上个工作做一个化工行业的销售项目的时候,会提前缓存 AI 总结的客户画像,以天为单位的产品信息等。再比如阿里的那个免费奶茶,你会发现他虽然中间很多步,但是那个功能尤其的快。 3. 工具并发,当需要调用多工具的时候,也要支持并发。因为工具调用是 agent 最重要的一步,也是和普通提示词工程的区别。 4. 增加兜底机制,允许超时等场景,agent 回复默认信息。 5. 如果还不行,那就加机器好了。 而且其实公司再 oa 上用的独立应用,并发理应不会很高。 |