对于现在的 Agent 来讲,理解 API 天然的就比理解 UI 更方便,更省 Tokens ,那么是不是以后 API 会变成一等公民,软件的设计应该是 API-First ,UI 反而是次要的。
如果以这个思路出发,超媒体驱动的 RESTful API 有没有机会再次登上历史舞台呢?一几年我在学习 REST 的时候就觉得超媒体这个设计不适合那个时代,那么现在是否时机到来了?
1
WithoutSugarMiao 23 小时 33 分钟前
不知道诶,上周公司内部头脑风暴,有个运营小姐姐突然发现,我们的 openclaw ,好像可以直接使用 API ,然后他们把现有的 swagger 文档的主要 API 都添加了额外描述给 openclaw 用。然后现在正在进行专门给 openclaw 用的 API 的开发。
|
2
FinnBai OP @WithoutSugarMiao #1 现在的模式里,agent 对软件的使用最好的办法就是对软件的 api 进行 skill 化,通过一个描述完整的 api 去理解软件会比通过 ui 方便的多。这方面有类似 openapi-to-skills 这种项目
|
3
YanSeven 23 小时 18 分钟前
API 和 UI 都是一等公民。
只要人和时间的接口仍然是眼耳鼻舌身意,而不是直接接入插头电信号。那么和用户直接打交道的 UI 永远都是重要的。 后台的任务那肯定是 API ,MCP 啥啥啥的。 |
5
WithoutSugarMiao 23 小时 13 分钟前
@baiyi 我太理解你说的啥意思,但是通过你发这个项目里的示例有点明白了。貌似和我同事在做的事情差不多吧。
|
6
FinnBai OP @YanSeven #3 如果是再科幻一点,Agent 能做到的更多一些,是否会有一个助手类的 Agent 会成为人与互联网交互的仅有的几个入口,甚至是唯一入口。那么此时,UI 的定义权就不在软件厂商手里,而是在这个 Agent 手里了。
举个点外卖的例子,现在点外卖需要使用各个外卖软件的 UI ,如果可以通过“助手”点外卖,会让“助手”猜测以及结合需求帮助推荐想吃的菜单,那么这个“助手”应该要提供的是这个用户更习惯的 UI ,甚至如果用户喜欢,提供一个转盘类的 UI ,让用户抽菜单。 如果是这样,软件厂商真的是需要提供 API 了。 |
7
cairnechen 22 小时 40 分钟前
@YanSeven UI 是产品经理和设计师用来表达用户意图的工具,以后各个 agent 可以直接理解用户口述内容,用户只需要表达,agent 识别意图并规划任务执行,UI 的作用可能就变成提供输入便利增加确定性以及缓解用户黑盒焦虑了(实际上现在已经在这么干了)
|
8
FinnBai OP 关于超媒体驱动的 API ,我再多阐述一下我自己的理解:
超媒体驱动的 API 来源于我对 REST 的理解,REST 架构准则是用于指导创建现代 Web 架构的基石,超媒体在其中发挥了重要的作用。 当我们点开一个网站时,能够从主页上的各种超媒体链接进入到另一个网页,从而完整的理解整个系统或者说整个网站。换到 API 上,把我们换成 Agent ,Agent 也应该可以从一个 API 提供出来的超媒体链接出发,完成的理解整个系统。 过去这种 API 是没有什么太大意义的,因为读取 API 的机器或系统不够智能,不能理解超链接没有自主性能够通过超链接理解整个系统。但现在 Agent 具备了这种可能性。 也许 REST API 会是后 Skill 时代的产品,不再需要通过创建一个 Skill 来指导 Agent 去使用一个暴露了 API 的软件系统,Agent 可以通过这个暴露的 API 去自行理解系统。 |
9
YanSeven 22 小时 26 分钟前
@cairnechen 除了提前预设和规范化表达用户的意图,UI 还负担呈现结果的任务啊。Agent 智能体通过接入语音和文字就能完全理解用户的意图之后,那么剩余的 UI 的核心任务应该就是呈现结果,可视化结果,以及补充语音和文字之外的交互能力。
|
10
cairnechen 22 小时 13 分钟前
@YanSeven 这个我不太确定诶,现在类似 ChatGPT 、Claude 、Gemini 会话中呈现出的一些结果形态(表格、卡片、链接等等),是被 UI 设计师设计好的吗,还是 LLM 自行决定的(或者工程师有限的提示词干预?)
|
11
iorilu 22 小时 13 分钟前
api 当然好
问题是公司不开放阿 最简单得, api 发微信, 你看微信干不干 当然了, 有一个可能, 就是付费开 api, 比如用啥龙虾等等, 想自动化操作什么东西, 就得用 api, 比如自动收发微信, 给钱就行 |
12
FinnBai OP @iorilu #11 是的,这才是核心问题,跟原来反爬一样,都是保护自家公司利益,不会轻易开放的。而且我估计微信也不会轻易放弃自己作为“入口”的可行性。
|
13
AoEiuV020JP 21 小时 56 分钟前 我看好, 重点是网站/服务商提供的服务会越来越方便 AI 使用,
我听说甚至已经在尝试让 http 支持 AI 付费访问了, |
14
FinnBai OP @AoEiuV020JP #13 这发展的也太快了,我去找找案例
|
15
iorilu 21 小时 23 分钟前
@AoEiuV020JP 应该得, 只要付钱得, 厂商应该会跟进
而且确实自动化是趋势了 像微信一直严防死守不想让大家自动化控制, 后面估计也会放开, 很可能微信会出一个 vip 会员 买了后就能用 api 控制, 话说回来, 这样腾讯就发了阿, 就算 5%开通, 那也是天文数字 |
16
uds9u32br 21 小时 21 分钟前
感觉是 AGENT 和现实世界交互的能力。
|
17
Valid 21 小时 14 分钟前
只要接口就好了,鉴权和风控都会朝着 ai 这块去发展
|
18
luemail2023 20 小时 47 分钟前
其实也可以是 CLI ,Obsidian 已经在做了
|
19
Samwulol 17 小时 40 分钟前 via Android
看你业务赚谁的钱,赚人的钱就是 ui first ,赚公司的钱就是 api first
|
20
heyzng 17 小时 38 分钟前
@luemail2023 CLI+1
|
21
sampeng 15 小时 37 分钟前 via iPhone
还第一等公民…你要知道 cf 这类 cdn 的防 ai 卖多贵你就晓得了。每天成千上万的爬虫。我实在忍不住给字节发了个邮件求他你要爬我可以,但你能不能每天几百万的爬啊
|
22
mizuhashi 15 小时 35 分钟前
@FinnBai 我認為 hypermedia 是適合 agent 的,因為 hypermedia 的一個要求是,返回的 html 就包含了交互所需的所有信息,不像 api 那樣需要 schema 的知識。另外瀏覽器最初就叫 user-agent
|
23
docx 15 小时 26 分钟前 via iPhone
从 Claw 让互联网厂商愿意开放 API 这一点来说,算是一大功劳
|
24
kkwa56188 14 小时 36 分钟前
API 为什么要跟 UI 较劲, 都不是同一个东西. 是不是在公司里职位争宠?
|
25
zerovoid 14 小时 18 分钟前
豆包手机通过 UI 操作 APP ,都被各路封杀了,你认为人家 APP 网站会开放 API 给你调用吗,
解析自己微信本地聊天记录的工具,都直接被腾讯给律师函了, 当然,大势所趋,人类通过 UI 操作的时代终将结束, 哪怕你不让我用 AI 操作,以后我直接叫机器人帮我手动操作总行吧, 那看来机器人才是未来的世界的入口啊。 |
27
sentinelK 5 小时 26 分钟前
UI 和 API 并不是同一个层级。
UI 的信息呈现也是通过 API 完成的。 UI 是给人交互的,API 是给机器交互的(这个“机器”可以是客户端,网页,第三方服务器,当然也可以是大模型) 所以没理解楼主想表达什么。 btw:豆包操作 UI 不就是 API 不开放么?所以聊 API 更重要是什么意思? |
28
FinnBai OP @sentinelK #27 是出于对一个软件系统的设计来讲的,过去实现一个软件系统,绝大多数都是直接面向人使用的,所以 UI 的设计是最重要的,但是以后可能面向的不再是人类了,而是 Agent 的,那么这个时候,对于软件开发者来讲,一个能更好被 Agent 理解的 API 是不是就更重要的,UI 会逐渐减少甚至消失。
|
29
sentinelK 5 小时 16 分钟前
|