无尘阁日记

无尘阁日记

数字人、RPA、Agent、小龙虾——四个东西到底啥关系?
2026-03-20

最近跟朋友吃饭,一桌子人聊AI,五分钟之内蹦出来四个词:

"我们公司在做数字人。" "我们上了RPA。" "现在都在搞Agent了。" "你养龙虾了没?"

然后大家互相看了一眼,发现一个尴尬的事实——

每个人嘴里说的,好像都是"AI帮人干活",但这四个东西到底有什么区别、什么联系,没人能说清楚。

今天我把这四样东西拆干净。

看完这篇,下次饭局上你就是那个能一句话点醒全桌的人。

先记住一个比方,后面全靠它

把AI想象成一个"人"。

一个人要干活,需要四样东西:脸、嘴、脑子、手。

脸和嘴,负责跟外界沟通——你长什么样,你怎么说话,别人怎么跟你打交道。

脑子,负责想——理解需求、拆解任务、做判断、下决策。

手,负责干——点鼠标、敲键盘、发邮件、搬文件、填表格。

记住这四样东西。

数字人、RPA、Agent、小龙虾,本质上就是这四样东西的不同组合。

有的只有脸,没有手。 有的只有手,没有脑子。 有的有脑子有手,但没有脸。 有的全都有了。

下面一个一个说。

RPA——只有手,没有脑子

RPA是最早出现的,也是最好理解的。

全名叫"机器人流程自动化",但别被"机器人"这个词唬住了。它跟你想象中的机器人没有任何关系。

它就是一个按照固定步骤,帮你在电脑上重复操作的脚本。

你告诉它:第一步打开Excel,第二步复制A列的数据,第三步粘贴到SAP系统的某个框里,第四步点确认按钮。它就老老实实地执行,一秒一秒地点,一个一个地粘,二十四小时不休息。

说白了,RPA就是一双不知疲倦的手。

你怎么教它,它就怎么干。你没教的,它一步都不会多走。表格格式变了?完了,它就卡死了。弹出来一个新的对话框?它就不知道该点哪个按钮了。

它不会思考,不会判断,不会随机应变。它是一个严格按图纸施工的泥瓦匠——图纸上画了砌三层砖,哪怕房子已经歪了,它也照样砌。

但你别小看这双手。

在过去五六年里,RPA帮全世界的企业省掉了数以亿计的人工小时。那些每天重复八个小时的数据录入、报表搬运、系统对账的工作,RPA分分钟搞定。它不需要你懂编程,拖拖拽拽录个操作流程就能跑。

一句话总结:RPA是一双没有脑子的手,干得快、不出错、不要工资,但只会照本宣科。

数字人——有脸有嘴,但手脚不行

数字人你一定见过。

直播间里24小时不下播的"虚拟主播",银行大厅里那个对你微笑的"虚拟客服",短视频里用AI生成的"数字分身"——这些都是数字人。

数字人的核心卖点是什么?是"像个人"。

它有脸——可以做出表情,可以皱眉、微笑、眨眼。 它有嘴——可以说话,语调有起有伏,听着像真人。 它甚至有一定的脑子——你问它问题,它能理解意思,给你回答。

但它有一个致命的缺陷——它没有手。

数字人不能帮你打开电脑上的Excel。不能帮你发一封邮件。不能帮你把文件从A文件夹移到B文件夹。它干不了任何"动手"的事情。

它的全部能力,就是"站在那里跟你说话"。

打个比方:数字人就像一个商场门口的迎宾小姐。长得漂亮,笑得甜美,你问路她能告诉你几楼卖什么,但你让她帮你把东西搬到车上——不好意思,这不是她的活。

当然了,数字人的价值不在于"干活",而在于"交互"。它解决的是"人机沟通的最后一公里"——让AI看起来不那么冰冷,让用户觉得自己在跟一个"人"打交道而不是一台机器。

在直播带货、客户服务、品牌形象这些场景里,数字人有它不可替代的价值。但说到底,它是一张脸,不是一双手。

一句话总结:数字人是一张能说会道的脸,擅长沟通和展示,但它只能"说",不能"做"。

Agent——有脑子,也有手,但没有统一标准

Agent是这两年最火的概念。

翻译成中文叫"智能体",但这个翻译没翻出它的灵魂。

Agent的灵魂是什么?

自主性

你给它一个目标——"帮我调研一下最近三个月新能源行业的政策变化,整理成一份报告"——它不需要你一步一步教它怎么做。它自己会把这个大任务拆解成小步骤:先搜索相关新闻,再筛选权威信源,然后提取关键信息,最后整合成报告格式。

中间遇到问题了,它会自己判断、自己调整。搜不到?换个关键词。格式不对?自己修。信息矛盾?多查几个来源交叉验证。

这就是Agent和RPA最本质的区别。

RPA是你画好了路线图,它沿着走。路线变了,它就瘫了。

Agent是你给它一个目的地,它自己找路。路堵了,它会绕。路断了,它会停下来想想有没有别的办法。

RPA只有手。Agent既有脑子,也有手。

但Agent有一个问题:它是一个概念,不是一个产品。

就好比"汽车"是一个概念,但你真正开的是一辆具体的丰田或者宝马。Agent也一样——你得把它变成一个具体的东西,才能真正用起来。

谁来做这个具体的东西?

这就是OpenClaw的位置。

一句话总结:Agent是一个有脑子有手的打工人,你给目标,它自己想办法完成,遇到变化能随机应变。

OpenClaw(小龙虾)——Agent的"毕业设计"

很多人把OpenClaw和Agent搞混了。

它们不是同一个层级的东西。

Agent是一种能力模式——"能想、能做、能自主决策"。

OpenClaw是这种能力模式的一个具体实现方案——它告诉你:怎么把Agent的理念,变成一个你真正能用的产品。

如果Agent是"我需要一个能自主干活的打工人"这个需求,那OpenClaw就是其中一位面试通过的候选人。

但这位候选人有几个非常突出的特点,让它从一堆Agent框架里杀出来,成了GitHub史上最火的开源项目。

第一个特点:它住在你家里。

大多数AI助手(比如ChatGPT、豆包)都跑在云端,你的数据上传到别人的服务器上。OpenClaw不一样,它装在你自己的电脑上,操控你本地的文件和应用,数据不出门。

第二个特点:它用你的聊天工具沟通。

你不需要打开一个新的App,在飞书、QQ、钉钉、企业微信里直接跟它说话就行。就像@一个同事。

第三个特点:它有心跳。

这是最让人觉得"活"的一个设计。它不是你说话它才响应——它有自己的"生物钟",会定时自己醒来,检查有没有该做的事、该提醒你的事。

第四个特点:它有记忆,还能自我进化。

你教过它的东西,它记得住。你纠正过的错误,它下次不会再犯。它甚至能把工作中学到的经验自动保存为新的技能,下次遇到类似问题直接调用。

如果说Agent是"打工人"这个物种,那OpenClaw就是这个物种里比较出色的一位——不但能干活,还能自己总结经验教训,越干越聪明,而且住在你家、随叫随到、还不用你提供工位。

一句话总结:OpenClaw是Agent概念的一个王炸级实现——装在你本地、接入你聊天工具、有心跳有记忆、能自我进化。

四个东西,一张图说清楚

现在你脑子里应该有一张清晰的图了:

RPA——一双不用休息的手。你教它怎么做,它就怎么做。不会想,不会变。适合大批量、高重复、规则固定的操作。关键词:执行。

数字人——一张能说会道的脸。跟你聊天、回答问题、展示形象。不能动手干活。适合客服、直播、品牌展示。关键词:沟通。

Agent——一个有脑子有手的打工人。你给目标,它自己规划、自己执行、自己调整。但它是一个概念,不是一个具体产品。关键词:自主。

OpenClaw——Agent的一个具体实现,而且是目前最火的那个。本地部署、聊天工具交互、有心跳、有记忆、能进化。关键词:落地。

它们之间是什么关系?

不是替代关系,是进化关系,也是组合关系。

进化关系:一条从"手"到"全身"的路。

RPA先出来,解决了"手"的问题——让机器帮你点鼠标。

数字人出来,解决了"脸"的问题——让机器看起来像个人。

Agent出来,解决了"脑子"的问题——让机器能自己想、自己做决策。

OpenClaw把脑子和手接在一起,还给了它一个家(本地电脑)和一个沟通方式(聊天工具)——让机器真正变成了一个"完整的数字员工"。

这条线的方向很清楚:从局部到整体,从被动到主动,从工具到伙伴。

组合关系:它们不是敌人,是同事。

在一个企业里,这四样东西完全可以同时存在、各干各的。

数字人在前台接待客户、回答问题——这是它的强项。

客户的需求被理解之后,Agent在后台接手,规划怎么完成这个任务。

Agent规划好了,调用RPA去执行那些标准化的操作——填系统、搬数据、发通知。

而OpenClaw作为一种Agent的具体实现,可以是你个人的数字助理,在你自己的电脑上帮你处理日常事务。

它们不是"谁替代谁"的关系,而是"谁在哪个环节发挥最大价值"的关系。

脸归脸,手归手,脑子归脑子。

最终极的形态,是把它们全部打通——一个有脸能沟通、有脑子能思考、有手能干活、有记忆能进化的"完整数字人"。

那个东西,目前还不存在。

但所有人都在往那个方向走。

对你来说,意味着什么?

如果你是企业老板,别再问"我该上RPA还是上Agent"了。这就像问"我该给员工配双手还是配脑子"一样。答案是:看你的业务场景。重复操作多就先上RPA,需要智能决策就上Agent,需要客户界面就上数字人。最终,它们会长在一起。

如果你是打工人,别把这四个东西当威胁。把它们当工具。RPA帮你干你最讨厌的重复活,Agent帮你做规划和决策辅助,数字人帮你分担沟通压力。你腾出来的时间和精力,去干只有人能干的事——创造、判断、建立关系。

如果你什么都不是,就是一个普通人——

至少记住今天这张图:手、脸、脑子、全身。

下次别人再聊这些概念的时候,你心里有数就够了。

有数的人,不会被忽悠。

合十。如夜话,至此。