作者:贾乐乐,编辑:赵元
大模型(LLM)发展起来之后,生成式AI开始井喷,有聊天对话、文生图,还有扩图等多种形态。
对于技术的进步,大众都喜闻乐见,但渐渐地另一种声音出现了:我们希望AI替我们工作,替我们打扫卫生,我们去风花雪月,可现在方向好
路要一步一步走,饭要一口一口吃,直接出现科幻小说、电影中“和人类无异,且供人类驱使”的机器人,显然不现实,但让AI从陪聊、废话大师到有用的工具,落地的途径已经不像之前那么模糊。
一个共识是,AI Agent是AI应用落地的关键推手,甚至是终极形态。
基于LLM的AI Agent是具有独立思考和行动能力的智能体,AI Agent=LLM+感知+规划+记忆+工具使用。
今年,红杉资本对2024年AI的发展趋势做出预测:Copilot将逐渐向Agent转变,Copilot是AI辅助人工作,Agent更像一个真正的同事,可以分担工作。未来,Agent还会走向具身智能,向实体形态的智能机器人形态发展。
确定性的趋势之下,很多平台和企业都在布局Agent,典型如OpenAI上线了GPT store,国内的钉钉近期上线了AI Agent store,智谱AI、昆仑万维也分别推出了各自的Agent平台。
OpenAI的GPT store已经于今年1月份上线,属于Agent的初级阶段,上线后的这三个月,GPT store差评满天飞。
作为本轮通用型人工智能技术“领头羊”,OpenAI具有风向标意义,GPT store的遇冷也让人不得不重新考虑这几个问题:GPT store 不行是不是代表Agent不行? AI通过Agent形态落地,路径应该是什么样的?更实际的落地场景有哪些? 和钉钉这样的平台应该扮演什么样的角色? 承担什么任务?
一、AI落地,To B 还是To C?
GPT store的推出,意味着人人都能构建Agent的时代拉开了序幕,也被认为是AI 的APP store时刻。
因为宫斗等事件,GPT store延迟上线两个月,在这两个月用户创建了超过300万个ChatGPT自定义版本。
300万是什么概念,我国国内市场上的APP数量,包括安卓和苹果商店也就260多万。
但GPT store上线不久,就出现了热门GPTs被抄袭、僵尸号泛滥、刷单、假官方、软色情等多重罪。最受欢迎的当属AI女友,尽管OpenAI已经明确,不允许GPT专注于培养浪漫伴侣关系。
GPT store里的产品同质化、低劣化,于是开发者纷纷抱怨,如OpenAI审核不力,用户少、商业模式完全跑不通,对GPT store失去了信心。
To C的GPT产品备受争议,有的To C的企业创始人团队也转向To B。
Inflection是一家AI独角兽,也是融资额仅次于OpenAI的初创公司,有着自己的类ChatGPT产品——Pi,主打的是陪伴,To C属性明显。
有消息称,Inflection的核心层被微软挖墙脚,负责组建名为“Microsoft AI”的新团队,整合微软的消费者AI工作以及Copilot、Bing和Edge等产品。
这不好说是To B还是To C,但相较于谈天说地、吟诗作对,微软和AI相关的产品显然更工具化、更以提升效率为目的。
据华尔街见闻的报道,Inflection也正在调整业务重心,转向为其他企业提供API服务,也就是To B化,因为即使Pi的每日用户数量已达到100万,它也还没有找到有效的商业模式,更别提GPT store里的那些GPT了。
To C的Agent在当前遇到了较大的阻力,To B可能才是更有希望的“生路”。
To C产品的主要逻辑是创造增量需求,创造的方向是让用户感受到有趣,而有趣是一个模糊的概念,短视频、AI生成照片、拍摄表情包、游戏里设定AI NPC、编笑话等等都可以是有趣的。
需求分散、使用频率低下,这是To C产品需要突破的关键点。
To B产品的逻辑是解决问题,尽管也有不同行业不同的场景,但每个应用场景都有清晰的、具体的需求。不管是以什么形态落地,AI都需要以更低成本、更高效率的方式满足需求,这就是天然的约束。
未来,当Agent成为科幻小说描述的那样成为个人管家、助理时,To C应用的天花板将被彻底掀开,而在当前软件层面,To B才是AI Agent的破局的最佳路径。
二、To B场景,Agent走到哪儿了?
从LLM到Agent,AI在To B场景已经走了三个阶段:大模型涌现,不管是To B还是C,这都是基础;应用层的+AI,AI作为辅助,比如微软的Copilot、钉钉的AI魔法棒;现在是第三个阶段,从Copilot走向Agent,自主性、执行力都更强,向着自动化和拟人化发展。
在第三阶段,企业所需要的不一定是一个完整的产品,也可以是一小节智能化的能力。将原子化的能力组合在一起,可能是解决企业个性化需求、不同员工个性化需求更有效的途径,这也正是传统的SaaS所面临的最大的问题。
(来源:中金研报)
这些智能化生产力使用场景有哪些?谁来提供这些智能化生产力?
B端有很多场景都有Agent的应用空间,比如电商的语音助手、智能客服、个性化推荐;教育行业的智能辅导和答疑、教育数据分析;房地产行业的虚拟房源展示、合同生成与管理、风险评估;旅游行业的实时翻译、旅游数据分析;物流行业的园区管理与监控、搬运与装卸等等。
To B涉及到的行业多样、场景分散,需要的能力是专家级的,所以那些沉淀了行业know-how的企业、ISV、个人/专家是创造AI Agent的关键角色。
于是钉钉用更加开放的方式来做AI助理生态,就像钉钉一直以来的生态战略一样,自己做底座和基础,把创造留给所有企业和用户、服务商。
今年1月,钉钉宣布举办AI助理大赛,不设门槛,鼓励企业、ISV、个人进行AI助理的创造,最高可得20万奖金,包括企业赛道、办公赛道和高校园生活赛道,截至3月底,有超过700份作品参与了大赛。
我们可 以从这些作品中看见To B的Agent已经可以做哪些事,能在多大程度上能够提升效率。
本次AI助理大赛中,实在智能是办公赛道进入到前十的选手,作品是RPA助理——实在Agent。
AI是电脑,RPA是更具执行力的手,AI+RPA能实现业务流程的超自动化。比如,在对话中调出某个业务部门当季的收入或其他统计指标,项目的进度等,这些任务不是简单对话,而需要查询、拆解、查看项目数据、推送等执行层面的动作,也涉及到数据库的读取、API管理等等。
实在智能与钉钉的合作主要集中在电商这个赛道,实在Agent可以帮助电商商家做全域数据的更新与维护。
现在的电商商家都是多平台经营,店铺数据也分散在不同的平台,以往商家的操作方式是通过增加员工数量完成每日的取数工作,成本高还易出错。
实在Agent可以模拟人工方式,在不同的平台上取数并汇总,还可以把数据汇总到宜搭上做BI看板,就能实现数据的自动更新。
如果是原来的模式,实在智能需要先打响“取数宝”的品牌,而现在多了一种选择:将取数宝的能力,集成在AI助理里。现在钉钉对于AI助理的入口比较重视,客户就可以随时点进去,通过自然对话就可以执行。
用友薪酬创造的薪酬分析助理,可以帮助用户统计日常工作报表、做人力成本的分析、薪酬结构分析、市场薪酬统计等。
用友薪酬和实在智能都是为企业提供服务的服务商,也有一些企业选择自己上,比如长龙航空创造了航空维修助理,可以提交维修需求、智能推荐维修方案、材料出库入库登记等等。
在4月23日,钉钉极客大会上,钉钉CTO程操红提到,钉钉上已经有数十万个AI助理。
三、GPT Store不行,还是Agent不行?
B端固然更容易培育出有用的AI工具,但GPT Store的经历不免让人担忧钉钉的AI Agent store会不会上演相似的剧情。
先来看看钉钉的AI Agent store与OpenAI的GPT Store有何相似与不同。
相似之处,是都降低了Agent的开发门槛。
OpenAI通过提供GPT builder降低了建立一个Agent的门槛,用户无需懂编程,也不用懂代码,通过可视化点击操作就可以构建一个自定义GPT,部分GPTs通过插件参与业务流程、使用工具,具有执行能力,但仍然达不到Agent的执行标准。
在技术普惠上,钉钉是走得更快的,比如钉钉早就通过低代码实现了半AI化,让企业通过低门槛的方式开发更契合真实业务场景的应用。
同时,低代码的普及,也为AI Agent打下了“系统”和“数据”基础设施,比如可以接入钉钉上原有的应用、低代码、企业自建系统、外部第三方平台。
最大的不同还是在于应用场景,也就是前面提到的,OpeAI的GPTs主要是给C端用的,低门槛所带来的是同质化与低劣化,而钉钉上产生的AI Agent更有需求的约束。
以解决问题为开发工具的目的,低劣化问题就能在很大程度上得到解决,同质化方面,有了GPT Store的前车之鉴,钉钉表示,钉钉未来的AI助理市场不做全量推荐,只会推荐精选过的AI助理。
(钉钉AI助理市场)
除了审核之外,在优秀AI Agent的涌现上,钉钉有哪些优势?
前面我们提到,AI Agent=LLM+感知+规划+记忆+工具使用,也就是说在大模型之外的更多的框架、组件,以及产生框架和组件的业务场景和数据,也是关键的要素。
就像观众不能指望没上过一天班的编剧写出底层打工人的真实生活,我们也不能指望只吸收了风花雪月知识、没在真实业务流程中工作过的LLM具有解决实际问题的能力。
钉钉的最大优势是,它既是一个To B的协同办公平台,也是一个开放的生态,一个AI应用创作平台,有大量的用户、组织和ISV,也沉淀了真实、复杂的业务场景。
企业、ISV和个人开发者可以在钉钉上连接、开发和加工各种应用,同时,由于用户多、企业多,钉钉成Agent天然的试验场,就像毕业的大学生有了工作机会,AI Agent store也会成为AI Agent高频的分发通道,为未来的商业变现提供了更大的可能,避开了GPTs活跃用户少的困境。
钉钉所做的,是连接场景和数据,实现结构性自动化和批量处理各种工作。具体来说,钉钉的职责是确保外部记忆存储部分的完善,包括短期和长期记忆的处理,同时做好任务规划,之后将大模型生成的内容与本地业务数据集成,并将形成的行动在各个系统中落地。
同时,To B的场景也在增强钉钉。
在To B服务中,钉钉需要频繁与用户、企业互动,甚至去线下了解实际工作流程,虽然每个企业需求不同,但产品会逐渐沉淀下来,钉钉也可以保留抽象层和公共层,完成产品的广泛行业适用性。
再比如,用友这样的老牌财税专家在薪酬领域的理解一定比大模型更深,所以AI薪酬分析助理也是在增强大模型在垂直领域的能力。
总的来说,和OpenAI相比,钉钉在LLM没有优势,但在感知、记忆和提供工具等方面都做得更好,这是AI Agent store不会成为下一个GPT store最重要的原因,也是钉钉能长出AI Agent生态的重要原因。
四、结语
历史总是在不断重复。
蒸汽机面世后,除了工业和纺织业的应用,人们还研究过将蒸汽机直接装到马车上,后来蒸汽机才找到在交通运输方面真正的用武之地——船舶和汽车。
大模型出现后,To B开始的方向同样是增强原有的产品,逐渐过渡到更具有自主性和执行力的AI+。
就像人们需要的是跑得更快的工具,而不一定非是马车,实现目标的途径是可以改变的,AI也在改变解决问题的方式。
以往,C端用户要解决问题,需要打开一个个的APP,企业需要解决问题,需要借助一个个垂直场景的SaaS。现在AI Agent将能力抽离出,并组合、重塑,形成特定事件、场景的解决方案。
在简单场景下,我们需要的是足够多、足够智能的AI Agent,在相对复杂的场景下,我们还需要这些AI Agent可以进行协作。
钉钉现在所做的就是用大量的需求促使有用的AI Agent涌现。当有用的AI Agent够多,覆盖工作场景,也覆盖生活场景,距离想象中的未来世界就更近了。
原文标题 : AI入凡尘:从风花雪月到千行百业