奥飞寺金雷
量子比特 | 公众号QbitAI
我的朋友们,OpenAI刚刚发布了一个定制的GPT,允许每个人进行开发;然后中国的一家大型模型初创公司也推出了一款重新定义开发的产品——允许AI代理进行协作!
只需要一句话,最快不到3分钟,费用只需2元多一点,“砰~”一个软件就开发出来了。
比如你想开发一个红包雨小软件,你只需要说一句话:
《红包雨》是一款点击小游戏。红包的外观是一个又高又细的红色圆角矩形。红包从上方缓缓落下,每个红包间距均匀,没有重叠。用鼠标点击任意一个红包,红包会随着交互点击而消失。同时会显示一个幸运数字,表示抢到红包能得到多少钱。
更重要的是,在整个开发过程中,从产品经理到程序员,到设计师、测试员,他们都是AI代理!
没错,整个过程中你只需要提出你的要求,其余智能代理会自行讨论、交流,甚至战斗,最终确定计划并执行。
要知道常规软件的开发周期是2-3周,费用在1-5万美元之间(含人力);相比较而言,真可谓“降本增效”!
这个神奇的工具就是绵笔智能最新推出的SaaS级智能软件开发平台ChatDev。
其实,早在两个月前,“ChatDev智能代理协同开发框架”就在GitHub开源,并多次荣登Trending排行榜榜首,目前已获得近17000颗star。
棉比智能此次之所以推出产品版本,是为了再次降低“一句话开发”的门槛。
现在我们有了它,发展就不再是关于技术,而是创造力。
就好比身边有一只多啦 A 梦,只要你敢想,它就敢给你“创造”。
那么 ChatDev 的生产版本会带来什么样的变化?它是如何做到的?
产品开发已发生改变:可以融入更多创意
有了ChatDev产品版本的支持,开发迭代变成了有想法就好的事情。
比如你想把“红包”替换成你想要的元素,也只需要一句话。
随后AI代理们又开始了新一轮的工作流程。这一次,我们来仔细看看它们是如何相互配合的。
我们以红包雨demo为例。
首先,正如前面提到的,我们需要做的就是填写“项目名称”和“提示”。
而且即使提示写得不好,ChatDev旁边还有“一键润色”功能,会自动帮你完成要求。
然后我们就可以看到AI代理们开始“搓手”,准备工作了。
CTO首先发言,大意是:
有活干了!客户要搞一场“红包雨”~
随后CTO对需求进行了详细的分解,并列出了项目的每个步骤:
任务分配好之后,就轮到程序员工作了。
他很轻松地给出了一段Python代码:
代码完成后会有AI顾问对整个项目进行总结,提供逻辑、结果等:
整个谈话过程非常顺利,我们就像尊贵的客户一样,静静地看着这些“AI员工”有序地推进项目。
不得不感叹,如今发展真的变成了有想法就好。
比如网络爬虫、数据库读写、文件批处理、网页设计等编程助手,五子棋、贪吃蛇等休闲游戏,以及数字时钟、计算器、画板、图像编辑器等效率管理和创作辅助工具。
都能hold住~
你是怎么做到的?
从早期披露的信息和论文我们可以看出,最初的ChatDev是一个团队设计的,通过集体智慧连接起来的ChatChain(通讯链)。
它可以看作是由原子任务组成的“软件生产线”,通过专业角色的智能代理的对话式信息交互和决策,驱动自动化全流程软件工程。
但应用创新离不开基础模型能力的提升,随着棉笔智能推出ChatDev SaaS版本,我们发现其自研的基础模型也有了新版本。
CPM-Cricket(CPM代表Chinese Pretrained Model)是棉笔智能研发的新一代千亿参数大模型。
据了解,CPM-Cricket为第三代面壁智能模型,前两代分别为CPM-Ant、CPM-Bee。
(有意思的一点是,每代车型的名字都是根据英文字母的首字母,用昆虫的英文单词来命名的。)
至于CPM-Cricket的能力,简单来说,它在逻辑、代码、知识、指令理解等方面都有了显著的提升,全面超越了Llama 2。
在经典的LLM评估集(HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH等)中,CPM-Cricket的表现如下:
或许这样的一组数据并不能给人带来很直观的感受。
那么基于CPM-Cricket实现的ChatGPT类产品Luca 3.0在被“扔”进公务员考试场景之后的表现,会让CPM-Cricket的能力更加一目了然。
主题是这样的:
选取了2022-2023年公开考试题型,涵盖常识判断、数量关系、数据分析、判断推理、语言理解与表达等多种题型425道题。
比如面对下面这道选择题,Luca 3.0不仅可以在几秒钟内做出解答,还详细列出了解答的每个步骤:
即使是面对需要大量对话且真人需要一段时间才能做出反应的逻辑问题,Luca 3.0 也能够轻松回答:
可以说,Luca 3.0在这组题上的表现是“快”和“准”。
与其竞争的对手棉比智能也选择了业界比较标杆的大模型GPT-4。
不难看出,在常识判断和判断推理两项重要能力上,Luca 3.0相对于GPT-4一直能够保持相对优势。
不仅如此,在英文测试环境下,Luca 3.0 在 GMAT 官方模拟试题中的表现也整体与 GPT-4 相当(阅读量达到 GPT-4 的 97%)。
Luca 3.0之所以能取得如此成绩,除了背后CPM大模型的升级外,FaceWall Intelligence在微调上也做出了相应的策略:
第一是课程学习(CL)训练策略,模仿人类由易到难的学习过程,先在预训练中让模型学习底层的推理规则,然后在对齐阶段学习人类一步步的推理思维。
第二种是思想链(CoT)策略,将推理过程进行分解,使得模型的推理更加易于解释。
(PS:Luca现在正式对外开放,可以免费体验哦~)
在其他底层基础设施,比如训练、压缩、推理等环节,棉笔智能也制定了自己的一套策略:
据称,其大模型已集成超过16000个真实API,可一键访问并调用工具来解决更复杂的任务。
此外,棉币智能还部署了Int8量化模型游戏开发,将模型推理成本降低了50%。
综上所述,棉比智能探索出了更加低成本、高效的模型训练方式,让大模型不仅能“练”,而且能“练好”、“用好”。
这或许就是这家创业公司推动“大模型+代理”应用落地的实力与底气。
还有一场更大的棋局
不过除此之外,基于大模型库的基础能力,棉笔智能还开源了两大重磅作品——AgentVerse与XAgent。
加上我们前面提到的ChatDev,三者共同构成了面墙智能的“三驾马车”,以AI智能实体为核心。
AgentVerse是一个大规模模型驱动的智能代理通用平台,其功能是创建各种AI代理,使其具有感知、思考、推理、理解、协作和执行等能力,从而“组队打怪”。
XAgent是一个大型模型驱动的AI代理应用框架,使代理具有自主规划和决策能力,理解人类的指令,制定复杂的计划并采取自主的行动来完成任务。
ChatDev则更加专注,是一个大模型驱动的多智能体协同开发框架,采用了软件工程瀑布模型的思想,将软件开发分为软件设计、系统开发、集成测试、文档编写四个主要阶段。
但如果将本次发布的“单节点”全部串联起来,我们可以发现,FaceWall Intelligence 其实在玩一场更大的游戏——
左手有一个大模型,右手有一个AI代理,我们要构建的是一个智能代理网络(Internet of Agents,IoA)。
因为在棉比智能看来,我们已经经历了从互联网到物联网的转变,而下一个方向就是智能物联网。
如果说互联网是二维信息的连接、物联网是三维空间的连接,那么,智联网则是更高维度智能实体的连接。
在智能物联网中,AI代理应该是最关键的存在,它们可以是拟人化的原生代理,也可以是真实人与物体的数字孪生代理。
通过智能体的连接,人工智能才能真正为人类服务,提供价值(提高生产力、改变交互方式)。
打个大胆的比喻,在物联网的未来,哪怕是家里的一张桌子、一台冰箱,都具备智能实体的特征游戏开发,能够与人和其他物体进行智能交互。
这也正是“面墙智能”——“万物智能”愿景的由来:
“智能”指的是AI Agent;“万物”可以是人,也可以是物。
AI Agent网络是连接现实世界与虚拟世界的桥梁,使它们能够真正地互动、协作、创造价值。
但平心而论,智能互联网的理想虽然美好,但现实情况是,即便是ChatDev和第三代大模型的发布,也只能算是朝着愿景迈出了一步。
那么面壁智能是否具备足够的力量来解锁未来“万物智能”呢?
关于棉比智能
对于这个问题,我们首先要看看棉比智能的团队实力。
据官方介绍,棉比智能成立于2022年8月,CEO为李大海,首席科学家为刘志远。
两人的学术和技术实力都不容小觑。
李大海毕业于北京大学数学系,后加入谷歌,成为谷歌中国创始员工之一,之后还在多家知名公司担任过技术总监、CTO等职位,有丰富的技术体系构建和商业化经验。
刘志远是清华大学计算机系终身副教授,主要研究领域为自然语言处理、知识图谱、社会计算等,在人工智能领域著名国际期刊和会议上发表论文200余篇,Google Scholar引用量超过3.7万次,学术造诣十分深厚。
不仅如此,官方的“顾问”成员也十分重量级,其中包括两位来自清华大学计算机系的教授——孙茂松和刘洋。
不难看出,棉比智能绝对是一家规模化、模式化、具有浓郁“清华味”的创业公司。
此外,其对产学研生态圈也有自己独特的做法,即“一体两翼”。
“一体”指面壁智能,“两翼”则是OpenBMB和清华NLP实验室。
据了解,OpenBMB是2021年由棉比智能团队联合清华NLP实验室联合创建的国内领先的大模型研发及应用开源社区,社区宗旨是“让大模型飞进千家万户”。
除了Agent技术框架外,OpenBMB还开源了CPM-Ant、CPM-Bee 10B基础模型、BMTrain、BMCook、BMInf、OpenPrompt、OpenDelta等大模型全流程加速工具包,为中国的大模型开源事业做出了独特的贡献。
清华自然语言处理实验室是国内首个系统开展深度学习与大模型研究的单位,团队在国际顶级学术会议和国际权威期刊发表论文200余篇,总引用近4.4万次,并多次获得最佳论文奖。
由此可以看出,无论是自身实力,还是“一体两翼”的强强联合,面墙智能对于技术的把握可谓是牢牢的。
这也就不难理解为何成立仅一年的棉比智能能够将CPM模型迭代三代,并在国内率先推出“大模型+Agent”群智模型的产品应用。
- 超过-
量子比特QbitAI·今日头条签约
关注我们,第一时间获取最新前沿科技资讯