中国AI大模型平台排行榜 | 11月份发表时间:2023-12-25 18:03
作者|星奈 编辑|方奇 媒体|AI大模型工场
国内大模型发展趋势|11月份解读 小模型异军突起 如今,国内大模型厂商在模型参数上越来越卷,动辄百亿、千亿甚至万亿的模型层出不穷。与此同时,小模型也在悄悄爆发。 近期,微软推出Phi-2的小型语言模型,据了解,该模型参数仅有27亿,但在Big Bench Hard(BBH)、常识推理、语言理解、数学和编码基准测试中,其平均性能得分已经超过70亿、130亿参数规模的Mistral和Llama 2。Phi-2也因参数规模足够小,可以在笔记本电脑、手机等移动设备上运行。 谷歌也在积极拥抱小模型,今年5月开发者大会上发布的新一代大语言模型 PaLM2,共四个尺寸,其中最小尺寸模型“壁虎”可以在手上运行。最近谷歌新杀手锏——多模态大模型“Gemini”发布并同步上线Nano版本,同样侧重端侧。 在国内,阿里云最近开源模型Qwen-1.8B,成为尺寸最小的中国开源大模型,推理2K长度文本内容仅需3G显存,可在消费级终端部署。 小模型异军突起的背后是大模型进入“平台期”后的困境。相比大模型,小模型在参数量上不及大模型,但它们仍然能够实现一系列的智能任务,比如图像分类、语音识别、文本生成等。并且小模型只需要较少的计算资源和内存,就可以在资源受限的环境中部署和运行。对企业来说,在大模型高昂的训练和推理成本面前,小模型无疑能“花小钱办大事”,是他们最好的选择。 HuggingFace首席执行官Clem Delangue预测:“大多数公司都会意识到,更小、更便宜、更专业的模型对99%的人工智能用例更有意义。” Agents是大模型的未来? 大模型争夺战的下半场已拉开序幕,而AI Agent(智能体)成为舞台上科技巨头们争抢的焦点。 11月6日,OpenAI开发者大会上,OpenAI推出一系列产品功能用于支持Agents的发展,包括: GPT builder:对话形式构建agent的UI,无需任何代码; Assistants API:一系列高级API帮助开发者快速搭建应用; GPTs平台:Agents分发平台。开发者可以上传自己的Agent(OpenAI叫客制化GPT),并获得利润分成。 此前,微软的AutoGen、谷歌Deepmind的Robotic Agent、亚马逊的Bedrock Agents以及阿里云推出的魔搭GPT等均已在 Agent领域布局。 Agent为什么成为巨头关注的焦点? Agent可以看作是“人类管家”或者“数字助理”,在大模型语境下,可以理解成能够自主理解、规划、执行复杂任务的系统,即它不仅告诉你怎么做,还会帮你去做。因此,Agent被认为是大模型落地到具体场景的重要路径,也是通往AGI的重要一环。 大模型发展到现在已经不再是模型、算力的竞争,场景落地才是王道,这也是大模型厂商布局Agent的重要原因。 Agent发展分为两个阶段,一个是以OpenAI的GPTs为代表的单体智能,发展到后期,则进入多智能体协作的群体智能阶段。值得一提的是,面壁智能在11月正式推出基于群体智能的AI原生应用——“面壁智能 ChatDev”智能软件开发平台。 虽然现在AI Agent发展仍在早期,但其未来潜力无穷。 开源大模型不断升级 开源、闭源之争一直围绕在大模型发展的各个阶段。开源模型能否像闭源模型一样性能强硬?能否媲美闭源模型? 随着越来越多模型开源,对开源模型的质疑在发生转向。Meta的开源模型LLaMA 系列凭借其强大的参数量、快速迭代、可定制性等优势获得行业认可与追捧。 Meta 初次开源的 LLaMA参数量包括 70 亿、130 亿、330 亿、650 亿 4 种规模,其中130 亿参数的 LLaMA 模型“在大多数基准上”可以胜过参数量达 1750 亿的 GPT-3,而且可以在单块 V100 GPU 上运行;而最大的 650 亿参数的 LLaMA 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM-540B,表现可谓十分惊艳。 此后LLaMA2开源,更是在开源圈掀起一波风浪。相比于LLaMA,LLaMA 2 的训练数据多了 40%,上下文长度也由之前的2048升级到4096,可以理解和生成更长的文本,并采用了分组查询注意力机制。 最近,大模型开源圈又新添两位重量级选手:通义千问及Yi 模型。 全球最大的开源大模型社区HuggingFace日前公布的最新开源大模型排行榜显示,阿里云通义千问开源720亿参数模型Qwen-72B,零一万物开源340亿两款参数模型Yi-34B-Llama和Yi-34B-200K成为前三甲。 目前通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源;Yi 模型则是李开复博士创办的AI 2.0公司零一万物的首款开源大模型,可一次处理40万字。 开源模型或许在不久的将来将赶超闭源模型。
国内主要大模型进展|11月份最新 百度 李彦宏在多个场合反复强调,卷AI原生应用才有价值,别卷大模型。百度也正沿着AI原生应用的路线持续深耕。 11月初,在2023年世界互联网大会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰披露,文心一言用户规模现已达到7000万,场景4300个,应用2492个。此外,他还表示,飞桨和文心生态已凝聚800万开发者,服务22万家企事业单位,创建了80万个模型。 百度AI原生应用生态在文心大模型的加持不断繁荣,百度文库、百度营销等产品加速重构与升级。 百度文库用大模型重构为“一站式智能文档平台”,并上线智能文本生成与编辑、智能PPT生成与编辑、智能问答与总结等AI新功能,为用户提供全场景AI伴随服务,既可以依托海量内容实现跨时空、跨语言内容沉淀和分享。 在营销领域,11月底,百度推出“虚拟人整体解决方案”,打造全新“智能体商业”。 “智能体(Agent)商业”,即基于文心大模型能力,一方面让每一个企业都在百度拥有专属分身智能体,以最佳方式与用户进行自主交流,激发用户需求、提供极致服务;另一方面,百度营销将以“轻舸”作为与客户交互的统一载体,深刻理解和满足客户需求。 值得注意的是,AI Native营销平台“轻舸”也在持续迭代进化,客户数提升7.5倍,互动量级已达百万。 阿里云 阿里云继续大模型开源之路。近期,通义千问开源720亿参数模型Qwen-72B,性能超越开源标杆Llama 2-70B和大部分商用闭源模型。同时还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。 阿里云是国内最早开源自研大模型的科技企业,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。值得一提的是,Qwen-VL不断更新,大幅提升通用OCR、视觉推理、中文文本理解基础能力,还能处理各种分辨率和规格的图像,甚至能“看图做题”。 日前,阿里云通义千问(Qwen-72B)还同时登上全球最大的开源大模型社区HuggingFace和国内权威大模型评测平台OpenCompass的榜首,开源模型累计下载量已超过150万,催生出150多款新模型、新应用。 360 11月4日,360大模型“奇元大模型”通过备案落地。是360公司继今年9月份“360智脑大模型”面向公众开放后第二个通过备案的大模型。360公司也成为国内首家完成双备案的大模型厂商,并且已实现C端、B端的全线布局。 从大模型定位和应用角度来看,奇元大模型具备充足的灵活性和可扩展性,商业化和产品定位以B端用户为主,后期将会聚焦更多的商业化应用和垂直领域,帮助用户提升工作效率。而此前发布的360智脑大模型接入“360全家桶”,面向C端开放和服务。 据了解,360智脑大模型于今年9月首批获得备案开放,并全面接入360搜索、360浏览器等互联网全端应用。360智脑大模型集成了360GPT大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,覆盖大模型全部应用场景,上线首周即获300万用户超5000万余次互动。 夸克大模型 11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,随后公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。 夸克大模型基于数据、行业、知识正确性、平台等四方面的优势,其整体水平超越GPT-3.5,在多语言翻译、写代码、安全合规、内容创作等方面处在国内行业头部水平。 具体来看,首先,夸克大模型依托搜索平台,夸克大模型拥有高质量的各类数据能更好地理解、评估、提炼中文知识体系;第二,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,沉淀了非常丰富的数据及用户场景;第三,在通用知识、写作增强等方面,夸克建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系。第四,夸克组建了数百人的研发团队,在搜索、教育、医疗等垂直领域中进行大模型的预训练与精调。 此外,夸克App将借助自研大模型全面升级,以用户需求出发,打造工作、学习、生活的AI助手,还将借助大模型驱动推进搜索革新,加速迈向下一代搜索。 面壁智能 11月15日,面壁智能正式推出基于群体智能的AI原生应用——“面壁智能 ChatDev”智能软件开发平台,发力“大模型+Agent” 。 这是业内首次将 AI Agents 群体智能协作技术应用于软件开发的 SaaS 平台产品,也是让软件开发者和创新创业者以极低的成本和门槛高效完成软件开发工作的开端。 同时,面壁智能还升级了其CPM系列基座模型,推出全新一代千亿参数大模型“面壁智能 CPM-Cricket ”,基于 CPM 的多模态智能对话助手“面壁露卡Luca”也升级为3.0版本,并在11月初正式面向公众开放服务。 面壁智能联合创始人、CEO李大海认为“大模型+Agent”将会引起新一轮的应用爆发,为行业和用户带来更多新的能力与服务,推动 AI 大模型的场景落地。 实际上,面壁智能在今年5月就陆续推出并开源了 AI Agent “三驾马车”:AgentVerse、ChatDev、XAgent。并且已经在金融、制造、商业、汽车、法律等多个领域进行应用场景落地。 昆仑万维 11月3日,昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务。 昆仑万维从用户需求倒推,以“搜索”为抓手切入大模型赛道,今年8月推出国内第一款AI搜索产品——“天工AI搜索”。并在10月份开源百亿级大语言模型「天工」Skywork-13B系列,配套开源600GB、150B Tokens的超大高质量开源中文数据集。 目前昆仑万维已经确定六大AI业务矩阵,包括AI大模型、AI搜索、AI游戏、AI音乐、AI动漫、AI社交。 值得注意的是,近期,昆仑万维推出SkyAgents平台,用户可以通过自然语言和简单操作,零代码打造属于自己的智能体,几分钟内完成行业研究报告、单据填写、商标设计、甚至健身计划、旅行航班预定等需求。 昆仑万维董事长兼CEO方汉表示,大模型使用门槛太高,Agent才是AGI的真正表现形式。 OPPO 11月16日,OPPO 正式发布了自主训练的个性专属大模型与智能体 —— 安第斯大模型 (AndesGPT),并将与自研智慧跨端系统“潘塔纳尔”实现深度协同。 据介绍, AndesGPT有三大类规格:AndesGPT-Tiny、AndesGPT-Turbo和AndesGPT-Titan,可涵盖十亿至千亿以上多种不同参数规模的模型规格,能够基于“端云分工、端云互补、端云协作”等方式,适应不同的应用场景。并且,AndesGPT拥有对话增强、个人专属和端云协同三大技术特征,及知识、记忆、工具与创作四大核心能力。 OPPO手机助手小布同步接入AI大模型能力,AndesGPT 能够快速根据用户对话解决问题,支持各种文生图与图生图任务。小布助手在大模型的赋能下不仅可以实现更流畅、更自然的对话,也支持自然语言指令调用手机设置,还能够提供涵盖短视频脚本、策划案生成、要点总结、小红书文案等内容生成能力。 不仅OPPO将大模型装进手机,华为、小米、vivo等都将大模型接入手机助手,打造大模型的端侧入口。 端侧大模型俨然成为手机厂商争夺的下一个风口。 其实,在大模型爆火之前,手机助手由于受制于技术限制,其智能水平远达不到用户的需求。而大模型所带来的“智能涌现”带来了手机影像、操作、文生图等多种体验的升级,打造超级手机助理逐渐照进现实。 |