探索AI大模型:超越传统AI技术的新篇章

日期:2023-03-27  作者:益祥资本

作者  编辑 Jason





随着ChatGPT迅速破圈,AIGC被看作继PGCUGC之后新型利用AI技术自动生产内容的方式。而AIGC的快速迭代演变,让AI大模型技术席卷全球,成为“当红炸子鸡”。从国外的谷歌、微软、英伟达,到国内的阿里、百度,都在不遗余力布局AI大模型。


AI大模型成为人工智能迈向通用智能的里程碑技术。它的出现,让很多产业人士认为这项技术会改变信息产业格局,即基于数据的互联网时代和基于算力的云计算时代之后,将进入基于大模型的AI时代。


那么,什么是AI大模型?它是如何发展起来的,经历过哪些过程?其产业应用价值又有多少?本文将为您一一解答。




什么是AI大模型


AI大模型是“大数据+大算力+强算法”结合的产物,凝聚了大数据内在精华的“隐式知识库”。包含了“预训练”和“大模型”两层含义,即模型在大规模数据集上完成了预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。



简单来说,就是在大数据的支持下进行训练,学习出一些特征和规则,微调后应用在各场景任务中。目前,其主要在自然语言处理、计算机视觉、语音识别等领域得到广泛应用。


AI大模型具有很高的计算和存储需求,需要使用极为强大的计算设备和高效的算法才能训练和应用,所以参数量一般可以达到惊人的数十亿或者数千亿。例如OpenAI的GPT系列,最开始的GPT-1拥有1.17亿个参数,到GPT-3的参数已经到达1750亿个,最新的GPT-4没有给出具体的参数量,但根据推测,它或将接近万亿。


AI大模型的发展历程


► 从参数规模上看AI大模型先后经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段,参数量实现了从亿级到百万亿级的突破。


► 从模态支持上看,AI大模型从支持图片、图像、文本、语音单一模态下的单一任务,逐渐发展为支持多种模态下的多种任务。



但,一般认为AI大模型的发展源于自然语言处理领域。早期,研究人员主要集中在该领域的研究,诞生了像BERT、GPT-3等一系列代表性模型。随着它们参数量从初期的几亿增长到数十亿乃至千亿规模,相应的能力也得到了提升,具备了从简单的文本问答、文本创作到符号式语言的推理能力。近两年,部分研究者提出了以视觉等其他模态为基础的大模型研究,在这个阶段,诞生了如ViT等包含数亿参数规模的视觉模型。


当前,AI大模型的发展正从以不同模态数据为基础过渡到与知识、可解释性、学习理论等方面相结合,呈现出全面发力、多点开花的新格局。


在大模型的演变过程中,国内外也涌现出多个具有代表性的AI大模型。


1.国外方面

Google于2018年提出BERT模型,掀起了预训练模型的研究热潮;OpenAI在2020年提出首个千亿级的GPT-3模型,将模型规模推向新的高度。


图片源:通信产业网


凭借高水平的生成能力和开放的API服务,OpenAI又在该模型的基础上不断催生孵化出系列创新产品,包括像3月15日最新发布的具备多模态的GPT-4模型。


2.国内方面

在2021年,华为发布了首个中文千亿级的盘古模型,进一步增强中文大模型研究影响力;中科院自动化所提出首个三模态的紫东太初模型,预示着AI大模型进一步走向通用场景;百度在2022年发布10个产业级知识增强的ERNIE模型,全面涵盖基础大模型、任务大模型、行业大模型。


图片来源:通信产业网


同时,百度又在今年3月16日,基于文心大模型,正式推出了具备包括文学创作、商业文案创作、数理推算、中文理解、多模态生成在内的多项通用能力的文心一言。


AI大模型的应用价值


在AI大模型兴起之前,AI模型基本上都是对特定应用场景需求进行训练的,即小模型。它属于传统的定制化、作坊式的模型开发方式。这也意味着除了需要优秀的产品经理准确确定需求之外,还需要AI研发人员扎实的专业知识和协同合作能力完成大量复杂的工作。这就导致了模型无法复用和积累,使得AI落地的高门槛、高成本与低效率


而大模型在研发时就具备了更标准化的流程,它通过从海量的、多类型的场景数据中学习,并总结不同场景、不同业务下的通用能力,学习出一种特征和规则,成为具有泛化能力的模型底座



与传统的小模型生成模式相比,大模型能够大幅缩减特定模型训练所需要的算力和数据量,缩短模型的开发周期,并得到更好的模型训练效果


可以说,大模型的真正意义在于改变了 AI 模型的开发模式,将模型的生产由“作坊式”升级为“流水线”。而模型开发模式的转变,使得 AI 技术在落地时拥有更强的通用性,可以泛化到多种应用场景。由此利用大模型的通用能力可以有效应对多样化、碎片化的AI应用需求,为实现规模推广AI落地应用提供可能。



当然,AI大模型的发展也并非一蹴而就的。它的构建,首先需要大规模、高质量数据集的支撑,数据集的质量很大程度上决定了模型的质量。在大规模高质量数据集上,目前不但缺少相关配套软件,也缺少数据集质量评测标准;其次还有模型算法以及训练算力等方面的挑战。


不过挑战只是暂时的,AI大模型代表了人工智能技术发展的方向。随着AI大模型在技术上产生更多的突破,必然会对应用的规模化落地产生更好的促进作用。


资料参考:

1.科技日报:大模型时代,AI将如何影响你我生活?

2.人民邮电报:AI大模型:以“大规模预训练﹢微调”范式满足多元化需求


声明

本文章仅供一般性参考,并不构成针对任何证券或其他金融工具订立任何交易或采用任何对冲、交易或投资策略的邀约、推荐或建议。本文仅使用历史实际数据进行一般性论述,并未考虑任何特定人士或群体的具体投资目标、财务状况、特定需求等,亦非转为任何特定人士或群体编制。如有侵权,请第一时间联系删除。