大模型是什么?与人工智能有什么区别?

如题所述

大模型与人工智能区别:以前的模型大都是弱人工智能,像阿尔法狗只能下围棋,而各种识别产品也只能完成一个任务。这些模型之间是隔离的不能互相支撑。而大模型则通过扩大模型的参数规模,并通过大量数据的训练,来支撑所有人工智能的任务。

大模型就是一种参数规模非常大的人工神经网络。因为参数足够大之后它能力非常强,所以在很多任务上都表现出非常好的能力。

因为大模型学习了非常多的知识,经过了非常多的数据训练,这样就具有了非常好的通用性。包括像我们日常生活中经常见到的各种人工智能产品,比如说人脸识别、对话机器人,等等。

因为大模型的容量非常大、能力非常强,所以它把所有的任务都合在一起,用一个模型来提供非常多的任务的支撑,就是我们人工智能这个领域所谓的通用人工智能,所以它展示出来通用人工智能一个非常好的前景。

人工智能大模型的类型

大模型可以分为两类,通用大模型和垂直大模型。通用大模型,基础大模型,擅长处理多种任务,是行业技术的制高点,推动产业革命。如GPT系列就是通用模型。训练通用大模型的参数规模大,需要强大的算力支撑,通常是头部企业的兵家必争之地。

国内科技、互联网巨头纷纷布局,百度的文心一言、阿里的通义千问大模型、腾讯的混元大模型、科大讯飞的星火认知大模型、商汤科技的日日新大模型等都是。

垂直大模型,行业大模型,是大模型应用落地的重要形式。基于通用大模型进行微调,通过训练专业数据,向各行各业等多个场景提供更加精准、高效的解决方案。比如华为盘古大模型就是针对行业提供专业大模型,已经初步运用在政务、金融、铁路、气象、煤矿等领域。

国际上,除了ChatGPT外,还有Llama2,是Meta与微软联手推出的开源大模型,包含70亿参数、130亿参数、700亿参数三个规模;其训练数据快速增加,接受了2万亿tokens的训练。

温馨提示:答案为网友推荐,仅供参考
相似回答