体积数量
7月6日至7日,2023年世界人工智能大会在上海举行的两天时间里,据记者不完全统计,已有10余款大型模型新品发布或宣布即将发布。 发布的企业包括互联网科技公司、初创公司、通信公司; 新型大型机型中,有通用型大型机型和专注于细分行业的行业专用型大型机型。
已发布的包括:阿里巴巴大型绘画模型“统一万向”、中国电信类ChatGPT产品“TeleChat大型模型”、商汤科技联合推出的“学者通用大型模型系统”等。香港中文大学、清华大学等。第四范式重点关注企业软件领域“风格理论”的大模型。
7月7日下午,华为宣布发布盘古Model 3.0。 华为执行董事、华为云CEO张平安在PPT最显眼的位置写道,“不做诗,而做事”。 他表示,盘古模式聚焦价值场景,致力于深化政务、金融、制造、煤矿、铁路、医药、气象等行业。 例如,在气象行业,盘古大陆气象大模型在相同空间分辨率下可以比欧洲气象中心业务IFS快10000倍以上,同时保持极高的精度。
还有多款重大大型模型产品即将发布。 京东将于7月13日发布千亿级“延禧大模型”。中国移动近期将发布“九天”1+N大模型。 医都科技表示,正在开发大型医疗模式,并将针对一些目标场景开展小范围邀请测试。 奇安信集团董事长齐向东表示,正在为政企客户开发安防行业的大模型; 10月24日,科大讯飞将发布通用大模型,全面对标ChatGPT。
在5月底举行的中关村论坛上,有专家透露,据他们统计,截至目前,国内已发布参数10亿以上的大型模型79个。 今天,随着世界人工智能大会一批大型模型的发布,百模型大赛正式启动。
垂直滚动
年初ChatGPT在国内爆火后,大模型的火爆持续至今。 中金公司一位高管在会议论坛上表示,过去三个月他参加的会议有一半以上与人工智能有关。 “看来如果不谈ChatGPT,大家就都完了。”
这种热情或许可以解释为什么迄今为止还有如此多的公司不断发布大型车型。 然而,随着人们对大模型认识的增强,大模型的问题逐渐凸显,成为需要直接面对的挑战。
图灵奖获得者、中国科学院院士、清华大学交叉信息研究所所长姚期智认为,未来对大模型应用最直接的影响是文书工作。 作为生产力工具,很多文书工作都可以通过大模型来完成。
作为文档领域的重要玩家,金山办公也发布了基于大模型的AI办公产品“WPS AI”,可以润色文章并自动创建表格和PPT。 用户可以让AI将大纲制作成PPT,并可以随意改变PPT风格。
“WPS AI”建立在MiniMax、百度文心、智浦AI等大型模型之上。 金山办公CEO张清源在会上表示,金山办公将把WPS AI定位为大语言模型的应用端,未来将锚定AIGC(内容创作)、Copilot(智能助手)、Insight(知识洞察) 。
同样在7月7日,语言智能科技公司米读发布了一款专门针对校对垂直行业的大模型,名为“米读文秀”。 米读CTO刘益东告诉经济观察报,米读深耕语言智能领域十余年,拥有庞大的专业数据语料库。 今年ChatGPT流行之后,他们尝试在校对领域做一个大模型。 训练效果惊人,垂直领域效果远好于一般大模型。
刘益东还提到,垂直行业的大型模型制作成本远低于通用型大型模型。 他们的校对模型只用了一百多张卡,训练了一个多月,经过几轮对比实验,效果已经达到了可以发布的水平。
成交量进度
新的大尺寸模型不断涌现,此前已经发布的大尺寸模型公司也不甘示弱,分别于7月6日和7月7日公布了最新进展。
今年4月10日,商汤科技发布了通用大型模型产品“天天上新”。 7月7日,《每日新报》更新至2.0版本,商汤科技联合创始人、董事长兼CEO徐立现场展示了大模型的新能力。
徐力以自己的照片为例,生成了一张“戴眼镜的男人弹吉他”的图片。 这是他以前从未做过的事情。 生成后,他发给了家人和朋友,很多人都相信这是真的。 这些人工智能生成的图像的细节非常逼真。 他还演示了AI绘画的功能。 现在商汤模型可以帮助用户添加提示词。 例如,用户输入关键词“中国龙,蓝色饰品,珠宝风格”后,AI生成龙的总体图片,大模型可以自动补充提示为“中国龙的3D渲染,极其精细”。图案中,龙立于蓝色玛瑙海之上,增添了深度和神秘感……”,AI生成的新画面艺术增强了不少。
徐立表示,自4月份发布大模型后,商汤科技每周都在大模型上进行迭代。 此外,针对行业需求,他们还在大车型的基础上推出了小车型。
作为国内首家发布大型模型的大型互联网公司,百度也在人工智能大会上公布了“文心一言”的最新进展。 百度首席技术官、深度学习技术与应用国家工程研究中心主任王海峰表示,文心大模型3.5的效果、功能、性能全面提升,基础模型进行了升级,微调技术创新,强化知识点,强化逻辑推理。 ,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
此外,制作大型模型的公司目前正在努力构建生态系统并建立标准。 7月7日,百度、华为、阿里巴巴等企业被工信部中国电子技术标准化研究院(下称“电子标准院”)授予“国家人工智能标准化总体组大模型专项组”牵头单位工业和信息化,正在积极推动大型模型国家标准体系的建立,助力我国大型模型产业的发展。
体积算力
与三四月份人们充满期待的科幻想象相比,现在制作大型模型的人把注意力集中在更贴近现实的题材上。 他们发现数据是一个问题,计算能力也是一个问题。 大车型之路前景光明,但现实却艰难。
“算力是人工智能行业创新的基础,大模型的不断创新带动了算力需求的爆发式增长。可以说,大模型训练的效率或者说创新的速度,从根本上取决于规模的计算能力。” 华为轮值董事长胡厚昆判断,随着大模型带来的生成式AI突破,人工智能正在进入新时代,算力成为越来越稀缺的资源。
华为目前正在致力于解决算力问题。 7月6日,华为宣布算力解决方案Ascend AI集群全面升级。 集群规模从最初的4000卡集群扩大到16000卡,成为业界首个万卡AI集群。 此前,腾讯云还发布了面向大型模型的新一代高性能计算集群,计算性能较上一代提升高达三倍。
然而,目前的计算能力仍然是一个很大的挑战。 一位大型模型初创公司人士告诉记者,大型模型的研发成本非常高。 仅在计算能力领域,训练、推理和数据处理就需要数千张卡并行。 这是一个非常复杂和昂贵的系统工程。
清华大学电子工程系系主任王宇举了一个例子。 如果同时处理14亿人的推理请求,需要10*24 FLOPs(模型算力),超过中国数据中心总算力三个数量级。
“现有GPU硬件平台的计算能力仍难以满足大型模型的需求。” 王宇说道。 即使使用现有最好的芯片,解决计算能力问题仍然是一个巨大的挑战。
除了计算能力之外,大模型数据也存在挑战。 一位智能汽车创始人对海量数据感到困扰。 他的公司刚刚售出一万辆汽车,但产生的数据已经让他感到巨大。 他无法想象当他卖掉十万辆汽车时会发生什么。 另一方面,有些人因为数据不足而感到困难。 一位利用大模型进行生物医学研发的人士表示,他们最缺乏的是数据,这阻碍了他们医学研发的速度。
腾讯高级执行副总裁唐道生表示,通用大模型一般都是基于公开信息训练,专业知识和行业数据积累不足。 从策略上来说,通用大模型有点像“沸海”,针对性不够,可以解决80%的问题,但不一定能满足某个场景的具体需求企业的。
徐立还提到,大模型的幻觉问题仍然很严重,需要解决。 幻觉问题是自然语言处理领域的基本问题之一,指文本生成模型的生成结果中包含与输入实际相冲突的内容。 这些问题导致了大型模型的“严重胡说八道”现象。
此外,清华大学智能产业研究院院长、中国工程院院士张亚勤提到,目前的大模型仍然有其自身的局限性。 例如ChatGPT就存在时效性问题。 你问它什么时候发布,它也不知道,因为它使用的是2021年9月之前的数据。此外,大型模型还存在效率低下、涉嫌侵犯隐私、知识产权保护问题,这些都会影响大型模型的商业使用。楷模。 张亚勤认为,大规模模型的效率必须提高至少10倍,才有可能大规模商用。
搜虎网转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。