科技

OpenAI推出GPT-4可以解析文本和图像输入 券商商业化应用将进一步加速背后

金融界3月15日消息 北京时间3月15日凌晨1点,OpenAI正式推出GPT-4文本生成AI系统。

据悉,GPT-4是新一代多模态大模型,支持图像和文本输入以及正确的文本输出,拥有强大的识图能力,文字输入限制提升至2.5万字,支持多个语言,回答准确性显著提高,从而让新的ChatGPT更聪明。此外,GPT-4还开放了角色扮演和性格定制能力。另外,GPT-4版本还会随着时间进行自动更新。

据OpenAI介绍,GPT-4在各种专业学术基准上有着人类水平表现。根据官方实验表明,GPT-4在各种专业测试和学术基准上的表现与人类水平相当。

首先,在美国BAR律师执照统考模拟中,GPT-4得分约为前10%——击败了90%人类,而ChatGPT背后的GPT-3.5得分约为倒数10%;生物奥林匹克竞赛,GPT-3.5能达到后31%水平分位,GPT-4可达到前1%水平分位;研究生入学考试 (GRE) 、SAT数学考试成绩中,也有大幅提升,击败了80%以上的人类答题水平,而医学知识自测考试准确率达75%。

第二个测试是与其他英文机器学习模型的技术能力。研究团队使用微软Azure Translate,将MMLU 基准——一套涵盖57个主题、14000个多项选择题翻译成多种语言。在测试的英语、拉脱维亚语、威尔士语和斯瓦希里语等26种语言中,有24种语言下,GPT-4优于GPT-3.5 和其他大语言模型(Chinchilla、PaLM)的英语语言性能。

华泰证券表示,GPT-4 的核心升级点包括:1)能够处理复杂的长文本,准确性显著提升;2)接受文本和图像的输入;3)风格多样化,创造力强。建议关注应用落地方向包括:1)对话机器人:利用GPT-4 的提升交互能力,如社交与教育应用、直播、游戏等;2)搜索:借助GPT-4 的分析能力,总结生成建议,如导购平台、搜索引擎等;3)办公:引领B 端生产力变革,如营销文本等;4)开放内容创作:如小说创作。

中信证券认为,伴随成本下降以及多模态的持续演进,GPT等大模型有望构筑AIGC核心基石,推动AI商业化进程加速和市场天花板打开。建议持续关注相关领域的AI公司:1)应用层;2)基础设施层。

1、ChatGPT通过大模型突破AI瓶颈,GPT-4多模态应用带动商业化加速

ChatGPT凭借大算力、大规模数据训练、基于人类知识的强化学习等方式突破AI技术瓶颈,获得超预期的用户体验效果与市场反响。回顾GPT系列模型演进,GPT-1结合无监督预训练与有监督微调过程,GPT-2突出零样本设定,GPT-3强调上下文学习能力,参数量、训练数据量不断提升。我们预计即将推出的GPT-4或支持多模态应用,开启通往人工通用智能(AGI)之路,并有望控制训练成本,降低使用门槛。目前,ChatGPT已在C端推出ChatGPT Plus订阅计划,B端开放ChatGPT API,且成本降低为0.002美金/1000token,海外多个应用率先接入。我们预计在GPT-4带动下,未来大模型以及多模态模型的商业化应用将进一步加速,带动行业景气度持续向上。

2、Transformer架构支撑GPT走向多模态,构筑AIGC领域核心基石

GPT系列模型使用Transformer架构,当前基于Transformer的多模态研究为AI领域研究热点,Transformer已开始打破NLP与CV领域壁垒,有望支撑GPT系列模型走向多模态应用,构筑AIGC领域核心能力基石。我们梳理出GPT的潜在基础能力包括文本生成(分析)、代码生成、对话交互、机器翻译、图像生成、视频生成等。我们认为,前述基础能力将支撑GPT系列模型在通用与垂直领域的应用,典型应用场景如:通用领域—搜索引擎/办公软件,垂直领域—教育/金融/医疗/图像视频等。

3、通用与垂直场景多点开花,GPT变革内容生成与交互方式

GPT有望革新各行各业的内容生成与交互方式。基于GPT 文本代码对话翻译图像视频,我们看好GPT类技术未来在通用与垂直场景的应用空间。例如,搜索引擎结合GPT将重塑搜索结果呈现方式,多模态的引入带来一站式的文本、图像、视频汇集结果,将大为提升用户信息收集效率。

中金公司机构以下四大环节有望迎来新机遇:

(1)算力方面,ChatGPT训练所耗费的算力大约为3640 PF-days,即假设每秒运算一千万亿次,需要连续运行3640天,训练大模型需要强大的算力。人工智能的跨越式发展将成为算力流量消耗的重要驱动力,未来数据中心和相关的配套产业有望实现更好增长。其中,数据中心建设有四大重点方向:

①第三方IDC运营环节:宝信软件、数据港(与阿里合作)、科华恒盛(与腾讯合作)、奥飞数据、美利云、光环新网、铜牛信息等。

②储能温控环节:英维克(互联网IDC空调龙头)、佳力图(绑定中国移动)、高澜股份、依米康、申菱环境、朗进科技、科华数据、润泽科技等。

③传输网设备、光纤光缆、光模块等ICT环节:光模块领域的新易盛、中际旭创、博创科技;光器件领域的天孚通信、腾景科技、光库科技;光纤光缆领域的中天科技、亨通光电等。

④高性能计算芯片板块:澜起科技、国芯科技、聚辰股份、兆易创新、景嘉微、寒武纪、芯原股份等。

(2)数据标注方面,ChatGPT的训练过程加大了人工标注的力度和精度,这代表着在未来的人工智能领域,优质的数据源和强大的标注能力,将成为行业的基础设施。

(3)NLP(自然语言处理)方面,安信证券表示,由于ChatGPT主要基于自然语言处理,因此在NLP领域沉淀较多的企业,有望率先实现功能的部分复现,NLP头部厂商将率先受益。

(4)AIGC(人工智能生成内容)方面,ChatGPT是AIGC应用的又一个起点,随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC有望加速发展。

本文源自金融界