找回密码
 立即注册

微信扫码 , 快速开始

林骏超:从一级市场角度看AI的投资机会

2023-7-25 15:57| 发布者: admin| 查看: 2084| 评论: 0|来自: 钛资本研究院

摘要: 过去半年,AI大模型如雨后春笋般涌现,不论是一级市场还是二级市场,国内的AI投资非常火热。基于大模型的相关应用迅速兴起,数月内仅国内就有近百家AI企业推出了大模型产品。 ...
 

在ChatGPT席卷全球后,人工智能被推到了新的风口,作为颠覆性的智能生产力工具,早已成为热门话题。当前,全球发达国家和地区均把人工智能产业发展上升到国家战略,相关新兴技术和应用不断落地。随着新一轮AI浪潮的深入发展,一场由数智化技术引领的工业革命呼之欲出,同时也拉开了各行各业“大模型时代”的序幕。

为何大型语言模型能够引领AI的潮流?国内AI有哪些投资机会?近期,钛资本邀请到容亿资本投资总监林骏超进行分享,主题是:从一级市场角度看AI的投资机会。林先生拥有英国伦敦大学学院(UCL)的电子电气工程学士学位和一等荣誉硕士学位,有三年创业经验和六年股权投资经验。其投资重点包括基础软件开发工具、元宇宙和AIGC等领域,其中包括景业智能、智能开源中国等项目。本次分享主持人是钛资本董事总经理吴凯,以下为分享实录:

大语言模型为何能独领AI潮头‍‍‍AI发展简史

自香农在1950年提出计算机博弈以来,AI已经历了超70年的发展历程。我们大致可将其分为四个阶段:早期启蒙+专家系统时代(50-70年代)、机器学习+计算机视觉时代(80-90年代)、深度学习时代(2006-2017)、多模态+大语言模型时代(2018-至今)。

早期启蒙阶段的里程碑事件发生在1956年的达特茅斯学院夏季研讨会,会上首次提出了人工智能概念,正式拉开了人工智能的序幕,期间相继出现了1966年MIT开发的首个聊天机器人ELIZA,首个专家系统DENDRAL,以及1976年David Marr提出计算机视觉和计算神经学概念。

机器学习时代,有一位里程碑式的人物,就是前段时间从谷歌离职的AI教父——杰弗里·辛顿。他在1986年提出反向传播算法,使得大规模神经网络训练成为可能,为后来的神经网络和深度学习铺平了道路。同时,在这一阶段内,也出现了许多里程碑事件和人物,例如1979年的西洋双陆棋比赛,以及1997年深蓝战胜国际象棋世界冠军卡斯特罗夫。2006年,杰弗里·辛顿等人正式提出深度学习的概念,从而将AI引入了第三阶段——深度学习时代。

在深度学习时代中,杰弗里·辛顿在2012年提出卷积神经网络AlexNet并在ImageNet图像分类竞赛上夺魁,整体错误率比第二名低了10.8%,正式开启了计算机视觉的深度学习元年。2013年3月,谷歌将杰弗里·辛顿的创业公司DNNResearch以4400万美元收购,自此谷歌开始引领全球AI的发展;2015年全球最具影响力的深度学习框架TensorFlow开源;2016年AlphaGo以4:1战胜九段围棋高手李世石;2017年推出Transformer模型,自此拉开了当下大语言模型时代的巨幕。同时,伴随着这波谷歌引领的AI浪潮,Scale AI、HuggingFace、OpenAI等AI独角兽也相继于2016年成立。互联网巨头Meta也在2017年开源了更好用的深度学习框架Pytorch。

大语言模型时代的主导者OpenAI,最早于2019年4月初露头角,其研发的OpenAI Five以2:0的绝对优势击败了Dota2世界冠军OG战队,随后分别于2020年5月发布了1750亿参数的GPT-3、2022年11月推出ChatGPT(GPT-3.5)、2023年3月推出GPT-4,自此正式接棒谷歌,开始引领全球大语言模型的发展。而谷歌、Meta、微软等互联网/软件巨头也调整战略,积极参与到大模型竞赛之中。自2022年年底ChatGPT以来,我们看到全球各大厂商纷纷入局大模型,国内高校、科技巨头、初创企业等,也不断推出各类大模型产品和应用。

国内的AI发展史最早可以追溯到1998年成立的微软亚洲研究院,如今国内熟知的创新工场、百度、金山软件、阿里巴巴、商汤、旷世等公司,背后的创始人和核心团队都来自于微软亚洲研究院。国内第一批AI公司科大讯飞、大华、海康威视于2008年-2010年前后在A股上市。2011年-2015年,国内涌现出不少计算机视觉创业企业,例如AI四小龙旷视(2011年成立)、依图(2012年成立)、商汤(2014年成立)、云从(2015年成立)等。2018年,国家队——北京智源人工智能研究院成立。这次大型模型的发展也受益于这股浪潮。2002年以来,寒武纪、商汤、海天瑞声、云从等AI相关企业相继在科创板和港股上市。

ChatGPT和GPT-4的魅力

为什么ChatGPT和GPT-4能让我们直观的感受到这波AI与过往的与众不同和强大之处?主要可以从以下几个方面来看:

第一,从用户角度来看,这次属于非常类人的交互方式。与ChatGPT进行对话时,内容是逐字逐句生成的,一边在思考,一边在生成回答。同时,它还具备多轮对话的能力。此外,它还能扮演一些角色,例如翻译官、心理咨询师等。

第二,泛化能力,主要体现在没有上下文的情况下,能够快速理解需求,并给出相对准确的回答。这背后依赖于海量的预训练语料和提示工程的支持。

第三,思维链。能够理解上下文和语境,甚至是长文本。如最新发布的Claude2,上下文处理能力达到10万token,基本可以将整本书喂进去让它处理。同时,还有强大的逻辑推理能力,能够将问题按照人类的思维处理方式逐步拆解和推导。

这些能力其实都是伴随着模型参数的增加以及训练时间的延长,才涌现出来的。此外,我们可以看到GPT-4在人类各项考试方面,成绩也非常优秀,基本上可以达到准大学生的水平。

大语言模型的构成

回到大语言模型本身,推荐大家去看OpenAI联合创始人Andrej Karpathy之前在微软开发者大会上分享的State of GPT主题演讲。他将大模型的训练过程拆解成了四个阶段:

预训练阶段,需要庞大的、相对低质量的训练数据(包括书籍、互联网爬取、论文等)和整个大模型训练过程中的99%的算力和时间,来训练出一个基础模型。例如,训练一个6500亿参数的LLaMA基础模型,需要2048张英伟达A100 GPU,耗时21天,整个训练成本在500万美元左右。因此,训练一个基础模型对于初创企业来说并不友好,这样的资源和成本一般只有大厂才具备。

第二步是在基础模型上进行有监督、微调,从而训练出SFT model,例如Vicuna-13B等常见的开源模型,都是经过监督微调的模型。在这个阶段,只需要提供少量的、高质量的数据,算力需求也比较少。

第三、第四阶段是奖励建模和强化学习阶段,也就是RLHF人类强化反馈学习。通过这两个阶段,模型的输出结果会远远优于监督微调模型和基础模型,但会牺牲掉基础模型的熵。

从一级市场产业角度看AI机遇

从一级市场投资角度系统性地看AI投资机遇,主要可以将其分为基础层、部署层和应用层,AI模型社区贯穿了这三层。

基础层又可以分为基础设施层、数据层和算法层。

基础设施层的最底层是算力,也是目前面临最直接卡脖子的地方,如今英伟达和AMD的GPU都存在对国内禁运的问题。国内算力龙头华为鲲鹏,也面临流片难题,未来中国在高端算力方面可能会面临越来越大的压力。同时,这里还存在GPU利用率的问题,即便是OpenAI,有大量英伟达工程师常驻在现场人工调优,但其GPU利用率也只有50%-60%。算力之上是围绕着大模型的基础软件层,例如AI原生的数据存储、数据传输、数据安全等围绕着数据的各类工具和开发运维平台,具体包括向量数据库、LLMOps、MLOps等。

数据层可能存在较多机遇,因为基础模型未来可能是头部公司在做,同时还会有大量开源的基础模型存在,所以没有必要花大量资金去开发自己的基础模型。应该将精力放在垂直行业和企业自身的数据积累,以及如何形成客户愿意付费的大模型应用上。目前,大模型最大的痛点是如何获得高质量数据集和垂直行业数据集,大家看到了大模型在工业、科学、医疗、法律、金融、教育等领域的潜力。未来的机会可能就在如何高效地获取高质量数据,如何处理多模态数据,如何标识符化,如何让数据资产化,如何确权,如何交易,如何保护安全等方面。

算法层的核心在于深度学习框架和基础模型

深度学习框架可谓是AI的操作系统,向下统筹调用算力资源,向上承接AI算法模型的构建能力,提供大量的算子库、模型库以及文档教程等,本质上也是一种生态,降低开发门槛。目前,全球主流的深度学习框架主要是谷歌的TensorFlow和Meta的Pytorch,国内主要有百度飞桨、华为昇思和之前被光年之外收购的Oneflow。

基础模型本身也存在着多样性,例如从技术路径上来说有CNN、RNN、GAN、Transformer等,Transformer模型又可以分为自编码模型、自回归模型、编码器-解码器模型等,从形式上又可分为闭源和开源等。这个方向是最有可能诞生出市值千亿,甚至万亿的公司,但同时也是竞争最激烈的主战场。

在百模大战的时代,模型评测成为了衡量各类模型能力的核心工具。目前,市面上已出现面向传统小模型(GLUE、SuperGLUE等)、针对大语言模型(HELM、BIG-Bench等)和针对中文大语言模型(SuperCLUE、C-Eval等)的各类评测工具。像SuperCLUE和C-Eval,在其评测集内增加了大量具有中国特色的问题(毛泽东思想、马斯克主义基本原理等)和中文特性(成语、诗词、文言文等)等维度。从评测结果来看,除了GPT-4、GPT-3.5和Claude,国内大模型产品在整体评测表现上都优于其他海外模型,因此训练中文大模型的必要性非常高。


12下一页

路过

雷人

握手

鲜花

鸡蛋

本文导航

最新评论

QQ|手机版|小黑屋|博士驿站:连接全球智慧,共创博士人才生态圈 ( 浙ICP备2023018861号-3 )平台提供新鲜、免费、开放、共享的科技前沿资讯、博士人才招聘信息和科技成果交流空间。 平台特别声明:线上内容(如有图片或视频亦包括在内)来自网络或会员发布,均已备注来源;本站资讯仅提供信息和存储服务。Notice: The content above (including the pictures and videos if any) is uploaded and posted by user , which is a social media platform and only provides information storage services.

GMT+8, 2025-12-1 16:39

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

返回顶部