自2021年起,生成式人工智能(以下简称“生成式AI”)连续两年入选Gartner 《Hype Cycle for Artificial Intelligence》[1] ,被认为是未来重要的AI技术趋势。2022年以来,生成式AI产品不断涌现,生成内容模态多样,引起广泛的关注和讨论。2022年11月,OpenAI发布chatGPT[2],定义为优化对话语言模型(Optimizing Language Models for Dialogue),仅用2个月就创造了APP用户过亿的新记录。此前,APP用户破亿最快的记录是字节跳动TikTok的9个月,每个创造用户过亿时间记录的APP都成为了一个时代的符号,ChatGPT的的发布同样具有划时代的意义。 ![]() 图:APP用户过亿时间表(数据来源:UBS / Yahoo Finance) ChatGPT具备强大的对话能力和生成能力,可以回答后续问题、承认错误、挑战不正确的前提、拒绝不适当的请求,这意味着ChatGPT能够颠覆搜索行业,在智能客服、游戏、虚拟人等领域也将得到广泛应用,从ChatGPT到AIGC,AI已经成为新时代新的生产力。 一、ChatGPT发展现状 ChatGPT由大规模预训练语言模型GPT-3.5微调得来,在理解能力、结果准确性、识别非法与偏见能力上均能取得更优效果,不仅在日常对话、专业问题回答、信息检索、内容续写、文学创作、音乐创作等方面展现出强大的能力,还具有生成代码、调试代码、为代码生成注释的能力。ChatGPT发布后5天用户已超百万,而OpenAI之前发布的GPT-3用了将近两年的时间才突破100万用户。 ChatGPT相较于GPT-3具有支持多轮对话、易于修正、人机交互效果更好、更快、更高效等优势,更适合应用于人工智能客服、搜索引擎、智能客服、虚拟人、代码编程、文学创作等领域。微软目前整将ChatGPT整合进旗下搜索引擎必应(Bing),提高必应在搜索引擎市场的市占率;同时Chat-GPT功能引入Office,用于部分文本的生成和问答。 ChatGPT带动AIGC(AI-Generated Content)的革新。AIGC[3]指利用人工智能技术自动生成的内容,与此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比,代表人工智能构思内容的AIGC,是新一轮内容生产方式变革,而且AIGC内容在Web3.0时代也将出现指数级增长。ChatGPT模型的出现对于文字模态的AIGC 应用具有重要意义,未来,与图形模态的AIGC相结合,有望打造从文字描述到图片生成的AI创作辅助工具,对AI产业上下游产生重大影响[4] 。 国内生成式AI产品以语言生成类和视觉生成类为主,其他应用类型处于探索阶段。文本生成类产品如百度的“文心ERNIE3.0”,可实现小说诗歌创作、新闻内容生成、商业文案生成。音频生成产品如网易的“天音”可实现自动编曲。图片生成类应用如百度的“文心一格”,其创作出的作品效果接近人类作品。 同时,国内部分企业也陆续推出新工具和平台,可生成数字内容、合成数据等。华为云推出数字内容生产线MetaStudio,该平台具备3D模型制作、云渲染等能力,可用于虚拟直播、虚拟视频内容制作。中国移动研究院实现了GAN生成NFV相关合成数据技术,并逐步探索结构化数据生成技术的落地路径。声智科技融合语言和视觉生成,基于Azero AIoT开发框架,生成多轮智能交互数字人[5],并成功应用在2022年北京冬奥会和冬残奥会和北京国际马拉松,以及全国人大、故宫博物院、环球影城等重点场景。 国外生成式AI产品应用方向多样,现象级产品迅速获取大量用户。根据知名创业组织Antler的统计,截止2022年年底,海外生成式AI产品数量达到190余个,包括视频、音频、游戏、数据、搜索等多种类型应用。同时,2022年年底图片生成应用Midjourney官方Discord中的关注人数超过百万,ChatGPT上线后一周内用户数量已近百万。 生成式AI产品在交互设计中,更注重用户体验。目前生成式AI产品形态包含插件、API网页交互、客户端等。其中,API网页交互无需下载安装产品,在云端即可获得生成内容,如用户可在百度的“文心ERNIE 3.0”产品网页中输入提示词生成内容。同时,生成式AI技术与搜索产品融合后,匹配内容、意图理解表现更好。例如,用户使用论文阅读助手SciSpace时,无需指定关键词即可搜索和查找相关论文,可提升阅读论文效率。 表:AIGC应用场景及所处发展阶段 表:AIGC国内外典型应用 二、ChatGPT带来的影响 ChatGPT强大的内容生成能力,引起了业界普遍关注,也加速了人工智能行业从决策式/分析式AI(Discriminant/Analytical AI)到生成式AI (Generative AI)的演化。 图:决策式/分析式AI(Discriminant/Analytical AI) VS 生成式AI (Generative AI) 决策式AI:学习数据中的条件概率分布,根据已有数据进行分析、判断、预测,主要应用模型有用于推荐系统和风控系统的辅助决策、用于自动驾驶和机器人的决策智能体。 生成式AI:学习数据中的联合概率分布,并非简单分析已有数据而是学习归纳已有数据后进行演技创造,基于历史进行模仿式、缝合式创作,生成了全新的内容,也能解决判别问题。 随着生成式AI技术的不断进步,生成模态不断更新,呈现多元化格局。按照生成模态划分,生成式AI产品分为文本生成(以ChatGPT为代表)、图片生成、代码生成和音频生成多个方向。2022年9月Meta发布自研视频生成大模型Make-A-Video;2022年11月,NVIDIA公司发布了3D模型生成工具Magic3D;同月WebAR软件平台解决方案商Geenee AR发布了AI WebAR内容创造套件RT3D AI SDK。生成模态的多元也推动了生成式AI的多行业应用。 图:生成式AI的多行业垂直应用 从机器辅助人跃迁到机器代替人。随着生成式AI的不断成熟,部分专业内容生产者将被替代。数据、算力的进一步提升将带来具有更强生成效果的AI,能够根据用户需求生成个性化定制内容终稿,并且AI生成内容达到专业内容生产者水平且具有独特新颖的创意,从而替代部分文字作者、翻译人员、插画创作者、配音人员、音乐制作人、视频编辑人员等等。 丰富数字内容供给侧供给。AIGC大幅度降低了数字内容生产的成本,打破了数字内容生产受到人类想象能力和知识水平的限制,广泛应用于文本生成、音频生成、图像生成、视频生成、跨模态生成及游戏领域,其广泛应用能够满足数字经济时代日益增长的数字内容供给需求。 创造新的生产力,带来巨大影响。生成式AI强调学习归纳后进行演绎创造,生成全新的内容,本质是对生产力的大幅度提升和创造,已催生了营销、设计、建筑和内容领域的创造性工作,并开始在生命科学、医疗、制造、材料科学、媒体、娱乐、汽车、航空航天进行初步应用,为各个领域带来巨大的生产力提升,在个人计算机、互联网、移动设备和云的规模上产生变革性的影响。 三、ChatGPT引发的思考 自1947年以来,AI领域取得的关键进展,(如Eliza、AlphaGo和chatGPT的发布),都是由西方主导,美国在AI技术发展的过程中不断进行颠覆性技术创新,尤其是最近十多年,更是建立先发优势和累加优势,逐步拉大中美在AI领域的差距。[6] -[7] 图:AI关键发展节点的符号产品 以chatGPT的发展历程为例: 2015年12月,OpenAI成立,探索大模型路线。 2017年6月,Google发布Transformer论文。 2018年6月,OpenAI发布GPT-1,参数量1.17亿,预训练数据量5GB。 2019年2月,OpenAI发布GPT-2,参数量15亿,预训练数据量40GB。 2020年5月,OpenAI发布GPT-3,参数量1750亿,预训练数据量45TB。 2022年11月,OpenAI发布chatGPT。 2023年2月,Google发布Bard。
从算力的角度看,以英伟达GPU的发展历程为例: 1999年,NVIDIA公司在发布其标志性产品GeForce256时,首次提出了GPU的概念。 2006年,NVIDIA公司推出了CUDA,这是一种通用并行计算平台和编程模型。 2017年,NVIDIA公司发布了全新Volta架构GPU—Tesla V100,这是训练chatGPT的GPU。
从AI重要分支ChatBot的发展历程来看:[7] -[10] 1966年,MIT发布聊天机器人ELIZA,主要用于辅助心理咨询。 2010年,Apple发布聊天机器人Siri,主要用在iPhone作为语音助手。 2015年,Amazon发布聊天机器人Alexa,主要用在智能音箱等智能硬件。 图:Chatbot的发展历程 回过头来看,国内也在追赶AI的热潮,在ChatBot方面快速跟进: 2015年,科大讯飞发布了AIUI,定义为人机交互服务新界面。 2016年,百度发布了DuerOS,定义为对话式人工智能操作系统。 2017年-2019年,小米发布了水滴平台,阿里发布了天猫精灵,腾讯发布了小微,微软发布了小冰,思必驰发布了DUI,这段时间的补贴竞争就是“百箱大战”。 2019年,声智发布了Azero 2.0,定义为多模态与 |
|手机版|小黑屋|博士驿站:连接全球智慧,共创博士人才生态圈
( 浙ICP备2023018861号-3 )平台提供新鲜、免费、开放、共享的科技前沿资讯、博士人才招聘信息和科技成果交流空间。
平台特别声明:线上内容(如有图片或视频亦包括在内)来自网络或会员发布,均已备注来源;本站资讯仅提供信息和存储服务。Notice: The content above (including the pictures and videos if any) is uploaded and posted by user , which is a social media platform and only provides information storage services.
GMT+8, 2025-6-30 07:02
Powered by Discuz! X3.5
© 2001-2024 Discuz! Team.