新质生产力看视谷③|全球前沿科技亮“剑锋”,杭州何以抢滩大模型之争
2024-07-22 10:55:20 世界浙商
编者按:“中国视谷”国家经济地理新地标是国家新质生产力的重要驱动力之一,是浙江因地制宜以科技创新推动产业创新的典型案例,也是杭州构建新质生产力全要素矩阵、建设现代化产业体系的重要载体。2024年,《浙商》杂志开设“新质生产力看视谷”专栏,以“中国视谷”为切口,多维度展现杭州以前瞻性视野、落地性举措探寻新质生产力飞跃,培育世界级先进制造业集群的突破路径。
当前,全球技术创新步入密集活跃期,国内“百模大战”酣战一年格局初显,人工智能大模型整体呈现爆发式发展,逐渐成为产业新型基础设施,加速转动商业化应用齿轮。
大势之下,让我们一起探寻全球大模型生态的发展步伐与涌现了哪些强悍的大模型,崛起了哪些新兴应用?以杭州为代表的国内城市又是如何抢滩大模型阵地,打造新质生产力加速发展的重要“引擎”?
一、溯源进阶:科技巨头引领全球创新潮流
大模型的提出与实践标志着人工智能的研究步入了通用人工智能时代,已成为新一代人工智能产业的核心驱动力,成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。
图:大模型技术迭代历程 来源:《人工智能图景展望:跃迁点来临(2023)》
2022年,AIGC初步呈现爆发态势。其中,最引发市场关注的是Stable Diffusion和ChatGPT。
Stable Diffusion文本转图像模型于2022年10月发布,推动 AI绘画作品风靡一时。当年年底,ChatGPT惊艳问世,其人机文本对话功能和文本创作能力将机器水平推向新高,代表AI家族率先撕下“人工智障”的标签,被视作通往通用人工智能的一条重要路径,开启“人机互生”新阶段。
一年前的3月15日成为AIGC时代来临的关键节点。OpenAI发布多模态预训练大模型GPT-4,引发了全球科技巨头“互掰手腕”、中国市场“百模大战”的连锁反应。
随后,OpenAI又在2024年初输出了现象级“爆款”——视频生成大模型 Sora,60s一镜到底的电影级视频“硬控”了每一位见证者。
图:国内外大模型基座发展示意图 来源:《大模型关键技术与未来发展方向——从 ChatGPT 谈起》
从全球范围看,世界各地积极推动大模型研发和应用,美国、中国是主要“玩家”,而英国、加拿大、新加坡等国家和地区尚处于前期尝试阶段,仅个别头部企业开始应用。
现阶段,国外大模型领域主要呈现三大发展模式,包括“龙头大模型+原有业务”、“龙头大模型+外部行业数据”、“开源大模型+自有行业数据搭建行业大模型”,最具代表性的有OpenAI模式、微软模式、谷歌模式等,已在自然语言处理、计算机视觉、智能语音等领域取得了标志性技术突破,在模型精度、通用性和泛化能力等方面实现了跨越式发展。
二、大模型之争:“千模大战”与“四省争霸”
大模型之争在国内产业界日趋“白热化”,“百模大战”逐渐演变为“千模大战”。
相比国外大模型“龙头效应”显著,国内大模型的发展模式主要包括“自有通用大模型+外部行业数据”以及“自有或其他开源大模型+自有行业数据”。
大模型可分为通用大模型和行业大模型两大类。我国具有代表性的通用大模型主要包含百度“文心一言”、阿里巴巴“通义千问”、科大讯飞“讯飞星火认知”等;行业大模型主要涵盖蜜度“文修”、容联云“赤兔”、用友“YonGPT”等。根据运行载体不同还形成了端侧和云侧大模型,如端云结合的有vivo“蓝心”大模型,端侧主要以蔚来“NOMI GPT”大模型为代表。
截至目前,国内AI大模型市场尚未出现爆款级应用,其红利和贡献还远未被发掘。下一步,从基础研究角度看, 更强的自主可控和建模能力是我国下一代大模型技术基础研究的两大核心任务。
图:基于大语言模型的多模态大模型通用结构 来源:《大模型关键技术与未来发展方向——从 ChatGPT 谈起》
大模型在行业内“争奇斗艳”,城市之间也“打”得火热,托举中国大模型实力稳居全球第一梯队。
据中国信息通信研究院近《全球数字经济白皮书》显示,全球人工智能大模型数量为1328个,美国位居第一位,占比44%,位居第二位的中国大模型数量占比为36%。《中国人工智能大模型地图研究报告》显示,全国14个省市/地区均在开展大模型研发,北京、广东、浙江、上海等地的大模型数量最多,也是将近三年人工智能服务器采购数量最高的地区。
截至2024年3月28日,通过国家互联网信息办公室备案的大模型名单有117个,其中,北京51个,上海24个,广东19个,浙江9个,大模型数量占全国总模型数量的88%。
北京占据AI大模型的“半壁江山”,其中“百模大战”的第一枪正是由北京百度网讯科技有限公司打响。
图:浙江省生成式人工智能服务已备案信息 制图:“中国视谷”融媒体中心
浙江则是大模型孕育的繁荣之地、大模型应用的领先之地。截至2024年4月29日,浙江已备案如阿里巴巴“通义千问”、新华三“百业灵犀”、同花顺“问财”等11项生成式人工智能服务。还有一大批垂直类大模型以及处于内测、未开放给公众的大模型不断壮大,譬如,“中国视谷”正在突破发展超大模型类脑计算,培育类脑计算自主框架和算法平台,加快超大模型在机器视觉、多模态、人机交互等领域应用。
综合来看,浙江省泛人工智能企业主要集中在环杭州湾地区,省内现有大模型也大多数诞生于杭州,成为了杭州助力浙江加快培育新质生产力的强大引擎。
三、城市案例:杭州打造“模型即服务”新模式
当前,杭州加速引领全省人工智能产业的特色化发展,推进“模型即服务”新模式,支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型,鼓励相关技术和算法开源开放,推动“中国视谷”产业生态企业合力探索大模型的商业化应用进程,形成“1+N+X”的协同创新、双向赋能产业生态。
图:MaaS模式下的AGI基础业态分析 来源:《人工智能图景展望:跃迁点来临(2023)》
例如阿里巴巴“通义千问”已迭代2.5版本,落地应用速度不断加快,赋能天文、PC、文旅、航空、矿业等多个领域,已服务超9万家企业,累计下载量突破700万。
图:通义千问”已迭代2.5版本 来源:阿里巴巴
“达到GPT4级的国产大模型主动开源,拉平了开源、闭源模型之间的差距,让普通开发者也能用上最好的AI模型,大大加速了大模型的应用落地进程。”阿里云CTO周靖人表示,开源开放战略将为大模型服务企业带来新的商业增长。
新华三集团则一直积极推动智能算力的创新与发展,秉持“1+N”大模型策略,以国内首发的私域大模型百业灵犀(LinSeer)为基础,开放合作了N个业界优秀的通用大模型和行业细分大模型,为垂直行业和专属地域客户提供订制、独享、生长的智能化服务。
图:灵犀大模型 来源:新华三
再看宇视科技。2023年,宇视率先推出了“梧桐”大模型,并与多家行业龙头联合启动“种子合作伙伴计划”,2024年又推出了升级版“梧桐2.0”,并发布“猎光2.0”AI-ISP图像引擎感知终端等一系列大模型产品,打响了AIoT行业“装备大模型化”的第一枪。
此外,还有海康“观澜”,大华“星汉”、安恒信息“恒脑·安全垂域大模型”、恒生电子“Light-GPT”、实在智能“塔斯”, 以及致力于大模型与智能体技术普惠落地的联汇科技。
杭州的大模型生态呈现“百花齐放”的态势,充分发挥了链主作用,并部署集聚更多国内软硬件设备厂商、核心元器件厂商、解决方案应用商协同发展,共同做强做优做大智能物联产业集群。
四、展望未来:算力像水电即取即用
无论是技术演进还是应用升级,大模型的发展仍是强调人工智能技术变革的本质——算法、数据、算力三大核心要素。
算力资源的稀缺性是制约大模型发展的关键瓶颈,芯片作为AI的“超级大脑”便显得尤为重要。
图:NVIDIA Grace CPU 超级芯片 来源:英伟达
今年,英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上官宣了最新量产版的Blackwell芯片。但基于英伟达芯片“一卡难求”的现状,我国本土的高性能芯片形成了以华为海思、寒武纪、地平线、昆仑芯等为代表的龙头引领,部分解决方案正逐渐替代英伟达成为科技大厂的优选,但仍与国际顶尖水平存在一定差距。
在数据对比上,国内AI 大模型数据来源于互联网、电商、社交、搜索等渠道,存在数据类型不全面、信息可信度不高、中文数据库体量不足,以及有效数据源呈现碎片化分散状态等问题。
总体而言,大模型的爆发式发展面临着算力限制和高质量训练数据集匮乏两大难题,有望倒逼算力基础设施建设加强,以及数据在大规模、多模态、高质量三大维度上的全面提升。
作为国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区,杭州市围绕促进人工智能与实体经济深度融合这一主线,去年出台了《关于加快推进人工智能产业创新发展的实施意见》《关于高标准建设“中国视谷”高质量发展视觉智能产业的实施意见》等系列政策。
文件显示,杭州的目标是到2025年基本形成“高算力+强算法+大数据”的产业生态,打造成为全国算力成本洼地、模型输出源地、数据共享高地,人工智能创新应用水平全国领先、国际先进。
杭州一要建设算力中心,创建国家公共算力开放平台,打造算力高地和模型输出高地;二要推进算力供给市政化,设立“算力券”重点支持中小企业购买算力服务。
例如,1月25日,在“中国视谷”建设主阵地萧山区,新华三与政府共建的人工智能新高地图灵小镇正式启用AIGC智算中心,规模可达2300P,相当于100万台PC电脑的算力,打破了过去算力分散且成本高昂的瓶颈。“中国视谷”核心区之一滨江区也于6月上线杭州人工智能计算中心三期,进一步落地“算力券”和免费适配等一系列鼓励使用自主创新算力的措施。中心成立两年来,已服务企业和组织机构160余家,联合了浙江大学等十余所高校与科研院所深入创新,成功孵化超过50个行业大模型和应用创新。
抢滩未来,杭州这座数字之城加快实施“人工智能+”行动推进数字经济二次攀登、五大产业生态圈提能增效,推动以大模型为代表的新技术加速规模化、体系化发展,在“中国视谷”的建设进展中不断孕育发展新质生产力的关键变量。有朝一日,算力或许如水电一般即取即用,AIGC步入新一轮爆发期,人工智能全面赋能新型工业化,推动人类社会快速迈入高度智能化时代。