专访全国政协委员贺晗:于“ChatGPT”风潮中寻找国产AI生态蝶变先机
2023年02月16日 18:02
来源:中新网山西

  中新网山西新闻2月16日电 (记者 杨杰英) 在AI基础设施方面,国内与发达国家还存在差距。贺晗认为,底层技术能力的提升首先需要的是基础设施建设。

  打造数字经济集群、数字经济基础设施建设、推动数字经济与实体经济的融合发展等,在不少省市自治区《政府工作报告》中被重点着墨。

  全国两会召开前夕,ChatGPT爆火出圈,或成为里程碑式的AIGC应用。

  其背后的生成式人工智能技术如何为国内元宇宙和数字经济发展注入新动能,ChatGPT又可为我国数字经济、元宇宙的发展带来哪些启示?

  作为第十四届全国政协委员、天娱数科副总经理、山西数据流量生态园董事长,生于1988年的贺晗是本届全国政协委员中最年轻的一位。

  产业数字化大有可为

  “数字经济与传统产业、与实体经济是分不开的。”贺晗指出。

  党的二十大报告提出,加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。发展数字经济是建设数字中国的重要内容,是建设现代化产业体系的重要基础,是推动经济实现质的有效提升和量的合理增长的重要举措。

  在贺晗看来,数字经济是以数据为生产要素的经济活动的总称,其中最重要的两个关键词,即数字产业化和产业数字化。

  “我们很多地方对数字经济偏好大都停留在数字产业化上,即期望能够带来多少新产业新业态新模式上,对产业数字化认识不够。”贺晗告诉记者。

  按照其预计,产业数字化是给传统产业数字化赋能,对传统产业改造升级,很多数字化改造是颠覆性的,这是一场革命,不亚于前几次技术革命,市场空间巨大。

  根据产业内数据统计,2021年中国数字经济规模达45.5万亿,数字产业化占数字经济比重为18.3%,占比逐年下降;产业数字化占数字经济比重达81.7%,占比逐年提升。由此能看出,产业数字化带来了更强的增长动能。

  贺晗基于此大胆提出,产业数字化强调的是数字技术与实体经济的深度融合,本质是通过数字化带来全要素生产率的提升,核心是数据、算法、算力与场景的结合,空间是对120万亿GDP的重新解构。

  一个典型案例是在传统公路货运领域。卡车司机一大早去货站的小黑板上寻找货源,三五天才能有所收获,之后开空车去装货,一来一回空载几十甚至上百公里,这是过去的常态。

  在产业数字化的背景下,车源与货源充裕且精准配对,即可实现整个行业的降本增效。

  “这个行业就有7万亿的市场规模。”贺晗指出。

  通过数字化升级改造将整个货运物流过程数据化,让物流行迹变得有据可循,通过数据对其中各个环节进行定向定性分析和预判,随着数据的积累、算法的优化和算力的提升,将使整个货运网络达到最优的运行状态,使得车源与货源充裕且精准配对,实现整个行业的降本增效。

  有效的虚实融合生态

  据了解,元宇宙作为数字经济的一部分,也是多个地区发力数字经济的重心。

  贺晗分析指出,元宇宙通过数字技术链接虚拟与现实,实现数字世界与现实世界的互联互通,发展元宇宙并不是“脱实向虚”,而是“虚实融合”“以虚促实”。

  发展元宇宙需要突破关键数字技术,夯实数字基础设施,这属于数字产业化的范畴。

  其中的关键节点包括如何通过三维重建、动作捕捉、深度学习等技术提升虚拟数字人沉浸交互体验;如何推动大规模预训练模型等技术在语言、图形、视频等方面的融合应用;建设大规模公共算力集群,支撑大规模图像渲染、模型训练、智能决策等高性能算力应用;聚焦海量数据连接和传输需求,培育5G+、卫星互联网、Wi-Fi7、IPv6等网络生态,打造高性能通信网络等。

  “不论是前沿数字技术还是数字基础设施,都是当下整个数字产业化发展的关键。元宇宙与商业、文旅、工业、城市服务等各领域虚实融合发展模式正在有效形成。”贺晗称。

  虚拟数字人在电商直播、在线培训、影音娱乐、服务咨询等多个场景已经开始替代真人。

  其中顶流级的虚拟人天妤,在过去一年就有多款虚实融合跨界共赢的样板案例引发关注。

  “从背后的运营数据可以清晰看出,虚拟数字人可在多个环节和场景中实现降本增效。”贺晗指出。

  相应的逻辑正在更大的产业范畴内开花结果。

  在工业领域,以数字孪生工厂为例,贺晗分析指出,通过建设高精度、可交互的虚拟映射空间,对工业制造全环节进行建模仿真,可实现各环节协同和生产流程再造,从而达到对产品的仿真设计、测试验证和优化,对设备的运维巡检和远程维修等。

  加快基础设施建设

  ChatGPT爆火出圈,为人工智能产业发展带来新的动能,有望推动数字经济时代的产业转型升级。ChatGPT的核心是用海量数据和海量算力对算法模型进行长期重投入的训练,系统性提升底层技术能力。

  贺晗认为,中国科技企业目前更多注重实际场景运用,这与经济发展阶段有关,当下中国有大量的传统行业需要迅速借助数字化实现生产力提升。但长远来看,底层技术能力的欠缺会限制产业数字化的发展空间,甚至,类似ChatGPT大规模预训练模型本身也会成为“卡脖子”技术。

  在AI基础设施方面,国内与发达国家还存在差距。贺晗认为,底层技术能力的提升首先需要的是基础设施建设。

  产业发展的着力点,可围绕数据、算法、算力三个方面展开。

  数据方面,互联网英文数据汇聚全球数据信息,互联网中文数据在部分指标方面尚难以企及。

  譬如美国有全球最多的高质量的开源数据,如ImageNet、VisualData等,涵盖了目标检测、图像识别、自动驾驶、自然语言处理等绝大部分人工智能研究方向;其公共数据开放起步较早,已建立起全国性的政府数据开放平台。早在2009年上线的美国data.gov网站,即发布了农业、商业、气候、教育、能源等多领域的高质量公共数据,至今仍在不断更新。

  贺晗指出,从覆盖范围、开放程度、共享程度、交易效率几个维度来看,我们都有许多功课要补。

  算法方面,贺晗认为,发达国家已有成熟的开源生态,开源项目基本覆盖目前主流技术领域。

  一方面,依托开源通过“集众智”的模式突破单一组织边界和资源限制,集结海量用户创新力量,在标准化平台上加速算法生产和迭代;另一方面,通过开源,降低AI算法运用门槛和创业门槛,对繁荣产业生态起到了至关重要的作用。

  “正是由此产生了大量贴近C端用户的内容服务,这也成为了AIGC能够现象级爆火的条件之一。” 贺晗分析指出。

  算力方面,根据工业和信息化部披露数据,近几年我国算力总规模发展较快,目前已超过140EFLOPS(每秒浮点运算次数),算力规模排名全球第二,排在美国之后,但规模差距在逐步缩小。

  贺晗认为,在AI领域,对于大量进行模型训练和推理的科技企业来说,算力的瓶颈并不体现在算力的绝对规模上,而在于实现算力的单位成本,而这一成本又与芯片技术密切相关。

  目前国内算力的单位成本居高不下,也是一些科技企业发展AI的短板之一。

  “希望相关行业主管部门通过规划指引、财政补贴、试点示范、揭榜挂帅、产业基金等方式,鼓励科技企业围绕算法模型开源、开源数据集建设、数据要素共享流通、中英文数据互补、智能算力集群建设等关键点进行长期投入,加快数据、算法、算力基础设施建设,形成生态。” 贺晗指出。

  通过降低AI开发和应用门槛,让AI融入千行百业,方可为产业数字化注入更强劲的动能。(完)

【编辑:张怡】
热点视频