首页 > 车圈原创 > 车圈原创 > 中国信息通信研究院人工智能研究所李荪:人工智能正在由“模型为中心”转向“数据为中心”

中国信息通信研究院人工智能研究所李荪:人工智能正在由“模型为中心”转向“数据为中心”

发布时间:2025-09-21 22:20:47来源: 13041198719

9月21日,青海数据要素生态大会在西宁举行,本次大会以“激活数据要素价值,赋能青海高质量发展”为核心主题,会聚了众多行业领袖与专家,共同探讨数据要素与区域经济的深度融合路径。

会议期间,中国信息通信研究院人工智能研究所平台与工程化部副主任李荪,以“站在AI产业与企业端”的务实视角,结合团队研究实践,深入剖析了数据在人工智能领域的关键地位及未来趋势。

近年来,人工智能的发展有目共睹,AI大模型的创新应用也逐步进入日常生产生活。随着人工智能的模型训练及可信AI的研究实践加速深入,人工智能领域正在经历一场深刻的范式变革。

转向“以数据为中心”

自2022年开始,人工智能研究和应用重点逐步从“模型为中心”(Model-centricAI,MCAI)转向“数据为中心”(Data-centricAI,DCAI)。也就是说,在模型相对固定的前提下,通过提升数据的质量和数量来提升整个模型的训练效果。

“人工智能每次阶段性的进步,数据都扮演着重要角色,尤其在大模型时代,海量、高质量、多样化的数据集,成为拉开模型能力差距的关键要素。”李荪认为,人工智能持续演进对数据集提出了新要求,而且,大模型技术对数据集质量和工程路线也提出了更高要求。

在技术层面,大模型对数据集的要求主要体现在三个方面,包括规模可扩展性增强、多任务适应性增强以及能力可塑性增强。

具体来说,参数规模和计算量的增加带来了模型性能的持续提升,而一个模型能同时支持多种任务和多个模态,甚至实现跨模态,已成为新的技术追求。为了实现这些目标,迫切需要强化四类数据集的供给,包括多模态数据集、具身智能数据集、推理思维链数据集和长视频数据集。

李荪表示,这些数据集将使模型更加全面和精准地理解和处理任务,增强机器人在多样化环境和任务中的适应性和决策智能,并促进模型推理能力的大幅提升。

此外,大模型的研究训练中,进一步强化学习新范式聚焦于高质量推理型数据集,通过收集大量的推理相关训练样本和非推理训练样本,推理训练监督微调数据占比大幅减少,从而提高了模型的推理能力。

高质量数据集建设

数据产业和人工智能的发展离不开政策的助力,近年来,国家部委和地方政府加大对“人工智能+高质量数据集”的支持,政策协同效应开始显现。

作为数据要素领域的行动指南,《“数据要素×”三年行动计划》,强调打造高质量人工智能大模型训练数据集。2025年国务院国资委发布首批30项央企高质量数据集,覆盖了能源、物流等关键领域。

同时,《关于促进数据标注产业高质量发展的实施意见》的落地,提出通过提升数据集质量、扩大应用场景、强化技术创新等举措,为人工智能产业发展提供关键支撑。截至2025年3月底,沈阳、保定等7个数据标注基地建设高质量数据集335个。

而且,从地方层面的实践来看,高质量数据集建设已经在各地开花。比如,上海市明确“2025年形成1000个高质量数据集”的目标,苏州市发布首批30个工业、交通领域数据集,北京市、山东省等11个地区则通过奖补政策激励数据建设等。

李荪提出,“AI与数据的融合,最终要形成产业‘飞轮’”,优质数据集能支撑企业研发出更优行业大模型,而大模型应用落地后,又会采集到更多真实场景数据,反哺数据集迭代。基于此,她认为,未来拥有高质量数据的企业,会持续拉开与同行的差距。

不过,在AI与数据的融合落地实践中,仍存在一些问题。李荪指出,当前企业在构建数据集时普遍面临目标定位模糊、实施路径碎片化以及技术底座薄弱等挑战。许多企业陷入“为数据而数据”的误区,未能将数据工程目标与核心业务指标深度绑定,导致数据价值难以转化为模型性能的实际提升。

展望未来,李荪表示,随着技术的不断进步和应用场景的持续拓展,数据与人工智能的深度融合将成为不可逆转的趋势。

车圈原创更多>>

新款理想L6完成工信部申报!全能家用增程SUV值得入手吗? 雅马哈劲战125特别版引入赛道元素强化热血感 奥迪Q9内饰发布:比Q7更大 这台“9系旗舰”到底值不值得等? 全新沃尔沃XC60谍照曝光,将于2027年正式亮相 五菱星光L实车正式曝光!中大型家用SUV登场,大六座来了吗? 国轩高科7款新品:固态、钠电、储能齐发 预售39.98万元,浅析小鹏GX定价合不合理 昊铂S600预售20.99万起,4.3秒破百,双腔空悬+四驱 余承东官宣:200万级尊界S800 Grand Design典藏大观,定档6月 曝某传统合资头部豪华汽车品牌开始裁员 占比约8% 路特斯Emira将弃用现有梅赛德斯-AMG与丰田V6引擎! 4月香港MPV市场:中国品牌霸榜,埃尔法跌出前五,释放了什么信号 ­­智界V9上市发布,售价38.98万-51.98万元,重塑MPV高端市场格局 又一国产猎装车来袭,方程豹方程S GT路透图曝光,或第三季度上市! 星途ET5 EXEED OS 3.7.0 OTA重磅推送,全维安全进阶 变大的Smart:精致小车扛不住中国市场的铁拳 智界V9上市发布,售价38.98万-51.98万元,重塑MPV高端市场格局 从DTM经典到“夜光”艺术车,HWA Evo.R成为纽博格林24小时焦点 “锁电”辟谣之外:新能源车最该补的是信任课 大型SUV市场“神仙打架”4月销量榜 1款销量过万 极氪9X第二 绿紫新色炸场!一汽悦意08以轿跑之姿乱入,可谓颜值天花板 2026款海鸥正式上市 比亚迪把激光雷达下放到A00级 「 爱车空间 」大众品牌全球首款支持城市NOA的轿车来了! 1.5T+双电机 凯迪拉克XT5插混版申报图曝光 对标奔驰EQS 雷克萨斯TZ正式发布 破局存量竞争 比亚迪4月销量背后的技术加速度 2026款海鸥6.99万起!比亚迪把激光雷达塞进A00级小车 奥迪 E7X 开启预售 28.98 万起,德系豪华纯电添新将 传统与新贵的分水岭之间,奥迪E7X为豪华纯电定了新基调? 德系底子+城市NOA,上汽大众ID. ERA 5S工信部信息公布