统计模型可替代大模型降低成本

腾赚网 112 0

在2025中国国际大数据产业博览会期间,中国科学院院士、清华大学讲席教授陈松蹊接受采访时指出,面对高昂的大模型训练成本,并非所有问题都需要复杂模型来解决。部分企业和行业可优先采用统计模型,在实际需求基础上逐步引入如CNN等复杂人工智能模型,既能控制成本,也能满足业务需求。

陈松蹊强调,统计学是连接各领域数据应用的核心基础。他的团队在大气环境研究中,通过密集监测数据追溯沙尘暴变化;在医疗领域,发现脑电图数据在癫痫诊断中具有关键作用。尽管不同领域数据来源不同,但在统计分析上却存在共性。统计学不仅能给出估计结果,还能衡量不确定性,与人工智能形成互补。清华大学统计与数据科学系正聚焦于人工智能与统计方法的不确定性度量问题,力求通过科学手段提升模型可靠性。

高质量数据集的构建是推动智能技术发展的关键环节。目前,陈松蹊团队正在打造西太平洋高质量海洋数据集,测试表现已达到国际水平,部分指标甚至超越欧美国家。他指出,中国在统计学理论与应用场景方面已进入世界前沿,具备自主构建高质量数据集的能力,无需过度依赖国外资源。

在人才培养方面,清华大学于2024年7月成立统计与数据科学系,致力于统计学课程体系与教材建设,培养高水平数据分析人才。随着数据科学在商业、医学、工程等领域的广泛应用,数据分析人才缺口日益凸显。与此同时,隐私计算也成为研究热点。陈松蹊团队基于统计学原理,提出一次性加噪算法,有效平衡隐私保护与数据可用性之间的矛盾,为数据安全提供新思路。

抱歉,评论功能暂时关闭!