文章来源:
腾赚网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wulanwray@foxmail.com 举报,一经查实,本站将立刻删除。
在2025中国国际大数据产业博览会上,中国科学院院士、清华大学讲席教授陈松蹊指出,面对高昂的大模型训练成本,并非所有问题都需要复杂模型解决,部分行业可优先采用统计模型,再视需求引入CNN等人工智能模型。他强调,统计学是串联各领域数据应用的核心基础,数据虽来源广泛,但在统计分析中常展现出共性,为跨领域研究提供了可能。
陈松蹊团队已在多个领域展开深入研究,例如通过空气质量监测数据溯源沙尘暴变化,同时发现沙尘暴与癫痫发作的数据在统计特征上存在相似性。统计学不仅能给出估计结果,还能衡量不确定性,与人工智能形成互补。清华大学统计与数据科学系正聚焦人工智能模型的不确定性度量问题,并在高质量数据集构建方面取得突破,如西太平洋海洋数据集测试表现已达到甚至超过国际水平。陈松蹊表示,中国统计学研究已跻身世界前沿,具备自主构建高质量数据集的能力。面对数据分析人才缺口,清华大学于2024年成立统计与数据科学系,致力于培养拔尖创新人才。在数据隐私方面,团队提出一次性加噪算法,兼顾隐私保护与数据可用性,为隐私计算提供新思路。
抱歉,评论功能暂时关闭!