(通讯员:李伟夫)近日,公司陈洪教授人工智能与统计学习课题组以“Huber Additive Models for Non-stationary Time Series”为题,在International Conference on Learning Representations(ICLR 2022)发表研究论文。ICLR是人工智能领域的顶级会议,得到国内外学者的广泛认可。
稀疏可加模型在处理时间序列数据时表现出良好的灵活性和可解释性。然后,现有的方法通常假设时间序列数据是平稳的,且服从高斯分布。对于金融和医疗领域等经常出现的重尾非平稳时间序列数据,这两种假设都过于严格。为了解决该问题,该论文提出了一种自适应稀Huber可加模型 (SpHAM) ,以实现面向非高斯数据和(非)平稳数据的稳健预测。理论上,对于平稳和非平稳时间序列数据,论文建立了独立于观测混合条件的泛化误差界。特别地,非平稳时间序列情形的误差界包含数据分布随时间变化的差异度量,借助该差异度量的经验估计可用于改造正则模型的惩罚项。应用上,该方法在合成和真实基准数据集上显示了良好的性能。
传统稀疏可加模型与论文方法的差异如下表所示:
下表显示了SpHAM在不同噪声、不同种类(平稳、非平稳)时间序列数据下的有效性:
该研究是陈洪教授前期可加模型系列CCF A人工智能顶会工作(H. Chen, X. Wang and H. Huang, NIPS 2017; X. Wang, H. Chen and H. Huang, NIPS 2017;G. Liu, H. Chen and H. Huang, ICML 2020;Y.Wang, H.Chen et al., NeurIPS 2020)和人工智能顶刊工作(H. Chen, Y. Wang, C. Deng and F. Zheng, TNNLS 2021)的进一步延续和深入,得到了国家自然科学基金面上项目等的资助。该论文合作单位包括京东探索研究院、悉尼大学等。陈洪教授指导的博士研究生王英杰为论文第一作者,陈洪教授为论文通讯作者。
(编辑:熊锦 审核:石峰)