数据评估

🚧 功能预告：该功能即将上线，敬请期待。

在用数据做预测或训练模型之前，需要先了解数据质量是否过关。数据质量评估从三个角度给数据打分：数据完不完整、规不规律、序列之间有没有关联，分数越高代表质量越好。

三个评估维度

这个分数告诉你：数据有没有缺、有没有乱。

传感器掉线、网络抖动、重复上报……这些问题都会让时间序列数据出现空洞、重复或错位。完整性分数反映的就是这些问题的严重程度。

如果完整性分数低，后续的预测或分析结果会受到影响——模型可能学到错误的规律，或者因为数据空洞而产生偏差。建议先处理数据问题再继续。

这个分数告诉你：这条数据”有没有规律可循”。

有些数据天然有规律——比如每天固定时段的用电量、随季节变化的温度。有些数据则更像随机波动，比如某些金融数据。可预测性分数反映的就是序列的规律程度。

如果可预测性分数低，并不代表数据有问题，而是说明这条序列本身波动性强、难以预测。此时需要结合业务判断，决定是否引入其他变量辅助预测，或降低对预测精度的期望。