Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请问有什么方法适用于多份时间序列吗 #56

Open
Enderfga opened this issue Sep 21, 2022 · 7 comments
Open

请问有什么方法适用于多份时间序列吗 #56

Enderfga opened this issue Sep 21, 2022 · 7 comments
Labels
enhancement New feature or request

Comments

@Enderfga
Copy link

我想把HyperTS用在一个新冠患者人数的数据集中,所以有不同国家相同时间段的数据,国家是否可以作为协变量?同一时间点有多个国家的数据,而且时间长度有差异

@zhangxjohn
Copy link
Collaborator

目前,协变量支持的功能性是突出某时间点是否与其他时间点存在差异性。如果您想多国家一起预测,那么如果所有国家在时间点上是对齐的,可以采用多变量预测来建模。

@Enderfga
Copy link
Author

训练集是多国家的时序数据 测试集是新的国家的未来数据 请问这样的功能可以实现吗

@zhangxjohn
Copy link
Collaborator

这样大概是不行的,数据已经不是同分布了。

@yunchenran
Copy link

我也有同样的问题,比如预测商家/商品销量,不同商家/商品的销售时间可能是做不到一一对应的,这种情况下如果要用这个库有没有示例呢?
把所有商家的销量和特征放到一个训练集里会报错么(因为会出现相同或不连续的时间)

@zhangxjohn
Copy link
Collaborator

我也有同样的问题,比如预测商家/商品销量,不同商家/商品的销售时间可能是做不到一一对应的,这种情况下如果要用这个库有没有示例呢? 把所有商家的销量和特征放到一个训练集里会报错么(因为会出现相同或不连续的时间)

是不同商家/商品出现了采样缺失吗(即没有销量无记录状态)?
如果是这样,您可以对于数据先做一个简单的处理,依据所有商品的销量的最小时间频率对齐所有商家的所有商品销量,其中补充出的时间特征位置可以置0(即该时间点无销量)。

@yunchenran
Copy link

依据所有商品的销量的最小时间频率对齐所有商家的所有商品销量
嗯嗯 好的 感谢。
另外这种情况下数据里的商家/商品的 ID 假如不想当特征的话,是直接忽略掉就可以么,这样一份数据里同一天的数据可能出现多个样本是 OK 的么?还是说只能对单个商家/商品分别建模(但是这样的量级可能无法接受)
还有就是这种选择预测模式的话是算作多变量时序预测?

@newbei
Copy link
Collaborator

newbei commented Sep 29, 2022

你好,对于以上提到销量预测的数据情况,可以这样处理:
1、将商品/商品的ID两列拼接为一列"商家_商品ID"列
2、通过行转列的方法(可以用pandas 的pivot_table方法),将每个商家_商品ID值,转成时间序列。

预测模式选择多变量预测。

@zhangxjohn zhangxjohn added the enhancement New feature or request label Sep 30, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

4 participants