FAQ: questions techniques et autres

Dataset

Comment faire de la Data Augmentation?

Nous proposons 4 type de data augmentation possible:

Une prédiction type « backward », sachant une séquence à prédire et son label, nous inversons l’échelle du temps et le modèle doit alors prédire lors du training la séquence d’entrée sachant le label.
Une prédiction type « random flip », nous allons faire des rotations de bodys sur des angles faibles [+-17 degré] pour rajouter de nouvelles « scènes » où sont pris les vidéos. Cette idée est motivée par [1]
Une prédiction type « Mixup ». Inspiré par [2], l’idée est de prendre deux squelettes d’humains et de concaténer le haut du premier squelette avec le bas du second squelette
Une prédiction type "Cutmix " [3] Cette prédiction est un raffinement de Mixup : On va prendre cette fois non une séparation (haut/bas) mais on va à la place prendre deux échantillons puis prendre aléatoirement des membres des deux personnes pour en faire un nouveaux sample

Pour pouvoir les utiliser, il suffit d'ajouter en argument à main.py --augment et de mettre "--prop 0.05,0.05,0.05,0.05". le premier est backward, le second flip, le troisième cutmix et le dernier Randmix. Il est à noter que notre implémentation ajoute les données augmentées au dataset et non les transforme.

J'aimerais avoir un nom de channel différent en entrée/sortie

Je n'ai pas compris exactement la relation entre enc_in,dec_in et c_out. Pour simplifier le problème, je crois avoir compris que enc_in et dec_in doivent toujours avoir la même valeur pour FEDFormer et j'ai fait à la fin une projection linéaire dans le cas où c_out est plus petit ( ou grand).

Pourquoi stocker un dataframe intermédiaire des données?

On a besoin de récupérer des informations intermédiaires sur les skeletons comme la longueur totale de la vidéo, le nombre de personne sur chaque vidéos... plutôt que de calculer ça à chaque fois, nous avons fait un dataframe qui permet en quelque seconde d'obtenir toutes ces informations.

Comment rajouter rapidement un Dataset à l'implémentation?

Pour rajouter son propre dataset, il faut créer un dataset pytorch qui va posséder les deux attributs fondamentaux getitem et len. Voir ceci pour plus d'explication. Dans la fonction getitem , il doit produire en sortie au moins 4 matrices qui sont:

entry, une matrice de la série temporelle de départ. Elle est de la forme (seq_len,nb_channel)
label, la matrice de la série temporelle à prédire. Elle est de la forme (pred_len,nb_channel)
time_value_enc, matrice de la série temporelle qui encode le temps en entrée.Il est de la forme (seq_len,)
time_value_dec, matrice de la série temporelle qui encode le temps pour le label. Il est de la forme (pred_len,). Il faut ensuite rajouter un nom à votre dataset dans le data_dict de data_factory

Modèle

Quel est la différence entre seq_len, pred_len et label_len?

seq_len correspond à la longueur à prédire, pred_len à la longueur à prédire du modèle et label_len la longueure effectivement prédite des labels issus du dataset. Contrairement à l'implémentation initiale, nous supposons toujours que pred_len>label_len.

Que contient le string setting? Que correspondent chaque entier?

les modèles sont sauvegardé selon leur nom de settings, voici ce que chaque caractère représente:

long_term_forecast_model-id_FEDformer_NTU_ftM_sl16_ll32_pl32_dm512_nh8_el2_dl1_df2048_fc3_ebtimeNTU_dtTrue_Exp_0_cv0_tvv1_p3

nom du setting	signification	remarque éventuelle
long_term_forecast	nom de l'expérience qu'on utilise. Normalement ce sera toujours celui-ci ( sinon bug dans get_settings)
model_id	id du modèle qu'on expérimente	nom des expériences qu'on va faire référence
FEDFormer	nom du string du modèle	le même que celui dans le model_dict
NTU	nom du dataset	Même nom que le nom du dataset dans le data_dict
ft M	indique si on prédit en varié ou multivarié	à priori ne pas changer
sl	longueur de l'input	dans le code correspond à args.seq_len
ll	longueur du label	dans le code correspond à args.label_len
pl	longueur de prédiction	correspond à args.pred_len
dm	dimension du modèle, je crois que c'est la dimension intermédiaire entre les layers
nh	je ne sais pas
el	nombre de layer de l'encodeur	2 est un fort minimum local
dl	nombre de layer du décodeur	1 fort minimum local
df	dimension du modèle, ptet la dimension de l'espace intermédiaire	cet hyperparamètre ne joue pas trop dans le tuning de FEDF
fc	winow average utilisé dans la seric decomposition de certains modèle
ebtime	comment on encode le temps.	Pour NTU c'est embedNTU qui correspond à ne rien faire
dt	?	?
EXP	nom de l'expérience	je crois que c'est pour faire joli
0	nombre d'itération, à priori c'est un boulet
cv	1 si on prend les categorical value, 0 sinon	recommandé 0. Sinon il ne fait que concaténer les catégories à l'input
tv	1 si on récupère dans le dataset l'encodage du temps,0 sinon	recommandé 1
p	preprocessing de l'entrée,	le preprocessing recommandé pour FEDFormer est 1 pour enlever uniquement l'épine et 3 pour enlever la moyenne

Tensorboard comment c'est implémenté?

Tensorboad est initialisé au début de Exp et nous ajoutons au modèle les loss de train/vali/test à chaque epoch.

Comment tester rapidement un modèle?

Voir commande_utile Run of the model:FED pour plus d'explications. Il ne faut pas oublier de choisir au début un arg.

Quels modèles recommandez vous d'essayer?

Nous avons testé lors de stage principalement AutoFormer,FEDFormer et légèrement NTS. Nous recommandons FEDformer qui donne des résultats décents. Concernant les autres modèles, nous tenons à signaler qu'ils semblent relativement peu optimiser car la compléxité temporelle semble non néggligeable...

Comment rajouter rapidement un modèle à l'implémentation?

Il suffit d'implémenter un torch.nn module avec une méthode forward. Voir ici pour plus d'informations. Il faut ensuite donner un nom du model dans exp_basic du dossier exp.

Bugs ou techniques utiles.

cannot import distutils.version

Prends tes jambes à ton cou et inverse ton update de version de cuda :

conda list --revisions
conda --revision N

Sinon il faut chercher sur le net mais il s'agit d'un bug présent sur une version de pytorch mais patcher ensuite.

C'est qui ce cupy dans les import?

Numpy ne marche pas sur GPU, donc pour accélerer le training il fallait soit passer en torch soit utiliser une autre librairie. Cupy a l'avantage d'avoir une interface proche de Numpy et d'être GPU friendly sans aucune réecriture, nous avons donc adopté cette solution. A noter qu'il y a eût une augmentation de près de 0.1 seconde par itération mais que numpy est importé au lieu de numpy dans certains dossiers.

Mon modèle sort " double precision and not float precision" ou un truc du genre

Il faut faire attention à la précision du modèle. dans la boucle de train nous ne gardons q'une précision en float, il faut alors transformer les entrées en float

#from commande_utile
from models.FEDformer import *
network=Model(args)
network.float()
# Batch recovery
from data_provider.data_factory import data_provider
args=Args()
data_set, data_loader=data_provider(args,flag="train") 

(batch_x, batch_y, batch_x_mark, batch_y_mark)=enumerate(data_loader).__next__()[1]
y=network(batch_x.float(), batch_x_mark.float(),None, batch_y_mark.float())

Je veux plus d'info sur une fonction?

toutes les fonctions utilisées pour NTU_RGB sont normalement commentées, contacte moi sinon pour toute précision supplémentaire.

Je veux plus d'info sur un dossier

clique sur le dossier et il y a normalement un readme explicatif

Je veux rentrer plus profondément dans le code rapidement comment faire?

Regarde commande_utile.ipynb qui résume pas mal d'opérations qu'on peut faire rapidement. Pour aller plus loin, toutes les fonctions sont commentées.

Quels sont les sorties d'un modèle?

Les sorties d'une boucle de train et de test sont de trois natures:

les runs du training sont stockés dans le dossier runs et sont facilement accessible avec Tensorboard
des vidéos à prédire sont stockés dans le fichier test_results. Le squelette bleu est le ground truth et le squelette rouge est la prédiction.
un dataframe avec les loss pour chaque sample est disponible dans le dossier results.

Comment marche plot_skeleton

Si on veut plot les squelettes deux possibilités s'offre à nous:

On veut plot par rapport à un nom de squelette,dans ce cas on utilise la fonction plot_skeleton de utils/NTU_RGB/plot_skeleton

plot_skeleton(path_skeleton=Nom_du_skeleton,save_name=nom du fichier sauvegardé,num_body: numéro du corps correspondant, path_folder_save=quel dossier on va sauvegardé)

Si on veut faire en sortie du modèle il preprocess un peu les données et utiliser plot_video_skeleton

plot_video_skeletons(list_mat_skeleton= liste des array desskeleton qu'on veut plot de la bonne manière, save_name=nom du fichier sauvegardé, path_folder_save= nom du dossier où on veut sauvegardé.)

Pourquoi c'est aussi mal codé?

Je ne suis pas encore employé chez google et il y a peut-être une raison....

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FAQ.md

FAQ.md

FAQ: questions techniques et autres

Dataset

Comment faire de la Data Augmentation?

J'aimerais avoir un nom de channel différent en entrée/sortie

Pourquoi stocker un dataframe intermédiaire des données?

Comment rajouter rapidement un Dataset à l'implémentation?

Modèle

Quel est la différence entre seq_len, pred_len et label_len?

Que contient le string setting? Que correspondent chaque entier?

Tensorboard comment c'est implémenté?

Comment tester rapidement un modèle?

Quels modèles recommandez vous d'essayer?

Comment rajouter rapidement un modèle à l'implémentation?

Bugs ou techniques utiles.

cannot import distutils.version

C'est qui ce cupy dans les import?

Mon modèle sort " double precision and not float precision" ou un truc du genre

Je veux plus d'info sur une fonction?

Je veux plus d'info sur un dossier

Je veux rentrer plus profondément dans le code rapidement comment faire?

Quels sont les sorties d'un modèle?

Comment marche plot_skeleton

Pourquoi c'est aussi mal codé?

Files

FAQ.md

Latest commit

History

FAQ.md

File metadata and controls

FAQ: questions techniques et autres

Dataset

Comment faire de la Data Augmentation?

J'aimerais avoir un nom de channel différent en entrée/sortie

Pourquoi stocker un dataframe intermédiaire des données?

Comment rajouter rapidement un Dataset à l'implémentation?

Modèle

Quel est la différence entre seq_len, pred_len et label_len?

Que contient le string setting? Que correspondent chaque entier?

Tensorboard comment c'est implémenté?

Comment tester rapidement un modèle?

Quels modèles recommandez vous d'essayer?

Comment rajouter rapidement un modèle à l'implémentation?

Bugs ou techniques utiles.

cannot import distutils.version

C'est qui ce cupy dans les import?

Mon modèle sort " double precision and not float precision" ou un truc du genre

Je veux plus d'info sur une fonction?

Je veux plus d'info sur un dossier

Je veux rentrer plus profondément dans le code rapidement comment faire?

Quels sont les sorties d'un modèle?

Comment marche plot_skeleton

Pourquoi c'est aussi mal codé?