Tous les logiciels de statistiques se trompent dans le typage des données, particulièrement sur certaines variables. R++ à l’avantage de proposer un visualisateur de type afin de ne pas “traîner” des mauvais paramètres pendant toute l’analyse.
Dans ce visualisateur, chaque couleur représente un type de données :
Lorsque le type n’est pas le bon, vous pouvez le modifier en un simple clic grâce au menu de paramétrage. Dans notre exemple, les départements sont reconnus comme variables integer. Bien sûr, ça n’a pas de sens, on ne peut pas faire la moyenne de 32 (Haute Garonne) et 91 (Essonne). Donc, pour corriger le typage, il suffit de cliquer sur « nominale » dans la colonne « Département ».
Dans certains cas, une variable est mal typée parce que certaines modalités sont mal typées.
Par exemple, si un individu saisit « Zero » au lieu de « 0 », la variable est reconnue comme nominale. On peut changer le type en cliquant sur integer. Dans ce cas, R++ met en évidence les valeurs qui posent problèmes en les mettant en tête de colonne, en rouge. En effet, vous pouvez ainsi les repérer et les corriger très rapidement.
De plus, les logiciels de stats détectent systématiquement les variables ordonnées comme nominales. Ainsi, avec R++, vous pouvez voir les modalités puis les ordonner par un simple drag and drop, cliquer sur « ordered » et enfin valider pour que les modifications soient prises en compte.
Enfin, quand on vient de travailler sur le format d’une variable, on peut le dupliquer à d’autres. Il suffit de copier le format d’une variable et de le coller sur le format d’une autre variable.
Comme toujours, toutes ces actions sont disponibles sous forme de code.
Pour voir le typage en vidéo, cliquez ici.
Pour voir toutes les vidéos tutos, cliquez ici