Version Clustering (1.7) (17/09/2024)

Bienvenue dans la nouvelle version de R++, R++ Clustering ! Cette nouvelle version contient un nouvel outil... le Clustering ! Il s'agissait d'un besoin pour nombre d'entre vous et désormais votre logiciel d'analyses statistiques préféré y répond ! Nous avons également intégré dans cette version d'autres solutions à vos demandes les plus partagées, et grandement amélioré les performances du logiciel. Vous trouverez le détail des nouvelles fonctionnalités de cette version ci-dessous :

Clustering

Le partitionnement de données ou Clustering est l'ajout majeur de cette version de R++. Cette technique vous permet de découper vos données en groupes partageant des caractéristiques communes. Dans R++, ouvrez l'aide pour plus d'informations sur cette nouvelle fonctionnalité.

Tests post hoc pour l'Anova et Kruskal-Wallis

La correction de Bonferroni a été ajoutée pour les tests Anova et Kruskal-Wallis. Cette technique vous permet de déterminer quels groupes présentent des différences significatives deux à deux après une Anova au résultat significatif. En effet, l'Anova peut vous indiquer qu'au moins une moyenne des groupes testés est différente des autres groupes, mais pas quels groupes. Cliquez sur<icone>dans l'en-tête des tests statistiques dans une colonne contenant une Anova ou un Kruskal-Wallis pour calculer cette correction.

DeLong test dans ROC

Le test de DeLong a été ajouté dans les courbes ROC pour vous permettre de tester si deux courbes ROC sont statistiquement différentes. Pour utiliser le test de DeLong, créez au moins deux courbes ROC, puis cliquez sur le bouton<icone>dans la barre d'outils.

Styles de graphiques pré-enregistrés pour Elsevier et Nature

Dans l'Éditeur de Graphiques, vous pouvez créer vos styles afin d'appliquer vos paramètres sur tous vos graphiques en un clic. En plus du style R++ par défaut, nous avons ajouté deux styles adaptés pour des graphiques dans des publications dans les revues d'Elsevier et Nature.

Textes à inclure pour les tests χ2, Kruskal-Wallis et Fisher

Nous avons ajoutés des textes à inclure dans vos articles pour les tests du χ2, Kruskal-Wallis, et Fisher (le support pour ce dernier test n'est pour l'instant que partiel).

Gestion des colonnes

Dans la Gestion des données et les Tests statistiques, vous trouverez un nouvel outil de Gestion des colonnes ! Pour l'ouvrir, cliquez sur<icone>dans la barre d'outils.

Cette nouvelle fonctionnalité vous permet de déplacer les colonnes de vos données ! Sélectionnez une variable dans la Gestion des colonnes, puis déplacez la variable par cliquer-glisser, et la colonne correspondant à la variable se déplace dans la table à l'emplacement désiré.

Vous pouvez également cacher les colonnes avec un clic-droit, puis choisissez "Masquer" dans le menu qui s'ouvre.

Il est aussi possible de déplacer ou cacher plusieurs colonnes en même temps. Laissez appuyée la touche Ctrl (Cmd sous Mac), puis cliquez sur les variables que vous souhaitez déplacer ou cacher pour les sélectionner toutes en même temps, enfin appliquez un cliquer-glisser ou un clic-droit sur une de ces variables afin d'appliquer l'action sur toutes les variables sélectionnées.

Vous pouvez également supprimer (clic-droit) ou renommer (double-clic) les colonnes dans la Gestion des colonnes.

Multiple colonnes appariées

Dans les Tests statistiques, il est désormais possible de sélectionner plusieurs colonnes appariées à la fois. Pour cela cliquez sur le bouton<icone>dans la barre d'outils, puis sélectionnez une ou plusieurs colonnes appariées compatible avec votre colonne de référence. Enfin, cliquez à nouveau sur<icone>pour sortir de la sélection des colonnes appariées.

Configurer le nombre de décimales dans la Table1

Vous pouvez désormais contrôler le nombre de décimales des nombres de la Table1. Vous pouvez changer indépendamment le nombre de décimales des p-values, et le nombre de décimales des autres nombres.

Support pour tous les modèles dans la pellicule et les sessions

Il n'était pas possible avant cette version de sauvegarder les modèles de ROC, survie et ACP dans la pellicule, et dans les sessions R++. C'est désormais chose faite ! Vous pouvez également enregistrer vos opérations de Clustering dans la pellicule et les sessions.

Nouveaux types Texte et Identifiant

Deux nouveaux types sont désormais utilisables : le type Texte, pour des variables contenant de l'information qui ne doit pas être utilisé pour des tests, modèles, graphiques, etc. Ce type est utile par exemple pour un champ Commentaire dans un formulaire, qui contient des informations qui peuvent être intéressantes, mais qui n'auraient pas de sens en tant que Nominale. Dans des gros jeux de données, utiliser ce type peut permettre d'améliorer les performances de certaines opérations. Le type Identifiant est presque comme le type Texte, mais avec les contraintes que les valeurs de la variable doivent être uniques et non-manquantes, ce qui vous permet de vérifier des problèmes dans vos données si une variable qui est censée être un identifiant ne respecte pas ces contraintes.

Pour utiliser ces nouveaux types, cliquez sur<icone>à droite du type Nominal dans le Typeur.

Créer une variable Binaire à partir du filtre des lignes

Dans l'outil "Ajout de colonne", dans l'onglet "Général", vous pouvez désormais choisir l'option "À partir du filtre des lignes". Cette option vous permet de créer une variable Binaire qui contient pour chaque ligne vrai si la ligne est toujours visible avec le filtre des lignes actuel, et faux sinon.

Version 1.6.1 (13/12/2023)

Cette version disponible sous Mac et Windows ajoute quelques fonctionnalités très demandées :

Détails des points des courbes ROC et de survie

Un nouvel onglet "Points" fait son apparition dans les courbes ROC et de survie. Cet onglet contient les coordonnées des points des courbes.

Dans Courbe de survie, vous trouverez dans ce nouvel onglet le détail des valeurs de temps liées à la probabilité de survie, et à l'intervalle de confiance.

Dans Courbe ROC, vous y trouverez les valeurs de spécificité liées à celles de sensibilité.

Vous pouvez copier la table de l'onglet Points pour la coller dans Word par exemple.

Citer R++

Dans le menu Aide, nous avons ajouté une option "Citer R++" qui vous donne le texte à inclure dans vos publications pour citer votre logiciel d'analyse statistique favori.

Cercle unité pour les graphiques des ACPs

Les graphiques des ACPs incluent désormais le cercle unité. Il est possible de le retirer dans l'éditeur de graphiques.

Changement de la version de R à 4.3.1

Cette nouvelle mise à jour de R nous permet d'améliorer les performances de R++ et de résoudre quelques bugs des versions précédentes.

Fermer les data frames depuis les Tests statistiques

Pour des raisons de simplicité, il est possible de faire certaines des opérations disponibles dans le Nettoyage des données depuis les Tests statistiques, mais il n'était pas possible de fermer des data frames. Depuis cette version,c'est désormais chose faite.

Graphiques bivariés dans le rapport bivarié

Les rapports bivariés incluent désormais les graphiques bivariés des Tests statistiques.

Version 1.6 (01/07/2023)

Vous avez aimé la 1.5 ? Vous allez adorer la 1.6 ! Elle contient les Analyses en Composantes Principales (ACP) ; les graphiques vectoriels, des graphiques qu'on peut zoomer à l'infini, exigés par de plus en plus de revues dont celles en ligne ; beaucoup de nouveaux graphiques ; un éditeur de graphiques revisité qui vous permettra de personnaliser à peu près tous les graphiques générés par R++ ; des rapports automatiques ; et plein d'autres améliorations ! Comme toujours, nous mettons un point d'honneur à répondre à vos retours utilisateur, et espérons que cette mise à jour répondra à vos attentes. Vous trouverez le détail des nouvelles fonctionnalités de cette version ci-dessous :

Général

Amélioration du design des fenêtres, des icônes et des images

Certaines fenêtres et icônes ont été refaites pour les rendre plus intuitives.
De plus, certaines images comme celles qui représentent Rhinelle, notre mascotte qui vous aide à utiliser R++, ont été modifiées afin de rendre les fonctionnalités du logiciel encore plus simple à appréhender.

Barres d'outils retravaillées

Les barres d'outils en haut des différentes fenêtres de R++ ont été réorganisées en sous-sections, pour trouver plus facilement les fonctionnalités dont vous avez besoin.

Changement de la version de R à 4.2.2

Cette mise à jour de R qui est embarqué dans R++ permet de nombreuses améliorations, notamment de performances. Certains utilisateurs manipulent jusqu'à 4 millions (sic) de lignes !

Fichiers rpp et rppSession associés à R++

Les fichiers rpp ont été introduits à partir de la version 1.5 et vous permettent d'enregistrer vos données ainsi que les données supplémentaires comme les types des colonnes et l'ordre des modalités.
Les fichiers rppSession eux permettent de sauvegarder une session entière de R++, ce qui comprend vos données et ses données supplémentaires, mais aussi vos graphiques et vos modèles dans la pellicule, ainsi que vos scripts R.
Depuis la 1.6, les fichiers rpp et rppSession sont désormais associés à R++ sur votre PC (la même chose arrive sous Mac bientôt !). Vous pouvez donc importer ces fichiers en les ouvrant directement sans passer par l'import. Ouvrir un fichier rpp ou rppSession lorsque R++ n'est pas ouvert lance le logiciel automatiquement et importe le fichier.

Gestion des dates

La gestion des dates dans R++ est maintenant dépendante du langage d'affichage de R++. En particulier, si vos fichiers contiennent des dates au format Européen et que vous utilisez R++ en français, R++ saura détecter les colonnes comme des colonnes de type Date.

Gestion des proxy système

R++ est maintenant entièrement capable de prendre en compte les proxy de votre PC ou Mac. Si vous vous connectez au réseau derrière un proxy, la mise à jour et le rapport de problème fonctionneront désormais normalement.

ACP

Les Analyses en Composantes Principales sont disponibles dans cette nouvelle version ! Vous les trouverez dans la section "Modélisation" du chemin de fer, avec les régressions.

Graphiques version 2.0

Nouveaux graphiques

R++ intègre de nouveaux graphiques :
  • Le Q-Q plot, utilisé dans les tests statistiques et dans les régressions linéaire et logistique
  • Le graphe en violon univarié et bivarié
  • Le graphe multi-moyenne

Éditeur de graphiques version 2.0

L'éditeur de graphiques a été entièrement refait. Non seulement l'interface a été épurée pour en retirer le superflu, mais elle contient désormais toutes les options dont vous avez besoin pour la réalisation de vos articles de recherche, telles que les courbes de densité et de loi normale dans l'histogramme, les tests statistiques entre deux boxplots dans les boxplots bivariés, ou les points de censure dans les courbes de survie.

La quasi-totalité des graphiques de R++ peuvent désormais être sauvegardés dans la pellicule, ainsi que modifiés dans l'éditeur de graphiques. Cela inclut les graphiques dans la section Gestion des données, ceux de la section Tests statistiques, ceux des régressions, et les graphiques de Survie, ROC, et ACP. Seules exceptions, le graphique de densité et Q-Q plot des tests statistiques, et les graphiques de diagnostic des régressions. Tous les graphiques sauvegardés dans la pellicule peuvent être enregistrés dans une session R++.

Format vectoriel

Les graphiques de R++ sont désormais enregistrables au format vectoriel. De plus, l'éditeur de graphiques permet de visualiser les graphiques au format vectoriel, ce qui rend notamment les graphiques plus nets, sans perte de qualité si l'image est agrandie ou zoomée.

Graphiques pour variables de type Date

R++ génère désormais des graphiques adaptés pour les colonnes de type Date, y compris des graphiques bivariés.

Gestionnaire de styles

Les graphiques de R++ ont un style par défaut. Cependant, nous vous laissons la possibilité de définir vos propres styles, et de les appliquer sur vos graphiques. De cette manière, vous pouvez très simplement appliquer un même style à tous les graphiques que vous souhaitez intégrer dans vos articles.

Gestion des données

Reporting version 2.0

Nouvelle interface simplifiée et plus ergonomique pour le rapport.

Verrouillage des colonnes

Vous pouvez désormais verrouiller des colonnes afin de les garder à tout moment sous les yeux lorsque vous explorez vos données. Par exemple, vous pouvez verrouiller une colonne nom afin de toujours savoir à quelle personne correspond les données d'une ligne.

Formats numérique et date

Le typeur permet maintenant de visualiser les colonnes de type Numérique avec les formats Euro ou Dollar, ainsi que de modifier le nombre de décimales après la virgule. Il permet également de visualiser les colonnes de type Date avec les formats Date seule, Heure seule, ou Date et Heure.

Complétion automatique dans les formules de l'ajout de colonne

R++ complète désormais automatiquement les noms de colonne dans la partie "Autre formule" de l'ajout de colonne. Fini les problèmes de fautes d'orthographes dans vos formules sur des colonnes aux noms compliqués et très longs !

Ordre fixe des modalités dans les graphiques

À partir de cette version, les graphiques des colonnes suivent toujours l'ordre des modalités.

La chaîne vide est une valeur manquante par défaut

À partir de cette version, remplacer une valeur par une chaîne vide dans une colonne avec des modalités qui ne contient pas la modalité vide remplace la valeur par valeur manquante (NA).

Ajouter 1 à la différence entre deux colonnes Date

Lors de la création d'une colonne à partir de la différence entre deux colonnes de type Date, il est désormais possible d'ajouter 1 à tout le résultat. Cette fonctionnalité nous a été demandée afin d'inclure la date de départ et la date de fin dans le résultat. Par exemple, grâce à cette option, quelqu'un qui arrive à l'hôpital le samedi midi et qui repart le dimanche midi sera resté deux jours, alors que mathématiquement il n'est resté que 24h, donc un jour.

Limites des colonnes de type Entier

La différence entre le maximum et le minimum des colonnes de type Entier ne peuvent plus dépasser 20000 pour des raisons de cohérence et d'optimisation. Veuillez utiliser le type Numérique pour les colonnes dont l'étendue dépasse 20000.

Tests statistiques

Textes à inclure

R++ génère maintenant automatiquement les textes à inclure dans vos articles pour les différents tests que vous utilisez. Par exemple :
The ANOVA suggests that:
  - The main effect of ChocSep is statistically significant and large (F(4, 73) = 33.39, p < .001; Eta2 = 0.65, 95% CI [0.53, 1.00])
Effect sizes were labelled following Field's (2013) recommendations.

Q-Q plot pour les graphiques des tests

Avec le graphique de densité, pour chaque test, R++ vous fournit désormais également un Q-Q plot.

Rapport bivarié

Le rapport bivarié est désormais disponible ! Son fonctionnement est similaire à celui du rapport univarié.

Recherche de colonne

Il est maintenant possible de rechercher une colonne dans les Tests statistiques, comme dans Nettoyage des données !

Export en dehors de R++

Cliquer-glisser depuis l'éditeur de graphiques

R++ permet d'exporter un graphique (vers Word par exemple) avec un cliquer-glisser depuis la pellicule. Maintenant, il est également possible de le faire depuis l'éditeur de graphiques.

Ajout du titre dans les graphiques exportés

Lors d'un export vers Word, le graphique est désormais exporté avec son titre.

Import

Détection automatique des paramètres du CSV

Notre intelligence artificielle détecte désormais les paramètres optimaux pour l'import d'un fichier CSV. Vous n'aurez donc plus besoin de modifier les paramètres de l'import pour utiliser R++ avec la plupart de vos fichiers CSV !

Import de plusieurs feuilles d'un tableur en même temps

Avec cette nouvelle version, vous pouvez maintenant importer plusieurs feuilles d'un tableur en même temps. Une data frame sera créée pour chaque feuille sélectionnée, comme si vous les aviez importées une par une.

Interface améliorée pour l'import depuis une base de données

L'interface pour l'import depuis une base de données est améliorée. Elle permet maintenant d'importer plusieurs tables à la fois, et est dotée d'une prévisualisation.

Amélioration de la détection des colonnes de type Binaire

Les colonnes numériques contenant uniquement les valeurs 0 et 1 sont désormais détectées comme des colonnes de type Binaire.

Dans une colonne de type Binaire, l'ordre des modalités est désormais insensible à la casse.

Tri par fréquence des modalités

Pour les colonnes de type Ordinal ou Nominal, les modalités sont désormais triées par fréquences par défaut. Il est toujours possible de trier par ordre alphabétique avec un clic-droit sur l'en-tête de la colonne concernée dans le typeur.

Suppression des lignes vides à l'import

Désormais, l'option de suppression des lignes vides à l'import prend en compte la liste des valeurs considérées comme valeurs manquantes dans les paramètres.

Régressions, ROC, Survie

Intercept sélectionné par défaut dans la régression logistique

À partir de cette version, l'ordonnée à l'origine (intercept) est sélectionnée par défaut dans la régression logistique.

Entier à deux valeurs comme variable État dans ROC

Dans ROC, il est maintenant possible d'utiliser une variable de type Entier contenant seulement deux valeurs comme la variable État.

Table1

Suppression des valeurs manquantes dans les résultats

Désormais les valeurs manquantes dans les variables Groupe et Sous-groupe sont retirées des résultats même si la valeur n'est pas manquante dans les variables à comparer.

Homogénéisation de la précision du petit p

La précision du petit p est désormais la même que dans les tests de Tests Statistiques.

Licences

Messages d'erreur plus explicites

Les messages d'erreur pour un problème de licence sont désormais plus clairs afin de pouvoir résoudre les problèmes plus rapidement.