2 min read

Données IRIS

Dans le jeu de données iris , nous avions vu qu’il y avait 150 observations , avec un facteur catégorisant qui est l’espèce , au nombre de 3 :

  • setosa
  • versicolor
  • virginica

Nous allons afficher la longueur et la largeur des sépales :

ggplot(data=iris, aes(x = Sepal.Length, y = Sepal.Width )) +

Appliquer un jeu de couleurs et de formes en fonction de ce facteur .


  geom_point(aes(color=Species, shape=Species)) +

Mettre les labels en français. Nous avions vu que l’on pouvait definir les labels avec un bloc labs.


labs(title = "Evolution du prix du diesel",
         subtitle = "Principalement station Payot",
         caption = "De Janvier 2021 à Octobre 2021",
         y = "Prix (€)")

Mais nous pouvons également le définir comme ceci:

  ggtitle("Largeur et longueur des sépales") +
  xlab("Longueur des sépales") + 
  ylab("Largeur des sépales") +

Par contre il y a un petit piège pour la légende , puisque l’esthétique de la géométrie des points est défini par l’espèce avec des couleurs et des formes différentes.

Il faut signifier le label pour ces 2 caractéristiques:

  scale_color_discrete(name = "Espèces") +
  scale_shape_discrete(name = "Espèces") +
library(ggplot2)
library(ggdark)
ggplot(data=iris, aes(x = Sepal.Length, y = Sepal.Width )) +
  geom_point(aes(color=Species, shape=Species)) +
  ggtitle("Largeur et longueur des sépales") +
  xlab("Longueur des sépales") + 
  ylab("Largeur des sépales") +
  scale_color_discrete(name = "Espèces") +
  scale_shape_discrete(name = "Espèces") +
  dark_theme_gray() 
## Inverted geom defaults of fill and color/colour.
## To change them back, use invert_geom_defaults().

Car si on tente de le faire avec le bloc label labs, il ne faut pas oublier de définir le label pour les 2 caractéristiques.

library(ggplot2)
library(ggdark)
ggplot(data=iris, aes(x = Sepal.Length, y = Sepal.Width )) +
  geom_point(aes(color=Species, shape=Species)) +
  labs(title = "Largeurs et longueurs des sépales par espèce",
        caption = "Jeu de donnée iris",
         x = "Longueur des sépales",
         y = "Largeur des sépales",
         colour = "Espèces",
         shape = "Espèces"
     ) +
    dark_theme_gray() 

Sinon , ça nous donne ça:

library(ggplot2)
library(ggdark)
ggplot(data=iris, aes(x = Sepal.Length, y = Sepal.Width )) +
  geom_point(aes(color=Species, shape=Species)) +
  labs(title = "Largeurs et longueurs des sépales par espèce",
        caption = "Jeu de donnée iris",
         x = "Longueur des sépales",
         y = "Largeur des sépales",
         colour = "Espèces"
     ) +
  dark_theme_gray() 

Néanmoins , l’utilisation du bloc labs est la meilleure pratique, et renvoie moins d’erreur.

Ce travail est sous licence Attribution-NonCommercial 4.0 International. Attribution-NonCommercial 4.0 International