Learn R Programming

summarytools (version 1.0.1)

tabagisme: Usage du tabac et etat de sante (donnees simulees)

Description

Jeu de donnees simulees de 1000 sujets, avec les colonnes suivantes:

  • sexe Variable categorielle (facteur), 2 niveaux: “F” et “M”. Environ 500 chacun.

  • age Numerique.

  • age.gr Groupe d'age - variable categorielle, 4 niveaux.

  • IMC Indice de masse corporelle (numerique).

  • fumeur Variable categorielle, 2 niveaux (“Oui” / “Non”).

  • cigs.par.jour Nombre de cigarettes fumees par jour (numerique).

  • malade Variable categorielle, 2 niveaux (“Oui” / “Non”).

  • maladie Champs texte.

  • ponderation Poids echantillonal (numerique).

Usage

data(tabagisme)

Arguments

Format

Un data frame de 1000 rangees et 9 colonnes

Details

Note sur la simulation des donnees: la probabilite pour un sujet de tomber dans la categorie “malade” est basee sur une fonction arbitraire faisant intervenir l'age, l'IMC et le nombre de cigarettes fumees par jour.

A copy of this dataset is available in English under the name “tobacco”.