Bienvenue à l'Institut de recherche et d'éducation numériques Stata FAQ Comment obtenir une tabulation croisée à 3, 4, 5 ou plus dans Stata La commande tabulate est idéale pour les tabulations croisées bidirectionnelles. Mais comment faire 3-way, 4-way, 5-way de plus de tabulations croisées La réponse est d'utiliser la commande table avec l'option contents (freq). Voici la forme générale de la commande table. Avant de commencer, nous allons charger l'ensemble de données et créer une variable catégorielle supplémentaire, readlevel. Nous commençons par examiner tous les tableaux à 1 voie pour nos variables catégorielles. Ensuite, la table à 2 sens. Maintenant la table à 3 voies. Suivi par une table à 4 voies. Enfin, une table à cinq sens. Les tables à 5 voies ne sont pas la limite. Vous pouvez ajouter d'autres niveaux. Nous laissons un exercice pour trouver le nombre maximal de variables autorisées. Le contenu de ce site Web ne doit pas être interprété comme un endossement d'un site Web, d'un livre ou d'un produit logiciel particulier par l'Université de Californie. Bienvenue à l'Institut de recherche et d'éducation numériques Stata Learning Module Un échantillonneur statistique dans Stata Version info: Le code de cette page a été testé dans Stata 12. Ce module donnera un bref aperçu de quelques tests statistiques courants dans Stata. Utilisons le fichier de données automatique que nous utiliserons pour nos exemples. Faisons un t-test comparant les miles par gallon (mpg) des voitures étrangères et domestiques. Comme vous le voyez dans la sortie ci-dessus, les voitures nationales avaient considérablement moins de mpg (19.8) que les voitures étrangères (24.7). Chi-carré Comparons la cote de réparation (rep78) des voitures étrangères et nationales. Nous pouvons faire un tableau croisé de rep78 par des étrangers. On peut se demander si ces variables sont indépendantes. Nous pouvons utiliser l'option chi2 pour demander un test du chi-carré d'indépendance ainsi que le tableau croisé. Le chi carré n'est pas vraiment valable lorsque vous avez des cellules vides. Dans les cas où vous avez des cellules vides, ou des cellules avec de petites fréquences, vous pouvez demander Fishers test exact avec l'option exacte. Corrélation Nous pouvons utiliser la commande correlate pour obtenir les corrélations entre les variables. Regardons les corrélations entre le prix du mpg et le rep78. (Nous utilisons rep78 dans la corrélation même si elle n'est pas continue à illustrer ce qui se produit lorsque vous utilisez corréler avec les variables avec les données manquantes.) Notez que la sortie ci-dessus dit (obs69). La commande de corrélation supprime les données sur une base listwise, ce qui signifie que si l'une des variables sont manquantes, alors l'observation entière est omis de l'analyse de corrélation. Nous pouvons utiliser pwcorr (corrélations par paire) si nous voulons obtenir des corrélations qui suppriment les données manquantes sur une base par paires au lieu d'une base listwise. Nous utiliserons l'option obs pour montrer le nombre d'observations utilisées pour calculer chaque corrélation. Notez que les corrélations qui impliquent rep78 ont un N de 69 par rapport aux autres corrélations qui ont un N de 74. C'est parce que rep78 a cinq valeurs manquantes, donc il a seulement 69 observations valides, mais les autres variables n'ont pas de données manquantes donc Ils ont eu 74 observations valides. Régression Permet de faire une analyse de régression dans Stata. Pour cet exemple, laissez les cas où rep78 est 1 ou 2 ou manquant. Maintenant, permet de prédire mpg de prix et de poids. Comme vous le voyez ci-dessous, le poids est un prédicteur significatif de mpg. Mais le prix n'est pas. Et si on voulait prédire mpg de rep78 aussi. Rep78 est vraiment plus d'une variable catégorique que d'une variable continue. Pour l'inclure dans la régression, nous devons convertir rep78 en variables fictives. Heureusement, Stata rend les variables factices facilement à l'aide de tabulation. L'option gen (rep) indique à Stata que nous voulons générer des variables fictives de rep78 et nous voulons que la tige des variables fictives soit rep. Stata a créé rep1 (1 si rep78 est 3), rep2 (1 si rep78 est 4) et rep3 (1 si rep78 est 5). Nous pouvons utiliser la commande tabulate pour vérifier que les variables fictives ont été créées correctement. Maintenant, nous pouvons inclure rep1 et rep2 comme variables fictives dans le modèle de régression. Analyse de variance Si vous voulez faire une analyse de variance en regardant les différences en mpg parmi les trois groupes de réparation, vous pouvez utiliser la commande oneway pour ce faire. Si vous incluez l'option de tableau, vous obtenez le mpg moyen pour les trois groupes, ce qui montre que le groupe avec la meilleure note de réparation (rep78 de 5) a également le mpg le plus élevé (27.3). Si vous souhaitez inclure des covariables, vous devez utiliser la commande anova. L'option continue (poids de prix) indique à Stata que ces variables sont des covariables. Le contenu de ce site Web ne doit pas être interprété comme un endossement d'un site Web particulier, d'un livre ou d'un produit logiciel par l'Université de Californie.
No comments:
Post a Comment