Des articles

17.4 : Analyse quantitative - Mathématiques


Lorsque nous travaillons avec un grand nombre de variables qui décrivent des aspects d'un phénomène (par exemple, des éléments d'un test en tant que mesures multiples du trait sous-jacent de "maîtrise du sujet"), nous concentrons souvent notre attention sur ce que ces mesures multiples ont " en commun". En utilisant des informations sur la co-variation parmi les multiples mesures, nous pouvons déduire une dimension ou un facteur sous-jacent ; une fois cela fait, nous pouvons situer nos observations le long de cette dimension. L'approche de localisation, ou de notation, des cas individuels en termes de leurs scores sur les facteurs de la variance commune entre plusieurs indicateurs est l'objectif de l'analyse des facteurs et des composantes (et d'autres techniques de mise à l'échelle moins courantes).

Si nous pensons à notre problème à deux modes, nous pourrions appliquer cette logique de "mise à l'échelle" aux acteurs ou aux événements. C'est-à-dire que nous pourrions « échelonner » ou indexer la similitude des acteurs en termes de participation aux événements - mais pondérer les événements en fonction de la variance commune entre eux. De même, nous pourrions « échelonner » les événements en termes de modèles de co-participation des acteurs - mais pondérer les acteurs en fonction de leur fréquence de co-occurrence. Des techniques comme Outils>MDS et l'analyse des facteurs ou des composantes principales pourrait être utilisée pour « mettre à l'échelle » les acteurs ou les événements.

Il est également possible d'appliquer ce type de logique de mise à l'échelle aux données acteur par événement. UCINET comprend deux techniques d'analyse factorielle étroitement liées (Outils>Mise à l'échelle 2 modes>SVD et Outils>Analyse factorielle d'échelle à 2 modes) qui examinent simultanément la variance en commun entre les acteurs et les événements. UCINET comprend également Outils>Mise à l'échelle à 2 modes>Correspondance qui applique la même logique aux données binaires. Une fois que les dimensions sous-jacentes de la variance conjointe ont été identifiées, nous pouvons alors « mapper » à la fois les acteurs et les événements dans le même « espace ». Cela nous permet de voir quels acteurs sont similaires en termes de participation à des événements (qui ont été pondérés pour refléter des modèles communs), quels événements sont similaires en termes de quels acteurs y participent (pondérés pour refléter des modèles communs) et quels acteurs et les événements sont situés "proche" les uns des autres.

Il est parfois possible d'interpréter les facteurs ou les dimensions sous-jacents pour comprendre pourquoi les acteurs et les événements vont de pair comme ils le font. Plus généralement, des groupes d'acteurs et d'événements situés de manière similaire peuvent former des « types » ou des « domaines » significatifs d'action sociale.

Ci-dessous, nous appliquerons très brièvement ces outils aux données sur les grands donateurs aux initiatives californiennes sur la période 2000-2004. Notre objectif est d'illustrer la logique de la mise à l'échelle à 2 modes. La discussion ici est très courte sur les traitements techniques des différences (importantes) entre les techniques.

Analyse SVD à deux modes

La décomposition en valeur singulière (SVD) est une méthode d'identification des facteurs sous-jacents aux données bimodes (évaluées). La méthode d'extraction des facteurs (valeurs singulières) diffère quelque peu de l'analyse factorielle et composante conventionnelle, c'est donc une bonne idée d'examiner à la fois les résultats de la factorisation SVD et 2-mode.

Pour illustrer SVD, nous avons saisi une matrice de 23 principaux donateurs (ceux qui ont donné un total combiné de plus de 1 000 000 $ à cinq campagnes ou plus) par 44 initiatives de vote en Californie. Chaque acteur est noté -1 s'il a contribué en opposition à l'initiative, +1 s'il a contribué en faveur de l'initiative, ou 0 s'il n'a pas contribué. La matrice résultante est constituée de données valorisées qui peuvent être examinées avec SVD et analyse factorielle ; cependant, le faible nombre de contributeurs à de nombreuses initiatives et la variance très restreinte de l'échelle ne sont pas idéales.

La figure 17.6 montre les « valeurs singulières » extraites de la matrice rectangulaire donateur par initiative en utilisant Outils>Mise à l'échelle 2 modes>SVD.

17.6 : Mise à l'échelle bimodale des donateurs et des initiatives californiennes par décomposition en valeur unique : valeurs singulières

Les « valeurs singulières » sont analogues aux « valeurs propres » dans les techniques de mise à l'échelle des facteurs et des composants les plus courantes. Le résultat montre ici que l'« espace » conjoint de la variance entre donateurs et initiatives n'est pas bien saisi par une simple caractérisation. Si nous pouvions facilement donner un sens aux modèles avec des idées comme "gauche/droite" et "financière/morale" comme dimensions sous-jacentes, il n'y aurait que quelques valeurs singulières qui expliqueraient des parties substantielles de la variance articulaire. Ce résultat nous dit que la manière dont les acteurs et les événements « se mettent ensemble » n'est pas propre, simple et facile - dans ce cas.

Avec cette mise en garde importante à l'esprit, nous pouvons examiner comment les événements et les donateurs sont « mis à l'échelle » ou situés sur les dimensions sous-jacentes. Premièrement, les initiatives de vote. La figure 17.7 montre l'emplacement ou les scores d'échelle de chacune des propositions de vote sur les six premières dimensions sous-jacentes de cet espace hautement multidimensionnel.

Graphique 17.7 : Donateurs et initiatives SVD de Californie : mise à l'échelle des initiatives

Il s'avère que la première dimension tend à localiser les initiatives soutenant les dépenses publiques pour l'éducation et la protection sociale vers un pôle, et les initiatives soutenant la limitation du pouvoir législatif vers l'autre - bien que de telles interprétations soient entièrement subjectives. La deuxième dimension et les dimensions supérieures semblent suggérer que les initiatives peuvent également être considérées comme différentes les unes des autres par d'autres aspects.

Dans le même temps, les résultats nous permettent de localiser ou de redimensionner les donateurs selon les mêmes dimensions sous-jacentes. Ces chargements sont illustrés à la figure 17.8.

Graphique 17.8 : Donateurs et initiatives SVD de Californie : mise à l'échelle des donateurs

Vers l'extrémité positive de la dimension un (que nous avons précédemment interprétée comme favorisant les dépenses publiques), nous trouvons le parti démocrate, les employés publics et les syndicats d'enseignants ; au pôle opposé, on trouve des républicains et quelques groupes d'entreprises et professionnels.

Il est souvent utile de visualiser les emplacements des acteurs et des événements dans un nuage de points défini par des scores d'échelle sur les différentes dimensions. La carte de la figure 17.9 montre les résultats pour les deux premières dimensions de cet espace.

Graphique 17.9 : Donateurs et initiatives SVD de Californie : carte en deux dimensions

Notons que la première dimension (gauche-droite sur la figure) semble avoir ses pôles « ancrés » par les différences entre les initiatives ; la deuxième dimension (haut-bas) semble être définie davantage par les différences entre les groupes (à l'exception de la proposition 56). Le résultat ne localise pas proprement et clairement des événements particuliers et des acteurs particuliers le long de fortes dimensions linéaires. Cependant, il produit des grappes intéressantes qui montrent des groupes d'acteurs ainsi que les problèmes qui sont au cœur de leurs modèles de participation. Les démocrates et les syndicats se regroupent (en haut à droite) avec un certain nombre de propositions particulières dans lesquelles ils ont été très actifs (par exemple 46, 63). Groupe d'entreprises, de construction et de capital-risque (plus vaguement) en bas à droite, ainsi que les questions fondamentales qui ont constitué leur programme principal dans le processus d'initiative (par exemple, la proposition 62).

Analyse factorielle à deux modes

L'analyse factorielle fournit une méthode alternative à la SVD pour atteindre les mêmes objectifs : identifier les dimensions sous-jacentes de l'espace conjoint de la variance acteur par événement, et localiser ou mettre à l'échelle les acteurs et les événements dans cet espace. La méthode utilisée par l'analyse factorielle pour identifier les dimensions diffère de la SVD. La figure 17.10 montre les valeurs propres (par composantes principales) calculées par Outils>Mise à l'échelle à 2 modes>Analyse factorielle.

Graphique 17.10 : Valeurs propres de l'affacturage bimodal des donateurs et initiatives californiens

Cette solution, bien que différente de la SVD, suggère également une complexité dimensionnelle considérable dans la variance conjointe des acteurs et des événements. C'est-à-dire que des caractérisations simples des dimensions sous-jacentes (par exemple « gauche/droite ») ne fournissent pas de prédictions très précises sur les emplacements des acteurs ou des événements individuels. La méthode d'analyse factorielle produit une complexité légèrement inférieure à celle de la SVD.

Avec la mise en garde d'un ajustement assez médiocre d'une solution de faible dimension à l'esprit, examinons la mise à l'échelle des acteurs sur les trois premiers facteurs (Figure 17.11)

17.11 : Chargements des donateurs

Le premier facteur, par cette méthode, produit un modèle similaire à SVD. À un pôle se trouvent les démocrates et les syndicats, à l'autre se trouvent de nombreux groupes capitalistes. Il existe cependant quelques différences notables (par exemple AFSCME). La figure 17.12 montre les chargements des événements.

Graphique 17.12 : Chargements d'événements

Les modèles ici ont également une certaine similitude avec les résultats SVD, mais diffèrent considérablement dans les détails. Pour visualiser les modèles, les chargements des acteurs et des événements sur les dimensions pourraient être extraits des fichiers de données de sortie et représentés graphiquement à l'aide d'un nuage de points.

Analyse des correspondances à deux modes

Pour les données binaires, l'utilisation de l'analyse factorielle et du SVD n'est pas recommandée. Les méthodes de factorisation opèrent sur les matrices de variance/covariance ou de corrélation entre acteurs et événements. Lorsque les connexions des acteurs aux événements sont mesurées au niveau binaire (ce qui est très souvent le cas dans l'analyse de réseau), les corrélations peuvent sérieusement sous-estimer la covariance et rendre les modèles difficiles à discerner.

Comme alternative à la mise à l'échelle binaire acteur par événement, la méthode d'analyse des correspondances (Outils>Mise à l'échelle à 2 modes>Correspondance) peut être utilisé. L'analyse des correspondances (plutôt que l'analyse des classes latentes) fonctionne sur des tableaux croisés binaires multivariés, et ses hypothèses de distribution sont mieux adaptées aux données binaires.

Pour illustrer l'application de l'analyse des correspondances, nous avons dichotomisé les données des donateurs politiques et des initiatives en attribuant une valeur de 1 si un acteur a fait un don en faveur ou contre une initiative, et en attribuant un zéro s'il n'a pas participé à la campagne. d'une initiative particulière. Si nous voulions que notre analyse prête attention à la partisanerie, plutôt qu'à la simple participation, nous aurions pu créer deux ensembles de données - l'un basé sur l'opposition ou non, l'autre basé sur le soutien ou non - et faire deux analyses de correspondance distinctes.

La figure 17.13 montre la localisation des événements (initiatives) selon trois dimensions de l'espace conjoint acteur-événement identifié par la méthode d'analyse des correspondances.

Graphique 17.13 : Coordonnées de l'événement pour la co-participation des donateurs aux campagnes de l'initiative californienne

Étant donné que ces données ne reflètent pas la partisanerie, mais uniquement la participation, nous ne nous attendrions pas à ce que les résultats correspondent à ceux discutés dans les sections ci-dessus. Et, ils ne le font pas. Nous voyons cependant que cette méthode peut également être utilisée pour localiser les initiatives selon de multiples dimensions sous-jacentes qui capturent la variance à la fois des acteurs et des événements. La figure 17.14 montre la mise à l'échelle des acteurs.

Graphique 17.14 : L'acteur coordonne la co-participation des donateurs aux campagnes de l'initiative californienne

La première dimension présente ici une certaine similitude avec les pôles démocrate/syndical versus capitaliste. Ici, cependant, cette différence signifie que les deux groupements ont tendance à participer à des groupes d'initiatives différents, plutôt que de s'affronter dans les mêmes campagnes.

La visualisation est souvent la meilleure approche pour trouver des modèles significatifs (en l'absence d'une théorie solide). La figure 17.15 montre le tracé des acteurs et des événements dans les deux premières dimensions de l'espace d'analyse conjointe des correspondances.

Graphique 17.15 : Carte bidimensionnelle d'analyse des correspondances

Le quadrant inférieur droit contient ici un groupe significatif d'acteurs et d'événements, et illustre comment les résultats de l'analyse des correspondances peuvent être interprétés. En bas à droite, nous avons quelques propositions concernant les jeux de casino indiens (68 et 70) et deux propositions concernant les questions écologiques/de conservation (40 et 50). Deux des principales nations amérindiennes (les bandes Cahualla et Morongo des Indiens de la mission) sont cartographiées ensemble. Le résultat montre qu'il existe un groupe de problèmes qui « coexistent » avec un groupe de donateurs - les acteurs définissant les événements et les événements définissant les acteurs.


Une analyse quantitative et qualitative du modèle de pandémie COVID-19

Les efforts mondiaux à travers le monde se concentrent sur plusieurs stratégies de soins de santé pour minimiser l'impact du nouveau coronavirus (COVID-19) sur la communauté. Comme il est clair que ce virus devient une menace pour la santé publique et se propage facilement parmi les individus. Les modèles mathématiques avec des simulations informatiques sont des outils efficaces qui aident les efforts mondiaux pour estimer les paramètres de transmission clés et d'autres améliorations pour contrôler cette maladie. Il s'agit d'une maladie infectieuse qui peut être modélisée comme un système d'équations différentielles non linéaires avec des taux de réaction.

Ce travail examine et développe quelques modèles suggérés pour le COVID-19 qui peuvent répondre à des questions importantes sur les soins de santé mondiaux et suggérer des notes importantes. Ensuite, nous proposons un modèle mis à jour qui inclut un système d'équations différentielles avec des paramètres de transmission. Certaines simulations informatiques clés et analyses de sensibilité sont étudiées. De plus, les sensibilités locales pour chaque état du modèle concernant les paramètres du modèle sont calculées à l'aide de trois techniques différentes : les non-normalisations, les demi-normalisations et les normalisations complètes.

Les résultats basés sur les simulations informatiques montrent que la dynamique du modèle est considérablement modifiée pour différents paramètres clés du modèle. Fait intéressant, nous identifions que les taux de transition entre les personnes infectées asymptomatiques et les individus infectés symptomatiques signalés et non signalés sont des paramètres très sensibles concernant les variables du modèle dans la propagation de cette maladie. Cela aide les efforts internationaux visant à réduire le nombre d'individus infectés par la maladie et à empêcher la propagation du nouveau coronavirus plus largement dans la communauté. Une autre nouveauté de cet article est l'identification des paramètres critiques du modèle, ce qui facilite son utilisation par des biologistes ayant moins de connaissances en modélisation mathématique et facilite également l'amélioration du modèle pour un développement futur théorique et pratique.


Analyse de la transmission du COVID-19 dans la province du Shanxi avec des cas importés en temps discret

Depuis décembre 2019, une épidémie d'une nouvelle pneumonie à coronavirus (OMS nommée COVID-19) a balayé la Chine. Dans la province du Shanxi, le nombre cumulé de cas confirmés a finalement atteint 133 depuis l'apparition du premier cas confirmé le 22 janvier 2020, et dont la plupart étaient des cas importés de la province du Hubei. Les raisons de cette recrudescence continue dans la province du Shanxi, à la fois des cas infectés importés et autochtones, ne sont actuellement pas claires et nécessitent une enquête urgente. Dans cet article, nous avons développé un modèle d'équation de différence SEIQR de COVID-19 qui a pris en compte la transmission avec des cas importés à temps discret, pour effectuer une évaluation et une analyse des risques. Nos résultats suggèrent que si la date de verrouillage à Wuhan est antérieure, les cas infectieux sont moins nombreux. De plus, nous révélons les effets de la date de verrouillage de la ville sur l'échelle finale des cas : si la date est avancée de deux jours, les cas peuvent diminuer de moitié (67, IC 95% : 66-68) si la date est retardée de deux jours, les cas peuvent atteindre environ 196 (IC à 95 % : 193-199). Notre modèle d'enquête pourrait être potentiellement utile pour étudier la transmission du COVID-19, dans d'autres provinces de Chine à l'exception du Hubei. En particulier, la méthode peut également être utilisée dans les pays où le premier cas confirmé est importé.

Mots clés: Cas importés d'équation de différence de stratégie de verrouillage de ville modèle COVID-19 SEIQR.


Qu'est-ce que le raisonnement et la représentation quantitatifs ?

le raisonnement que le maire utilisé dans ce scénario est un Exemple d'utilisation raisonnement quantitatif pour résoudre un problème du monde réel. Raisonnement quantitatif est l'acte de comprendre des faits et des concepts mathématiques et d'être capable de les appliquer à des scénarios du monde réel.

De plus, qu'est-ce que le raisonnement qualitatif et quantitatif ? Les termes qualitatif et quantitatif s'appliquent à deux types de perspective raisonnement, utilisé le plus souvent lors de la recherche. Qualitatif se concentre sur la qualité de quelque chose, alors que quantitatif se concentre sur la quantité.

Par conséquent, pourquoi le raisonnement quantitatif est-il important ?

Raisonnement quantitatif la compétence ( QR ) est la capacité de comprendre et d'utiliser quantitatif informations pour arriver à une conclusion solide. QR est considéré comme l'un des plus important des compétences intellectuelles telles que la fluidité de la communication, la maîtrise de l'information et la pensée critique que tous les diplômés universitaires devraient acquérir.

Quelle est la définition du raisonnement quantitatif ?

Par un définition, raisonnement quantitatif (QR) est l'application de compétences mathématiques de base, telles que l'algèbre, à l'analyse et à l'interprétation du monde réel quantitatif l'information dans le contexte d'une discipline ou d'un problème interdisciplinaire pour tirer des conclusions pertinentes pour les élèves dans leur vie quotidienne.


Téléchargez et imprimez cet article pour votre usage personnel académique, de recherche et pédagogique.

Achetez un seul numéro de La science pour seulement 15 $ US.

La science

Vol 331, numéro 6014
14 janvier 2011

Outils d'articles

Veuillez vous connecter pour ajouter une alerte pour cet article.

Par Jean-Baptiste Michel , Yuan Kui Shen , Aviva Presser Aiden , Adrian Veres , Matthew K. Gray , The Google Books Team , Joseph P. Pickett , Dale Hoiberg , Dan Clancy , Peter Norvig , Jon Orwant , Steven Pinker , Martin A. Nowak, Erez Lieberman Aiden

La science 14 janv. 2011 : 176-182

Les changements linguistiques et culturels sont révélés à travers les analyses de mots apparaissant dans les livres.


Différents types de données quantitatives

  1. Mesure d'objets physiques : Ce type de données quantitatives concerne la mesure de tout type d'objet physique. Cela peut inclure la mesure de chaque cabine attribuée à chaque employé d'une entreprise.
  2. Projection des données : La projection future des données peut être réalisée en mettant en œuvre de nombreux algorithmes mathématiques et outils d'analyse. Par exemple, un chercheur de marché doit prédire l'augmentation des ventes après l'introduction d'un nouveau service ou produit grâce à une analyse.
  3. Compteur: Le compteur est lié aux actions. Par exemple, Counter désigne le nombre total d'utilisateurs qui ont téléchargé une application particulière à partir du magasin Google ou Apple.
  4. Calcul sensoriel : Le calcul sensoriel fait référence au processus de détection naturelle des paramètres pour générer une source continue d'informations. Le meilleur exemple de calcul sensoriel est la conversion d'informations électromagnétiques en une chaîne de données numériques constante.
  5. Quantification des entités de nature qualitative : Dans ce type de données quantitatives, des nombres dans les informations qualitatives sont identifiés. Par exemple, demander à un client dans un sondage en ligne de lui recommander un service ou un produit sur une échelle de 0 à 10.

Pourquoi les données quantitatives sont importantes ?

Les données quantitatives parlent de chiffres et de chiffres précis, contrairement aux données qualitatives. Ainsi, le chercheur propose de quantifier les attitudes, les attributs, le comportement et d'autres variables avec un certain motif. L'objectif principal peut être de s'opposer ou de soutenir l'hypothèse d'un produit ou d'un service particulier en représentant les données collectées lors d'entretiens ou d'enquêtes auprès de l'échantillon. Vous avez la possibilité d'opter pour la méthode de collecte traditionnelle ou de mettre en œuvre les dernières technologies pour recueillir les informations après une recherche appropriée. Le chercheur a également besoin d'outils statistiques, mathématiques et informatiques pour terminer les résultats à partir des données quantitatives.

Caractéristiques des données quantitatives

Certaines des caractéristiques les plus importantes des données quantitatives sont les suivantes :

  1. Représentation numérique : Les données quantitatives occupent l'intégralité des valeurs numériques ainsi que les propriétés.
  2. Opération arithmétique : Le chercheur peut effectuer des opérations arithmétiques de base comme la soustraction ou l'addition aux données quantitatives.
  3. Analyse: Elle peut être examinée à l'aide de procédures statistiques inférentielles et descriptives basées sur les objectifs de la recherche.
  4. Les types: Les données quantitatives sont principalement de deux types qui sont continues et discrètes. Les données continues sont ensuite classées en données de rapport et d'intervalle.
  5. Ordre: Il existe une échelle d'ordre pour quantifier les données. Par exemple, une donnée peut être classée comme 1,2,3 de manière ordonnée.
  6. Échelle standardisée : Les données quantitatives comprennent une échelle de mesure qui comprend une échelle standard mais n'a pas d'ordre.
  7. Visualisation des Données : La visualisation des données peut être réalisée en utilisant certaines techniques appelées dot plot, histogrammes, nuage de points et dot plot empilé.

Avantages de données quantitatives

  • Moins de biais : il existe de nombreux cas dans l'étude de la recherche où des biais personnels peuvent être impliqués et conduire à un résultat non concluant. En raison de la valeur numérique des données, le biais personnel est réduit dans une plus grande mesure.
  • Mener une recherche approfondie : Tout le processus de la recherche est expliqué en détail car toutes les données sont examinées statistiquement.Résultats exacts : Étant donné que les résultats obtenus sont objectifs, les données sont absolument exactes.

Inconvénients des données quantitatives

Outre les avantages mentionnés ci-dessus, les données quantitatives présentent également un certain nombre d'inconvénients, à savoir :

Selon le type de questions : Les biais dans les questions sont directement liés au type de questions posées dans la méthode de collecte des données quantitatives. La connaissance de la question du chercheur et le but de la recherche sont extrêmement importants lors de la conduite de l'analyse des données.

Information confidentielle: Avant, les données quantitatives n'étaient pas descriptives. En conséquence, il devient extrêmement difficile pour les participants d'arriver à une conclusion basée entièrement sur les informations recueillies.

Ainsi, les données quantitatives concernent davantage la pensée divergente que le raisonnement convergent. Il traite principalement de la logique, des valeurs numériques et des données. Les données quantitatives sont de nature complète et sont le seul type qui pourrait représenter la valeur analytique en termes de graphiques et de tableaux. Les chercheurs peuvent conclure des résultats précis en raison de l'intégrité et de l'exactitude des données.


Étapes de l'analyse quantitative

Gestion de données - Cela implique de vous familiariser avec un logiciel approprié en vous connectant et en filtrant systématiquement vos données : en saisissant les données dans un programme et enfin en « nettoyant » vos données.

Comprendre les types de variables – Différents types de données exigent un traitement discret, il est donc important de pouvoir distinguer les variables à la fois par cause et effet (dépendantes ou indépendantes) et leurs échelles de mesure (nominale, ordinale, intervalle et rapport).

Exécuter des statistiques descriptives – Ceux-ci sont utilisés pour résumer les caractéristiques de base d'un ensemble de données à travers des mesures de tendance centrale (moyenne, mode et médiane), de dispersion (plage, quartiles, variance et écart type) et de distribution (asymétrie et aplatissement).

Exécuter des statistiques inférentielles appropriées - Cela permet aux chercheurs d'évaluer leur capacité à tirer des conclusions qui vont au-delà des données immédiates. Par exemple, si un échantillon représente la population s'il existe des différences entre deux ou plusieurs groupes s'il y a des changements au fil du temps ou s'il existe une relation entre deux ou plusieurs variables.

Assurez-vous de sélectionner le bon test statistique - Cela repose sur la connaissance de la nature de vos variables, de leur échelle de mesure, de leur forme de distribution et des types de questions que vous souhaitez poser.

Rechercher une signification statistique - Ceci est généralement capturé par une "valeur p", qui évalue la probabilité que vos résultats soient plus qu'une coïncidence. Plus la valeur p est faible, plus les chercheurs peuvent être convaincus que les résultats sont authentiques.


Analyse quantitative à l'aide de la modélisation par équation structurelle

Les scientifiques de l'USGS sont impliqués depuis un certain nombre d'années dans le développement et l'utilisation de la modélisation par équation structurelle (SEM). Cette méthodologie représente une approche de la modélisation statistique qui se concentre sur l'étude d'hypothèses de cause à effet complexes sur les mécanismes opérant dans les systèmes. SEM est de plus en plus utilisé dans les études écologiques et environnementales et ce site cherche à fournir du matériel pédagogique lié à cette entreprise. Ce site propose des tutoriels, des exercices et des exemples conçus pour aider les chercheurs à apprendre et à appliquer SEM. Veuillez cliquer sur l'onglet "Science" pour en savoir plus.

L'une de nos applications de SEM a été de découvrir comment les activités humaines sont liées à l'intégrité écologique dans les parcs nationaux.

Comment utiliser ce site

Ce site propose des tutoriels, des exemples et des exercices pour ceux qui souhaitent apprendre des méthodes de modélisation d'équations structurelles de base ou spécialisées. Une description de ce qui a été ajouté et quand se trouve dans le document Quoi de neuf.

Les commentaires sur les didacticiels existants et les suggestions de didacticiels supplémentaires peuvent être envoyés à [email protected] Veuillez noter que même si les e-mails à cette adresse seront lus, nous ne pouvons pas fournir de réponses individuelles en raison des contraintes de temps. Pour cela, nous nous excusons, mais nous espérons que les documents fournis seront utiles.

Pour recevoir des avis de mise à jour

Nous maintiendrons une liste de diffusion pour envoyer des mises à jour aux personnes intéressées à suivre le développement de nouveaux matériaux. Faites-nous part de votre intérêt en envoyant un message à [email protected]

Contenu du site pdf

Prélude - Qu'est-ce que la modélisation par équation structurelle (SEM) ? vidéo pdf

Exemple d'étude basée sur SEM (SEM.0a) pdf

I. Introduction et contexte

Essentiels SEM
Résumé des points (SEM.1.1) pdf
Anatomie des modèles SE (SEM.1.2) pdf
Spécifications du modèle (SEM.1.3) pdf
Estimation (SEM.1.4) pdf
Règles de chemin (SEM.1.5) pdf
Interprétation des coefficients (SEM.1.6) pdf
Interprétation des effets des prédicteurs catégoriels (SEM.1.7) données de code pdf
Coefficients impliquant des variables enregistrées (SEM.1.8) pdf

Faire du SEM en R
Introduction aux données de code pdf de Lavaan (SEM.2.1)
Référence de syntaxe Lavaan (SEM.2.1a) pdf
Données de code pdf d'estimation locale des équations (SEM.2.2)

Données de code pdf d'évaluation du modèle (SEM.3)
Données de code pdf de l'exercice d'évaluation du modèle

II. Éléments de base de la modélisation

Aperçu du processus de modélisation (SEM.4) pdf
Données de code pdf du test de médiation (SEM.5)
Test d'exercice de médiation données de code pdf
Données de code pdf SEM versus régression multiple (SEM.6)
Principes de modélisation causale revisités (SEM.7) pdf
SEM versus ANOVA et ANCOVA (SEM.8) pdf

III. Modélisation avec des variables latentes et composites

Modélisation avec variables latentes (SEM.9.1) données de code pdf
Données de code pdf de l'analyse factorielle confirmatoire (SEM.9.2)
Données de code pdf de l'exercice d'analyse factorielle confirmatoire
Composites et indicateurs formatifs (SEM.10.1) code pdf
Composites et non-linéarités endogènes (SEM.10.2) pdf
Composites à effets multiples (SEM.10.3) pdf
Données de code pdf d'exercice sur les composites à effets multiples
Composites - Comparaison des spécifications (SEM.10.4) pdf


Données quantitatives : méthodes de collecte

Les données quantitatives étant sous forme de nombres, l'analyse mathématique et statistique de ces nombres peut conduire à l'établissement de résultats concluants.

Il existe deux principales méthodes de collecte de données quantitatives :

Enquêtes: Traditionnellement, les enquêtes étaient menées à l'aide de méthodes papier et ont progressivement évolué vers des supports en ligne. Les questions fermées constituent une partie importante de ces enquêtes car elles sont plus efficaces pour collecter des données quantitatives. L'enquête propose des options de réponse qui, selon eux, sont les plus appropriées pour une question particulière. Les sondages font partie intégrante de la collecte des commentaires d'un public plus large que la taille conventionnelle. Un facteur critique concernant les enquêtes est que les réponses recueillies doivent être telles qu'elles puissent être généralisées à l'ensemble de la population sans divergences significatives. Sur la base du temps nécessaire pour remplir les sondages, ils sont classés dans les catégories suivantes :

  • Études longitudinales: Un type de recherche observationnelle dans laquelle le chercheur de marché mène des enquêtes d'une période de temps spécifique à une autre, c'est-à-dire sur une période de temps considérable, est appelé enquête longitudinale. Cette enquête est souvent mise en œuvre pour l'analyse des tendances ou des études où l'objectif principal est de collecter et d'analyser un modèle de données.
  • Études transversales : Un type de recherche observationnelle dans lequel l'étude de marché mène des enquêtes à une période donnée sur l'échantillon cible est connu sous le nom d'enquête transversale . Ce type d'enquête met en œuvre un questionnaire pour comprendre un sujet spécifique de l'échantillon à une période de temps définie.

Pour administrer une enquête pour collecter des données quantitatives, les principes ci-dessous doivent être suivis.

  • Niveaux fondamentaux de mesure - Échelles nominales, ordinales, d'intervalle et de rapport : Il existe quatre échelles de mesure qui sont fondamentales pour créer une question à choix multiples dans une enquête de collecte de données quantitatives. Ce sont des échelles de mesure nominales, ordinales, d'intervalle et de rapport sans les bases desquelles, aucune question à choix multiples ne peut être créée.
  • Utilisation de différents types de questions : Pour collecter des données quantitatives, des questions fermées doivent être utilisées dans une enquête. Il peut s'agir d'un mélange de plusieurs types de questions, notamment des questions à choix multiples telles que des questions d'échelle différentielle sémantique, des questions d'échelle d'évaluation, etc., qui peuvent aider à collecter des données pouvant être analysées et interprétées.
  • Distribution de l'enquête et collecte des données de l'enquête : Dans ce qui précède, nous avons vu le processus de construction d'une enquête ainsi que la conception de l'enquête pour collecter des données quantitatives. La distribution de l'enquête pour recueillir des données est l'autre aspect important du processus d'enquête. Il existe différentes manières de distribuer l'enquête. Certaines des méthodes les plus couramment utilisées sont :
    • E-mail: L'envoi d'un sondage par courrier électronique est la méthode de distribution d'enquête la plus couramment utilisée et la plus efficace. Vous pouvez utiliser la fonction de gestion des e-mails de QuestionPro pour envoyer et collecter des réponses à l'enquête.
    • Acheter des répondants : Un autre moyen efficace de diffuser une enquête et de collecter des données quantitatives consiste à utiliser un échantillon. Étant donné que les répondants sont bien informés et sont également ouverts à participer à des études de recherche, les réponses sont beaucoup plus élevées.
    • Intégrer l'enquête dans un site Web :L'intégration d'un sondage dans un site Web augmente le nombre de réponses, car le répondant est déjà à proximité de la marque lorsque le sondage apparaît.
    • Répartition sociale : L'utilisation des médias sociaux pour diffuser l'enquête permet de collecter un plus grand nombre de réponses de la part des personnes connaissant la marque.
    • QR Code: Les codes QR QuestionPro stockent l'URL de l'enquête. Vous pouvez imprimer/publier ce code dans des magazines, sur des panneaux, des cartes de visite ou sur à peu près n'importe quel objet/support.
    • Sondage SMS : Un moyen rapide et efficace de mener une enquête pour recueillir un grand nombre de réponses est l'enquête par SMS.
    • Application QuestionPro : L'application QuestionPro permet de diffuser rapidement des sondages et les réponses peuvent être collectées à la fois en ligne et hors ligne.
    • Intégration API : Vous pouvez utiliser l'intégration API de la plate-forme QuestionPro pour que les répondants potentiels répondent à votre sondage.

    Entretiens individuels : Cette méthode de collecte de données quantitatives était également traditionnellement menée en face-à-face mais s'est déplacée vers des plateformes téléphoniques et en ligne. Les entretiens offrent à un spécialiste du marketing la possibilité de recueillir des données détaillées auprès des participants. Les entretiens quantitatifs sont extrêmement structurés et jouent un rôle clé dans la collecte d'informations. Ces entretiens en ligne comportent trois sections principales :

    • Entretiens en face à face : Un intervieweur peut préparer une liste de questions d'entrevue importantes en plus des questions d'enquête déjà posées. De cette façon, les personnes interrogées fournissent des détails exhaustifs sur le sujet en discussion. An interviewer can manage to bond with the interviewee on a personal level which will help him/her to collect more details about the topic due to which the responses also improve. Interviewers can also ask for an explanation from the interviewees about unclear answers.
    • Online/Telephonic Interviews: Telephone-based interviews are no more a novelty but these quantitative interviews have also moved to online mediums such as Skype or Zoom. Irrespective of the distance between the interviewer and the interviewee and their corresponding time zones, communication becomes one-click away with online interviews. In case of telephone interviews, the interview is merely a phone call away.
    • Computer Assisted Personal Interview: This is a one-on-one interview technique where the interviewer enters all the collected data directly into a laptop or any other similar device. The processing time is reduced and also the interviewers don’t have to carry physical questionnaires and merely enter the answers in the laptop.

    All of the above quantitative data collection methods can be achieved by using surveys, questionnaires and polls.

    Quantitative Data: Analysis Methods

    Data collection forms a major part of the research process. This data however has to be analyzed to make sense of. There are multiple methods of analyzing quantitative data collected in surveys . Elles sont:

    • Cross-tabulation:Cross-tabulation is the most widely used quantitative data analysis methods. It is a preferred method since it uses a basic tabular form to draw inferences between different data-sets in the research study. It contains data that is mutually exclusive or have some connection with each other.
    • Trend analysis:Trend analysis is a statistical analysis method that provides the ability to look at quantitative data that has been collected over a long period of time. This data analysis method helps collect feedback about data changes over time and if aims to understand the change in variables considering one variable remains unchanged.
    • MaxDiff analysis: The MaxDiff analysis is a quantitative data analysis method that is used to gauge customer preferences for a purchase and what parameters rank higher than the others in this process. In a simplistic form, this method is also called the “best-worst” method. This method is very similar to conjoint analysis but is much easier to implement and can be interchangeably used.
    • Conjoint analysis: Like in the above method, conjoint analysis is a similar quantitative data analysis method that analyzes parameters behind a purchasing decision. This method possesses the ability to collect and analyze advanced metrics which provide an in-depth insight into purchasing decisions as well as the parameters that rank the most important.
    • TURF analysis:TURF analysis or Total Unduplicated Reach and Frequency Analysis, is a quantitative data analysis methodology that assesses the total market reach of a product or service or a mix of both. This method is used by organizations to understand the frequency and the avenues at which their messaging reaches customers and prospective customers which helps them tweak their go-to-market strategies.
    • Gap analysis:Gap analysis uses a side-by-side matrix to depict quantitative data that helps measure the difference between expected performance and actual performance. This data analysis helps measure gaps in performance and the things that are required to be done to bridge this gap.
    • SWOT analysis:SWOT analysis , is a quantitative data analysis methods that assigns numerical values to indicate strength, weaknesses, opportunities and threats of an organization or product or service which in turn provides a holistic picture about competition. This method helps to create effective business strategies.
    • Text analysis:Text analysis is an advanced statistical method where intelligent tools make sense of and quantify or fashion qualitative and open-ended data into easily understandable data. This method is used when the raw survey data is unstructured but has to be brought into a structure that makes sense.

    Learn More: MaxDiff Analysis vs Conjoint Analysis

    Steps to conduct Quantitative Data Analysis

    For Quantitative Data, raw information has to presented in a meaningful manner using data analysis methods. Quantitative data should be analyzed in order to find evidential data that would help in the research process.

    • Relate measurement scales with variables: Associate measurement scales such as Nominal, Ordinal, Interval and Ratio with the variables. This step is important to arrange the data in proper order. Data can be entered into an excel sheet to organize it in a specific format.
    • Connect descriptive statistics with data: Link descriptive statistics to encapsulate available data. It can be difficult to establish a pattern in the raw data. Some widely used descriptive statistics are:
        1. Mean- An average of values for a specific variable
        2. Median- A midpoint of the value scale for a variable
        3. Mode- For a variable, the most common value
        4. Frequency- Number of times a particular value is observed in the scale
        5. Minimum and Maximum Values- Lowest and highest values for a scale
        6. Percentages- Format to express scores and set of values for variables
    • Decide a measurement scale: It is important to decide the measurement scale to conclude descriptive statistics for the variable. For instance, a nominal variable score will never have a mean or median and so the descriptive statistics will correspondingly vary. Descriptive statistics suffice in situations where the results are not to be generalized to the population.
    • Select appropriate tables to represent data and analyze collected data: After deciding on a suitable measurement scale, researchers can use a tabular format to represent data. This data can be analyzed using various techniques such as Cross-tabulation or TURF .

    Learn More: Data analysis in research


    Label-Free Molecular Vibrational Imaging for Cancer Diagnosis

    Liang Gao , Stephen T.C. Wong , in Cancer Theranostics , 2014

    Data Analysis

    Quantitative analysis was performed to separate cancer from noncancer samples, supporting the potential of the system in determining surgical margins. To this end, a semiautomatic segmentation algorithm was developed to precisely delineate boundaries of cell nucleus ( Figure 11.3(a) ). The algorithm consists of one manual step and four automatic steps to obtain an accurate nuclear boundary, as shown in Figure 11.3(b) through (f) . Following nuclear segmentation, 5 cellular features were calculated, including nuclear size, maximum, minimum, and average neighbor distance of a cell in the Delaunay triangulation graph [27] and variation of nuclear orientation between adjacent cells as defined in Gao et al. [25] . Because of the diversity among different cells within each image, the measurement of each feature resulted in producing a unique distribution. To characterize these distributions, we then made use of the mean value and standard deviation of each distribution, leading to a total of 10 quantitative features (a 10-element vector) to represent each sample. A principal components analysis (PCA) [28] was further performed to reduce the data dimensionality and reach immediate visualization of the data distribution.

    Figure 11.3 . Overview of the nuclear segmentation process and the resulting Delaunay triangulation graph. (a) through (f) are five illustrative steps for nuclear segmentation. (g) Delaunay triangulation on the segmented image.


    Voir la vidéo: Analyse des données quantitatives (Décembre 2021).