I. Introduction
Il ya des confusions autour du teste psychologique ; caricaturaux, dangereux, nécessaire. On ne fait pas de teste à n’importe qui, il faut relever ce qui est un teste en psy et ce qui ne l’est pas. On retrouve des outils éprouvés de mesure des processus, fonctions, traits, états, psychologique non observable (intelligence, mémoire, personnalité).
Un teste éprouvé est un test mis à l’épreuve, on interroge des personnes cibles, on regarde si il mesure bien ce qu’il est censé mesurer. Un test est une évaluation psychométrique de construits psychologiques
Psycho test des magazines : ce test n’a rien de psychologique, il ne renvoie à aucun concept de psy, il ne se réfère à aucun processus, trait ou état. Il ne mesure pas comme annoncé une tendance à être accro au sac, il ne sert pas à identifier un certain degré de connaissance objective par rapport à un sujet (on peut y répondre correctement au hasard).
Il n’a rien d’un test : il n’a aucune logique de structure (hors que test psy oui), il n’a aucune sensibilité, fiabilité (on peut y répondre au hasard) , validité (ne mesure rien, il doit mesurer juste ce qu’il doit mesurer et pas déborder dans d’autre thème) et utilité.
A) Les tests psychométriques
L’évaluation psychométrie : par qui ? Pour quoi ?
Par qui ? Tous les psychologues
Pour quoi ? Mesure de l’anxiété (clinique), motivation, intérêt pro, personnalité (travail), oral, lecture (développement), attention sélective (neuro).
Test- questionnaire beaucoup utilisé par les psychologue car très efficace pour mesurer un construit et très pratique (donne lieu à un score numérique).
Info « par nature » sont insuffisante car différente mesure exacte, objective, finies mais mesure relativement fiable et validée, qui nécessite donc d’être complétée par d’autre test. La différence entre un bon test et moins bon est dans l’erreur mesure, elle doit être très petite.
Qu’est ce que la psychométrie ?
- Branche de la psychologie qui s’intéresse à la mesure des phénomène mentaux non observable
- L’étalonnage :mise en place de norme, score au test est différent dune mesure absolue mais c’est une mesure relative,, c’est non interprétable tel quel.
Exemple du 0 à un test, il ne signifie pas une absence complète ou absolue.
Qu’est ce qu’un test psychologique ?
- Mesure systématisée du degré auquel un individu manifeste une certaine caractéristique (trait de personnalité), qui permet de le comparer puis de le positionner par rapport à son groupe de référence.
- Fonction essentielle du test : pas de mesurer la caractéristique d’un individu en elles même mais en comparaison à celle d’un autre individu.
è En psychométries tous ces scores permettent de caractériser la distribution des scores
è Associer une distribution des scores de référence à chaque test= établir une norme= étalonner
è Avec l’étalonnage, on dispose de repères permettant de situer le score d’un individu par rapport aux scores d’autres individus comparables.
Comment faire un étalonnage :
- Constituer d’un échantillon de population aussi représentatif que possible de la pop de sujet à laquelle on s’intéresse= échantillon de normalisation ou d’étalonnage.
- Soumettre cet échantillon à la situation-test, puis établir grâce à l’ensemble des réponses de la distribution statistique des scores.
- On va mesure la moyenne, l’écart type, la médiane, les quartiles, le score minimum/maximum.
- L’Ensemble de repère utile permet de situer l’individu, comparer ses réponses à celle de ses paires.
L’étalonnage permet de se comparer à un ensemble de personnes les plus porches de nous. Si la dispersion autour de la moyenne est la même pour tout le monde, sa standardisé de score brut c’est qu’on transforme toutes ces moyennes en une même moyenne.
La standardisation
Grace à l’étalonnage, on peut donc donner du sens au score d’un individu en le positionnant dans SA distribution de référence. (Ayant sa propre combinaison de repère)
C’est un méthode efficace mais laborieuse car les repères varient d’une dimension à l’autre, mais aussi d’une population à l’autre, en fonction de leur caractéristique propre ; il faut donc disposer d’autant de distribution de référence qu’il y a de dimension et de population d’intérêt.
è Elle permet de donner du score à 35 score par ex, en une seule fois.
Comment simplifier la procédure ?
En ayant à disposition une seule distribuions de référence = un ensemble unique de repères = une distribution standardisée. On utilise un score standardisée à la place d’un score brute.
Dans la standardisation, on transforme tous les moyens en zéros et écarts-types en 1 de notre score brute.
L’avantage est qu’on perd de la précision dans la standardisation.
Comment ça marche ?
On part d’une base de travail : la distributions des scores des échantillons de normalisation
- Étape 1 : pour chacune des distinctions, les scores sont centrés = on soustrait la moyenne M de chacun deux. C’est donc un score brut qui est centré autour de la moyenne.
A une grande échelle, on arrive à une moyenne pour tous de 0 par ce que c’est comme si on faisait moyenne – moyenne (si petite échelle ça donne pas grand-chose) : X-M
X - m = 0
- Etape 2 : Les scores centrés sont réduits : on divise chaque X-M par l’écart type S.
L’écart type nous dit comment mon score es différent de la moyenne, c’est la variabilité de la moyenne, c’est la distribution de la moyenne.
Importance : la variabilité sont les différences inter- individuelles. La meilleure estimation de la norme est la moyenne mais il faut s’intéresser au variabilité.
X - m)/s
Chaque score est alors transforme en un score centrée réduit = score standardisé
Ensemble des scores standardisé : distribution standardisée = ensemble unique de repère car moyenne = 0 et écart type = 1.
La distribution normale :
Pourquoi cette distribution s’appelle comme ça : derrière cette distribution il y a une distribution naturelle, de phénomène naturelle
- Rappel 1 : disposer d’une distribution de score = avoir repère important permettant de situer le score d’un individu par report aux score d’autre individu comparable : moyenne, écart type, proportion, d’individu associés à telle ou telle chose.
- Rappel 2 : avec la standardisation, les repères moyennes et écart type de toute distribution sont rendues « unique » : m=0 et s=1.
L’apport/ l’intérêt de la distribution porte sur la proportion d’individus associés à tel ou tel score
Quand une distribution est normale, on connaît automatiquement quelle portion d’individu est associée à a quel score car cette proportion est alors toujours la même. On parle de seuil de distribution.
Il est donc fondamental de vérifier la normalité de la distribution, qui prend alors la forme d’une cloche.
Quand pour un test donné, les scores bruts sont distribués normalement, alors les scores standarisés sont eux aussi logiquement distribués normalement.
è La DN est indépendante de l’étalonnage et la standardisation. (On peut avoir une distribution normale sans standardiser nos scores)
Tranche de score basique est toujours associée aux mêmes proportions d’individu. De ça, on est capable de se dire que suite au score, je suis capable de me dire que je fais partie de cette proportion. La standardisation permet de savoir le score est un score moyen ou un score éloigné de la moyenne.
Types de scores :
Ø Score brut : z= X- moyenne / écart type.
Ø Score Z : il permet à tous les échantillons d’avoir la même moyenne et le même écart type.
Ø Score T : transformation du score T : 50+ (10 * Z). La moyenne est fixé a 50 et l’écart type est de 10.
Exemple un score T de 50 correspond à la moyenne et un score T de 60 correspond à un Z de +1.
T nous permet d’interpréter nos résultats.
La structuration factorielle
Cette structurions est divisé en plusieurs dimension. Ils se sont d’abord penché comme la personnalité s’organiser avant de la mesurer, ils se sont penché dessus avec une réflexion théorique sur comment ça s’organise. Le NÉO 3 est un inventaire de personnalité avec 5 grands facteur (voir sur la feuille), mais ce n’est pas le seul.
Bon nombre de construit psychologique mesurés par les tests sont supposés être organisé, structurés autour de plusieurs dimensions. Ex de la personnalité :le modèle théorique majeur défendu actuellement pose que la personnalité est structuré en 5 grands facteurs.
L’enjeu est de vérifier l’adéquation entre le modèle théorique (la structure en 5 grands facteurs pour la personnalité) et les données empiriques recueillies grâce à des questionnaires composés d’un certain nombre d’ items de base.
è Si l’adéquation est bonne, le test satisfait à cette qualité de structuration factorielle.
Pour explorer (ou confirmer) la façon dont les données recueillies se structurent, on analyse l’ensemble des relations (=covariance ou corrélation),entre les réponses de tous les sujets aux items du questionnaires.
Les items qui présentent de forte relation entée eux et de faible relation avec les autres ittems sont regroupés en facette :suivant la même logique, les facettes sont regroupés en facteurs.
Le nombre et la nature des facettes et facteur empiriques ainsi obtenus sont alors comparés aux facettes et facteurs théorique issus du modèle pour savoir s’ils correspondent. Tout ceci correspond à l’analyse factorielle.
Les facteurs orthogonaux en statistique sont des regroupements d’items évoluent ensemble, cela suggère qu’ils appartiennent à un même groupe ou facteur. Cependant, pour qu’ils forment réellement un facteur distinct, il faut aussi que leur réponses ne covariance que très peu, vire pas du tout, avec comme d’autre items.
On déduit de ces covariance que les items de ces données forment un même paquet, on met donc dans la mm paquet les items concernés à conditions que ces items soient éloignés des autres items, ils doivent peu ou pas co varié avec les premier items.
La sensibilité ou finesse discriminative
La sensibilité ou finesse discriminative est la capacité d’un test à classer les performances des individus en les différenciant les uns ds autres.
- Si trop peu de catégorie notre questionnaire n’est pas sensible
- Dans le cas du neo – pi-R, par exemples il n’y avait pas deux profils identiques.
On dispose de plusieurs indices pour apprécier la sensibilité d’un test.
- Inventaire pas sensible = inventaire qui met des gens dans les mêmes catégories.
Comment rendre un test sensible ?
Le nombre de scores disponibles suite à la passation du test
- Un test avec peu d’item et des échelons de repose dichotomique (oui/non) est moins discriminant qu’un test vécu beaucoup d item et des échelons plus variés.
Adaptation du test à la population étudié
- Un test trop facile ou trop d’affilé est moins discriminant qu’un test de difficulté modérée « calibré » au niveau des sujets. Un test trop difficile ou trop facile fait que tout le monde ait le même score.
Effet plafond : facile
Effet plancher : trop difficile.
La fiabilité
C’est la consistance des mesures d’un test c’est-à-dire sa capacité à rendre compte du « score vrai » du sujet affranchi du hasard. Il n’existe évidemment pas de test 100% fiable. On cherche une fiabilité suffisante.
Sur la base de réponses auto-rapporté, il est impossible d’avoir une fiabilité totale. Les réponses au test peuvent varier d’un jour à l’autre du fait de facteur aléatoire. Les divergences de réponses produisent par les facteurs aléatoire sont cependant à la marge pour un test fiable.
Le vrai score correspond à notre personnalité dans la vraie vie. Sur le plan individuel, le score vrai correspond à la masure des caractéristiques du sujet.
Une telle mesure n’existe pas : les scores observés sont toujours entachés d’une certaine erreur de mesure aléatoire. Toute mesure du test est une approximation d’un score vrai.
Score observé
Sur le plan global, un test est fiable quand les différences entres les scores observés entre les sujets reflètent mes vraies différences inter individuelles concernant les caractéristiques d’intérêt.
Statistiquement, le coefficient de fiabilité varie entre 0 et 1 plus il se rapproche de 1 d’ailleurs est la fiabilité du test est meilleure (et moins grande est l’erreur). Ce coefficient est la pour minimiser l’erreur aléatoire. Le but est de savoir si les différences entre nous sont vraies ou sont des erreurs. L’ensemble des différences observées doit être la plus proche possible de l’ensemble des différences vraies, en faisant passer le test 1 fois a 100 individu.
Comment savoir si un score est faible ?
Il y’a plusieurs indices :
- Le test – retest ou fiabilité par constance, stabilité : administrer à niveau le mm ntest aux memes sujets après une certaine intervalle de temps. Si les écarts de scores sont faibles = aucun effet du temps passé entre T1 et T2 constance ou stabilité de la mesure -> test faible
Ex : un test d’intelligence qui donne un Q1 de 115 au temps T, et de 76 une semaine plus tard au temps t2 est un test peu fiable, car aboutissant à des mesures peu consistantes, qui semble beaucoup plus refléter le degrés de fatigue du sujet.
- Équivalence ou fiabilité parallèle d’un même test : administré deux versions parallèles d’un même test aux mm sujets. Si les écarts entre score A vs version B sont faibles = équivalence des deux versions – test fiable.
Ex : un test clinique qui classe le sujet comme schizophrène dans sa version A mais comme simplement épuisé dans sa version B est un test peu fiable, car aboutissant à des mesures inconstantes, qui semble plus refléter le degré de motivation du sujet (faible pour version A mais fort pour version B) que la pathologie de ce dernier.
- Cohérence interne ou fiabilité par bissection : administrer un même test à tous les sujets d’intérêt en une seule fois pour diviser ce test en deux sous parties équivalentes (par ex, items pairs vs items impaires). Si les écarts score sous parties 1 vs sous partie 2 sont faibles = cohérence interne entre les deux sous partis = test fiable.
- Homogénéité ou fiabilité par consistance inter-items : administrer le même test à tous les sujets d’intérêt une seule fois puis déterminer à quel point chacun des items censé relevé d’une même dimension est effectivement relié/corrélé aux autres. Si les écarts entre les scores à ces items sont faible = constance inter item fort pour la dimension concernée – test fiable.
Ex : pour estimer l’homogénéité du Neuroticisme, les auteurs ont mesuré à quel point les sujets décrits comme timides sont aussi décris impulsif, et …. Vulnérable et ceux décrits comme peu timides se sont aussi décrits peut impulsifs, …, et peu vulnérable. Si c’est trop proche de 1 c’est qu’il y’a de la redondance.
Mesure principale = alpha de Cronbach – consistance OK à partir de a > 70
Les qualités psychométrique d’un test : ajouter photo « donc »
Les erreurs types de mesures, l’erreur aléatoire est l’écart entre les scores, cet écart se matérialise par l’erreur type de mesure par un calcule.
Si a = r ressente le degrés de fiabilité de la mesure, alors « 1-r » représente l’erreur de mesure, c’est-à-dire la part des différences observées entre sujet (sur l’ensemble des différences observés) qui ne reflète pas des différence vraies entre sujet sur tel ou tel trait. Cette part est appelé l’erreur type de mesure (ETM) ou erreur standard de mesure (ESM)
Cette erreur est donc la part des différences observée qui ne correspondent pas à des différences vraies, l’ensemble de ces différences donne des différences observées avec des diff vraies. Chacun de ces ensembles sont des différences observées qui approches des diff vraies mais qui ne peut pas les atteindre. (Erreurs type de mesure)
L’ensemble de ces diff entre les sujets sont des écart types
è On a donc : 1- R (part de l’erreur dans les différences observées) = ESM au carré / ET (écart type) au carré
C’est la proportion des différences.
Quel est l’interêt de la mesure ESM ?
C’est un élément de base pour identifier le score vrai du sujet, ou plus exactement, la tranche des scores dans laquelle le score vrai du sujet a de fortes chances pour se trouver. S’approcher du score vrai du sujet (de sa personnalité réelles de ses vraies aptitudes) = objectif principales du praticien psychologue.
Comment ça marche ?
Ø Base de travail : score observé des sujets/ du sujet (connus)
Écart – type / erreur- standard de mesure (calculable)
Probabilité que le score de tel ou tel sujet se trouve dans l’intervalle « de confiance » autour de la moyenne / de se tromper quant à la valeur du score vrai du sujet.
Principe globale : dans toute distance normale réduite, 95% des scores des sujets se situent à + ou – 1,96 écart type de la moyenne (=0) des scores, il y’a 95% de chances que le socre de tel sujet se trouve a + ou – 1,96 E-T de la moyenne
Principe individuel : dans toute distance normale réduite, 95 des scores du sujet se situent à + ou – 1,96 ESM de son vrai score -il y’a 95% de chance que son score vri se trouve à + ou – 1,96 ESM de son score observé.
Ø La validité : il s’agit du degrés auquel un test mesure ce qu’il est censé mesurer et rien d’autre. Statiquement, le coefficient de validité varie entre 0 et 1, plus il se rapproche de 1, meilleure est la validité du test (et moins grande est l’erreur)
Ex non valide de l’intelligence : compter le nombre de lire que qlq a pour voir son intelligence
Ex non valide de la creativité : considérer le nombre de page écrite par un individu en une semaine comme une mesure de sa créativité.
- Validité apparente : impression que le test mesure ce qu’il doit mesurer. Evalué au moye d’un examen de surface non approfondi des items du questionnaires réalisé par les sujets eux-mêmes ou par des juges non spécialistes du domaine d’étude.
Ex : test de mémoire
- Validité de contenue ou représentative : évaluation du degré auquel les items d’un test sont bien représentatifs de a caractéristique visée, prend la forme d’analyser indépendantes du contenu du test par plusieurs experts reconnus du domaine d’étude, dont on estime ensuite le degrés de concordance – valdité du contenu OK et si Concordance forte quant à la bonne représentativité des items.
- Validité empirique ou de critère : evaluation de l’ampleur des relations entre le score au test et toutes autre épure indépendante de la caractéristiques que le test est censé mesurer. Cette mesure indépendantes = le critère. Plsuorus relation sont fortes, plus les scores au test sont aptes à prédire les scores au critères – validité empirique OK.
Concomitante : 2 mesures se font en même temps = Diagnostic
Prédictive : test puis mesure du critère = pronostic
Ex : test d’aptitude informatiques apte à prédire un niveau de perfomances en tant qu’informaticien.
- Validité empirique ou de critère = à leur de diagnostic / pronostic qui rend cet indice fondamental pour tout psychologue praticien. Le psy de l’éducation peut utiliser ce test pour les relations ente certain traits de personalté et de critère d’intérêt comme la pensée divergente ou la réussite sociale.
Le psy clinicien ou neuropsy peuvent employer ce t est pour aider au repérage de certain troubles cliniques comme la détresse psychogloqoues, certains mécanismes de défense. Le psy du travail peut se servir de ce test à des fins de sélections, de pronostic de capacité ou de travail en équipe.
- Validté theorique ou conceptuelle : évolution grâce à un ensemble de technique jusqu’à quel point le test fournit une mesure adéquat de la caractéristique viée / du concept theorique censé être mesuré.
Ne se fait pas « en un seul coup », mais par une accumulation progressive de données dont la première étape
Validité convergente : relation forte entre socre au test et score à test plus ancien reconnu comme des bonnes levures de la caractéristique visée.
Validité divergente : relation faible entre socre au test et socre à test plus ancien reconnus comme mesurant autre chose que la caractéristique visée.
II. La perspective différentielle.
C’est une approche psychométrique de la personnalité : usage des tests – questionnaires pour identifier la structure de la personnalité.
Méthode nomothétique : c’est un travail avec des statistique, on travaille avec un grand nombre, identification des grandes lois communes à tous les individus (méthode idographique, centration sur l’individu, non abordée (étude de cas, méthode projective).
Personnalité « normale » au sens du DSM- IV présenté.
Elle se différencie de la psychanalyse, de l’humaniste (rogers), de l’apprentissage (skinner et bandura), de la cognitive (Kelly et mischel) et de la psychobiologie (Gray , zuckerman, cloninger)
Un peu d’histoire :
Ø Hippocrate : description des conduites individuelles sur la base d’une typologie des humeurs (en référence au sang, à la bile noir, de la bile jaune, à la lymphe )
Ø Galien : à partir de la typologie des humeurs, identification de 13 type de personnalité. (Le type « sanguin »
Étymologie du mot personnalité vient du mot persona (masque de théâtre)
- Description des caractères / émotions des acteurs permettant au public de comprendre voir expliquée et prévoir les conduites des acteurs
- Masque inchangé au cours de la pièce
- Nombre limité de masque (12 masque)
A) Terminologie en psychologie de la personnalité
- De très nombreuses définitions
- Personnalité : psychologie général des différences individuelles
- Personnalité : large ensemble de traits latents, permanents, stable et reliés entre eux. La personnalité peut être considérée comme la résultat de facteur héréditaire.
La personnalité n’est pas du temperament
- Base biologique (idée présente dès l’antiquité)
- Apparition dès l’en
- Dimension affective de la personnalité
Le temperament est plus réducteur que la personnalité car :
La personnalité à des bases autres que biologique (ou pas seulement biologique) et la personnalité ne comporte pas qu’une dimension affective ou émotionnelle ( cette dimension ne concerne que 2 des facteurs de personnalité)
Le terme « caractère » est longtemps utilisé comme synonyme de « personnalité ». Progressivement, le mot caractère est de moins utilisé comme synonyme de personnalité car le caractère reflète un jugement de valeur que ne reflète pas de la personnalité.
Trait de personnalité a une tendance temperamentales sous j accents. Prédisposions à « tendance à », potentialité non directement observable en interaction avec l’environnement.
Adaptation caracteriduqe (conception de soi, attitude, valeur). Conduites observables ihérentes à la personnalité. Ces traits dépendent de leur intensité, ceux qui ont tendance à être la dans des situation alors il s’ actualise.
Type de personnalité : ce sont des configurations de caractéristiques, des patterns dorgasation de différents traits. (Ex type résilience et type extraverti)
Le type est donc différent de facteur de personnalité car le type se situe à un niveau supérieur du facteur = il peut représenter une combinaison de facteur. Le type est binaire/ categoriel alors que le facteur est à consideré comme un continuum avec deux pôles opposés.
Les triples objectif de la personnalité
- Descritpion exhaustive et parcimonieuse de la perosnnalité.
- Explication de l’émergence des traits de personnalité
- Prédiction des conduites à partir de la connaissance de la personnaliré.
Les grandes questions relatives à la personnalité
Q1 : la personnalité est une disposition ou une situation (environnement) ?
Le poids des facteurs héréditaires vs issu de l’environnement dans la personnalité
Thèse « héréditaire » : personnalité est principalement issues de facteurs génétiques/ base biologique.
Influence majorité voir totale des dispositions ou traits dans l’expression de la personnalité.
Thèse situationniste : personnalité dépend fortement des situations, des contraintes environnementales.
Constat de la faible cohérence inter-situationnelle des conduites et de la faiblesses des corrélations traits- conduites.
La conception « interactionniste », ni tout dispsitionnaliste, ni tout situationniste, différences interindividuelles de personnalité et de ses conduites afférentes issues d’interaction entre les caractérisques individuelle et les caractéristiques environnemental
Personnalité = génétiques + milieu + interaction.