Avant propos Pr J.D. Guelfi

L'emploi d'une évaluation standardisée en psychiatrie est relativement récent. La psychométrie désigne cette discipline qui consiste précisément à évaluer les phénomènes psychiques à l'aide d'instruments standardisés d'appréciation. Elle a été définie en 1879 par Galton comme "l'art d'imposer aux opérations de l'esprit la mesure et le nombre". Cette psychologie quantitative qui, souvent, explore des contenus psychopathologiques, comprend les tests mentaux (Cattell, 1890), dont les questionnaires font partie, les échelles d'évaluation (1915) et, de développement plus récent, les listes de critères diagnostiques.

Dans les tests mentaux, un stimulus rigoureusement standardisé est présenté à un sujet. La réaction de celui-ci - c'est-à-dire sa réponse - est enregistrée et comparée à celle d'une population de référence, population générale ou population atteinte d'une pathologie définie. Cette comparaison permet un classement quantitatif ou typologique du sujet examiné par rapport à la population d'étalonnage de référence (P. PICHOT).

Dans les échelles d'évaluation, le comportement du sujet examiné est observé dans une situation semi-standardisée seulement ; et c'est un observateur qui apprécie l'absence ou l'existence ainsi que l'intensité éventuelle de divers symptômes ou comportements.

Dans le langage courant, on distingue donc les tests que sont les questionnaires (inventories) remplis par les patients, "auto-questionnaires" ou questionnaires "autoestimation" et les échelles d'évaluation (rating scales) remplies par des tiers. Cette distinction est moins tranchée dans la littérature anglo-saxonne où les questionnaires sont souvent qualifiés de "self rating-scales".

Les listes à cocher (check-lists) sont, selon les cas, remplies par les patients, assimilées alors aux questionnaires, ou remplies par des observateurs. Les listes de critères appartiennent à cette dernière catégorie. Elles sont parfois intitulées "échelles-critères".

Nous aborderons successivement les principaux types de questionnaires ou d'échelles utilisables en psychopathologie, les principales qualités que ces instruments d'évaluation doivent avoir pour qu'ils aient un intérêt pratique, leur domaine d'application enfin.

Un questionnaire est une épreuve qui comprend un certain nombre de propositions ou de questions pour lesquelles on demande au sujet de répondre par oui ou non, par vrai ou faux, parfois encore par "je ne sais pas". Il existe également des questionnaires avec des réponses à choix multiples. Les questionnaires sont très fréquemment employés en psychologie. Ils sont relativement faciles à appliquer et à corriger. Leur interprétation se fait en comparant les notes obtenues par les sujets examinés et celles obtenues dans les différents groupes de sujets qui ont permis l'étalonnage ; ceci permet de situer le sujet par rapport aux diverses variables cliniques évaluées. Certains questionnaires de personnalité explorent une ou diverses dimensions de la personnalité, le plus souvent dans une perspective biphasique ou polyphasique de "traits" de personnalité. D'autres questionnaires ont pour objectif de faire évaluer par le patient non plus ses traits de personnalité mais son état actuel.

Comme nous le verrons, certains questionnaires explorent la psychopathologie générale comme les "symptom check-lists", d'autres explorent une pathologie déterminée comme les questionnaires de dépression ou d'anxiété. De façon encore plus spécifique, certaines épreuves évaluent les phobies, les obsessions, des comportements divers, par exemple, impulsifs, boulimiques, etc.

Les échelles d'appréciation représentent une modalité particulière, codifiée, du jugement clinique. Elles visent à faire analyser symptômes ou comportements dans une situation semi-standardisée par un observateur. Selon les cas, ce dernier peut être un médecin, un infirmier, une assistante sociale, un psychothérapeute, etc. 

Les échelles d'évaluation sont parfois cotées de façon dichotomique en oui-non ou en présent-absent. Le plus souvent la cotation est graduée, par exemple à l'aide d'une gamme d'adverbes ; une pathologie sera qualifiée de : "absente", "peu marquée", "marquée", "importante", "extrêmement importante". On utilise assez souvent une cotation selon une intensité croissante des variables explorées : en 3 points, 5 points, 7 points… Enfin, selon la nature de la pathologie explorée, on distingue les échelles d'appréciation globale de la pathologie, les échelles de psychopathologie générale ou les inventaires généraux et les échelles dites spécifiques d'une pathologie déterminée comme les échelles d'anxiété, de dépression, d’obsessions, etc.



LES QUALITÉS MÉTROLOGIQUES EN PSYCHOMÉTRIE
Pour qu'un questionnaire ou une échelle d'évaluation ait une utilité clinique, il est nécessaire qu'un certain nombre de qualités de mesure soient réunies et que cellesci aient été vérifiées préalablement à l'usage de l’outil dans la pratique courante.

Les principales de ces qualités sont la sensibilité (sensibility), la fidélité (reliability) et la validité (validity). Le terme de fiabilité (fiability), de plus en plus fréquemment employé, désigne habituellement le fait qu'il y a une adéquation satisfaisante entre l'instrument d'évaluation et les objectifs que l'on poursuit en l’employant, avec, notamment, une fidélité suffisante.

La sensibilité. Un instrument d'évaluation est dit sensible s'il permet de différencier un nombre suffisant de degrés d'une même variable, chacune ayant une signification clinique particulière. La sensibilité est partiellement liée au nombre d'items constituant l'échelle. En principe, les échelles longues permettent une discrimination plus fine que les échelles courtes.

La fidélité. Il en existe différentes variétés. Dans les tests - et particulièrement dans les questionnaires - c'est une bonne fidélité temporelle ou fidélité test-retest qui est recherchée en premier lieu. Dans ce cas, le test fournit des résultats à peu près identiques lorsqu'il est appliqué deux fois de suite à un même sujet dont l'état ne s'est pas modifié entre les deux passations. En matière d'échelles d'appréciation, c'est surtout une bonne fidélité inter-juges qui est recherchée et vérifiée. Elle s'apprécie par un coefficient de concordance inter-cotateurs. Elle nécessite que l'intitulé des items soit précis, dénué de toute ambiguïté sémantique et limité à des termes dont le sens est approximativement le même pour tous. La fidélité inter-juges s'améliore habituellement à la suite de séances de cotation en commun au cours desquelles on fait examiner un malade ou une série de malades simultanément par divers cotateurs chargés, dans un premier temps, d'effectuer des cotations indépendantes, puis d'expliciter les raisons qui expliquent leur éventuelle diversité de points de vue, puis de répéter l'expérience avec d'autres patients jusqu'à l'obtention d'un résultat satisfaisant. Le strict respect de consignes de cotation suffisamment détaillées est autre nécessité pour pouvoir aboutir à une concordance inter-juges suffisante.

La validité. Un instrument est dit valide lorsqu'il mesure effectivement ce qu'il est censé mesurer. La validité du diagnostic en psychiatrie reste - comme on le sait - un problème irrésolu dans la mesure où le modèle anatomo-clinique y est en règle générale inapproprié, de même que les relations linéaires de causalité. D'autre part, de nombreux progrès restent à faire dans l'identification des phénomènes multifactoriels qui entrent en jeu dans le déterminisme des troubles mentaux. Compte tenu de ces réserves, on peut dire à propos des échelles d'évaluation qu'une certaine validité est assurée, pour une variable donnée, par sa formulation même. Il s'agit d'une validité apparente ou " face validity" de type descriptif. Il n'en est pas obligatoire de même - pour une échelle regroupant plusieurs items - de la note totale, obtenue en faisant la somme des notes des différents items, qui est supposée représenter l'intensité globale du phénomène étudié. Il est en effet nécessaire de vérifier le bien fondé de cette affirmation.

En général, la validation d'une échelle se fait surtout, dans un premier temps, en se référant à un "critère externe" c'est-à-dire extérieur à l'instrument lui même. On peut ainsi, selon les cas, comparer les notes totales obtenues sur une échelle aux jugements cliniques concernant des patients ayant fait l'objet d'investigations cliniques approfondies, ou vérifier que les notes varient de façon satisfaisante lors d'un traitement dont on a pu montrer au préalable l'efficacité générale sur la pathologie explorée, ou encore et surtout comparer les résultats obtenus avec l'échelle ou le questionnaire expérimenté à ceux d'un instrument plus ancien que l'on sait être valide.

Cette validité "concourante" est très employée car la technique en est aisée. Ce type de validité ne suffit pas à prouver que l'instrument expérimental présente un avantage quelconque par rapport à d'autres instruments mieux connus. Aussi faut-il, dans une étude complète de validation, utiliser conjointement des méthodes dites structurales de validation et analyser la cohérence ou la consistance interne de l'instrument d'évaluation, sa structure et la stabilité de celle-ci.

La consistance interne d'une échelle est le reflet de l'homogénéité des divers items qui la constituent. On apprécie généralement celle-ci par l'étude des corrélations entre chaque item et la note globale. Le coefficient alpha de Cronbach représente la mesure la plus répandue de l’homogénéité d’un outil psychométrique.La structure d'un questionnaire ou d'une échelle est généralement étudiée par divers procédés mathématiques qui ressortent de l'analyse factorielle. Celle-ci permet de décomposer un ensemble de N variables en plusieurs sous-ensembles, plus homogènes, décrivant la population sans perte d'information.

Le regroupement de certains items de l'échelle en "facteurs" suffisamment indépendants les uns des autres dépend uniquement des corrélations que contractent les items entre eux. Les calculs dégageant les relations naturelles qui existent entre diverses variables mettent en quelque sorte en évidence les dimensions fondamentales sous-jacentes à la symptomatologie. Toutes les échelles ne possèdent cependant pas de véritable structure factorielle ; en effet certaines d'entre elles n'explorent pas un champ multidimensionnel mais unidimensionnel.

Dans cette éventualité, il n'est pas possible de mettre en évidence plusieurs facteurs mathématiques indépendants les uns des autres, une seule dimension, générale, expliquant la majeure partie des variations des notes (facteur général). Dans les outils multidimensionnels, il est d’usage de vérifier la stabilité de la structure factorielle identifiée qui est un bon critère de la généralisation possible de l’emploi de l’instrument dans une pathologie déterminée.


APPLICATION DES ECHELLES D'EVALUATION ET DES QUESTIONNAIRES
En pratique clinique quotidienne, l'emploi des échelles d'évaluation et des questionnaires peut avoir comme objectif premier d'aider au diagnostic, ou de suivre l'évolution d'un patient sous traitement. En recherche clinique, l'emploi des échelles permet surtout d'améliorer l'homogénéité des groupes de patients.

La première application possible est donc l'aide au diagnostic. Certaines échelles et de nombreux questionnaires ont en effet été construits avec cet objectif. On dispose dans ce cas de notes-seuils correspondant à tel ou tel diagnostic, les études de validation préalables ayant établi le degré de spécificité de l'instrument employé pour identifier la pathologie visée. Les listes de critères et les échelles ont aussi été élaborées avec cet objectif. Leur construction repose sur l'hypothèse, toujours discutée, du Scaling. Selon ce procédé, il existe de multiples équivalences symptomatiques et le diagnostic en psychiatrie peut être conçu selon un modèle additif comme la somme de divers symptômes, une note-seuil permettant de définir l'appartenance à une catégorie diagnostique. Il en est ainsi, par exemple, de la formulation suivante : au moins quatre des huit critères suivants doivent être conjointement réunis pour parler du diagnostic de tel ou tel trouble. Ce seuil - de quatre dans l'exemple choisi - correspond au nombre de critères qui permet la meilleure discrimination statistique possible des patients quant à la présence ou à l'absence du diagnostic. Ce seuil est aussi celui qui conduit au plus faible nombre possible d'erreurs de diagnostic, c'est-à-dire de "faux-positifs" par excès et de "faux-négatifs" par défaut.

La seconde application des échelles d'évaluation et des questionnaires consiste à suivre l'évolution des patients sous traitement. La note globale et les notes factorielles ont toujours une meilleure fidélité que celle des items pris isolément. Une application particulière de l'analyse factorielle qui a fait la preuve de son intérêt en psychopharmacologie consiste à réaliser l'analyse non plus sur les valeurs pré ou post thérapeutiques mais sur les différences de notes de chaque item avant et après traitement. On met ainsi en évidence les "facteurs de changement" sous traitement.

Le troisième groupe d'applications des instruments standardisés concerne la recherche clinique et l'obtention de groupes de patients suffisamment homogènes. Ceci s'avère possible soit par établissement de stéréotypes diagnostiques soit par identification de types nosologiques empiriques.

Pour l'élaboration d'un stéréotype diagnostique, on demande à un nombre suffisant  de cliniciens de se représenter un cas typique d'une catégorie nosologique et de remplir l'échelle étudiée à partir de ce cas imaginé. La moyenne des jugements exprimés permet d'aboutir à un stéréotype moyen du groupe nosologique en question. 

Dans nombre de recherches cliniques, on calcule le degré de similarité ou de dissemblance entre les notes obtenues par les patients examinés et les notes « prototypiques », établies par des experts de la pathologie étudiée.

Pour l'identification des types syndromiques empiriques, on cherche au sein d'un groupe hétérogène de patients si l'on retrouve certains profils particuliers, plus fréquemment que ne le voudraient les combinaisons symptomatiques liées au hasard. Ces profils de fréquence particulièrement élevée définissent des "types" ou "syndromes". Ces opérations sont à la base du diagnostic automatique. On peut comparer le profil d'un patient donné aux divers profils-types connus et définir ainsi des notions de distance et de proximité permettant d'aboutir au diagnostic le plus vraisemblable.

Une dernière application intéressante concerne l'identification de groupes de patients se distinguant les uns des autres par leur réactivité thérapeutique. Ainsi, en fonction des résultats obtenus dans un groupe hétérogène de patients, on peut identifier le profil moyen des "répondeurs" et des "non-répondeurs" au traitement. Si les deux profils identifiés sont significativement différents, on peut tenter de prédire l'action d'un traitement donné à partir de certaines caractéristiques initiales.

En résumé, les champs d'application des méthodes quantitatives en psychopathologie sont nombreux, aussi bien en pratique quotidienne qu'en recherche. Selon les cas, ils concernent la sémiologie descriptive, la nosologie ou la thérapeutique ; les instruments psychométriques permettent de plus d'améliorer la qualité de la communication entre praticiens.

Cet ouvrage présente aux praticiens 90 outils psychométriques utilisés en psychopathologie. Les articles ont été rédigés par trente deux auteurs distincts.

Pour chaque instrument d’évaluation sont exposés successivement après une brève introduction, l’historique et la présentation de l’outil, son mode de construction, les principales études de validation réalisées, le mode de passation, la cotation, les applications, l’intérêt et les limites, enfin un résumé et une courte bibliographie.

  • Le domaine de la psychopathologie générale a été coordonné par Jacques Pellet, avec douze outils et sept auteurs : M. Ansseau, P. Boyer, J.D. Guelfi, J.P. Lépine, J. Pellet, R. von Frenckell et L. Waintraub.

  • Le domaine de la dépression a été coordonné par Maurice Ferreri, avec dix-sept outils et dix auteurs : M. Ansseau, P. Boyer, J. Cottraux, M. Ferreri, J.D. Guelfi, Y. Lecrubier, J.P. Lépine, J. Pellet, J. Thuile et R. von Frenckell.

  • Le domaine de l’anxiété et du stress a été coordonné par Jean-Philippe Boulenger, avec dix-neuf outils et dix auteurs principaux : M. Ansseau, J.P. Boulenger, J. Cottraux, M. Ferreri, A. Hermès, Y. Lecrubier, P. Légeron et coll., A. Pélissolo, J. Pellet et L. Waintraub.

  • Le domaine des psychoses a été coordonné par Charles Siegfried Peretti avec sept outils et sept auteurs : M. Ansseau, P. Boyer, J.D. Guelfi, M.O. Krebs, Y. Lecrubier, J.P. Lépine et C.S. Peretti.

  • Le domaine de la gériatrie a été coordonné par Liliane Israël et Laurence Hugonot-Diener avec onze outils et quatre auteurs : J.D. Guelfi, L. Hugonot-Diener, L. Israël et L. Waintraub.

  • Le domaine de la pédiatrie a été coordonné par Manuel Bouvard avec quatre outils et quatre auteurs : S. Bioulac, M. Bouvard, M. Dugas et C. Galéra. 

  • Le domaine des effets secondaires a été coordonné par Marie-France Poirier avec cinq outils et trois auteurs : A. Galinowski, J.D. Guelfi et L. Waintraub.

  • Le domaine de la réhabilitation psychosociale a été coordonné par Denis Leguay avec deux outils et deux auteurs : D. Leguay et coll. et T. Lecomte.  

  • Le domaine de la qualité de vie a été coordonné par Patrick Martin avec sept outils et quatre auteurs : J.D. Guelfi, C. Lançon, P. Martin et F. Petitjean.

  • Un domaine « Divers » enfin a été rédigé par six auteurs : M. Ansseau, S. Bioulac, M.Bouvard, M. Ferreri, J.D. Guelfi et J. Pellet.


    En hommage à Christian CAUPEILéditeur imprimeur de la version originale des deux tomes de cet ouvrage réalisé en 1991-1993 et en souvenir du travail accompli alors.