Certains sceptiques considèrent que le test des taches d’encre de Rorschach est une pseudoscience, car plusieurs études ont suggéré que les conclusions tirées par les administrateurs de tests depuis les années 1950 s’apparentaient à une lecture froide. Dans l’édition 1959 du Mental Measurement Yearbook, Lee Cronbach (ancien président de la Psychometric Society et de l’American Psychological Association) est cité dans une critique : « Le test a échoué à plusieurs reprises en tant que prédiction de critères pratiques. Il n’y a rien dans la littérature qui encourage à se fier aux interprétations du Rorschach. » En outre, le principal critique Raymond J. McCall écrit (p. 154) : « Bien que des dizaines de milliers de tests de Rorschach aient été administrés par des centaines de professionnels formés depuis cette époque (d’une revue précédente), et bien que de nombreuses relations avec la dynamique de la personnalité et le comportement aient fait l’objet d’hypothèses, la grande majorité de ces relations n’ont jamais été validées empiriquement, malgré la parution de plus de 2 000 publications sur le test. » Un moratoire sur son utilisation a été demandé en 1999.
Un rapport de 2003 de Wood et ses collègues avait des avis plus mitigés : » Plus de 50 ans de recherche ont confirmé le verdict final de Lee J. Cronbach (1970) : certains scores de Rorschach, bien que très en deçà des affirmations des promoteurs, possèdent néanmoins une ‘validité supérieure au hasard’ (p. 636). Sa valeur en tant que mesure du trouble de la pensée dans la recherche sur la schizophrénie est bien acceptée. Il est également utilisé régulièrement dans les recherches sur la dépendance et, moins souvent, dans les études sur l’hostilité et l’anxiété. En outre, des preuves substantielles justifient l’utilisation du Rorschach comme mesure clinique de l’intelligence et du trouble de la pensée. »
Matériels du test
Le principe de base du test est qu’une signification objective peut être extraite des réponses à des taches d’encre qui sont censées être sans signification. Les partisans du test des taches d’encre de Rorschach pensent que la réponse du sujet à un stimulus ambigu et dénué de sens peut donner un aperçu de ses processus de pensée, mais la manière dont cela se produit n’est pas claire. De plus, des recherches récentes montrent que les taches ne sont pas entièrement dénuées de sens et qu’un patient réagit généralement aux aspects significatifs et ambigus des taches. Reber (1985) décrit les taches comme étant simplement « … le véhicule de l’interaction… » entre le client et le thérapeute, concluant : « L’utilité du Rorschach dépendra de la sensibilité, de l’empathie et de la perspicacité du testeur, indépendamment du Rorschach lui-même. Un dialogue intense sur le papier peint ou le tapis ferait aussi bien l’affaire, à condition que les deux parties y croient. »
Corrélations illusoires et invisibles
Dans les années 1960, les recherches des psychologues Loren et Jean Chapman ont montré qu’une partie au moins de la validité apparente du Rorschach était due à une illusion. À cette époque, les cinq signes les plus souvent interprétés comme un diagnostic d’homosexualité étaient 1) les fesses et les anus ; 2) les vêtements féminins ; 3) les organes sexuels masculins ou féminins ; 4) les figures humaines sans traits masculins ou féminins ; et 5) les figures humaines avec des traits masculins et féminins. Les Chapman ont interrogé 32 testeurs expérimentés sur leur utilisation du Rorschach pour diagnostiquer l’homosexualité. À cette époque, l’homosexualité était considérée comme une psychopathologie, et le Rorschach était le test projectif le plus populaire. Les testeurs ont rapporté que les hommes homosexuels avaient montré les cinq signes plus fréquemment que les hommes hétérosexuels. Malgré ces croyances, l’analyse des résultats a montré que les hommes hétérosexuels étaient tout aussi susceptibles de signaler ces signes, qui étaient donc totalement inefficaces pour déterminer l’homosexualité. Les cinq signes correspondaient cependant aux suppositions faites par les étudiants sur les images qui seraient associées à l’homosexualité.
Les Chapman ont étudié la source de la fausse confiance des testeurs. Dans une expérience, les étudiants ont lu une pile de cartes, chacune comportant une tache de Rorschach, un signe et une paire de « conditions » (qui pouvaient inclure l’homosexualité). Les informations figurant sur les cartes étaient fictives, bien que les sujets aient été informés qu’elles provenaient d’études de cas de patients réels. Les étudiants ont rapporté que les cinq signes invalides étaient associés à l’homosexualité, même si les cartes avaient été conçues de manière à ce qu’il n’y ait aucune association. Les Chapman ont répété cette expérience avec un autre jeu de cartes, dans lequel l’association était négative ; les cinq signes n’étaient jamais signalés par les homosexuels. Les étudiants ont tout de même déclaré avoir constaté une forte corrélation positive. Ces expériences ont montré que les préjugés des testeurs pouvaient les amener à « voir » des relations inexistantes dans les données. Les Chapman ont appelé ce phénomène « corrélation illusoire » et il a depuis été démontré dans de nombreux autres contextes.
Un phénomène connexe appelé « corrélation invisible » s’applique lorsque les gens ne voient pas une forte association entre deux événements parce qu’elle ne correspond pas à leurs attentes. Ce phénomène a également été constaté dans les interprétations du Rorschach par les cliniciens. Les hommes homosexuels sont plus susceptibles de voir un monstre sur la carte IV ou une figure mi-animale, mi-humaine sur la carte V. Presque tous les cliniciens expérimentés qui ont participé à l’enquête de Chapmans ont manqué ces signes valables. Les Chapman ont mené une expérience avec de fausses réponses Rorschach dans lesquelles ces signes valides étaient toujours associés à l’homosexualité. Les sujets ont manqué ces associations parfaites et ont plutôt rapporté que les signes invalides, tels que les fesses ou les vêtements féminins, étaient de meilleurs indicateurs.
En 1992, le psychologue Stuart Sutherland a soutenu que ces expériences artificielles sont plus faciles que l’utilisation réelle du Rorschach, et donc qu’elles sous-estimaient probablement les erreurs auxquelles les testeurs étaient susceptibles. Il a décrit la popularité continue du Rorschach après les recherches des Chapman comme un « exemple flagrant d’irrationalité parmi les psychologues ».
Projection du testeur
Certains critiques affirment que le psychologue testeur doit également se projeter sur les modèles. Un exemple possible parfois attribué au jugement subjectif du psychologue est que les réponses sont codées (parmi beaucoup d’autres choses), pour la « qualité de la forme » : en substance, si la réponse du sujet correspond à la façon dont la tache se présente réellement. À première vue, cela peut être considéré comme un jugement subjectif, selon la façon dont l’examinateur a intériorisé les catégories concernées. Mais avec le système de notation d’Exner, une grande partie de la subjectivité est éliminée ou réduite par l’utilisation de tableaux de fréquence qui indiquent la fréquence d’une réponse particulière dans la population en général. Un autre exemple est que la réponse « soutien-gorge » a été considérée comme une réponse « sexe » par les psychologues masculins, mais une réponse « vêtement » par les femmes.Dans le système d’Exner, cependant, une telle réponse est toujours codée comme « vêtement » à moins qu’il y ait une référence sexuelle claire dans la réponse.
Des tiers pourraient être utilisés pour éviter ce problème, mais la fiabilité inter-juges du Rorschach a été mise en doute. C’est-à-dire que dans certaines études, les scores obtenus par deux évaluateurs indépendants ne correspondent pas avec une grande cohérence.Cette conclusion a été remise en question dans des études utilisant de grands échantillons rapportées en 2002.
Validité
Lorsqu’ils sont interprétés comme un test projectif, les résultats sont peu vérifiables. Le système de notation d’Exner (également connu sous le nom de « système complet ») vise à remédier à ce problème et a pratiquement supplanté de nombreux systèmes de notation antérieurs (et moins cohérents). Il fait un usage intensif du facteur (ombrage, couleur, contour, etc.) de la tache d’encre qui mène à chacun des commentaires de la personne testée. Des désaccords sur la validité du test subsistent : alors que l’Exner proposait un système de notation rigoureux, une certaine latitude subsistait dans l’interprétation réelle, et la rédaction du dossier du test par le clinicien reste en partie subjective.Reber (1985) commente « … il n’y a essentiellement aucune preuve que le test ait ne serait-ce qu’une once de validité. »
Néanmoins, des recherches substantielles indiquent l’utilité de la mesure pour quelques scores. Plusieurs scores présentent une bonne corrélation avec l’intelligence générale. L’une de ces échelles est R, le nombre total de réponses ; cela révèle l’effet secondaire discutable que les personnes plus intelligentes ont tendance à être élevées sur de nombreuses échelles de pathologie, puisque de nombreuses échelles ne corrigent pas un R élevé : si un sujet donne deux fois plus de réponses dans l’ensemble, il est plus probable que certaines d’entre elles semblent « pathologiques ». Les échelles d’activité organisationnelle, de complexité, de qualité de la forme et de réponse à la figure humaine sont également corrélées à l’intelligence. La même source rapporte que la validité a également été démontrée pour détecter des conditions telles que la schizophrénie et d’autres troubles psychotiques, des troubles de la pensée et des troubles de la personnalité (y compris le trouble de la personnalité limite). Il existe certaines preuves que l’échelle de verbalisations déviantes est liée au trouble bipolaire. Les auteurs concluent que « Autrement, le système complet ne semble pas porter une relation cohérente avec les troubles ou symptômes psychologiques, les caractéristiques de la personnalité, le potentiel de violence, ou des problèmes de santé tels que le cancer ».(Le cancer est mentionné parce qu’une petite minorité d’enthousiastes du Rorschach a prétendu que le test peut prédire le cancer.)
Fiabilité
On pense également que la fiabilité du test peut dépendre substantiellement des détails de la procédure de test, tels que l’endroit où le testeur et le sujet sont assis, tout mot d’introduction, les réponses verbales et non verbales aux questions ou commentaires des sujets, et la façon dont les réponses sont enregistrées. Exner a publié des instructions détaillées, mais Wood et al. citent de nombreux cas judiciaires où celles-ci n’avaient pas été suivies. De même, les procédures de codage des réponses sont assez bien spécifiées mais extrêmement longues, ce qui les laisse très sujettes au style de l’auteur et de l’éditeur à la qualité des instructions (comme cela a été noté avec l’un des manuels de Bohm dans les années 1950) ainsi que les travailleurs de la clinique (ce qui inclurait les examinateurs) étant encouragés à prendre des raccourcis.
Les tribunaux américains ont également contesté le Rorschach. Jones v Apfel (1997) a déclaré (en citant le Attorney’s Textbook of Medicine) que les résultats du Rorschach « ne répondent pas aux exigences de normalisation, de fiabilité ou de validité des tests de diagnostic clinique, et l’interprétation est donc souvent controversée ». Dans l’affaire State ex rel H.H. (1999) où, lors d’un contre-interrogatoire, le Dr Bogacki a déclaré sous serment que « de nombreux psychologues ne croient pas beaucoup à la validité ou à l’efficacité du test de Rorschach » et dans l’affaire US v Battle (2001), il a été décidé que le Rorschach « n’a pas de système de notation objectif ».
Normes de population
Un autre aspect controversé du test est ses normes statistiques. On pensait que le système d’Exner possédait des scores normatifs pour diverses populations. Mais, à partir du milieu des années 1990, d’autres ont commencé à essayer de reproduire ou d’actualiser ces normes et ont échoué. En particulier, les divergences semblaient se concentrer sur les indices mesurant le narcissisme, la pensée désordonnée et le malaise dans les relations proches. Lilienfeld et ses collègues, qui critiquent le Rorschach, ont déclaré que cela prouve que le Rorschach a tendance à « surpathologiser les normaux ». Bien que les partisans du Rorschach, tels que Hibbard, suggèrent que les taux élevés de pathologie détectés par le Rorschach reflètent précisément la psychopathologie croissante dans la société, le Rorschach identifie également la moitié des personnes testées comme possédant une « pensée déformée », un taux de faux positifs inexpliqué par la recherche actuelle.
L’accusation de « surpathologisation » a également été considérée par Meyer et al. (2007). Ils ont présenté une étude collaborative internationale de 4704 protocoles de Rorschach, obtenus dans 21 échantillons différents, à travers 17 pays différents, avec seulement 2% montrant des élévations significatives sur l’indice de trouble de la perception et de la pensée, 12% élevés sur les indices de dépression et d’hyper-vigilance et 13% élevés sur la surcharge de stress persistante – tous en ligne avec les fréquences attendues parmi les populations de non-patients.
Applications
Le test est également controversé en raison de son utilisation courante dans les évaluations ordonnées par les tribunaux. Cette controverse découle, en partie, des limites du Rorschach, sans données supplémentaires, dans l’établissement des diagnostics officiels du Manuel diagnostique et statistique des troubles mentaux (DSM-IV).Irving B. Weiner (co-développeur avec John Exner du système complet) a déclaré que le Rorschach « est une mesure du fonctionnement de la personnalité, et il fournit des informations concernant les aspects de la structure et de la dynamique de la personnalité qui font des gens le genre de personnes qu’ils sont. Parfois, ces informations sur les caractéristiques de la personnalité sont utiles pour établir un diagnostic différentiel, si les autres diagnostics envisagés ont été bien conceptualisés en ce qui concerne les caractéristiques spécifiques ou déterminantes de la personnalité ».Dans la grande majorité des cas, de toute façon, le test de Rorschach n’était pas isolé, mais utilisé comme un test parmi d’autres dans une batterie de tests, et malgré les critiques de l’utilisation du Rorschach dans les tribunaux, sur 8000 cas dans lesquels des psychologues judiciaires ont utilisé un témoignage basé sur le Rorschach, la pertinence de l’instrument n’a été contestée que six fois, et le témoignage a été jugé irrecevable dans un seul de ces cas. Une étude a révélé que l’utilisation du test dans les tribunaux a été multipliée par trois au cours de la décennie 1996-2005, par rapport aux cinquante années précédentes. D’autres ont cependant constaté que son utilisation par les psychologues judiciaires a diminué.
Exner et d’autres ont affirmé que le test de Rorschach est capable de détecter la suicidalité.
Protection des éléments du test et éthique
Les psychologues s’opposent à la publication du matériel de test psychologique par crainte que les réponses du patient au test soient influencées (« amorcées ») par une exposition antérieure. La Société canadienne de psychologie estime que « la publication des questions et des réponses de tout test psychologique compromet son utilité » et demande que « les tests psychologiques ne tombent pas dans le domaine public. » Le même communiqué cite leur président qui dit : « La préoccupation de la SCP n’est pas la publication des cartes et des réponses au test de Rorschach en soi, pour laquelle il y a une certaine controverse dans la littérature psychologique et un désaccord entre les experts, mais la question plus large de la publication et de la diffusion du contenu des tests psychologiques ».
D’un point de vue juridique, les images du test de Rorschach sont dans le domaine public depuis de nombreuses années dans la plupart des pays, en particulier ceux qui ont une durée de droit d’auteur allant jusqu’à 70 ans post mortem auctoris. Ils font partie du domaine public dans la Suisse natale de Hermann Rorschach depuis 1992 (70 ans après la mort de l’auteur, ou 50 ans après la date limite de 1942), selon la loi suisse sur le droit d’auteur. Ils sont également dans le domaine public en vertu de la loi sur le droit d’auteur des États-Unis, où toutes les œuvres publiées avant 1923 sont considérées comme faisant partie du domaine public. Cela signifie que les images de Rorschach peuvent être utilisées par n’importe qui et à n’importe quelle fin. William Poundstone a, peut-être, été le premier à les rendre publiques dans son livre Big Secrets de 1983, où il a également décrit la méthode d’administration du test.
L’American Psychological Association (APA) a un code de déontologie qui soutient « la liberté d’enquête et d’expression » et aide « le public à développer des jugements éclairés ».Il affirme que ses objectifs comprennent « le bien-être et la protection des individus et des groupes avec lesquels les psychologues travaillent », et il exige que les psychologues « fassent des efforts raisonnables pour maintenir l’intégrité et la sécurité des matériaux de test ». L’APA s’est également inquiétée du fait que la diffusion de matériel de test pourrait causer « un préjudice très concret au grand public ». Elle n’a pas pris position sur la publication des planches de Rorschach mais a noté « qu’il existe un nombre limité de tests psychologiques standardisés considérés comme appropriés pour un objectif donné ». Dans une déclaration publique, la British Psychological Society exprime des préoccupations similaires au sujet des tests psychologiques (sans mentionner nommément aucun test) et considère que la « diffusion de matériel à des personnes non qualifiées » constitue une utilisation abusive si elle va à l’encontre des souhaits de l’éditeur du test. Dans son livre Ethics in Psychology publié en 1998, Gerald Koocher note que certains pensent que « la réimpression de copies des planches de Rorschach … et l’établissement d’une liste des réponses courantes représentent un acte contraire à l’éthique » pour les psychologues et sont révélateurs d’un « jugement professionnel douteux ».D’autres associations professionnelles, comme l’Association italienne de psychothérapie stratégique, recommandent que même les informations sur l’objectif du test ou tout détail de son administration soient tenus à l’écart du public, même si la « tricherie » du test est tenue pour pratiquement impossible.
Le 9 septembre 2008, Hogrefe a tenté de revendiquer un droit d’auteur sur les taches d’encre de Rorschach lors des dépôts de plainte auprès de l’Organisation mondiale de la propriété intellectuelle contre le psychologue brésilien Ney Limonge. Ces plaintes ont été rejetées. D’autres plaintes ont été envoyées à deux autres sites web qui contenaient des informations similaires au test de Rorschach en mai 2009 par le cabinet d’avocats Schluep et Degen de Suisse.
Les psychologues ont parfois refusé de divulguer des tests et des données de test aux tribunaux lorsque les parties le leur demandaient en invoquant des raisons éthiques ; on fait valoir que de tels refus peuvent empêcher la pleine compréhension du processus par les avocats et entraver le contre-interrogatoire des experts. La norme déontologique 1.23(b) de l’APA stipule que le psychologue a la responsabilité de documenter les processus de manière détaillée et de qualité adéquate pour permettre un examen raisonnable par le tribunal.
Une controverse s’est ensuivie dans la communauté psychologique en 2009 lorsque les plaques originales de Rorschach et les résultats de recherche sur les interprétations ont été publiés dans l’article « test de Rorschach » sur Wikipedia. Hogrefe &Huber Publishing, une société allemande qui vend des éditions des planches, a qualifié cette publication d' »incroyablement imprudente et même cynique de la part de Wikipédia » et a déclaré qu’elle étudiait la possibilité d’une action en justice. En raison de cette controverse, un filtre d’édition a été temporairement mis en place sur Wikipédia pour empêcher la suppression des planches.
James Heilman, un médecin urgentiste impliqué dans le débat, l’a comparé à la publication de la carte de test oculaire : bien que les gens soient de même libres de mémoriser la carte avant un test oculaire, son utilité générale en tant qu’outil de diagnostic de la vue n’a pas diminué. Pour les opposants à l’exposition, la publication des taches d’encre est décrite comme un « développement particulièrement douloureux », étant donné les dizaines de milliers de documents de recherche qui ont, pendant de nombreuses années, « essayé de relier les réponses d’un patient à certaines conditions psychologiques. » La controverse suscitée par la publication des taches d’encre par Wikipédia a entraîné la publication des taches dans d’autres endroits, comme The Guardian et The Globe and Mail. Plus tard cette année-là, deux psychologues ont déposé une plainte contre Heilman auprès du conseil de l’ordre des médecins de la Saskatchewan, arguant que son téléchargement des images constituait un comportement non professionnel. En 2012, deux articles ont été publiés montrant les conséquences de la publication des images dans Wikipédia. Le premier étudiait les attitudes négatives à l’égard du test générées pendant le débat Wikipédia-Rorschach, tandis que le second suggérait que la lecture de l’article de Wikipédia pouvait aider à simuler de « bons » résultats au test.
La publication des images de Rorschach est également saluée par les critiques qui considèrent le test comme une pseudoscience. Benjamin Radford, rédacteur en chef du magazine Skeptical Inquirer, a déclaré que le Rorschach « est resté en usage plus par tradition que par de bonnes preuves » et a espéré que la publication du test pourrait finalement hâter sa disparition.