• NEIN, WIR TESTEN SIE NICHT!

    Die Methoden der Eignungsdiagnostik müssen wieder einmal auf den Prüfstand.

 

Haben Sie heute schon den Persönlichkeitstest des Magazins Ihres Vertrauens gemacht? Und dabei festgestellt, dass Sie ungeduldig sind? Nicht leidensfähig? Zu emotional? Sich in Gesellschaft nicht gut bewegen können?

Wenn Sie also Samstagnachmittag beim Kaffee und nach dem 2. Sudoku den Psychotest sehen mit der Frage „Lieben Sie Ihren Partner noch?“, und Sie entschließen sich, diesen Test schnell zu machen ... Seien Sie ehrlich!

Sobald Sie die erste Frage beantwortet haben, schielen Sie erstmals auf die Ergebnis-Spalte.

0 Punkte, 3 Punkte, 6 Punkte oder 9 Punkte steht da bei den 4 Antwortmöglichkeiten. Aha, die von Ihnen gewählte Antwort ergibt 9 Punkte. Ein kurzer, nur ein ganz kurzer Blick auf die 3 Ergebnistypen zeigt Ihnen, dass ein hoher Punktewert bedeutet, dass Sie sich innerlich bereits von Ihrem Partner abgewendet haben.

Nein, dieses Ergebnis ist Ihnen eigentlich doch nicht sehr angenehm. Ein bisschen erkaltet mag sie ja vielleicht sein, die Beziehung, aber heiße Liebe hält eben nur ein paar Wochen. Also, Frage 1, nochmal angesehen. Eigentlich ist die andere Antwortvariante ohnehin zutreffender. 3 Punkte also dafür!

Das passt. Und schon kommt ein sehr „richtiges“ Bild raus. Genau, so sind Sie also wirklich. So wie das Testergebnis es Ihnen sagt.

Entscheidungen von welcher Wichtigkeit würden Sie denn von so einem Test abhängig machen?

Finanzielle Investitionen? Beförderungsentscheidungen? Die Entscheidung, ob jemand einen Job bekommt oder nicht? „Natürlich nicht!“, werden Sie jetzt entrüstet sagen, »Das ist ja ganz etwas anderes!«

Damit haben Sie jedenfalls recht. Trotzdem werden bei Personalauswahlentscheidungen, Beförderungsentscheidungen, der Feststellung von Potentialen und damit dem betrieblich richtigen Einsatz von Mitarbeitern, Experten und Führungskräften oder der Investition in Personalentwicklungsmaßnahmen etc. Persönlichkeitstests als Evaluierungstool eingesetzt. Und zwar sehr häufig.

Die Scheinwissenschaftlichkeit von Persönlichkeitstests

„Aber das ist ja etwas ganz anderes!“, werden Sie vielleicht jetzt wieder sagen. Wissenschaftlich entwickelte psychologische Tests, durchgeführt durch unfehlbare Computer. Solche Tests wurden ja wissenschaftlichen Validitätsmessungen unterzogen und die sind unfehlbar!

So?

Die Validität ist sozusagen die wissenschaftliche Überprüfung, ob ein Test auch wirklich das misst, was er messen soll, also gültig (Englisch: valid), ist. Der Validitätsgrad ist der dazugehörige Messwert, liegt zwischen 0 und 1, wobei 1 der höchste Wert ist und bedeutet, dass das Verfahren zu 100 % das misst, was es soll. Nehmen wir also einmal an, die Validität eines Tests wäre bei 0,9. Also extrem hoch, ein richtig guter Test. Und der Test würde Persönlichkeitseigenschaften auf einer bipolaren Skala messen, also immer 2 Gegensatzpaare gegenüber stellen, z. B.: introvertiert vs. extrovertiert.

Nun nehmen wir also an, die Ausprägung würde wie in Abb. 1 aussehen.

Der Test mit Validität 0,9 ist also ein ganz toller, wissenschaftlich abgesicherter Test.

Welche Aussage können Sie mit Ihrem Testwert zu Introversion vs. Extraversion nun machen? Sie sind also ein bisschen mehr extrovertiert als introvertiert. Aha. Was bedeutet das? Und nun beginnt das Interpretieren.

Extrovertierte Menschen sind ausgezeichnet für den Vertrieb geeignet. Ist diese Aussage eigentlich auch noch wissenschaftlich valide mit Wert 0,9? Im Vertrieb muss man gut reden können! Na klar! Oder doch etwa besser zuhören? Dem Kunden zuhören nämlich? Um seine Bedürfnisse zu hören, zu verstehen? Also doch besser introvertiert für die Vertriebsposition?

Hm. Kommt auf die Situation an. Aber wie viele Situationsmöglichkeiten gibt es in Ihrer Branche, in Ihrem Unternehmen, wenn man im Vertrieb tätig ist? Zumindest einige. Und der Entwickler des Tests hat sicher nicht Ihre persönliche Situation in Ihrem Unternehmen und in Ihrem Markt im Kopf gehabt, als er den Test entwickelt hat. Das kennt er nämlich gar nicht.

Der Test schert Sie also genauso über einen Kamm wie alle anderen standardisierten Standardtestpersonen. Sie werden also mit z. B. 5000 anderen Personen verglichen und mittels des genau gleichen Tests gemessen. Sie sind also ein Standardmensch? Ich nicht! Ich bin individuell! Der Test aber nicht! Glauben Sie noch immer, dass, wenn die Validität eines Tests hoch ist, das Ergebnis jedenfalls stimmt?

Ich längst nicht mehr.

Warum ich nicht sagen kann, wie andere mich erleben

Aber damit noch nicht genug.

Kennen Sie das Gefühl, wenn Sie eine Testauswertung über sich selbst lesen: „Wow, das bin ja echt ich!“ Wollen Sie meine Antwort dazu hören? „No Na! Sie haben den Test ja auch ausgefüllt!“

Was mich zum zweiten großen Denkfehler vieler Persönlichkeitstestverfahren führt. Die Testergebnisse sind ausschließlich ein verarbeitetes Selbstbild. Wenn die getestete Person sehr reflektiert ist und wenige blinde Flecken in der Selbstwahrnehmung hat, kann das sogar ein überaus zutreffendes Persönlichkeitsbild geben.

Bei jedem von uns weicht aber – beim einen mehr, beim anderen weniger – das Selbstbild vom Fremdbild, also davon, wie andere uns wahrnehmen, ab. Ist ein Mensch nicht sehr selbstreflektiert, die Differenz zwischen Selbstbild und Fremdbild also anteilig größer, ist das Testergebnis, das – wie bereits gesagt – ja nur auf einem Selbstbild beruht, auch dementsprechend verfälscht und damit weniger valide, als das Testsystem eigentlich vorgibt.

Der Test bestätigt also die getestete Person, die Umwelt erlebt jedoch etwas ganz anderes.

Das ist auch völlig klar, weil ein Test ja kein Fremdbild erfassen kann. In der Beurteilung von Auswahlentscheidungen etwa spielt es aber eine sehr wichtige Rolle, wie eine Person auf ihr Umfeld wirkt. Und damit ist die Aussagekraft des Tests schon wieder in Frage gestellt.

Keinesfalls möchte ich mit meiner provokanten Kritik alle Testsysteme über einen Kamm scheren. Es gibt eine Menge exzellenter Leistungstests, Konzentrationstests, Intelligenztests usw. Meine Kritik bezieht sich auf jene Verfahren, die Persönlichkeit und/oder Verhalten testen. Hier bin ich nach 20 Berufsjahren im HR-Bereich zur absoluten Überzeugung gekommen, dass das Bedürfnis nach einfachen, billigen, computergestützten, wissenschaftlich fundierten Verfahren zwar sehr hoch ist, die Verfahren aber die Erwartungen nicht erfüllen können.

Aus meiner Sicht basieren die Leistungsfähigkeit und das Potential einer Person im beruflichen Kontext auf einem ganz einfachen Zusammenhang (siehe Abb. 2).

Critical Incidents als entscheidende Diagnostikvariablen

Was an diagnostischen Verfahren sinnvoll feststellbar ist, ist das tatsächliche Verhalten in typischen Arbeitssituationen. Man evaluiert also das konkrete Arbeits-, Markt- und Unternehmensumfeld, die strategische Eingliederung einer Position und sammelt typische erfolgskritische Situationen für diesen Kontext (Critical Incidents Technique nach John Flanagan, 1954).

Diese Critical Incidents baut man in einen typischen Arbeitskontext ein und simuliert das unter möglichst realen Arbeitsbedingungen.

Das bedeutet zum Beispiel, man simuliert einen typischen Arbeitstag eines Projektmanagers, Key Account Managers, Marketingleiters, CFO etc. in seinem ganz konkreten Markt- und Unternehmenskontext.

Dazu setzt man ihn in ein eigenes Büro, eventuell sogar mit einer Assistentin vor der Tür, gibt ihm einen Laptop, dessen Outlook-Inbox mit 80 bis 100 EMails gefüllt ist (also ein typischer Arbeitstag), und da sind dann auch alle typischen Themen eines typischen Tages eingearbeitet. Strategische Konzepte für den Vorstand zu erarbeiten, eine Beschwerde des Nachbarunternehmens wegen belegter Kundenparkplätze zu beantworten, aufgeregte Mitarbeiter, die eine Entscheidung nicht verstehen, ein Kunde mit einer dringlichen Reklamation, eine Information der Nachbarabteilung, dass sie es doch nicht schafft, die vereinbarte Vorarbeit für ihr wichtiges Projekt rechtzeitig fertigzubekommen und so weiter.

Und zusätzlich finden tatsächlich Meetings an diesem Tag statt, mit verunsicherten Mitarbeitern, deren Leistung zurückgegangen ist, mit egoistischen Kollegen, die ihre Dinge unabgestimmt machen, mit Kunden, die nicht zufrieden mit dem Projektfortschritt sind usw. Was für die zu evaluierende Person eben in ihrer konkreten Arbeitssituation relevant ist und damit auf sie maßgeschneidert wird.

Was man als Assessor in so einem Verfahren (wir nennen das Simulation) alles sieht, braucht keine Interpretation oder Validitätsstudie – das ist echtes, ungeschöntes, reales Verhalten und damit die beste Diagnostikmethode, die man finden kann. Und natürlich ist diese Einschätzung nicht objektiv. Weil wir als Beobachter den Menschen in seinem ganzen Spektrum zu erfassen versuchen. Intuition und Erfahrung des Beobachters spielen dabei eine sehr wesentliche Rolle. Und das kann kein technisches System. Emotionen oder Gefühle auch intuitiv zu erfassen, werden wir hoffentlich noch länger nicht einer Maschine überlassen, weil jeder Mensch individuell anders ist.

Was ich mir von Testentwicklern wünschen würde, wäre, anstatt der vielen Persönlichkeitstestverfahren ein wirklich gutes Verfahren zum Herausarbeiten von Einstellungen und Werten zu entwickeln. Denn da liegt die Ursache für tatsächliches Verhalten. Und in diesem Feld habe ich noch kein wirklich überzeugendes Verfahren kennengelernt. Ich würde es sofort kaufen! Ehrlich!