Persönlichkeitsbeurteilung ist vielleicht mehr eine Kunstform als eine Wissenschaft. In dem Versuch, sie so objektiv und standardisiert wie möglich zu gestalten, haben Generationen von Klinikern psychologische Tests und strukturierte Interviews entwickelt. Diese werden unter ähnlichen Bedingungen durchgeführt und verwenden identische Stimuli, um den Befragten Informationen zu entlocken. So kann und wird jede Disparität in den Antworten der Probanden auf die Eigenheiten ihrer Persönlichkeit zurückgeführt.
Darüber hinaus schränken die meisten Tests das Repertoire der zulässigen Antworten ein. Dies beschränkt die Beteiligung des Diagnostikers auf die Interpretation der Testergebnisse (die Skalenwerte). Zugegebenermaßen ist die Interpretation wohl wichtiger als die Datenerfassung. Daher kann und wird ein zwangsläufig verzerrter menschlicher Input im Prozess der Persönlichkeitsbeurteilung und -bewertung nicht vermieden. Aber ihre schädliche Wirkung wird durch die systematische und unparteiische Natur der zugrunde liegenden Instrumente (Tests) etwas eingeschränkt.
Anstatt sich auf einen einzigen Fragebogen und dessen Interpretation zu verlassen, führen die meisten Praktiker für dasselbe Thema eine Reihe von Tests und strukturierten Interviews durch. Diese unterscheiden sich oft in wichtigen Aspekten: ihre Antwortformate, Stimuli, Verwaltungsverfahren und die Bewertungsmethodik. Um die Zuverlässigkeit eines Tests zu ermitteln, führen viele Diagnostiker ihn im Laufe der Zeit wiederholt beim gleichen Kunden durch. Wenn die interpretierten Ergebnisse mehr oder weniger gleich sind, gilt der Test als zuverlässig.
Die Ergebnisse der verschiedenen Tests müssen zueinander passen. Zusammengenommen müssen sie ein konsistentes und kohärentes Bild ergeben. Wenn ein Test Messwerte liefert, die ständig im Widerspruch zu den Schlussfolgerungen anderer Fragebögen oder Interviews stehen, ist er möglicherweise nicht gültig. Mit anderen Worten, er misst möglicherweise nicht das, was er vorgibt zu messen.
Daher muss ein Test, der die eigene Großartigkeit quantifiziert, mit den Ergebnissen von Tests übereinstimmen, die die Abneigung messen, Versäumnisse einzugestehen oder die Neigung, eine sozial erwünschte und aufgeblasene Fassade („Falsches Selbst“) zu präsentieren. Wenn ein Grandiositäts-Test positiv mit irrelevanten, konzeptuell unabhängigen Merkmalen, wie Intelligenz oder Depression, verbunden ist, macht er ihn nicht gültig.
Die meisten Tests sind entweder objektiv oder projektiv. Der Psychologe George Kelly hat diese augenzwinkernde Definition von beiden in einem Artikel von 1958 mit dem Titel „Die Konstruktion des Menschen über seine Alternativen“ (enthalten in dem Buch „The Assessment of Human Motives“, herausgegeben von G.Lindzey) angeboten:
„Wenn das Subjekt gebeten wird, zu erraten, was der Prüfer denkt, nennen wir es einen objektiven Test; wenn der Prüfer versucht zu erraten, was das Subjekt denkt, nennen wir es ein projektives Gerät.
Die Auswertung objektiver Tests erfolgt computergestützt (keine menschliche Eingabe). Beispiele für solche standardisierten Instrumente sind das MMPI-II, das California Psychological Inventory (CPI) und das Millon Clinical Multiaxial Inventory II. Natürlich erkennt ein Mensch schließlich die Bedeutung der durch diese Fragebögen gesammelten Daten. Die Interpretation hängt letztlich vom Wissen, der Ausbildung, der Erfahrung, den Fähigkeiten und den natürlichen Gaben des Therapeuten oder Diagnostikers ab.
Projektive Tests sind weit weniger strukturiert und daher viel mehrdeutiger. Wie L. K. Frank in einem Artikel von 1939 mit dem Titel „Projektive Methoden zur Untersuchung der Persönlichkeit“ bemerkte, sind sie sehr viel weniger strukturiert und daher viel mehrdeutiger:
„(Die Reaktionen des Patienten auf solche Tests sind Projektionen seiner) Sichtweise des Lebens, seiner Bedeutungen, Bedeutungen, Muster und vor allem seiner Gefühle“.
Bei projektiven Tests sind die Antworten nicht eingeschränkt, und die Bewertung erfolgt ausschließlich durch Menschen und erfordert ein Urteilsvermögen (und damit ein gewisses Maß an Voreingenommenheit). Kliniker sind sich selten über die gleiche Interpretation einig und verwenden oft konkurrierende Methoden der Bewertung, was zu unterschiedlichen Ergebnissen führt. Die Persönlichkeit des Diagnostikers spielt eine wichtige Rolle. Der bekannteste dieser „Tests“ ist der Rorschach-Tintenklecksatz.