La docimologie, l'étude des épreuves, est une discipline consacrée à l'étude du déroulement des évaluations en pédagogie.
En 1922, Henri Piéron introduit le terme de docimologie, il le définira en 1951 par « l’étude systématique des examens (modes de notation, variabilité interindividuelle et intra-individuelle des examinateurs, facteurs subjectifs, etc.) ». Avec sa femme et Henri Laugier, il pose les fondements de cette nouvelle discipline avec l'« Étude critique de la valeur sélective du certificat d'études et comparaison de cet examen avec une épreuve par tests. Contribution à une docimastique rationnelle », présentée lors de la IVème Conférence Internationale de psychotechnique. Inspirée par la psychologie expérimentale et la physiologie, la docimologie apparait dans le sillage du mouvement de l'éducation nouvelle, en recherchant des arguments scientifiques permettant la remise en cause des schémas traditionnel d'enseignement.
La manière de poser la question — au sens large, de présenter le problème servant à l'évaluation — va influer sur la réponse. Ceci a été étudié en psychologie cognitive.
L'énoncé peut aussi induire en erreur :
Selon cette discipline, l'évaluateur a des préjugés, un état d'esprit. Le résultat de l'évaluation dépend donc aussi de l'évaluateur. En particulier :
Cela pose notamment le problème de l'évaluation continue, et de manière générale de l'évaluation par le formateur lui-même :
Une évaluation inadaptée est une évaluation qui ne répond pas à la question posée, c'est-à-dire qui n'évalue pas, ou mal, les élèves vis-à-vis des objectifs de la formation.
Cela peut d'abord déboucher sur un problème de sélection : on risque de sélectionner un candidat ne correspondant pas au profil (mauvaise sélectivité) et éliminer au contraire un candidat intéressant (mauvaise sensibilité).
Cela peut également être un facteur de démotivation pour l'apprenant.
Une évaluation peut également être inadaptée parce qu'elle est inéquitable, par exemple parce que différents correcteurs attribuent les notes de manière différente. Outre le fait d'établir un barème plus précis, on peut mettre en place un système de péréquation des notes.
Les mêmes principes règlent habituellement l'évaluation des connaissances aux deux bouts de la formation, dans l'enseignement supérieur et dans les apprentissages de base, se contentant de vérifier la possession d'un bagage, au mieux, d'un savoir-faire. Pourtant, l'exercice d'une profession est très loin de se limiter à la possession d'un ensemble de connaissances, ou même d'un authentique savoir. Si ce décalage ne porte pas à conséquence majeure dans les filières techniques, il n'en est pas de même dans toutes les branches où le facteur humain est sinon au premier plan, du moins reste une dimension incontournable ; peut-on être médecin, sans une certaine fibre psychologique ou assistant social sans empathie ?
Certes, on peut supposer qu'à l'origine le choix d'orientation a été fait en intégrant cette dimension et que l'élève possède le potentiel nécessaire (qu'aucune formation d'ailleurs ne pourra remplacer). On peut également espérer que la formation inclura des approches autres que l'acquisition d'un savoir technique, et qu'enfin, une évaluation permettra de vérifier les réelles capacités du futur professionnel en situation.
Dans tous les cas où ces supputations ne sont pas vérifiées, la validation d'une formation d'après une représentation du métier amputée de sa dimension humaine prend le risque de reconnaître comme apte professionnellement des personnes manquant des qualités requises pour un exercice harmonieux de leur métier. Individuellement, il y a dans ces cas, une perte progressive de motivation et finalement un gâchis humain ; socialement, la division du travail perd une bonne partie de son intérêt. Untel qui aurait du être architecte devra se contenter d'en rêver en étant juge comme il peut ; Unetelle qui aurait du être chimiste devra faire sa carrière dans l'obstétrique alors que le cœur n'y est pas.
Quoique l'évaluation ne devrait pas pour autant servir à vérifier l'affinité de l'élève avec son futur métier, puisque ceci est du ressort de vérifications bien antérieures, elle devrait permettre la prise en compte de capacités humaines au sens le plus large et en tout cas bien différentes de la pure acquisition de connaissances et de leur mise en application fictive. Dans l'idéal, elle permettrait de reconnaître des aptitudes plus que des savoirs et permettrait ainsi de situer réellement les individus par rapport à la mission sociale qu'ils auront à assumer des années durant ; la reconnaissance d'insuffisances plus ou moins rédhibitoires permet alors, pour les plus motivés, des compléments de formation ou des choix plus appropriés à leur profil effectif et surtout une réorientation pour les plus intrinsèquement inadaptés au métier.
Inversement, l'absence de prise en compte de talents non immédiatement liés aux connaissances sous-évalue la valeur professionnelle si ces talents sont en fait déterminants dans le quotidien du métier. Bien sûr, par la suite, l'activité donne à l'individu l'occasion d'exprimer son potentiel et ne conduit pas à la démoralisation ou à l'inadéquation éprouvée par celui qui est condamné à travailler en porte-à-faux de sa vocation, mais les risques de gâchis individuel et collectif demeurent : « Mais qui dira les frustrations, les amertumes stérilisantes chez tous ceux qui, pourvus des qualités nécessaires, n'auront jamais la possibilité de les faire servir au bien commun, puisqu'ils n'ont pas pu prouver, dans une épreuve de mathématiques, qu'ils avaient le sens des relations humaines, dans une épreuve de vérification des connaissances, qu'ils avaient l'esprit d'invention ! »