Évaluation authentique - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Définition du concept - Quelques problèmes associés à l’évaluation authentique - Quelques exemples d’application - Conclusion - L’évaluation de la formation professionnelle

Quelques problèmes associés à l’évaluation authentique

Samuel Messick, de Educational Testing Service, soutient qu’il existe deux standards d’évaluation quand il s’agit d’évaluer les compétences. Le premier type est le standard de contenu qui concerne ce que l’étudiant doit connaître et être capable de faire pour un sujet précis. L’autre type concerne le standard de performance qui indique le degré de compétence qu’un étudiant doit atteindre à un moment donné. Pour lui, la performance doit refléter la complexité du construit et non la complexité de l’épreuve. Ce qu’on veut vérifier c’est la capacité de l’étudiant à transférer en pratique ce qu’il a appris de façon théorique.

Messick voit un conflit entre le temps nécessaire pour passer une évaluation authentique et la nécessité d’évaluer toute la matière apprise. Une épreuve authentique demande beaucoup de temps et évalue peu de choses. Il soutient que ce genre d’épreuve peut avoir des conséquences adverses sur l’étudiant. Celui-ci peut ne pas se sentir à l’aise avec la manipulation d’instruments tout en maîtrisant parfaitement les concepts qu’il doit utiliser.

Solano-Flores soulève quelques problèmes avec l’administration de certains tests. Il souligne que le montage et le démontage de l’équipement peut prendre tellement de temps que l’administration des tests devient presque impossible. L’utilisation de matériel qui sera détruit au cours de l’évaluation authentique devient coûteux. Les institutions peuvent alors utiliser du matériel moins cher mais de qualité inférieure. La mauvaise qualité des matériaux introduit alors des erreurs de mesure et fausse les résultats finals. Il souligne également le problème de la fidélité entre les différents évaluateurs. Pour lui, il est très important de former les évaluateurs afin que d’une façon générale leur évaluation soit standardisée.

Pour Bert F. Green, de Johns Hopkins University, si les autorités scolaires veulent pouvoir comparer les résultats de l’évaluation authentique d’une année à l’autre, il faut s’assurer que les résultats de performance puissent être comparables. Des changement dans l’administration des tests créent des difficultés de comparaison. D’autre part, si d’année en année, on utilise les mêmes tests, l’information circule parmi les étudiants. Les étudiants se préparent alors uniquement en fonction d’une épreuve spécifique. On assiste alors à du bachotage

Chez plusieurs auteurs que nous avons consulté, il semble se dégager une constante. L’évaluation authentique possède de nombreuses qualités mais elle ne peut pas dans tous les cas remplacer l’examen traditionnel, papier crayon. Pour ce qui est de vérifier l’acquisition de connaissance, l’examen traditionnel a fait ses preuves. On peut facilement en déterminer la fiabilité, la validité et la comparabilité.

Quelques exemples d’application

Depuis très longtemps, l’évaluation authentique a été utilisée dans des domaines professionnels. On peut penser au droit et au notariat qui s’enseignaient par apprentissage et qui étaient évalués par un bureau d’examinateurs. Les armées américaine, britannique et canadienne se servent de l’évaluation authentique dans l’attribution des brevets d’officiers.

Exemple de l’École des aspirants officiers des Forces armées canadiennes

Dans le cours de l’École des aspirants officiers des Forces armées canadiennes, on utilise l’évaluation authentique pour vérifier les compétences en leadership. Un élève-officier reçoit l’ordre d’aller chercher deux rebelles de l’Armée de libération de l’Ontario sur une route située à plus de 15 kilomètres de la base militaire. Pour se faire, il dirige une équipe de 6 soldats. On met à sa disposition un camion avec chauffeur et tout l’équipement militaire nécessaire. Durant toute l’opération, les actions de l’élève-officier sont examinées par un sergent ou un adjudant qui les évalue méthodiquement. On étudie la façon dont il planifie l’opération et la manière de passer les ordres à ses subalternes. On prépare une appréciation globale de toute l’opération. L’observateur n’interviendra que si la vie des participants est en jeu ou s’il y a des risques de destruction de matériel.

Afin de rendre l’opération plus réaliste, les rebelles peuvent opposer une résistance à leur arrestation ou un membre de l’équipe peut mourir subitement. L’évaluation des membres du corps médical se fait également par évaluation authentique. Au moment où l’interne se trouve au chevet d’un pseudo-patient et lui pose des questions, ce dernier peu mourir sans avertissement. Cette mise en scène peut également se réaliser avec un modèle informatique.

Chaque épreuve est suivie d’un de briefing avec l’aspirant où toute l’opération sera passée en revue. Cette méthode permet aux autorités militaires de faire en même temps une évaluation formative des connaissances des candidats. En colligeant les rapports, les autorités produisent une évaluation sommative de la performance des individus.

Cette méthode d’évaluation respecte la validité et la fidélité. On peut définir la validité d’un test ou d’un examen comme l’évaluation globale, fondée sur des preuves empiriques et sur un rationnel théorique, de l’adéquation et de la justesse des inférences et des actions issues des scores de test. La fidélité se définit comme la qualité que possède un instrument à mesurer avec la même exactitude chaque fois qu’il est administré. Le ministère de l'Éducation du Québec (MEQ) considère la fidélité comme la qualité d’un instrument de mesure dont les résultats demeurent stables pour les mêmes sujets qui se trouvent dans des conditions identiques lors d’administrations différentes

Dans le cas des cours des aspirants officiers, la validité de l’évaluation est assurée par la corrélation entre les contenus de cours donnés et les compétences évaluées. La fidélité inter-juge est favorisée en préparant un cours que tous les évaluateurs doivent suivre.

Exemple dans l’enseignement général au secondaire

Dans le domaine de l’enseignement général au secondaire, Guillermo Solano-Flores et Richard J. Shavelson rapportent quelques exemples d’utilisation de l’évaluation authentique. L’expérience Astronomie diurne consiste à recréer avec un globe terrestre, une lampe de poche et une boîte, les ombres créés par le soleil de l’aube au crépuscule.

Dans ce cas, l’évaluation d’une seule compétence demande du matériel quelques fois encombrant. Une de ces expériences permet seulement de vérifier un seul objectif. On doit ainsi laisser de côté d’autres objectifs.