Note sur la notation

 

La notation des travaux a plusieurs fonctions, et elle peut se faire de diverses manières. C’est dire par conséquent qu’elle peut avoir des significations différentes et donner lieu à de multiples malentendus.

Parmi ses fonctions, on peut en relever déjà deux principales, qui se recoupent en partie, mais pas totalement. Les notes servent d’une part à effectuer la sélection devant permettre la poursuite des études aux étudiants qui en sont reconnus capables, et justifier qu’on leur attribue un diplôme, c’est-à-dire une attestation à l’égard de la société de leur capacité en la discipline concernée. Elles servent d’autre part à permettre à l’étudiant de s’évaluer dans ses études, afin d’orienter ses efforts de la façon la plus pertinente en fonction des aptitudes et des lacunes qu’elles lui aident à se découvrir.

Dans ces deux fonctions, la notation doit permettre de différencier et elle a d’autant plus de valeur qu’elle aide à le faire de manière plus adéquate. On ne devrait pas avoir à énoncer cette banalité, s’il n’existait pas une opinion et une pratique qui la contredisent. Certains pensent que les notes doivent d’abord encourager les étudiants, et qu’il convient donc de distribuer surtout de bonnes notes. Et, participant ou non à cette croyance, beaucoup trouvent plus commode de donner principalement ou exclusivement de bonnes notes. On justifie aussi parfois cette pratique par l’importance de rendre l’ensemble des études, jusqu’au plus haut niveau, accessible à la plus grande partie de la population.

A cela, il suffit de répondre que, premièrement, la valeur des notes n’est rien qui existe en soi, et qu’un A donné à la moitié des étudiants ne signifie en fait que ce classement dans les premiers cinquante pour cent, avec l’absence de toute distinction dans cette classe grossière, qui pourrait être divisée en plusieurs classes plus fines par une attribution plus différenciée des notes. L’effet d’encouragement espéré n’est donc pas celui qu’on attend, à moins qu’on n’estime enthousiasmant pour un étudiant de se savoir simplement dans la bonne moyenne. Il faut remarquer également que la politique qui ouvre plus ou moins largement les portes des études supérieures ne suppose pas de la part des professeurs qu’ils doivent noter différemment selon que les critères de sélection doivent être plus ou moins élevés. Car cette politique doit se faire, pour être pertinente, en établissant les seuils de passage, ce qui ne peut avoir lieu efficacement qu’en se fiant à une notation fiable et stable.

Bref, pour ces deux rôles, la notation doit permettre avant tout de classer les étudiants en fonction de leurs aptitudes dans la discipline concernée. L’idéal serait donc qu’elle permette d’établir le plus précisément possible le rang de chaque étudiant par rapport aux autres, en faisant intervenir également, de manière progressive à mesure qu’avancent les études, les niveaux d’exigence de la discipline dans son champ propre. (Qu’on pense aux sports : au début, pour se situer, il suffit sans doute de se comparer, en patinage par exemple, à l’ensemble des enfants du même âge, et ensuite, à mesure qu’on se destine davantage à l’art et à la compétition, il faut élever les exigences et restreindre le groupe de référence.) C’est dans la mesure où la notation autorise de tels classements qu’elle permet une sélection éclairée, et c’est également dans cette même mesure qu’elle donne à l’étudiant les moyens d’évaluer de manière réaliste sa situation, ses capacités, l’effort à fournir et ses chances d’arriver aux divers degrés dans la discipline.

Je distinguerai deux manières principales de noter, qui ont chacune leur utilité suivant le type de savoir considéré et les exigences de la société à son égard. J’appellerai la première normative ou punitive, et la seconde évaluative ou dynamique.

La notation normative sert à calculer l’écart d’une épreuve par rapport à une norme obligatoire, c’est-à-dire par rapport aux réponses précises exigées dans un domaine. Il est considéré comme normal dans ce cas de donner les réponses justes, et toute déviation est considérée comme une faute. C’est pourquoi la notation a un certain caractère punitif du point de vue psychologique, en tant qu’elle signale seulement une certaine quantité de fautes. Cette évaluation procède d’habitude en fixant la note normale tout en haut de l’échelle, de telle manière que la notation se fait à partir de la meilleure note. Celle-ci est attribuée aux travaux sans fautes (ou éventuellement à ceux dont le nombre de fautes reste au-dessous d’un certain seuil), et la note descend à partir de ce sommet en fonction du nombre de fautes. Toute autre note que la meilleure est donc à comprendre comme signifiant un défaut. Cette forme de notation est appropriée là où il existe des normes qui doivent être respectées, des règles qui doivent être strictement suivies. C’est le cas lorsqu’il s’agit de s’assurer qu’un ensemble précis de savoirs a été mémorisé, ou que quelqu’un est capable d’appliquer rigoureusement des procédures, de suivre strictement des règles. Une épreuve de calcul ou d’orthographe est par exemple adéquatement notée de cette manière. Dans ce cas, la réponse juste est connue et on peut l’exiger. C’est le même principe que dans la justice, où l’on exige que chacun suive les lois, et où l’on condamne et punit les écarts, sans qu’il y ait lieu de récompenser comme telle l’obéissance, considérée comme normale.

La notation évaluative ou dynamique tente au contraire de situer les épreuves par rapport à une moyenne et de les répartir sur l’échelle au-dessus et au-dessous de cette moyenne en fonction à la fois des erreurs, des faiblesses, et des inventions pertinentes et réussites. Il ne s’agit plus de mesurer l’écart négatif par rapport à une norme qui devrait être respectée, mais de mesurer l’aptitude à approcher d’un modèle idéal, souvent indéfinissable sous la forme de règles explicites uniquement, et parfois inatteignable comme tel. Il s’agit donc d’évaluer, à la fois par rapport à ce modèle et par rapport à l’ensemble des aptitudes réelles de ceux qui cherchent à l’atteindre, la position de chaque épreuve sur une échelle. C’est pourquoi la répartition des notes tend ici à se faire selon une courbe normale, quoique cela ne soit pas obligatoire. On voit aussi que la note n’est plus punitive, n’étant pas dépendante de la seule quantité de fautes par rapport à une norme. Une telle évaluation doit nécessairement tenir compte à la fois de faiblesses et de points forts dans les travaux ou performances évalués. C’est le type de notation approprié à toutes les disciplines dans lesquelles il s’agit non pas de se conformer simplement à une norme, mais d’améliorer ses capacités en fonction d’un modèle idéal, qui reste généralement au-delà de ce qui peut être atteint définitivement. Tel est le cas dans les sports généralement, où le sommet atteint peut toujours en principe être dépassé encore, et où les meilleures performances ne sont pas celles que la norme exige de tous, mais au contraire celles qu’on n’attend que de très peu. C’est le cas évidemment dans les arts aussi, où il serait absurde de vouloir exiger la simple conformation à une norme, ce qui en éliminerait l’essentiel, la dynamique de la création. C’est le cas dans les sciences, lorsqu’il s’agit d’évaluer non pas la mémorisation d’un certain nombre de savoirs et la capacité d’appliquer quelques formules, mais les aptitudes à la recherche par exemple. Et qui doutera que c’est bien aussi le cas en philosophie, lorsqu’on ne conçoit pas celle-ci comme la simple connaissance d’une somme de savoirs tirés de son histoire, mais comme une aptitude à la pensée réflexive et critique, à l’interprétation des œuvres de l’histoire, à la discussion rationnelle, etc. ?

Puisque c’est cette forme de notation qui convient à la philosophie, examinons-la de plus près. Inutile de répéter d’abord qu’elle ne peut signifier simplement une certaine quantité de fautes, ni par conséquent situer la norme dont on exige l’atteinte au haut de l’échelle. Le haut de l’échelle, qui représente plutôt la position du modèle idéal, doit plutôt signifier maintenant ce qu’il est désirable d’atteindre, certes, mais qui ne peut l’être que difficilement. Le niveau qui pourra être considéré comme normal sera donc placé plus bas sur l’échelle, de telle manière qu’il soit possible de répartir les épreuves aussi bien au-dessus qu’au-dessous de lui. Il tendra à être souvent assez proche de celui de la performance moyenne de ceux qui sont arrivés au niveau d’étude considéré. La note correspondante signifiera que celui qui s’y trouve peut normalement continuer ses études, sans qu’on estime son épreuve ni comme particulièrement brillante, ni comme particulièrement déficiente. En ce sens, ce niveau sera toujours au-dessus de la note de passage et dans cette mesure fonction d’elle aussi. Cette note de passage est définie, elle, en fonction du niveau de sélection exact qu’on veut obtenir et dépend de considérations politiques. Le mieux, généralement, afin de pouvoir opérer le plus finement l’évaluation, est de situer ce niveau normal vers le centre de l’échelle, afin de se donner à partir d’elle autant d’espace vers le haut que vers le bas. De cette manière, lorsque l’évaluateur connaît ce niveau moyen normal, la manière la plus efficace d’évaluer est de placer tous les travaux sur l’échelle par rapport à cette moyenne et en fonction du modèle visé. Je nommais cette évaluation dynamique pour signifier cet aspect. En effet, en évaluant ainsi, il faut tenir compte à la fois des forces et des faiblesses, les unes poussant vers le haut, et les autres vers le bas, de telle sorte que le résultat de ces deux poussées, le point où elles trouvent leur équilibre, donne la situation de l’épreuve sur l’échelle. C’est ainsi que fonctionne un thermomètre, par exemple, où l’on construit le tube de manière à ce que la valeur moyenne se trouve vers le centre et permette le mouvement du mercure vers le haut comme vers le bas.

Il peut paraître étonnant qu’il soit nécessaire de parler de cela, qui semble aller de soi. Mais il y a une opinion très répandue qui vient aujourd’hui brouiller la perception à ce sujet. On aimerait que les notes ne signifient plus une évaluation, perçue comme subjective, mais une sorte de mesure objective. Il en résulte qu’on cherche à substituer partout la notation normative à la notation évaluative. En effet, compter des fautes, c’est une opération objective et facilement vérifiable. Seulement, pour pouvoir noter en fonction des seules fautes, il faut justement fixer des normes rigides. Et nous avons vu que cela n’était possible que pour l’aptitude à se conformer à des règles. On tend donc, pour atteindre l’objectivité, à ne plus noter que cette aptitude-là dans toute forme d’études. Pour cette objectivité, on en perd une autre, puisqu’on en vient à mesurer dans de nombreuses disciplines des aptitudes qui ne sont pas celles qui correspondent à leur objet, à savoir celles qui sont requises par la discipline elle-même. Or il se trouve que, dans toute discipline, il y a des parties normatives. On ne peut pas écrire sans respecter la grammaire et l’orthographe, ni faire des mathématiques sans savoir calculer, ni de la peinture sans connaître les règles de la perspective ou les principes du mélange des couleurs, etc. Le risque est donc de ne plus mesurer que cela et de considérer que le reste doit demeurer non évalué et abandonné à la pure subjectivité. Si notre société avait un peu moins de mépris pour la culture, il serait évident à tous que ces aspects qui échappent à la règle sont essentiels dans la plupart des disciplines des sciences et des arts, comme il saute aux yeux que c’est le cas dans le sport, par exemple.

Dans la mesure où l’on admet la nécessité de cette part d’évaluation non purement normative au sens que j’ai dit plus haut, on tend souvent à la réduire au minimum, et à diviser l’évaluation en parties, en attribuant des pourcentages à divers aspects, dans lesquels ceux qui paraissent mesurables objectivement reçoivent un poids important. S’agit-il d’évaluer une dissertation par exemple ? alors on pense à attribuer dix pour cent de la note à la langue, dont cinq pour cent à l’orthographe, vingt autres pour cent aux connaissances, puis une part au respect d’une forme scolaire quelconque, une autre à la cohérence, une autre aux bonnes idées, etc. Même si l’on peut certainement montrer qu’il importe de considérer ces aspects, comme on s’y efforcera pour justifier de tels modes de notation, dans la plupart des cas il est absurde de sectionner la note en de telles parties, qui empêchent en réalité l’évaluation générale au lieu de l’assurer. Il se peut que les erreurs d’orthographe ou de grammaire prennent dans des cas extrêmes une importance décisive, en rendant la lecture impossible (qui pourrait lire le texte de quelqu’un qui écrirait par exemple « orthographe » « atragrof », et le reste à l'avenant?), ou qu’un texte parfaitement correct du point de vue de la langue et des connaissances soit tout à fait inacceptable à cause de ses défauts de cohérence. Or, pour pouvoir donner leur poids réel aux différents paramètres, il faut que des règles n’empêchent pas à priori l’estimation de leur portée concrète pour l’ensemble du travail. De toute manière, dans de nombreux cas, nous ne sommes pas capables de définir d’avance quels sont exactement les divers paramètres dont il va falloir tenir compte, et cela d’autant moins lorsqu’il s’agit d’épreuves pouvant avoir un caractère inventif. Ainsi, pourquoi ne tiendrait-on pas compte du fait qu’un étudiant en peinture a trouvé un moyen intéressant de jouer avec la forme du cadre, sous prétexte qu’une liste arbitraire n’aurait pas prévu de prendre cet aspect en considération ?

D’ailleurs, ce n’est pas tant le souci d’objectivité qui incite à favoriser partout la notation punitive. En réalité, l’expérience montre que, dans tout domaine précis, les évaluations des experts, dites subjectives, concordent généralement à un très haut degré, et sont en ce sens fiables ou objectives. Ce qu’on vise donc, c’est autre chose, à savoir une sorte de mécanisation de la notation, comme si n’était fiable que ce qui pouvait être réduit à l’observation d’une règle simple, non ambiguë, qu’on puisse confier à l’opération d’une machine. Ce qui revient à supposer aussi que seul l’aspect mécanique de la culture mérite d’être pris en compte, et peut-être, finalement, enseigné. Qu’en philosophie, dans les lettres et les arts, comme en sciences du reste, on puisse se diriger dans ce sens, c’est le signe qu’on ne se soucie plus guère de ces disciplines elles-mêmes, mais d’autre chose.

Bref, pour ma part, cherchant à évaluer ce que les épreuves des étudiants révèlent de savoir faire et de capacité en philosophie, j’adopte clairement la notation que j’ai définie comme évaluative et dynamique. Je situe un point de l’échelle qui définit un niveau normal, ou moyen, neutre pour ainsi dire, correspondant à un travail ou bien qui ne présente ni qualités ni défauts marqués par rapport à ce qui est attendu, ou bien qui présente des qualités réelles compensées par des défauts équivalents. Ainsi, les qualités poussent-elles en quelque sorte la note vers le haut, comme la chaleur le mercure du thermomètre, tandis que les défauts, comme le froid, la tirent vers le bas. Rappelons que dans cette notation, la note résultante est donc à lire autrement qu’une note mise selon la méthode punitive, puisque la note normale n’est plus la plus haute de l’échelle, mais celle qui correspond à cette moyenne. Il s’ensuit que des notes supérieures à cette moyenne, quoique inférieures à la plus haute note possible, signifient la reconnaissance d’une réussite particulière, alors que, dans l’autre lecture, elles indiqueraient une lacune.

Concrètement, j’avais d’abord établi la note normale à C, selon l’esprit de notre notation, qui traduit C par bon. Mais, parce que cette pratique répondait davantage à l’esprit qu’à la réalité de la notation dans notre faculté et dans notre université, j’ai modifié cette échelle en 2000, de manière à ce que la note normale corresponde à B. Cette modification devait permettre surtout de ne pas désavantager les étudiants qui s'inscrivent à mes cours à option. L’évaluation s’effectue pourtant de la même manière qu’auparavant, selon l’échelle chiffrée, de sorte que les étudiants évalués avant et après la dévaluation peuvent comparer très précisément leurs notes en recourant à la note chiffrée.

C'est dans le même esprit de permettre à chacun, le mieux possible, l'évaluation de sa propre situation dans ses études que je propose aux étudiants qui le veulent bien de rendre disponibles leurs épreuves en les publiant sur la page de ce site que je leur consacre.