Comparer les modèles à l’aide du vecteur caractéristique : fonction, nature, principe et usage des modèles

Franck Varenne

doi:10.1051/nss/2022014

Open Access

Issue		Nat. Sci. Soc. Volume 30, Number 1, Janvier/Mars 2022


Page(s)		93 - 102
Section		Regards – Focus
DOI		https://doi.org/10.1051/nss/2022014
Published online		21 July 2022

Natures Sciences Sociétés 30, 1, 93-102 (2022)

Comparer les modèles à l’aide du vecteur caractéristique : fonction, nature, principe et usage des modèles

Comparing models using the characteristic vector: function, nature, principle, and use of models

Franck Varenne^*

Épistémologie, Université de Rouen-Normandie, UR ERIAC, Rouen, France

^* Auteur correspondant : This email address is being protected from spambots. You need JavaScript enabled to view it.

Résumé

Dans un contexte de pluralisation, de sophistication et de combinaison des modèles formels, il devient difficile de proposer des pratiques uniformes – sinon elles-mêmes comparables – de comparaison de modèles. Cet article présente les grandes lignes d’une épistémologie comparative des modèles, à la fois large et classificatoire. Le but de cette épistémologie est de proposer des outils conceptuels applicables, développables – au besoin rectifiables – qui puissent être utiles aux modélisateurs comme aux historiens et aux épistémologues. La notion ouverte de vecteur caractéristique de modèle – incorporant en particulier les concepts de fonction, de nature, de principe et d’usage du modèle – est introduite à cette fin. Cette proposition s’est développée pour servir à l’écriture mieux outillée d’une histoire comparative et interdisciplinaire des modèles et des simulations.

Abstract

In the context of pluralization, sophistication, and combination of formal models, it is becoming difficult to propose uniform – or even comparable – model comparison practices. This paper outlines a broad and classificatory comparative epistemology of models. The aim of this epistemology is to propose applicable, and if necessary rectifiable, conceptual tools that can be useful to modellers as well as to historians and epistemologists. The notion of model characteristic vector – incorporating concepts of function, nature, principle and use of the model – is introduced for this end. This proposal has been developed to serve a better-equipped writing of a comparative and interdisciplinary history of models and simulations.

Mots clés : recherche / territoire / modèle / épistémologie / comparaison de modèles

Key words: research / territory / model / epistemology / model comparison

© F. Varenne, Hosted by EDP Sciences, 2022

This is an Open Access article distributed under the terms of the Creative Commons Attribution License CC-BY (https://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, except for commercial purposes, provided the original work is properly cited.

Introduction

La pluralisation avérée des modèles n’a pas pour autant conduit les modélisateurs à cesser de les comparer, bien au contraire¹. Pour ce faire, ils n’ont bien souvent pas besoin d’épistémologie. Ils le font sur la base de méthodes mathématiques et computationnelles déterminées par les choix et contextes formels partagés par les modèles comparés. Mais lorsqu’il s’agit de comparer des modèles adoptant des hypothèses, des formes, des axiomatiques et/ou des échelles différentes, un vide épistémologique apparaît et, par contrecoup, une demande d’épistémologie se formule aussi.

Je me propose de présenter ici les grandes lignes d’une épistémologie des modèles classificatoire et discriminante². Elle n’est pas la seule en son genre³. Celle qui est proposée ici est susceptible non de prescrire mais au moins d’aider à décrire et à mieux expliquer des travaux fins de comparaison de modèles tant dans leurs aspects méthodologiques qu’épistémologiques. Sans s’opposer à d’autres approches pluralistes, notamment à celles inspirées de l’épistémologie sociale (Bouvier et Conein, 2007), elle se veut un point de vue plus analytique sur les propriétés tant intrinsèques que relationnelles de l’objet épistémique modèle. Sensible néanmoins au caractère inaugural de la décision du modélisateur (c’est pour le modélisateur que tel objet est un modèle d’un autre), une telle épistémologie retient cette leçon du pragmatisme et procède délibérément à partir de la fonction épistémique recherchée par le modélisateur, non à partir de la nature de l’objet modèle lui-même. C’est déjà un des points importants qui la différencie de la classification plus théoriquement orientée de Frigg et Hartmann (2020). Une telle épistémologie appliquée doit permettre d’aider à répondre à la question suivante : dans un contexte de pluralisation et de combinaison des modèles et des simulations, mais aussi dans un contexte d’automatisation croissante de leurs comparaisons⁴, avec quels outils épistémologiques renouvelés pourrait-on caractériser les modèles afin de mieux comprendre comment ils sont parfois implicitement comparés quant à leurs propriétés comme dans leurs choix épistémologiques sous-jacents ? Comment mieux contrôler conceptuellement et pas seulement computationnellement leurs comparaisons, mais aussi leurs compatibilités voire leurs combinaisons ? En marge d’un travail strictement épistémologique, cette recherche m’est apparue nécessaire et s’est développée pour servir à l’écriture mieux outillée d’une histoire contemporaine comparative des modèles et des simulations en agronomie et biologie végétale d’abord (Varenne, 2007, 2018), en sociologie (Varenne, 2010, 2011) et géographie humaine, ensuite (Varenne, 2017).

Pour la présentation succincte de cette proposition, la deuxième section introduira d’abord les concepts de fonction, de nature, de principe et d’usage d’un modèle. Ce quadruplet compose le vecteur caractéristique C du modèle M : C(M) = (Fonction, Nature, Principe, Usage). Dans la troisième section, je reviendrai plus en détail sur la seule première dimension de ce vecteur : la fonction de connaissance (épistémique) du modèle : observation substitutive, analyse, description, prédiction, explication, compréhension, etc. J’y présenterai sous la forme d’un tableau partiellement hiérarchisé les 21 fonctions possibles d’un modèle. Dans la quatrième section, j’évoquerai une étude de cas à même de montrer plus concrètement l’intérêt d’une telle caractérisation fine. Je suggérerai pour finir l’idée que l’approche par le vecteur caractéristique présente cet autre intérêt de nous mettre sur le chemin d’une formulation précise des questions épistémologiques touchant à l’incompatibilité, à la compatibilité ou bien à la dépendance mutuelle entre différentes fonctions épistémiques pour un même modèle. Il me semble que ces questions des rapports, non seulement entre différents modèles, mais également entre différentes fonctions épistémiques d’un même modèle, seront de plus en plus déterminantes à l’avenir, au regard de l’ère dans laquelle nous sommes déjà, à savoir celle qui voit l’essor, d’une part, de modèles de simulation de plus en plus intégratifs (multiéchelles et/ou multiprocessus donc possiblement multifonctionnels) et, d’autre part, de modèles prédictifs ou de décision aux principes souvent opaques et peu explicables (ex. : algorithmes à apprentissage machine⁵) mais de plus en plus nourris par des masses de données de sources et de natures diverses.

Le vecteur caractéristique d’un modèle: C (M) = (Fonction, Nature, Principe, Usage)

L’analyse comparative de plusieurs domaines scientifiques qui modélisent suggère qu’il est utile de distinguer, pour chaque modèle, non seulement sa fonction épistémique ou fonction de connaissance, mais aussi sa nature, son principe et son usage (Varenne, 2013, 2017, 2018).

La fonction épistémique rassemble la forme (observationnelle, propositionnelle, expérientielle, etc.) et le type (descriptif, prédictif, explicatif, de compréhension, théorique, etc.) de connaissance que le modèle est supposé fournir en priorité. Les 21 fonctions possibles sont exposées plus en détail en section 3. Un modèle peut en assurer plusieurs à la fois. Ainsi, dans un modèle de simulation multiprocessus de croissance de plantes, certains sous-modèles peuvent être descriptifs alors que d’autres sont explicatifs (Varenne, 2007, 2018). Ou encore : un modèle théorique de croissance urbaine peut être à la fois prédictif et de compréhension s’il est à base d’équations, ou bien seulement explicatif s’il est à base d’agents informatiques (Varenne, 2017).

La nature du modèle est sa substance, c’est-à-dire ce en quoi il consiste : elle est matérielle inerte (maquette), matérielle vivante (organisme modèle), mentale (expérience de pensée, théâtre mental, schéma, etc.) ou encore symbolique (diagramme, équation, algorithme, ensemble de relations ou d’équations, etc.).

Le principe est ce par quoi la nature du modèle lui permet d’assurer sa fonction⁶. Il en est de quatre types : la dénotation, l’exemplification, l’analogie et la compression d’information. En effet, un modèle réfère toujours d’une manière ou d’une autre à son système cible. Or, suivant Goodman (1968), on peut distinguer deux grands modes de référer : la dénotation (ex. : un agent informatique dans le modèle dénote un agent social dans le monde) et l’exemplification (ex. : un organisme modèle exemplifie le type de patients cibles ; une instance d’agent informatique dans le modèle de théorie exemplifie un type d’agent défini abstraitement dans la théorie). Mais un modèle combine souvent les deux : on dit ainsi souvent qu’il fonctionne comme une analogie. De fait, entendue comme similitude de propriétés, l’analogie reprend directement le principe de l’exemplification. Et, entendue comme similitude de rapports entre propriétés ou entre éléments du modèle et du système cible, elle procède selon une combinaison de dénotations et d’exemplifications. Par exemple, le voisinage spatial sur écran entre deux agents informatiques dénotant chacun des agents sociaux exemplifie dans le modèle le voisinage spatial entre ces agents sociaux. Enfin, quand se perd la capacité du modèle à dénoter ou exemplifier directement des propriétés, éléments ou structures internes au système cible, il reste parfois possible de fonder le principe du modèle sur un moteur indirect de réengendrement des dénotations et exemplifications de ces propriétés, éléments et structures : c’est alors le principe de la compression d’informations qui est mis en œuvre. Par exemple, les moments ou paramètres d’une distribution ou loi de probabilité compriment l’information issue du système cible et le modélisent en ce sens.

Enfin, l’usage du modèle se distingue de sa fonction. Cette distinction est rarement faite car ils sont souvent mêlés⁷. L’usage caractérise la manière dont la fonction de connaissance du modèle est utilisée dans une performance rhétorique tantôt explicite (communicative, argumentative ou persuasive), tantôt implicite non reconnue (biais) tantôt implicite assumée (manipulation). Une performance rhétorique cherche à modifier une représentation et non directement à déterminer une action: l’usage n’est donc pas à confondre avec la catégorie 5 des fonctions des modèles (les modèles de décision : voir infra). L’usage peut être normatif, prescriptif ou heuristique. En effet, pour inciter à l’adoption d’une représentation au détriment d’autres, comme toute performance rhétorique, l’usage se fonde sur l’invocation explicite ou implicite de valeurs ou de vertus (Perelman et Olbrechts-Tyteca, 2008 [1958]). Or, quant à leurs formes d’abord, ces valeurs peuvent consister tantôt en une idéalisation absolue –hors contexte– de la représentation présente du système cible suscitée par la fonction (usage normatif), tantôt en une idéalisation relative, c’est-à-dire liée à nos capacités limitées de représentation présente (usage prescriptif), tantôt en l’idéalisation du chemin cognitif vers les représentations non pas présentes mais futures et préférables du système cible (usage heuristique⁸). En termes de contenu, ces valeurs peuvent être directement épistémiques comme la cohérence, la simplicité, la parcimonie (ex. : on valorise un modèle dont la fonction est théorique parce qu’il est parcimonieux), ou encore non épistémiques comme des valeurs morales ou des valeurs déterminées par des biais (de genre ou autres) pouvant jouer sur l’identification du problème ou le choix des données (Ruphy, 2015). Il est à noter qu’une fonction épistémique ne détermine pas univoquement un usage, ni un usage une fonction. On peut montrer que tout modèle possédant une fonction théorique n’est pas nécessairement voué à un usage normatif, ainsi en géographie (Varenne, 2017), même si, historiquement, en économie, avec l’hypothèse de l’acteur rationnel idéalisé, par exemple, l’un a souvent été de pair avec l’autre. Lorsqu’on a mis en lumière cette indépendance, on sait donc qu’il faut trouver à cette association fréquente d’autres causes que seulement épistémiques. Elles peuvent être des intérêts épistémiques voisins mais hétérogènes à la seule fonction épistémique directe assurée par le modèle, comme l’intérêt pour le maintien d’outils de confiance ou de pratiques de formalisation éprouvée et bien connue (Fontaine, 2022), une dépendance au chemin des choix techniques pour des modélisations lourdes et complexes (Lenhard et Winsberg, 2010), ou encore des idéologies partagées, voire des rapports de domination, d’appartenance, de conformismes, etc. C’est là que l’épistémologie sociale et la sociologie des sciences deviennent des recours nécessaires.

Les 21 fonctions des modèles

Il y a un certain accord pour dire que la fonction de connaissance générale d’un modèle est d’être une médiation facilitante opérant dans le cadre d’un questionnement orienté (Minsky, 1965 ; Morgan et Morrison, 1999 ; Morrison, 2015). Or, j’ai montré qu’il est utile de la décliner ensuite dans le détail et de manière graduelle. En effet, si l’on analyse de plus près quelles sont les capacités d’appréhension entre lesquelles cette médiation facilitante opère spécifiquement, on peut distinguer plusieurs types de médiations entre ces capacités différentes. Dans Varenne (2018, 147-148), je précisais (ma traduction⁹) :

La médiation peut avoir lieu entre bien d’autres types de capacités cognitives ou d’appréhension [que la seule appréhension sensible et sa théorie conceptualisée], cela pour un même sujet connaissant comme aussi entre plusieurs sujets […]

La première grande fonction épistémique est celle qui consiste dans le fait, pour un modèle, de faciliter, par médiation, le type de connaissance possédant la forme d’une appréhension sensible : à savoir une expérience, une observation ou une expérimentation contrôlée. Il s’agit donc d’une médiation entre une connaissance sensible vague et une autre connaissance sensible plus informative, avec le but d’améliorer la première au moyen de la seconde.

La deuxième grande fonction épistémique des modèles est celle qui consiste à user d’un objet médiateur pour faciliter une première représentation intelligible de l’objet cible, c’est-à-dire une représentation à base de concepts et de symboles dénotant ces concepts. Typiquement, il s’agit d’une médiation facilitante entre une forme de connaissance observationnelle d’un système cible et une forme conceptualisée.

Pour les modèles [assurant la troisième grande fonction], il s’agit de faciliter la médiation entre une ou plusieurs représentations conceptualisées (comme des données ou des modèles de données) et des représentations d’hypothèses théoriques, de principes généraux ou de lois théoriques. Mais aussi, il peut s’agir, à l’inverse, de faciliter la médiation entre des hypothèses théoriques abstraites et des représentations figurées, de façon à permettre de se représenter sous une forme observationnelle les relations conceptuelles abstraites de la théorie.

La quatrième fonction consiste à faciliter la coconstruction des savoirs scientifiques. Remarquons qu’alors que les autres grandes fonctions concernent des médiations entre différentes appréhensions ou différents modes d’appréhension d’un système cible pour un même sujet connaissant, cette quatrième grande fonction consiste à faciliter la médiation entre différentes appréhensions propres à différents sujets connaissants, ou à différentes communautés scientifiques ou bien encore, plus largement, à différentes disciplines scientifiques.

La cinquième et dernière grande fonction épistémique des modèles rassemble la catégorie des médiations entre des formes de connaissances soit conceptualisées soit théorisées, d’une part, et des formes de cognitions pratiques (gestes, procédures, savoir-faire), d’autre part. Elle rassemble tous les modèles qui visent prioritairement à faciliter la décision et l’action (individuelle ou collective) plutôt qu’une représentation.

Ainsi, il est possible de distinguer au moins 5 grandes sous-fonctions de médiation facilitante¹⁰ : 1. faciliter la médiation pour l’observation, 2. la conceptualisation, 3. la théorisation, 4.la coconstruction de savoir, 5.la décision et l’action (Tab.1). Enfin, on peut encore utilement distinguer, dans ces cinq grandes sous-fonctions, les 21 fonctions atomiques et spécifiques que j’ai proposé d’expliciter et de tester d’abord sur divers types ponctuels de modèles dans des domaines très variés (Varenne, 2013). Elles ont ensuite été appliquées systématiquement dans le cadre d’une relecture historique comparative de nombreux modèles en géographie des villes, d’une part (Varenne, 2017, parties III et IV), puis en agronomie et biologie végétale, d’autre part (Varenne, 2018, chapitre VIII). Cette liste de 21 fonctions est un résultat empirique stabilisé mais encore modifiable. Il vient d’un travail d’aller-retour entre les publications, leurs comparaisons et le dialogue permanent avec les modélisateurs de terrain. On trouve déjà de telles listes dans les articles fondateurs de Leo Apostel (1960) ou de Jean-Marie Legay (1997). Celle que je propose les englobe autant que possible, les prend en compte ou les rectifie et leur fait, ainsi, également droit.

Les exemples donnés dans la colonne 3 du tableau 1 le sont de manière indicative. Ils sont rarement purs d’un point de vue fonctionnel : comme la plupart des modèles, ils peuvent assurer plusieurs fonctions épistémiques simultanément. Les 21 fonctions répertoriées dans le tableau sont justifiées et exposées en détail dans Varenne (2017) et aussi de manière plus synthétique dans Varenne (2016) et Varenne (2020).

Table 1

Les 5 grandes fonctions et les 21 fonctions spécifiques des modèles.

Compatibilités et dépendances mutuelles des fonctions: un exemple

En guise d’exemple, cette section revient brièvement sur le cas analysé dans la quatrième partie de Varenne (2017) et sur quelques résultats épistémologiques majeurs qu’il permet de mettre en lumière: il s’agit du recours précoce, par le géographe suédois Torsten Hägerstrand (1967), à la simulation agents pour la modélisation de la diffusion spatiale de l’innovation.

La « diffusion spatiale » est « le processus par lequel le comportement ou les caractéristiques d’un paysage changent comme un résultat de ce qui se passe ailleurs et plus tôt » (Morril et al., 1988, 7 ; ma traduction). Jusque dans les années 1950, les approches de modélisation quantitative des processus de diffusion spatiale en géographie, comme celle d’une innovation technique par exemple, prenaient le plus souvent la forme de courbes de distributions d’adoption de l’innovation par époque (Sorokin, 1957) ou encore de diverses courbes de croissance (courbes en S) liées chacune à des sites géographiques spécifiques. Au début des années 1950, on savait que la diffusion d’une innovation ne prend pas nécessairement la forme d’une vague avançant de manière continue et par l’effet d’une contiguïté dans l’espace concret, puisqu’elle opère aussi parfois de manière beaucoup plus décisive selon les proximités sociales et/ou économiques liées elles-mêmes à certaines hiérarchies non directement déterminées par l’espace géographique (hiérarchies sociales, hiérarchies des villes).

Afin d’élaborer des modèles qui permettent une forme d’explication (fonction n^o 8) des cartes de distribution de l’innovation et de prendre pour cela en compte au moins la pluralité et la simultanéité des espaces (géographiques, sociaux, technologiques, etc.) de sa diffusion, Hägerstrand décide dès 1951 de rejeter les approches phénoménologiques quantitatives (fonction n^o 7 : reproduction de données) procédant selon les plaquages formels et les analogies traditionnelles issus des modèles biologiques de croissance ou de diffusion. Il décide de voir la diffusion comme un processus spatiotemporel porté par les individus (Varenne, 2017, p.552). Il illustre ainsi précocement le déplacement des approches populationnelles issues au départ du travail de Ronald Fisher vers une représentation directe des dynamiques individuelles dans des processus multiples, stochastiques et évolutionnaires, déplacement des usages des statistiques que le statisticien Jerzy Neyman diagnostiquera et encouragera lui-même en 1960 (Varenne, 2017, p.191-197). La fonction d’explication procède alors, dans le modèle, d’une mise en œuvre quasi iconique, suivant un principe d’exemplification partielle, des interactions entre les choix individuels : il faut se proposer un modèle de simulation centré sur les individus et leurs règles d’adoption, d’attente ou de rejet de l’innovation.

Mais Hägerstrand se rend compte aussi que pour que cette explication soit réellement effective, il faut que ces règles de choix ne soient pas elles-mêmes identifiées et paramétrées de manière seulement ad hoc, contrairement à ce que certains modèles désagrégés dits de microsimulation sociale proposeront en revanche dans les années 1960. Ainsi du travail de Guy Orcutt à partir de 1961 (voir Sanders [2011] et une analyse comparative succincte dans Varenne [2011]). Or, vouloir que les règles de décision et d’action des agents simulés ne relèvent pas de paramétrisations ad hoc revient à exiger que ces règles soient également compréhensibles au regard de données psychologiques et sociologiques dont Hägerstrand dispose partiellement par ailleurs. Il comprend donc nouvellement que, pour que son modèle de simulation soit explicatif (fonction n^o 8), il doit permettre aussi une compréhension (fonction n^o 9) : la réalisation de la fonction d’explication est strictement conditionnée à celle de la compréhension à l’échelle des agents du modèle de simulation. Et la compréhension est elle-même pluridisciplinaire car multifactorielle: il y a, d’une part, le facteur du contact social, mais aussi les résistances économiques et psychologiques à l’innovation. Ce faisant, le modèle d’Hägerstrand noue pour la première fois au niveau computationnel les raisons et les causes des processus de diffusion. En situant les agents dans des espaces divers et cartographiés, espaces dont les agents ne déterminent pas complètement eux-mêmes les structures de contiguïtés, ce modèle intrique pas à pas les raisons de l’action individuelle (elles-mêmes hétérogènes et relevant de sciences sociales et comportementales différentes) avec les causes de l’émergence de patterns aux niveaux collectif et géographique.

En outre, s’il est affiché sur une table traçante ou un écran, ce que j’appelle le simulat¹¹ du modèle est lui-même un modèle assurant d’autres fonctions, dont la n^o 2 (rendre perceptible des rapports sur un substitut) puisqu’il s’agit d’une des premières formes de carte numérique. Or, pour valider son modèle de simulation, Hägerstrand cherche précisément à ce que le simulat de ce modèle permette d’assurer non seulement cette fonction n^o 2, mais aussi, dans son caractère dynamique, la fonction n^o 7 (description, prédiction de cartes). En 1953, la validation des simulats eux-mêmes au regard de ces deux fonctions se fait essentiellement de manière quantitative directe (production de courbes en S) puis qualitative sur carte (à l’œil), sans analyse de sensibilité. Il n’en demeure pas moins que l’approche par simulation engagée précocement par Hägerstrand est fondatrice d’un ensemble de méthodologies (simulations agents) aujourd’hui en plein déploiement.

Un modèle de simulation relativement complexe de ce type présente le premier intérêt de montrer comment un modèle se distingue d’un autre alors même qu’au final il donne à voir aussi (entre autres choses bien sûr) des courbes de croissance en S: ici, le but affiché d’Hägerstrand est de ne pas se cantonner à la fonction n^o 7 (reproduire ou prédire) directe et exclusive.

Ce modèle présente cet autre intérêt majeur de montrer comment plusieurs fonctions épistémiques peuvent être compatibles et même comment elles doivent, pour certaines, se déterminer rigoureusement les unes les autres. Dans ce modèle de simulation de la diffusion spatiale, la fonction n^o 7 (reproduire) subsiste mais elle doit devenir non une fin mais un moyen pour la fonction n^o 8 prioritaire, qui est l’explication. C’en est donc un moyen indirect. Car c’est le simulat dynamique, non le modèle, qui assure alors la fonction n^o 7. La fonction n^o 8 (explication) est celle qui est recherchée en priorité. Mais, par ailleurs, pour que la fonction n^o 8 soit assurée, une condition nécessaire bien que non suffisante est que la fonction n^o 9 (compréhension) soit également assurée, mais à l’échelle des règles, c’est-à-dire des sous-modèles des comportements des agents.

Enfin, l’apport du modèle de simulation d’Hägerstrand réside-t-il surtout dans le fait qu’il est une théorie ou un modèle théorique (fonction n^o 10) innovant pour les processus de diffusion comme Le Bras (2000, 121) par exemple le suggère ? Il me semble que, comme il n’y a pas de postulat théorique supérieur à d’autres et qui pourrait être le fondement commun des diverses règles de décision des agents (à motivations tantôt sociologiques, tantôt économiques, tantôt psychologiques), on doit dire qu’un tel modèle de simulation est au mieux intégratif et non théorique. Il n’implémente pas une théorie, même approchée : il assure non pas la fonction n^o 10 mais la fonction n^o 16, celle qui consiste en l’hybridation calculatoire, c’est-à-dire non conceptuelle, de plusieurs théories, mécanismes ou modèles théoriques partiels.

Conclusion et discussion

Au vu de toutes ces considérations rapides, on voit que la dimension « fonction » du vecteur caractéristique C(M) du modèle de simulation d’Hägerstrand est elle-même multiple. On pourrait tout aussi bien parler alors de matrice caractéristique. Mais je conserve ce terme de vecteur pour bien mettre en avant les différences liminaires qui fondent le quadruplet initial : fonction, nature, principe, usage. C’est le premier apport conceptuel et opératoire du vecteur. Comme on l’a vu, contrairement à ce que d’autres classifications proposent, il permet de ne plus confondre nature et principe (ainsi parler sans plus de précision de « modèle analogique » est désormais à écarter car confus) ni non plus fonction et usage. Cette dernière confusion repose elle-même sur celles que l’on fait souvent entre propriétés et valeurs épistémiques ou encore entre valeurs épistémiques et valeurs non épistémiques.

L’adoption du vecteur permet ensuite l’explicitation et la reconnaissance de la grande diversité des fonctions de connaissance sans pour autant en supposer une liste infinie, indéterminée ou chaque fois caractérisée par le seul contexte de modélisation. Cela permet d’adopter un pluralisme finitiste plutôt qu’un pluralisme vague ou indéterminé qui peut rendre les comparaisons raisonnées impossibles.

Les fonctions, une fois conceptuellement clarifiées, permettent en outre de mettre exactement au jour où et comment, dans la validation de la fonction attendue du modèle, jouent les engagements ontologiques¹² propres au modélisateur : ainsi, on peut comprendre qu’un même modèle à automates cellulaires peut être explicatif à échelle micro aux yeux de certains chercheurs mais seulement descriptif à échelle macro pour d’autres, donc selon les engagements ontologiques qui sont les leurs.

Le vecteur montre aussi pourquoi et quand exactement l’usage est à distinguer de la fonction : les types de modèle qui permettent avant tout de prédire sont souvent valorisés du fait que ce sont les seuls que l’on peut aisément formuler (comme les modèles de décision en finance) alors même qu’ils n’expliquent pas. D’une manière discutable et que l’on peut donc maintenant plus clairement discuter, ces modèles sont ensuite souvent rhétoriquement utilisés de façon normative (usage) pour les fonctions à privilégier pour d’autres modèles.

L’analyse d’exemple a enfin plus spécifiquement montré comment le vecteur permet de formuler plus explicitement et précisément non seulement la question de la distinction entre les fonctions mais aussi celle des rapports de dépendance rationnelle entre fonctions. L’explicitation du vecteur permet en particulier de comprendre ce qui est au fondement de ces relations de dépendance. Dans le cas du modèle de diffusion spatiale de l’innovation d’Hägerstrand, la conjonction des fonctions de compréhension, de description/prédiction et d’hybridation de plusieurs aspects théoriques permet que le modèle assure également la fonction d’expliquer, fonction qui était prioritairement recherchée au départ. Encore faut-il préciser que ces combinaisons et déterminations de fonctions ne valent pas chaque fois, comme on n’a pu que le suggérer ici, à une même échelle de considération pour le modèle, cela du fait des différentes échelles auxquelles s’appliquent, au regard du système cible, les quatre principes de dénotation, d’exemplification, d’analogie ou de compression d’information (échelles du modèle global, de l’agent individuel, des règles particulières ou du simulat).

Toutes ces considérations m’amènent à suggérer l’idée générale qu’on ne peut comparer des modèles dans leurs performances épistémiques que si on a préalablement complètement explicité et mis au clair leurs caractéristiques qui, on le voit maintenant, vont au-delà du seul choix de la question de recherche, du formalisme, des hypothèses d’idéalisation ou de la fonction épistémique : il faut notamment aussi s’astreindre à déterminer les principes supposés à l’œuvre, leurs articulations, leurs compatibilités, cela à chaque étape de calcul ou de mise en œuvre du modèle, ainsi que les engagements ontologiques ou les savoirs stabilisés qui peuvent (ou non) les soutenir.

Ajoutons pour finir qu’après une telle analyse du modèle grâce au vecteur, il devient possible d’en passer à une approche d’épistémologie plus formelle. Ainsi, sur les 21 sous-dimensions de la dimension « fonction » du modèle d’Hägerstrand, cinq peuvent se voir affecter le chiffre « 1 » (codant l’idée « fonction assurée »), les autres restant à « 0 » (codant l’idée « fonction non assurée »), à savoir pour les fonctions 2, 7, 8, 9 et 16. Une telle notation permet de coder et garder la mémoire des déterminations logiques réciproques entre fonctions. On a en effet la possibilité d’exprimer la relation de logique propositionnelle suivante : (fonction n^o 9 ˄ fonction n^o 7 ˄ fonction n^o 16) → fonction n^o 8. Ce travail d’analyse du fondement des déterminations réciproques des fonctions peut également commencer à être mis en place sur les modèles prédictifs à base d’apprentissage machine (Denis et Varenne, 2019). Il permet de demander par exemple dans quelle mesure un modèle prédictif surpassant les compétences humaines nous met aussi sur la piste d’une explication non encore aperçue ou conceptualisée: révélation d’un fondement ontologique partagé ou simple usage heuristique de ces modèles à prédiction pour d’autres modèles (à explication)?

Bien entendu, comme je l’ai dit, de telles distinctions et classifications ne sont pas définitives ni leur liste close, mais leur caractère d’ores et déjà précis et déterminé m’a été utile comme il a déjà été utile à certains modélisateurs, dont plusieurs géographes comme Pumain (2019) ou Raimbault (2021).

Sous le format unifié qu’il présente, ce vecteur, tout en ayant un potentiel de développement opérationnel, me paraît donc pouvoir être d’un certain secours, aussi bien pour les modélisateurs, les critiques des modèles que pour les chercheurs en études des sciences et des techniques (STS) ou les épistémologues.

Voir, par exemple, Rouchier et al. (2008).

Je remercie les deux relecteurs anonymes qui m'ont permis d'améliorer une première version de ce texte. Mes remerciements vont également à Antoine Missemer et Aurélie Méjean qui, en m'invitant comme conférencier au séminaire du Cired du 5 février 2019, m'ont donné l’occasion de produire une première formalisation de cette idée synthétique de vecteur caractéristique. Cette idée s'est imposée progressivement à moi tout au long de ces deux dernières décennies de recherche, cela sur la base d'analyses comparatives de corpora, d'entretiens d'acteurs, d'interactions et de collaborations directes avec des modélisateurs en biologie, en sociologie et en géographie.

Voir, pour les plus récentes, Frigg et Hartmann (2020, première version 2006) et Edmonds et al. (2019). Ces travaux de synthèse, remarquables et utiles, confondent cependant encore certains aspects que je cherche à distinguer.

⁴

On voit en effet de plus en plus de plateformes de comparaison de modèles qui opérationnalisent – et parfois opacifient – dans un méta-algorithme des procédures de comparaison de modèles et de préférences épistémiques sans que nous soit toujours explicitée l’épistémologie qui les sous-tend. Une heureuse exception à ce sujet se retrouve dans les travaux très explicites et conscients de plusieurs géographes autour de la plateforme comparative OpenMOLE. Voir par exemple Cottineau et al. (2015).

⁵

Sur ce cas précis, voir Denis et Varenne (2019).

⁶

La considération des principes correspond à peu près à ce que Frigg et Hartmann (2020) nomment dans leur première section la « sémantique » des modèles. Mais cette qualification reste très flottante chez eux : ils situent ainsi sur le même plan de ces distinctions selon la sémantique les « modèles analogiques » (qui sont certes bien caractérisés selon ce que j'appelle le principe) et les « modèles phénoménologiques » qui, par cette appellation, sont à caractériser en revanche selon la fonction et n'ont donc rien à faire dans cette section.

⁷

C'est pourquoi, par exemple, de même qu'ils confondent principe et fonction en classant l’analogie parmi les « buts » des modèles (but n° 6), Edmonds et al. (2019) confondent aussi fonction et usage : leur but n° 5 « illustration » est en réalité typiquement un usage et non une fonction épistémique.

⁸

On lit souvent que les modèles ont essentiellement une fonction heuristique : c'est confondre la fonction et l’usage. Un modèle ne peut avoir un usage heuristique (et c'est certes souvent le cas) que dans la mesure où il remplit déjà une certaine fonction épistémique : le modèle est utilisé comme moyen heuristique pour cette fonction et, notamment, pour l’orientation jugée préférable du développement de modèles ultérieurs.

⁹

¹⁰

Cette liste n'est pas exhaustive car les combinaisons a priori sont plus nombreuses, mais elle est déjà très large.

¹¹

Ce terme introduit dans Varenne (2012) sert à désigner le résultat du processus de simulation d'un modèle, distinct du processus lui-même.

¹²

Ou croyances de base assumées concernant l’existence effective de telle entité ou propriété du système cible.

Références

Apostel L., 1960. Towards the formal study of models in the non-formal sciences, Synthese, 12, 125-161, https://doi.org/10.1007/BF00485092. [CrossRef] [Google Scholar]
Bouvier A., Conein B. (Eds), 2007. L’épistémologie sociale. Une théorie sociale de la connaissance , Paris, Éditions de l’EHESS, https://doi.org/10.4000/books.editionsehess.11257. [CrossRef] [Google Scholar]
Cottineau C., Chapron P., Reuillon R., 2015. Growing models from the bottom up. An evaluation-based incremental modelling method (EBIMM) applied to the simulation of systems of cities, Journal of Artificial Societies and Social Simulation, 18, 4, 9, https://doi.org/10.18564/jasss.2828. [CrossRef] [Google Scholar]
Denis C., Varenne F., 2019. Interprétabilité et explicabilité pour l’apprentissage machine : entre modèles descriptifs, modèles prédictifs et modèles causaux. Une nécessaire clarification épistémologique, in Lang J. (Ed.), Actes de la Conférence nationale en intelligence artificielle (CNIA), PFIA 2019, Toulouse, Association française pour l’intelligence artificielle, 60-68. https://hal.archives-ouvertes.fr/hal-02184519. [Google Scholar]
Edmonds B., Le Page C., Bithell M., Chattoe-Brown E., Grimm V., Meyer R., Montañola-Sales C., Ormerod P., Root H., Squazzoni F., 2019. Different modelling purposes, Journal of Artificial Societies and Social Simulation, 22, 3, 6, https://doi.org/10.18564/jasss.3993. [CrossRef] [Google Scholar]
Finlay S., 2014. Predictive analytics, data mining, and big data. Myths, misconceptions and methods , New York, Palgrave Macmillan. [CrossRef] [Google Scholar]
Fontaine G., 2022. Ces objets qui ne tombent pas en désuétude. Le cas des modèles de transfert de la radioactivité dans l’environnement, Philosophia Scientiæ, 26, 1, 93-110, https://doi.org/10.4000/philosophiascientiae.3380. [CrossRef] [Google Scholar]
Frigg R., Hartmann S., 2020 (1^re éd. 2006). Models in science, in Zalta E.N. (Ed.), The Stanford encyclopedia of philosophy, https://plato.stanford.edu/archives/spr2020/entries/models-science. [Google Scholar]
Goodman N., 1968. Languages of art. An approach to a theory of symbols , Indianapolis, Bobbs-Merrill. [Google Scholar]
Hägerstrand T., 1967 [1^re éd. 1953 (suédois)]. Innovation diffusion as a spatial process, Chicago, The University of Chicago Press. [Google Scholar]
Le Bras H., 2000. Essais de géométrie sociale, Paris, Odile Jacob. [Google Scholar]
Legay J.-M., 1997. L’expérience et le modèle, Paris, INRA Éditions. [Google Scholar]
Lenhard J., Winsberg E., 2010. Holism, entrenchment, and the future of climate model pluralism, Studies in History and Philosophy of Modern Physics, 41, 3, 253-262, https://doi.org/10.1016/j.shpsb.2010.07.001. [CrossRef] [Google Scholar]
Minsky M., 1965. Matter, mind and models, in Kalenich W.A. (Ed.), Proceedings of the International Federation of Information Processing Congress, Londres, Macmillan and Co, 1, 45-49. [Google Scholar]
Morgan M., Morrison M. (Eds), 1999. Models as mediators , Cambridge, Cambridge University Press. [CrossRef] [Google Scholar]
Morril R., Gaile G.L., Thrall G.I., 1988. Spatial diffusion , SAGE Publications. [Google Scholar]
Morrison M., 2015. Reconstructing reality. Models, mathematics, and simulations , Oxford, Oxford University Press. [CrossRef] [Google Scholar]
Perelman C., Olbrechts-Tyteca L., 2008 [1^re éd. 1958]. Traité de l’argumentation. La nouvelle rhétorique , Bruxelles, Presses de l’Université libre de Bruxelles. [Google Scholar]
Pumain D. (Ed.), 2019. Geographical modelling. Cities and territories , Volume 2, Londres, Wiley/ISTE. [CrossRef] [Google Scholar]
Raimbault J., 2021. An interdisciplinary bibliometric analysis of models for land-use and transport interactions, arXiv, https://doi.org/10.48550/arXiv.2102.13501. [Google Scholar]
Rouchier J., Cioffi-Revilla C., Polhill J.G., Takadama K., 2008. Progress in model-to-model analysis, Journal of Artificial Societies and Social Simulation, 11, 2, 8, http://jasss.soc.surrey.ac.uk/11/2/8.html. [Google Scholar]
Ruphy S., 2015. Rôle des valeurs en science : contributions de la philosophie féministe des sciences, Écologie & Politique, 51, 2, 41-54, https://cairn.info/revue-ecologie-et-politique-sciences-cultures-societes-2015-2-page-41.htm. [CrossRef] [Google Scholar]
Sanders L., 2011. Géographie quantitative et analyse spatiale : quelles formes de scientificités ?, in Martin T. (Ed.), Les sciences humaines sont-elles des sciences ?, Paris, Vuibert, 71-91. [Google Scholar]
Sorokin P., 1957. Social and cultural dynamics. A study of change in major systems of art, truth, ethics, law, and social relationships , Boston, Porter Sargent Publisher. [Google Scholar]
Varenne F., 2007. Du modèle à la simulation informatique, Paris, Vrin. [Google Scholar]
Varenne F., 2010. Les simulations computationnelles dans les sciences sociales, Nouvelles perspectives en sciences sociales, 5, 2, 17-49, https://doi.org/10.7202/044073ar. [CrossRef] [Google Scholar]
Varenne F., 2011. Modéliser le social. Méthodes fondatrices et évolutions récentes , Paris, Dunod, https://www.cairn.info/modeliser-le-social--9782100562800.htm. [CrossRef] [Google Scholar]
Varenne F., 2012. La reconstruction phénoménologique par simulation : vers une épaisseur du simulat, in Parrochia D., Tirloni V. (Eds), Formes, systèmes et milieux techniques, Lyon, Jacques André, 107-123. [Google Scholar]
Varenne F., 2013. Modèles et simulations dans l’enquête scientifique : variétés traditionnelles et mutations contemporaines, in Varenne F., Silberstein M. (Eds), Modéliser & simuler. Épistémologies et pratiques de la modélisation et de la simulation, tome 1, vol. 1, Paris, Éditions Matériologiques, 9-47. [Google Scholar]
Varenne F., 2016. Histoire de la modélisation : quelques jalons, in Bonnaillie-Noël V., Dollet A., Gelenbe E., Pavé A. (Eds), Modélisation. Succès et limites. Actes du colloque CNRS et Académie des technologies, Paris, décembre 2016, Paris, CNRS et Académie des technologies, 9-35. https://hal.archives-ouvertes.fr/hal-02495473. [Google Scholar]
Varenne F., 2017. Théories et modèles en sciences humaines. Le cas de la géographie , Paris, Éditions Matériologiques, https://www.cairn.info/theories-et-modeles-en-sciences-humaines--9782373611274.htm. [Google Scholar]
Varenne F., 2018. From models to simulations , New York, Routledge. [CrossRef] [Google Scholar]
Varenne F., 2020. Modèle, modélisation, in Dictionnaire critique de l’anthropocène, Paris, CNRS Éditions, 556-559. [Google Scholar]

Citation de l’article : Varenne F. Comparer les modèles à l’aide du vecteur caractéristique : fonction, nature, principe et usage des modèles. Nat. Sci. Soc. 30, 1, 93-102.

Liste des tableaux

Table 1

Les 5 grandes fonctions et les 21 fonctions spécifiques des modèles.

Dans le texte

Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.

Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.

Initial download of the metrics may take a while.