Sur les origines de ce cours.
Cette partie des Cahiers regroupe les éléments d'un cours dont j'avais
été chargé en Maîtrise de Physique et Applications à l'université
Pierre et Marie Curie de Paris entre les années 1985 et 2004 et que
j'avais nommé Techniques d'Analyse pour Physiciens (TAP).
Le but de ce cours était de faire évoluer une partie l'enseignement
des mathématiques pour les physiciens en fonction du nouvel outil qui
entrait dans la vie de chacun, l'ordinateur. Cet appareil que l'on
n'approchait dans les années 1960 qu'avec respect dans des sanctuaires
de recherche spécialisés était devenu progressivement dans les années
1980-1990 le compagnon de tous les jours et il était logique
d'introduire son enseignement dans la formation des jeunes
universitaires.
L'idée la plus naturelle, pour de futurs physiciens, était de leur
enseigner un langage évolué. J'avais choisi le fortran
[1]
parce qu'il était le langage le plus adapté par sa conception même
(FORmula TRANslator) pour transcrire des formules et pour les évaluer.
Mais cela ne suffisait pas, et de loin. Il était connu, depuis les
débuts de l'utilisation des ordinateurs, qu'un programme bien
construit, répondait en général à ce qu'on attendait de lui, mais
pouvait donner, rarement mais indiscutablement, des résultats faux ;
que le même programme pouvait donner, par endroits, des résultats
légèrement différents quand il était utilisé sur deux ordinateurs
distincts ; que des tentatives d'augmentation de la précision des
résultats n'aboutissaient pas toujours au résultat espéré\dots
Certaines personnes allaient jusqu'à dire que, lorsqu'elles avaient
besoin des résultats d'un calcul, elles utilisaient deux méthodes
différentes pour l'obtenir, et que si les méthodes donnaient des
résultats sensiblement identiques, c'est qu'ils étaient exacts ; que,
si les résultats ne concordaient pas, elles prenaient une troisième
méthode, etc., jusqu'à ce que « cela marche ». C'était peut-être une
bonne « recette », mais sûrement pas un exemple de démarche
scientifique.
Parallèlement aux travaux dirigés qui leur donnaient initialement les
bases du fortran
[2] ,
il fallait donc montrer aux étudiants qu'il y avait quelque chose de
beaucoup plus profond dans l'outil qu'ils manipulaient. C'est l'objet
du cours qui suit et dont on trouvera exposées les idées principales
dans le présent chapitre.
Un mot sur le niveau de ce cours. Il était enseigné en maîtrise de
Physique et Applications, c'est-à-dire au niveau d'études « bac +
4 ». Je me suis imposé de ne jamais utiliser (c'est-à-dire, tenir pour
acquis) des connaissances dépassant le niveau des deux premières
années de la faculté (« bac + 2 »), ce qui ne veut pas dire que je
n'ai pas cherché à élever le niveau des connaissances de mes
étudiants, bien au contraire : le niveau « bac + 2 » était simplement
le vivier dans lequel il était admis que je pouvais puiser sans avoir
besoin d'en redémontrer les propriétés. En cas « d'oubli », les
étudiants étaient (et sont toujours) invités à relire leurs anciens
manuels et à rafraîchir leur mémoire
[3] .
Un certain nombre de chapitres sont terminés par des exercices qui
sont proposés comme des applications directes du cours qui les
précède, même si certains d'entre eux peuvent être traités plus
simplement par d'autres méthodes. D'autres correspondent à des
extensions possibles du cours. La plupart de ces exercices sont des
parties d'une épreuve posée lors d'un examen. Leur numérotation n'a
été rajoutée que pour des raisons pratiques d'identification. À noter
que, quand elles apparaissent, les numérotations des équations ou
celles des figures d'un exercice ne sont valables que pour cet
exercice.
Bref survol des différents chapitres.
Lorsqu'on publie sur Internet, les règles du jeu ne sont pas les mêmes
que lorsqu'on publie en s'appuyant sur un éditeur. S'il est possible,
par exemple, de feuilleter un livre pour prendre conscience de sa
dimension, de son contenu, l'opération est impossible à réaliser avec
les outils qui sont actuellement proposés pour lire en ligne sur
Internet. Il faut donc se substituer aux techniques non encore
existantes et tenter de présenter au lecteur un résumé objectif du
travail qu'on lui présente.
Cette présentation est le sujet du présent chapitre
[4] ,
le chapitre 1 de
ce cours qui sera proposé sous deux formes : celle d'un fichier HTML
qui lui permettra d'être rapidement consultable sur Internet et celle
d'un fichier postscript ou PDF plus agréable dans sa lecture ou son
impression, mais nettement plus gros et plus long à transférer. Les
chapitres suivants forment jusqu'au chapitre 6 une succession logique
et il est préférable de les lire dans l'ordre. Les derniers chapitres,
orientés vers les applications, supportent plus aisément une lecture «
aléatoire ».
---------------
Le chapitre 2, Analyse numérique et Ordinateur, pose le problème
de l'utilisation des ordinateurs dans le calcul numérique. Il y est
tenté de préciser ce que nous entendons par la locution « analyse
numérique », cet art « d'approcher les procédés spécifiques de
l'analyse mathématique en utilisant les quatre opérations
fondamentales de l'arithmétique »
[5] .
Nous y développerons quelques exemples qui mettent en relief des
points importants qui peuvent apparaître lors de la résolution d'un
problème d'analyse numérique.
Il est alors logique d'étudier en détail le comportement d'un
ordinateur lorsqu'on lui soumet l'une quelconque des quatre opérations
de l'arithmétique, et c'est ce que nous ferons en mettant en évidence
les problèmes soulevés.
Nous montrerons enfin qu'il est possible de résoudre des problèmes
d'analyse numérique en tenant compte des contraintes posées par les
ordinateurs et nous en tirerons une philosophie que nous développerons
tout au long du cours : formuler le problème de façon que sa solution
puisse s'exprimer comme le maximum ou le minimum unique d'une certaine
fonctionnelle soumise ou non à des conditions données.
Il deviendra alors obligatoire de connaître les outils mathématiques
permettant d'établir l'existence d'extrema de fonctions ou de
fonctionnelles ou de les calculer. Ce sont eux que nous développerons
au cours des chapitres suivants.
---------------
L'extremum le plus simple étant celui d'une fonction, il fera l'objet
du chapitre 3 qui permettra de rappeler quelques propriétés, censées
connues, comme les différences de comportement entre les fonctions
d'une seule variable et celles de plusieurs variables ; mais ce
chapitre servira surtout d'introduction, en toute généralité, de la
notion de différentielle, qui s'avèrera être l'outil de base du calcul
des variations.
Cette notion sera directement appliquée au calcul des extrema liés des
fonctions de plusieurs variables et permettra de donner
l'interprétation mathématique des multiplicateurs de Lagrange associés
à de tels problèmes.
Le lecteur pourra, au moins dans un premier temps, ne pas trop
s'attarder sur le détail de certaines démonstrations de ce chapitre
(par exemple, la différentielle d'une application composée) s'il a
compris le sens général de la propriété dont il est question. Cette
dernière sera appliquée ultérieurement à plusieurs reprises soit dans
le cours, soit dans les exercices et le lecteur pourra alors revenir
sur des démonstrations dont la finalité lui apparaîtra moins
abstraite.
---------------
Le chapitre 4 abordera le problème du calcul des variations. Les
équations d'Euler-Lagrange y seront démontrées dans le cas le plus
simple, celui d'un Lagrangien ne dépendant que d'une fonction. Nous
illustrerons, bien sûr, ces équations en les appliquant aux problèmes
classiques (plus courte distance, problèmes isopérimétriques, etc.).
Nous introduirons brièvement la notion de « covariance des équations
d'Euler-Lagrange » qui a des conséquences remarquables aussi bien en
mathématiques qu'en physique (notion de quantité scalaire, changement
de système de coordonnées ou de repère).
La « variation », autrement dit la différentielle, sera prise par
rapport à un ensemble que nous qualifierons de « bonnes fonctions ».
Ces « bonnes fonctions », souvent négligées dans les présentations «
calculatoires » du calcul des variations, sont particulièrement
intéressantes car elles contiennent le germe d'approximations
possibles ; le calcul différentiel met en valeur leur importance.
Nous avons proposerons également, en appendice du chapitre 4, une
version plus « classique » de la démonstration des équations
d'Euler-Lagrange. Ceux que le calcul différentiel rebuterait a
priori y trouveront peut-être une présentation plus à leur goût ; les
autres pourront s'apercevoir que d'utiliser les propriétés des
différentielles réduit fortement la longueur et la complexité des
démonstrations.
Une section « historique » exposera enfin le premier problème de
calcul des variations résolu par Bernoulli, celui de la
brachistochrome. Son « raisonnement » très physique, mérite d'être
connu, ainsi que la démonstration actuelle, bien entendu.
---------------
Dans la logique de ce cours, le chapitre 5, Formes quadratiques
et opérateurs associés, n'aurait jamais dû être écrit puisqu'en aucun
endroit, il ne traite d'extremum et nous aurions dû passer directement
« sauter » au chapitre suivant. Mais l'utilisation des formes
quadratiques dans les chapitres ultérieurs justifie a posteriori
l'importance d'une brève introduction à leur étude.
Nous verrons en effet par la suite que les formes quadratiques sont
intimement liées aux méthodes variationnelles de recherches d'éléments
propres des matrices ou des solutions des systèmes linéaire. De plus,
sans aller chercher aussi loin, en mathématiques, elles interviennent
naturellement comme le second ordre des approximations des fonctions
réelles de variables réelles ; en physique, elles sont associées à des
grandeurs fondamentales, souvent invariantes, comme la longueur dans
les systèmes galiléens, le ds2 de la relativité, l'énergie ; elles
se cachent derrière des concepts comme celui de l'oscillateur
harmonique, le pain béni des théoriciens et sont à l'origine de «
l'apparition » d'opérateurs dans diverses théories.
C'est ce dernier point que nous illustrerons tout au long du chapitre
5 en développant l'exemple de la Mécanique analytique des petits
mouvements qui a l'avantage considérable de pouvoir se traiter sans
complications mathématiques. Nous verrons comment les formes
quadratiques apparaissent naturellement dans ce cadre et nous
résoudrons les équations d'Euler-Lagrange de ces systèmes en montrant
comment « réduire » simultanément les formes quadratiques
fondamentale. Les techniques utilisées permettront de réfléchir sur la
notion de norme et conduiront à associer à toute forme quadratique
définie positive un opérateur hermitien défini positif dont il sera
aisé de donner une interprétation géométrique des éléments propres.
---------------
L'étude et le calcul à partir d'un principe variationnel des éléments
propres d'un opérateur linéaire sur un espace de dimension finie
feront l'objet du chapitre 6. Nous les obtiendrons pour commencer à
partir d'une forme qui les caractérisera récursivement. Puis après
avoir introduit la notion de contrainte, nous démontrerons le fameux
théorème de Rayleigh qui indique dans quel sens se déplacent les
valeurs propres d'un système lorsqu'on le soumet à des contraintes.
Utilisant les résultats précédents, nous démontrons enfin le célèbre
théorème du « min-max » qui caractérise sous forme variationnelle,
mais de façon non récursive cette fois, les éléments propres d'un
opérateur. Ce résultat puissant, connu depuis le début du
XXe siècle, est à la base de nombreuses méthodes de calcul
spécialisées.
---------------
Les noms des deux derniers chapitres peuvent être sujet à discussion,
mais les domaines qu'ils effleurent sont si vastes qu'il est difficile
de les caractériser.
Le chapitre 7 est essentiellement tourné vers la résolution des
systèmes linéaires. Dans un premier temps, nous démontrerons quelques
théorèmes caractérisant une forme variationnelle de leur résolution,
c'est-à-dire que nous mettrons en évidence sous quelles hypothèses la
solution du système est l'unique minimum d'une certaine fonctionnelle
[6] .
Nous développerons ensuite un exemple montrant comment la
discrétisation d'une équation différentielle aboutit à un
système linéaire dont la matrice correspondante appartient à la classe
importante des matrices de Jacobi ; nous donnerons alors la méthode
classique de résolution de tels systèmes.
Nous introduirons ensuite, sur un exemple, les méthodes de
programmation dynamique ; nous appliquerons ensuite à la résolution
d'un système de Jacobi.
Enfin, les méthodes de résolution de systèmes linéaires utilisant la
recherche d'un minimum ont des propriétés communes qu'il est bon de
connaître et que nous analyserons avant d'étudier les récurrences dans
les mêmes systèmes.
Ces démonstrations seront accompagnées d'exercices permettant soit de
bien « ancrer » les concepts proposés, soit de proposer certaines
extensions dans des cas particuliers.
---------------
Enfin, le chapitre 8 proposera une étude approfondie d'une méthode
permettant de calculer, lorsqu'ils existent, la valeur propre de plus
grand module et les éléments propres correspondants (vecteurs propres
et formes propres) associés à une matrice donnée. Cette méthode, dite
des puissances successives d'une matrice, sera suivie par la
description de la méthode de déflation qui permet de transformer une
matrice en remplaçant l'une de ses valeurs propres par la valeur
propre 0. Associées, ces deux méthodes permettent, dans certain cas,
de trouver l'ensemble des éléments propres d'une matrice.
Les deux méthodes qui seront présentées ensuite sont toutes deux dues
à Fourier (1824). Elles ont pour but de donner les extrema d'une forme
linéaire dont les paramètres sont soumis à des inégalités. La
première, redécouverte en 1947, porte le nom de « méthode du simplexe
» et est actuellement universellement utilisée ; elle sera décrite sur
un exemple simple. La seconde est intéressante, non parce qu'elle
n'est pas connue, mais parce qu'elle permet, comme nous le montrerons,
lorsqu'il y a peu de conditions d'effectuer rapidement les calculs « à
la main ».
Enfin pour terminer ce chapitre, nous exposerons la méthode de
Bairstow dont la finalité est de donner toutes les racines d'un
polynôme si l'on est capable de trouver avec précision tous les points
d'intersection de deux courbes.
---------------
Comme les lecteurs avertis pourront le constater, les domaines restant
à développer dans cet esprit sont immenses. Peut-être l'un d'eux
reprendra-t-il le flambeau.
En témoignage de reconnaissance.
C'est à la suite de la lecture du livre de S.H. Gould
[7]
et de quelques discussions que j'ai eues avec Jean Vignes que, petit à
petit, a germé l'idée de ce cours. Je ne l'ai pas oublié et je leur
reste redevable.
Le développement de ce cours et son évolution progressive n'auraient
pu se faire sans la lecture attentive de Claude Piquet qui critiqua
amicalement mes polycopiés successifs page après page. Je l'en remercie
sincèrement.
Enfin, j'ai découvert et appris le métier d'enseignant sous la direction
bienveillante et patiente de Charles Pisot. Je dédie ce cours à sa
mémoire.
---------------