CLUSTER
Une
migration douce au CRI !
Le
CRI vient de recevoir un ensemble d'ordinateurs destinés
à absorber l'augmentation de la demande. Il s'efforce,
afin d'améliorer le confort des utilisateurs, de
sui-vre un plan rigoureux de migration, de l'ancien vers
le nouveau dispositif, en minimisant les arrêts de
service.
Pourquoi
ce changement ?
Deux facteurs essentiels concourent à faire de l'augmentation
de la puissance des machines de traitement, une nécessité :
l'augmentation du nombre d'utilisateurs et l'augmentation
et l'évolution rapide du nombre de services
mis à disposition des utilisateurs. Ces deux facteurs
devraient impliquer une augmentation des accès concurrents
aux services qui ont de plus en plus de succès auprès
des utilisateurs.
Mais il ne s'agit pas d'une simple addition de ces deux facteurs.
Plus d'utilisateurs implique plus d'expertises de ces derniers,
et donc plus d'exigence sur les services. Dans de telles conditions
il devenait nécessaire, et de plus en plus urgent,
d'augmenter la disponibilité des services et donc la
sécurisation des machines qui distribuent cette puissance
de traitement. Pour cela, au delà de la sécurisation
électrique, le CRI a prévu un système
qui permette à une machine de prendre le relais d'une
autre machine qui deviendrait défaillante : on
parle de machine "backup".
Il était nécessaire de mettre aussi en place
des systèmes redondants assurant une plus
grande disponibilité des données, assurant
la sauvegarde ainsi que l'archivage,
en utilisant des méthodes automatisées ne
mobilisant aucune ressource humaine. Des dispositifs dédiés
assurant ces tâches ont également été
mis en place au CRI.
L'augmentation du nombre des utilisateurs est associée
à une augmentation du nombre de postes de travail,
et partant, du nombre de réseaux et de matériels
d'interconnexion. Le ré-seau des utilisateurs se
complexifie à la fois par son nombre de machines,
par la variété des matériels, mais
aussi par les politiques de filtrage. Il devient alors nécessaire
d'inventorier les constituants du réseau, de pouvoir
intervenir à distance sur les matériels actifs
de routage pour effectuer par exemple un réglage
dû à un changement de politique de l'utilisateur,
de pouvoir détecter les dysfonctionnements, d'être
en mesure, au travers de différentes statistiques,
d'anticiper sur l'évolution des "dimensions"
des ressources réseaux. Dans le cadre de cette politique,
les serveurs PingOO sont en première ligne, mais
il convient de prévoir les dispositifs nécessaires
à leur maintenance technique à distance. Dans
ce cas, encore, une machine dédiée est nécessaire
pour assurer l'ensemble de ces tâches de gestion
et surveillance réseau.

De plus, un système qui permettrait de réduire
les tâches de maintenance (concernant aussi bien
le système opérationnel que les applicatifs)
et de centraliser la gestion des différentes
machines serait un plus très apprécié.
Cela revient à dire qu'à ressource humaine
constante nous devons pouvoir augmenter la puissance
de calcul (encore identifiée comme puissance de traitement)
en choisissant des unités de traitement plus puissantes,
mais aussi, pour des raisons de sécurité et
disponibilité, en multipliant le nombre d'unités
de traitement. Il est important de noter que, dans ce
registre, la con-figuration des machines du CRI est très
proche de celle d'un PingOO; cela permet de se retrouver
dans une configuration à économie d'échelle.
Il est nécessaire également de se positionner
dans une configuration qui garantisse la plus grande
évolutivité possible, tant en ce qui concerne
les capacités d'absorption du nombre d'unités
de traitement, que leur qualité (carte mère
et processeur), ou que la capacité de stockage des
données.
Pour des raisons de sécurité, l'idéal
serait de faire exécuter une seule tâche
par machine. A défaut d'une solution aussi coûteuse,
il convient de ne pas trop multiplier le nombre de tâches
assurées par machine. De plus il convient de bien
équilibrer les choix pour "marier" les
tâches sur une seule machine : les tâches
résidentes sur une même machine ne doivent
pas toutes être simultanément grosses consommatrices
des mêmes ressources de cette machine.
Les fonctionnalités à assurer sont, ce que
l'on peut désigner par un infocentre dont
le rôle majeur consiste à distribuer de l'information
aux utilisateurs (DNS, messagerie, web, ftp, news, statistiques,
...), des tâches enchaînées (workflow)
assurant un dialogue entre l'administrateur et les utilisateurs
tels que processus d'ouverture et de fermeture des comptes
d'utilisateur, processus de suivi d'incident, processus
d'échange confidentiel de fichiers par ftp entre
deux utilisateurs, ..., la sauvegarde et l'archivage
assurant une sécurisation des données, la
gestion et la surveillance du réseau, le secours
(backup) en cas de panne d'une machine ou d'un service,
la gestion des systèmes minimisant les ressources
humaines, et enfin la possibilité de tests et
développements de nouveaux produits.
Techniquement il est nécessaire de pouvoir disposer
d'un système qui permette à plusieurs unités
de traitement de partager des ressources disques
(logiciels ou données).
Il est également nécessaire de prévoir
un dispositif de communication entre les différentes
machines assurant des tâches de serveur, capable de
traiter des échanges de données volumineux,
le traitement d'un grand nombre de requêtes simultanées
et des temps de réponse aussi courts que possible.
Cela revient à prendre en considération
la bande passante entre les différents serveurs.
La quasi totalité de ces services repose au CRI,
sur des logiciels libres, à commencer par
l'un des plus connus, Linux.
{Auteur}