jeudi 6 décembre 2012
Essais avec le matériel serveur et Burn-in - Stress Testing détaillée et détection de défaut sur Nouveau matériel
Allez, avouez-le, vous y avez pensé vous-même. Ce ne serait pas satisfaisant de configurer votre ordinateur allumé? Malheureusement, ce n'est pas ce que cet article est d'environ. Burning In est le terme utilisé pour décrire le processus de test du nouveau matériel serveur géré pour les défauts avant de mettre à profit dans un environnement réel. Ceci est fait en exécutant le logiciel «test de stress» pour une certaine période de temps.
Chaque fois que nous obtenons un nouveau matériel serveur, nous faisons toujours une brûlure complète pour s'assurer que le matériel du serveur est à nos normes élevées. Si le matériel tombe en panne à tout moment, nous le renvoyer au fournisseur. Le processus réel est facile, bien que sa mise en place n'est pas.
Mémoire
Tout d'abord, lorsque le nouveau serveur est sous tension, nous démarrer sur le réseau, ce qui nous permet de démarrer plusieurs machines à la fois sans avoir besoin de 20 + disques amorçables. Le premier test est le bien connu Memtest, vous trouverez tout ça dans Google, cette vérifie soigneusement la mémoire de l'ordinateur, et fonctionne pendant environ 1 jour.
Si l'ordinateur passe Memtest l', il est redémarré et démarré dans un chapeau rouge personnalisée avec Kickstart qui va installer un environnement Chapeau Rouge nue, et le système de contrôle Cerberus test, un logiciel spécial qui fonctionne nombreux essais sur tout le matériel dans le système.
CPU
Cerberus effectue plusieurs tâches pour tester la CPU. Il compile le noyau Linux maintes et maintes fois, va compliquer les problèmes mathématiques (combien de temps vous faut-il de travailler si 3214235409234472020393848453 est premier?), Et exécute du code écrit spécifiquement pour exécuter le CPU au zénith.
Disque dur
Cerberus écrit de gros volumes de données sur les disques durs, encore et encore afin de s'assurer que les plateaux du disque sont fonctionnels, et il va également supprimer et déplacer des fichiers et vérifiez les disques d'erreurs.
Si après une semaine le serveur est toujours en cours d'exécution (non fumeur) et ne s'est pas écrasé, il est considéré comme assez bon pour être utilisé comme une machine de production. Si elle échoue les tests n'importe où le long du chemin, il est emballé et retourné à être remplacé. Les serveurs Web qui ont survécu à ce processus va certainement survivre à tout ce que vous pouvez par le biais d'eux.
Vous devriez normalement s'attendre à ce que ce niveau de test sera complété par les fabricants de matériel et de sorte que ces tests ne devrait pas permettre de détecter les défauts. Dans nos centaines d'essais de machines expérience nous ne trouvons régulièrement des défauts, et nous envoyons des composants dos.
La raison pour laquelle il est si important d'effectuer ce niveau de test sur des ordinateurs qui seront utilisés en tant que serveurs est que les exigences de disponibilité sont si élevés. Les moindres fautes ne causent des pannes et les temps d'arrêt. Une fois un serveur Web est déployé, plus jamais vous avez l'occasion de le mettre hors ligne et d'effectuer de tels tests détaillés. Même si elle devait tomber en panne, il ya toujours une demande qu'il soit remis en ligne le plus rapidement possible, pas en reste déconnecté pendant diagnostics approfondis sont terminées....
Inscription à :
Publier les commentaires (Atom)
Aucun commentaire:
Enregistrer un commentaire