Accueil - Explorer - Détails

Comment dépanner les défauts du réseau

Nous savons que les commutateurs sont des appareils réseau importants dans les réseaux locaux, et leur statut opérationnel est étroitement lié à l'état d'accès Internet des systèmes clients.
 
Cependant, dans les travaux pratiques, l'état des commutateurs peut facilement être affecté par des facteurs externes, résultant en divers défauts de réseau dans le réseau local.
 
Pour assurer un fonctionnement du réseau stable, nous devons gérer et maintenir correctementinterrupteursDans nos travaux quotidiens pour empêcher les échecs de commutation.
 
Dans cet article, nous raconterons l'expérience d'un expert senior à basse tension dans le dépannage des défauts de socket. Lors de l'entretien d'un réseau local dans un bâtiment, il a rencontré un défaut où l'interrupteur de plancher n'a pas pu être pingé en raison de connexions physiques inappropriées. Le processus de dépannage de cette faute de réseau s'est avéré assez difficile.
 
Étant donné que cette faute est relativement typique et que l'approche de dépannage peut être référencée, elle est partagée ici pour les avantages de chacun.
 

1. Scène de défaut:

 
L'immeuble de bureaux dont je était responsable à l'époque se composait de plusieurs sociétés. Pour s'assurer que chaque entreprise pourrait avoir un accès Internet indépendant et que son statut Internet ne serait pas affecté par d'autres sociétés, j'ai choisi un interrupteur de routeur comme commutateur de base du réseau du bâtiment.
 
Dans le même temps, différents sous-réseaux de travail virtuels ont été configurés pour chaque unité du commutateur.
 
Étant donné que chaque unité était située sur différents étages et que le nombre d'entreprises à chaque étage variait, certains étages avaient deux ou trois unités, tandis que d'autres avaient jusqu'à cinq ou six unités.
 
Les sous-réseaux de travail d'unités sur différents étages étaient tous connectés au réseau local du bâtiment via l'interrupteur d'étage correspondant et ont accédé au réseau Internet via le pare-feu matériel du réseau du bâtiment.
 
Pour améliorer l'efficacité de la gestion du réseau, les administrateurs de réseaux géraient et maintenaient généralement les commutateurs via des connexions distantes.
 
Cependant, un matin, lorsque j'ai commencé à travailler et que je scannais et diagnostiquait l'état de travail de divers ports de commutation sur l'interrupteur de noyau réseau local, j'ai constaté que l'un des ports de commutation était en baisse.
 
J'ai donc vérifié les enregistrements de gestion du réseau et j'ai constaté que la connexion à ce port provenait d'un commutateur au deuxième étage au cinquième étage.
 
Lorsque j'ai essayé de me connecter à distance à l'interrupteur au sol, j'ai trouvé que je ne pouvais pas me connecter avec succès. Lorsque j'ai utilisé la commande ping pour tester l'adresse IP du commutateur, il a renvoyé le "temps de demande".
 
Juste au moment où je me demandais pourquoi personne n'a signalé la faute, le téléphone a sonné comme prévu, et bien sûr, les utilisateurs du cinquième étage ont commencé à signaler les défauts du réseau les uns après les autres.
 
Sur la base des symptômes de défaut ci-dessus, je soupçonnais qu'il pourrait y avoir un problème inattendu avec l'interrupteur au sol.
 
Je me suis donc précipité sur les lieux de l'interrupteur défectueux, déconnecté son alimentation, attendu un certain temps, puis reconnecté l'alimentation pour le redémarrer.
 
Une fois l'opération de redémarrage terminée, j'ai utilisé la commande ping pour tester à nouveau l'adresse IP du commutateur.
 
Cette fois, les résultats renvoyés étaient normaux et les opérations de connexion à distance pourraient se dérouler en douceur.
 
Cependant, une demi-heure plus tard, l'interrupteur défectueux a à nouveau présenté les mêmes symptômes de défaut, et lorsque je l'ai testé avec la commande de ping, il a renvoyé à nouveau des résultats anormaux.
 
Plus tard, se sentant mal à l'aise, j'ai répété le processus de redémarrage et de test, seulement pour constater que le commutateur défectueux ne pouvait toujours pas être ping normalement.
 

2. Dépannage approfondi:

 
Étant donné que les redémarrages répétés n'ont pas résolu le problème, j'ai estimé que la cause de la faute était plus compliquée, étant donné que ce type de défaut est souvent rencontré dans les processus de gestion du réseau.
 
J'ai donc effectué un dépannage approfondi après l'approche ci-dessous:
 
Étant donné que un seul commutateur d'un étage au cinquième étage de l'ensemble du réseau de construction a montré ce phénomène, j'ai initialement jugé qu'elle pourrait être causée par des problèmes avec ce commutateur de sol lui-même.
 
Afin d'identifier avec précision la cause du défaut, j'ai prévu de remplacer l'interrupteur défectueux par un fonctionnement correctement fonctionnant et d'observer si le défaut a toujours persisté.
 
Dans le même temps, je connecterais le commutateur problématique suspecté à un environnement de réseau indépendant.

info-500-333

Après une demi-heure de test et d'observation, j'ai vu que le commutateur défectueux, qui était connecté à l'environnement du réseau isolé, fonctionnait normalement et que son adresse IP pouvait être pingée dans cet environnement de réseau.
 
Cependant, le commutateur nouvellement remplacé, lorsqu'il est connecté au réseau de construction, ne peut pas être pingé normalement.
 
Sur la base de ces observations, j'ai conclu que la possibilité du commutateur du cinquième étage lui-même ayant un problème était presque négligeable. Après avoir exclu les facteurs liés à l'état du commutateur défectueux, j'ai examiné la structure du réseau et l'état de l'ensemble du réseau de construction.
 
Alors que les utilisateurs d'autres étages du bâtiment pourraient accéder normalement à Internet, une partie des utilisateurs du cinquième étage ne pouvait pas.
 
En vérifiant les informations de réseautage pour le cinquième étage, j'ai constaté qu'il y avait cinq unités à cet étage. À cette époque, l'administrateur réseau avait configuré des commutateurs de deux étages au cinquième étage et les avait connectés dans une configuration en cascade.
 
De plus, cinq sous-réseaux de travail virtuels ont été créés sur ces deux commutateurs pour s'assurer que chaque unité pourrait fonctionner de manière indépendante dans leurs sous-réseaux virtuels respectifs.
 
Étant donné que le port correspondant sur l'interrupteur de base était déjà en baisse, théoriquement, toutes les unités du cinquième étage ne devraient pas être en mesure d'accéder à Internet. Alors pourquoi certains utilisateurs signalaient-ils le défaut?
 
Dès qu'il était temps de commencer le travail, j'ai immédiatement contacté plusieurs sociétés qui n'avaient pas signalé de défauts de réseau. Leur réponse a été qu'ils venaient de découvrir l'accès anormal sur le réseau et étaient sur le point de demander l'aide de l'administrateur du réseau de construction.
 
Si tel est le cas, toutes les unités au cinquième étage ne devraient pas être en mesure d'accéder à Internet. Par conséquent, la cause de la faute devrait se situer dans les sous-réseaux de travail virtuels de ces unités.
 
Après avoir rétréci le champ de dépannage des cinq unités au cinquième étage, j'ai considéré que le redémarrage de l'équipement d'un commutateur spécifique au cinquième étage pourrait temporairement restaurer la faute du réseau.
 
Cependant, après une demi-heure, le même défaut de réseau réapparaîtrait.
 
Compte tenu de ce phénomène spécifique, je soupçonnais que ce pourrait être une tempête de diffusion de réseau qui a provoqué la congestion dans le commutateur pendant une certaine période de temps, bloquant finalement le port de commutateur correspondant sur le commutateur de base.
 
Pour faciliter l'analyse du défaut, j'ai utilisé des outils de surveillance de réseau pour analyser la transmission du paquet réseau sur les ports en cascade du commutateur du cinquième étage.
 
Les résultats ont montré que le trafic entrant et sortant des paquets était extrêmement élevé, dépassant presque environ 100 fois les valeurs normales. Cela a indiqué la survenue de la congestion du réseau dans le réseau du quatrième étage.

info-640-380

 
Alors, la congestion du réseau est-elle causée par un virus du réseau?
Ou est-il causé par une boucle de réseau?
 
Je prévois d'observer les modifications d'informations d'état des ports en cascade du commutateur défectueux, en particulier les modifications des paquets de diffusion de sortie. Si les paquets de diffusion de sortie continuent d'augmenter chaque seconde, il est très probable qu'il y ait une boucle de réseau dans le réseau du cinquième étage.
 
Sur la base de cette approche d'analyse, je me suis directement connecté au commutateur défectueux à l'aide d'un câble de commande de console et connecté au backend système en tant qu'administrateur système.
 
À l'aide de la commande "Affichage", j'ai vérifié les modifications des paquets de diffusion de sortie des ports Cascade du commutateur, en examinant les résultats chaque seconde et en les comparant.
 
Après des tests répétés, j'ai découvert que la taille des paquets de diffusion de sortie du commutateur défectueux augmentait en effet en continu.
 
Cela indique qu'il y a certainement une boucle de réseau dans les cinq unités au cinquième étage.
 
Après un examen attentif des deux interrupteurs au cinquième étage, j'ai constaté que leur connexion physique était normale.
 
De plus, les différents ports de commutation de ces deux commutateurs étaient directement connectés aux prises de réseau mural dans les pièces du cinquième étage.
 
En théorie, tant que les salles n'utilisent pas de commutateurs pour la cascade non autorisée, il ne devrait pas y avoir de boucle de réseau.
 
Maintenant qu'il est prouvé qu'il existe une boucle de réseau dans le réseau du cinquième étage, cela signifie que quelqu'un utilise arbitrairement les commutateurs pour agrandir le réseau. En trouvant l'interrupteur élargi et en inspectant ses connexions physiques, nous pouvons rapidement identifier le nœud défectueux spécifique.
 
J'ai donc contacté les administrateurs du réseau des différentes unités au cinquième étage par téléphone, leur demandant d'inspecter chaque salle de bureau et de signaler les chambres à l'aide de commutateurs subordonnés.
 
Il n'a pas fallu longtemps pour que les résultats d'inspection me soient rapportés, et étonnamment, environ 10 chambres utilisaient des commutateurs subordonnés pour l'expansion du réseau.
 
À ce stade, je savais qu'il y avait une forte probabilité de boucle de réseau dans ces 10 chambres. Mais quelle pièce exactement?
 
Dois-je visiter chaque pièce et inspecter leurs connexions de réseau une par une?
 
Après un examen attentif, j'ai récupéré la documentation du réseau et identifié les numéros de port utilisés par ces 10 pièces.

info-640-402

 
Ensuite, je me suis directement connectécâbles de réseauÀ ces ports et, dans le mode de vue de ces ports, j'ai pingé séquentiellement l'adresse IP du commutateur défectueux.
 
Quand j'ai atteint le sixième port, j'ai découvert qu'il ne pouvait pas être ping avec succès.
 
Pour déterminer si ce port était en effet problématique, j'ai utilisé la commande "Affichage" dans le mode de vue du port pour vérifier ses informations d'état.
 
Après avoir analysé les résultats, j'ai constaté que les tailles de paquets d'entrée et de sortie de ce port étaient significativement anormales. Par conséquent, j'ai estimé que ce port était certainement la cause du statut de travail anormal du commutateur défectueux.
 
Après avoir fait référence aux enregistrements de fichiers, j'ai rapidement identifié la pièce correspondante en fonction de ce numéro de port.
 
À mon arrivée sur les lieux, j'ai découvert que les deux ports de réseau disponibles dans cette pièce étaient tous deux connectés à de petits hubs, et ces deux centres étaient connectés à plusieurs ordinateurs.
 
Pour aggraver les choses, il y avait un câble réseau les connectant directement ensemble, créant une boucle de réseau entre les deux hubs.
 
Cette boucle a provoqué une tempête de diffusion, bloquant finalement le port en cascade de l'interrupteur défectueux et faisant en sorte que l'ensemble du réseau de construction ne soit pas en mesure d'accéder correctement à Internet.
 

3. Dépannage:

 
Après avoir retiré le câble réseau supplémentaire, j'ai revérifié les informations d'état du port de commutateur. Les résultats ont montré que les tailles de paquets d'entrée et de sortie étaient revenues à la normale.
 
Lorsque j'ai vérifié à nouveau l'état du port correspondant sur le commutateur de noyau, j'ai constaté que l'état de "baisse" précédent avait changé en statut "up". À ce stade, j'ai également réussi à faire un ping de ping-borde au quatrième étage.
 
Cela confirme que le problème a en effet été causé par l'utilisation non autorisée d'un interrupteur ou d'un centre par un utilisateur dans l'une des pièces du cinquième étage. Plus tard, grâce à une enquête plus approfondie auprès des internautes, j'ai appris que leurs chambres avaient été nettoyées la veille et à ce moment-là, tous lescâbles Ethernetont été débranchés.
 
Une fois les travaux de nettoyage terminés, en raison de la connaissance limitée des connexions des utilisateurs, ils ont reconnecté au hasard les câbles, résultant en une boucle de réseau. Par conséquent, en tant qu'ingénieurs de réseau, nous devons également en être conscients lors de la réalisation de projets de maintenance.

Envoyez demande

Vous pourriez aussi aimer