Author Topic: Переодически отваливается досту по сети  (Read 2403 times)

Nabaro

  • Zen Apprentice
  • *
  • Posts: 32
  • Karma: +0/-0
    • View Profile
Проблема следующего характера. Через некоторое время пропадает наглухо доступ к серверу, даже не пингуется. Оборудование проверил, вроде в норме. Позже доступ возобновляется и работает все как часы. Потери связи случайные, может через 10 минут после ребута пропасть, а может через полчаса. Подскажите, что это может быть?

версия 3.4 со всеми обновлениями. (без последних обновлений так же себя вел).

tunsa

  • Zen Samurai
  • ****
  • Posts: 350
  • Karma: +15/-1
    • View Profile
htop гляньте

corwin-mg

  • Zen Warrior
  • ***
  • Posts: 246
  • Karma: +1/-1
    • View Profile
Причина 1 - сетевая карта - проверить (замена на другую)
Причина 2 - коммутатор - проверить на другом коммутаторе
Причина 3 - слишком много устройств в сети, ARP забита
Причина 4 - сам сервер с глюками - поставить на другое железо посмотреть

И так далее...

p.s.

Ещё посмотреть в сторону возникновения колец в сети.

Nabaro

  • Zen Apprentice
  • *
  • Posts: 32
  • Karma: +0/-0
    • View Profile
Причина 1 - сетевая карта - проверить (замена на другую)
Причина 2 - коммутатор - проверить на другом коммутаторе
Причина 3 - слишком много устройств в сети, ARP забита
Причина 4 - сам сервер с глюками - поставить на другое железо посмотреть

И так далее...

p.s.

Ещё посмотреть в сторону возникновения колец в сети.

В общем менял 3 разных материнки, проверял жесткий диск на ошибки. Проблема осталась. К сожалению свичи в даный момент заменить не могу, попробую в будущем. Как проверить забитость ARP на неуправляемых свичах?

Еще вот интересный момент, если с одного компа не пингуется то с другого вполне себе пинги бегут. Иногда пинг идет, но зайти в морду или работать через прокси не выходит. Лечится на время перезагрузкой. Откопал старый сервер 2003го года, там 2 встроенные интел сетевые карты, развернул там 3.3, и о чудо, он работает стабильно (но медленно и там умирает рейд). Поставил все поэтапно на другое железо - проблема осталась.

Вот такие сетевушки на железяке где проблема прошла:
Quote
01:03.0 Ethernet controller: Intel Corporation 82557/8/9/0/1 Ethernet Pro 100 (rev 0d)
01:04.0 Ethernet controller: Intel Corporation 82540EM Gigabit Ethernet Controller (rev 02)
01:09.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (rev 10)

вот последние сетевые на проблемном сервере, до этого были риалтеки:
Quote
01:07.0 Bridge: NVIDIA Corporation MCP61 Ethernet (rev a2)
01:06.0 Ethernet controller: Intel Corporation 82557/8/9/0/1 Ethernet Pro 100 (rev 02)
01:07.0 Ethernet controller: Intel Corporation 82557/8/9/0/1 Ethernet Pro 100 (rev 02)

logdog

  • Zen Hero
  • *****
  • Posts: 623
  • Karma: +29/-2
    • View Profile
Дайте вывод
ifconfig eth0
ethtool -i eth0

bubnov-pi

  • Zen Samurai
  • ****
  • Posts: 425
  • Karma: +27/-0
    • View Profile
А точно нет конфликта IP в сети?
Как вариант - на свитче начали шалить порты - попробовать установить зависимость "глюков" от того, в какой порт подключен сервер.

Nabaro

  • Zen Apprentice
  • *
  • Posts: 32
  • Karma: +0/-0
    • View Profile
Дайте вывод
ifconfig eth0
ethtool -i eth0

На всякий случай сделал вывод по всем интерфейсам, "рабочего" и не рабочего серверов.
Уже 3яя сборка сервера с разными комплектующими, проблемного компьютера:
(eth0 - интернет1 но без настроек, eth1 - интернет2, eth2 - внутренняя сеть\локалка)
eth0:
Code: [Select]
ifconfig eth0
eth0      Link encap:Ethernet  HWaddr 00:60:94:23:e2:3d
          BROADCAST MULTICAST  MTU:1500  Metric:1
          RX packets:0 errors:0 dropped:0 overruns:0 frame:0
          TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:0 (0.0 B)  TX bytes:0 (0.0 B)

ethtool -i eth0
driver: e100
version: 3.5.24-k2-NAPI
firmware-version:
bus-info: 0000:01:06.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes

eth1:
Code: [Select]
ifconfig eth1
eth1      Link encap:Ethernet  HWaddr 00:60:94:a5:a3:a4
          inet addr:192.168.1.43  Bcast:192.168.1.255  Mask:255.255.255.0
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:35266 errors:0 dropped:619 overruns:0 frame:0
          TX packets:21861 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:5423734 (5.4 MB)  TX bytes:1004166 (1.0 MB)

ethtool -i eth1
driver: e100
version: 3.5.24-k2-NAPI
firmware-version:
bus-info: 0000:01:07.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes

eth2:
Code: [Select]
ifconfig eth2
eth2      Link encap:Ethernet  HWaddr 00:1d:60:17:a8:79
          inet addr:10.1.1.223  Bcast:10.1.1.255  Mask:255.255.255.0
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:52383 errors:1 dropped:619 overruns:1 frame:0
          TX packets:491 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:4440240 (4.4 MB)  TX bytes:188538 (188.5 KB)
ethtool -i eth2
driver: forcedeth
version: 0.64
firmware-version:
bus-info: 0000:00:07.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: no
supports-register-dump: yes

Тот самый старый сервер, что по непонятным мне причинам держит сетку:
(eth0 - интернет1 основной, eth1 - внутренняя сеть\локалка, eth2 - интернет2)
eth0:
Code: [Select]
ifconfig eth0
eth0      Link encap:Ethernet  HWaddr 00:07:e9:31:fe:39
          inet addr:192.168.2.42  Bcast:192.168.2.255  Mask:255.255.255.0
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:3156533 errors:0 dropped:25 overruns:0 frame:0
          TX packets:2501645 errors:28 dropped:0 overruns:0 carrier:28
          collisions:0 txqueuelen:1000
          RX bytes:3816877285 (3.8 GB)  TX bytes:321927112 (321.9 MB)

ethtool -i eth0
driver: e100
version: 3.5.24-k2-NAPI
firmware-version:
bus-info: 0000:01:03.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes
eth1:
Code: [Select]
ifconfig eth1
eth1      Link encap:Ethernet  HWaddr 00:07:e9:31:fe:3a
          inet addr:10.1.1.222  Bcast:10.1.1.255  Mask:255.255.255.0
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:2196255 errors:0 dropped:1935 overruns:0 frame:0
          TX packets:3740136 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:316295984 (316.2 MB)  TX bytes:396597290 (396.5 MB)

ethtool -i eth1
driver: e1000
version: 7.3.21-k8-NAPI
firmware-version:
bus-info: 0000:01:04.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes
eth2:
Code: [Select]
ifconfig eth2
eth2    Link encap:Ethernet  HWaddr 00:02:2a:e1:83:44
          inet addr:192.168.1.42  Bcast:192.168.1.255  Mask:255.255.255.0
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:165936 errors:0 dropped:1944 overruns:0 frame:0
          TX packets:10656 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:16309031 (16.3 MB)  TX bytes:12529570 (12.5 MB)

ethtool -i eth2
driver: 8139too
version: 0.9.28
firmware-version:
bus-info: 0000:01:09.0
supports-statistics: yes
supports-test: no
supports-eeprom-access: no
supports-register-dump: no

Пробовал настройки интернет\сеть делать на другие интерфейсы, результата не дало. Основное отличие это то, что старый сервер - реально сервер, модель Netfire 3100. А то, что я пытаюсь собрать - обычные комплектующие. Вот еще, кажется, что если бесконечно пинговать локальный сетевой интерфейс, он не отваливается. Но стоит перестать к нему обращаться, то есть шанс к нему уже не достучатся, какое-то время.

А точно нет конфликта IP в сети?
Как вариант - на свитче начали шалить порты - попробовать установить зависимость "глюков" от того, в какой порт подключен сервер.

Конфликта нет. Дело в том, что вот какая ситуация в последнее время: Я собираю компьютер, настраиваю там Zentyal, и подменяю его вместо рабочего, то есть в те же порты, и идут спонтанные отваливания. Точнее я не могу достучатся к нему. Снимаю, меняю комплектующие, перепробовал даже все версии Zentyala. Но проблема остается.
В серверной два 24х портовых свича DES-1024D. Как минимум четыре 8 портовых свича раскиданы по предприятию. 60+ компьютеров. 5 сетевых принтеров. Как мне вычислить неисправное оборудование которое возможно влияет на проблему? Отключать по одному, долго и наталкивается на сопротивление начальства.

logdog

  • Zen Hero
  • *****
  • Posts: 623
  • Karma: +29/-2
    • View Profile
Я попросил вывод, как бы намекая, что нужно либо установить последние драйвера (либо наоборот откатиться), либо взять версии дров+карточка и погуглить (по багтекерам).
По-моему мнению, у Вас проблема либо в сетевушках, либо в дровах к ним (уверен, что в e100).

 RX packets:52383 errors:1 dropped:619 overruns:1 frame:0
 TX packets:2501645 errors:28 dropped:0 overruns:0 carrier:28
« Last Edit: July 14, 2014, 11:49:49 am by logdog »

ua4wiy

  • Zen Apprentice
  • *
  • Posts: 11
  • Karma: +0/-0
    • View Profile
Если включен и настроен шейпер, попробуй выключить, или полностью удалить.

AlexZen

  • Zen Apprentice
  • *
  • Posts: 25
  • Karma: +0/-0
    • View Profile
Та же история. Через некоторое время сервер перестаёт отвечать (совсем). Выключать пробовал - не помогает. Буду удалять.

А откуда инфа про глючный модуль Traffic Shaping? Неужели в нём проблема?

logdog

  • Zen Hero
  • *****
  • Posts: 623
  • Karma: +29/-2
    • View Profile
А откуда инфа про глючный модуль Traffic Shaping? Неужели в нём проблема?
Не факт, но его и Intrusion Detection/Prevention System стоит вырубить пока ищите проблему.
Ну а по поводу сетевых... я писал выше.

ua4wiy

  • Zen Apprentice
  • *
  • Posts: 11
  • Karma: +0/-0
    • View Profile
Та же история. Через некоторое время сервер перестаёт отвечать (совсем). Выключать пробовал - не помогает. Буду удалять.

А откуда инфа про глючный модуль Traffic Shaping? Неужели в нём проблема?

У меня глючил, та же история была инет периодически отваливался, снёс Traffic Shaping, проблема исчезла...

Nabaro

  • Zen Apprentice
  • *
  • Posts: 32
  • Karma: +0/-0
    • View Profile
Подскажите какими командами скачать и установить новый драйвер сетевой карты из консоли?

Вот например, нашел совет как заменить r8169 на r8168:
Quote
Качаем Отсюда драйвер, я взял LINUX driver for kernel 3.x and 2.6.x and 2.4.x.

Распаковываем скачанный файл, переходим в распакованную папочку, далее
sudo rmmod r8169
sudo ./autorun.sh
sudo modprobe r8168
sudo su
echo "blacklist r8169" >> /etc/modprobe.d/blacklist.conf
exit

Собственно не совсем понятно как скачать и распаковать.
« Last Edit: July 24, 2014, 12:30:00 pm by Nabaro »

logdog

  • Zen Hero
  • *****
  • Posts: 623
  • Karma: +29/-2
    • View Profile
Собственно не совсем понятно как скачать и распаковать.

wget путь до скачаваемого файла
mc - тоже себе поставьте.

Nabaro

  • Zen Apprentice
  • *
  • Posts: 32
  • Karma: +0/-0
    • View Profile
В общем, после долгих экспериментов с драйверами, решил попробовать другие карточки, проблема с отваливанием ушла. Не самое элегантное решение, но возможно кому-то эта тема укажет на причину в схожей ситуации.