LINUX.ORG.RU

r8169 чехарда Link is Down ... Link is Up и частичное решение

 , , ,


2

2

Такие дела — вдруг, практически откуда ни возьмись, со вчерашнего вечера стало каждые несколько минут отваливаться проводное соединение (r8169, 5.15.0-78/76). В dmesg:

[  251.118395] r8169 0000:01:00.0 enp1s0: Link is Down
[  253.694702] r8169 0000:01:00.0 enp1s0: Link is Up - 100Mbps/Full - flow control rx/tx
[  254.052888] r8169 0000:01:00.0 enp1s0: Link is Down
[  256.796432] r8169 0000:01:00.0 enp1s0: Link is Up - 100Mbps/Full - flow control rx/tx
[  269.570727] r8169 0000:01:00.0 enp1s0: Link is Down
[  272.252308] r8169 0000:01:00.0 enp1s0: Link is Up - 100Mbps/Full - flow control rx/tx
[  302.297242] r8169 0000:01:00.0 enp1s0: Link is Down
[  304.894322] r8169 0000:01:00.0 enp1s0: Link is Up - 100Mbps/Full - flow control rx/tx
[  309.748182] r8169 0000:01:00.0 enp1s0: Link is Down
[  312.387393] r8169 0000:01:00.0 enp1s0: Link is Up - 100Mbps/Full - flow control rx/tx
[  313.071430] r8169 0000:01:00.0 enp1s0: Link is Down
[  315.857187] r8169 0000:01:00.0 enp1s0: Link is Up - 100Mbps/Full - flow control rx/tx
[  320.375260] r8169 0000:01:00.0 enp1s0: Link is Down
[  322.983243] r8169 0000:01:00.0 enp1s0: Link is Up - 100Mbps/Full - flow control rx/tx
[  330.535909] r8169 0000:01:00.0 enp1s0: Link is Down
[  333.206734] r8169 0000:01:00.0 enp1s0: Link is Up - 100Mbps/Full - flow control rx/tx


Погрешил на Network Manager, перелом жилы в кабеле, обновления ядра... оказалось (вроде бы): Energy Efficient Ethernet. Первый раз об этом EEE в жизни слышу.

Сделал
ethtool --set-eee enp1s0 eee off

и помогло.
smacker@Ideapad510 ~ $ ethtool --show-eee enp1s0 
EEE Settings for enp1s0:
	EEE status: disabled
	Tx LPI: disabled
	Supported EEE link modes:  100baseT/Full 
	                           1000baseT/Full 
	Advertised EEE link modes:  Not reported
	Link partner advertised EEE link modes:  100baseT/Full

Прописал в отключение EEE в /etc/rc.local

Ходят слухи, что еще помогает параметр ядра «igb.EEE=0», но я пока не проверял — igb для интела, для r8169 параметров нет. И в целом решение я считаю верным чисто в силу марксистского принципа «практика — критерий истины», хотя очень может быть, что оно лечит симптом, а не причину.

Вопрос: что это такое и почему вдруг эта проблема появилась по видимому на пустом месте?

PS: Есть похожая и очень старая тема Link is Down & Link is UP про r8168, но и там молчат про причины и решение. Аналогично, https://forums.debian.net/viewtopic.php?t=149173 — толку нет, но аж прошивку роутера успели обличить. И в https://bugzilla.redhat.com/show_bug.cgi?id=1737207 тоже обсуждение закрылось по причине EOL дистра.

★★★★★

Последнее исправление: Smacker (всего исправлений: 3)

А баг-то точно есть? Ну вырубает драйвер железку чтобы не кушала, потом врубает. Вон pipewire звуковуху так же дрючит, каждые 5 сек после последнего звука громкий «пук» - это она отключилась…

mrjaggers
()
Последнее исправление: mrjaggers (всего исправлений: 1)
Ответ на: комментарий от mrjaggers

Хороший вопрос. На мой взгляд, поведение ненормальное — натурально пропадает коннект. Оно, конечно, можно сказать, что мол именно в этот момент был простой оборудования — но не выключать же сетевую карту из-за отсутствия активности каждую минуту или около того. Это всё равно как если бы монитор гас, если я 30 секунд не нажимаю кнопки — может я что смотрю или читаю?

Smacker ★★★★★
() автор топика
Ответ на: комментарий от Smacker

Это всё равно как если бы монитор гас

Так тоже бывает, если небольшое время поставить. Я помню чуваки жаловались что у них так диски жесткие вырубались из-за технологии энергосбережения.

vbcnthfkmnth123 ★★★★★
()
Ответ на: комментарий от mrjaggers

Ну тут думаю, линк не упадёт, если пакеты будут гоняться туда-сюда — но у меня как раз вечером отключилась сетевая карта при включённом VPN поверх. Сессия оборвалась. По мне так не норм.

Smacker ★★★★★
() автор топика
Ответ на: комментарий от vbcnthfkmnth123

Хммм... а на постоянную раскрутку дисков заново при регулярном засыпании не уйдёт ли больше энергии, чем если бы мотор их то же время просто вращал на постоянной скорости?

Smacker ★★★★★
() автор топика
Ответ на: комментарий от Smacker

Хммм... а на постоянную раскрутку дисков заново при регулярном засыпании не уйдёт ли больше энергии, чем если бы мотор их то же время просто вращал на постоянной скорости?

И при этом сокращается ресурс накопителя. Экономисты они такие.

utanho ★★★★★
()
Ответ на: комментарий от utanho

Верно и при этом сплошные плюсы для производителя. Благодаря экономии энергии они могут рисовать красивые цифры в характеристиках(Что важно для маркетинга) и при этом люди будут покупать жесткие диски чаще, потому что ресурс таких накопителей меньше. И ещё диски с такой отключенной оптимизацией можно продавать как серверные.

vbcnthfkmnth123 ★★★★★
()
Последнее исправление: vbcnthfkmnth123 (всего исправлений: 3)
Ответ на: комментарий от Chord

Нет, всё, теперь эта тема про преимущества двухтактных ДВС и литых чугунных дисков в НЖМД. Головка для считывания, само собой, используется фрезерная.

Smacker ★★★★★
() автор топика
Ответ на: комментарий от utanho

У нас было 2 вала, 75 самоконтрящихся гаек, 5 шестерёнок разного диаметра, коробка, на половину наполненная болтами, и целое море разноцветных смазок, герметиков и присадок...

Smacker ★★★★★
() автор топика
Ответ на: комментарий от Smacker

ethernet энергии жрёт как не в себя.

ты знаешь, да!

как только ты чуть вырастаешь из админа локалхоста и обладателя пятипортового коммутатора, оказывается, что можно сэкономить на электричестве, подумав с сторону энергосбережения.

но у хомячков это всё только вызывает негодование, хихихи ))

aol ★★★★★
()
Ответ на: комментарий от andytux

Вот вам авария: в Замоскворечье
Трое везли хоронить одного, -
Все, и шофер, получили увечья,
Только который в гробу - ничего.
(с)

mrjaggers
()
Последнее исправление: mrjaggers (всего исправлений: 1)

В домашних условиях не нужен eee, можно выключать всегда.

но аж прошивку роутера успели обличить

Ну линк то двусторонний. В некоторых SOHO роутерах этот eee принудительно выключают, чтобы подобные темы не создавали.

zent
()

Хм, аналогичную проблему последнюю неделю наблюдаю и у себя.

[42965.431390] r8169 0000:22:00.0 alli: Link is Down
[42972.180586] Generic FE-GE Realtek PHY r8169-0-2200:00: Downshift occurred from negotiated speed 1Gbps to actual speed 100Mbps, check cabling!
[42972.180593] r8169 0000:22:00.0 alli: Link is Up - 100Mbps/Full (downshifted) - flow control off
[43008.446611] r8169 0000:22:00.0 alli: Link is Down
[50705.469831] Generic FE-GE Realtek PHY r8169-0-2200:00: Downshift occurred from negotiated speed 1Gbps to actual speed 100Mbps, check cabling!
[50705.469836] r8169 0000:22:00.0 alli: Link is Up - 100Mbps/Full (downshifted) - flow control off
[50826.876248] r8169 0000:22:00.0 alli: Link is Down

Отключил eee, продолжаю наблюдение.

JaM
()
Ответ на: комментарий от Smacker

можно делать шаги в полтора раза длиннее, тогда обувь прослужит в полтора раза дольше!

Правда, можно порвать штаны, но это уже совсем другая история.

Nervous ★★★★★
()

Ну что, на балконе, вы готовы к прорыву в духе святом? Настал черёд очешуительных рассказов и паранормальных историй.

Итак, вчера я поехал на дистанцию 50 км на велосипеде. Уходя из дома отключил ADSL маршрутизатор, который по ту пору после фикса работал отлично. Вернувшись через часов этак 5, включаю — а он дохленький. Загораются индикаторы «вкл», «adsl» и «pppoe», причем все сразу, не мигают, потом мигают lan-порты, и всё. Обратно он пакетов не отдаёт, на пинг не реагирует, возврат к заводским настройкам не делает (я пробовал). Замерил напряжение у источника питания (вдруг кондёры вспухли) — нет, штатные 9В. Короче, кирпич. А то, что я видел два последних дня — видимо, были его дыханием Чейна-Стокса симптомами скорого выхода из строя.

Позвонил в ростелеком, где я оставлял ранее заявку на проверку кабеля (дожди были, одной из моих версий про разрывы было просачивание воды в распредкоробку), уточнил. Попросил добавить, что прошу изыскать возможность вернуть меня с Annex B на Annex A. Так-то я на B сидел из-за сигналки, но она в том году на GSM была переделана, а я просто выполнял заповедь «не трогай то, что работает». А вообще у меня есть два модема на Annex A, и само собой я хотел заменить кирпич именно ими. Я же не зря их не выкинул!

Утром звонит техник, спрашивает подробности. Вкратце излагаю по тезисам ситуацию и свой траблшутинг. Он идёт смотреть порты мультиплексора, перезванивает и говорит — а вы у нас и так на Annex A... более того, оборудование в стойке не умеет делать Annex B... И инфы о недавних изменениях в конфиге нет. Я взял старый модем, сплиттер на A, воткнул — и работает, он тут же говорит — вот, линк поднялся! Я его спрашиваю — а как же я с модемом, который физически не поддерживает B ни в каком виде, и со сплиттером на B сидел все эти месяцы вплоть до позавчера? Ответа у нас не нашлось: физически должно быть невозможно, а по имеющимся данным именно так и должно было быть.

Итого должен сделать единственно возможный для серьёзного материалиста и учёного вывод: самому господу было угодно, чтобы я наконец отказался от Annex B, и он устроил так, чтобы я мог пользоваться тем, для чего у меня есть оборудование и основное, и запасное. Иного объяснения этого технического феномена у меня для вас нет.

Smacker ★★★★★
() автор топика
Последнее исправление: Smacker (всего исправлений: 1)
Ответ на: комментарий от sr11

Это я забыл уточнить, что после моего фикса на ноутбуке ethernet линк не терялся, но периодически терялся сам ADSL линк на маршрутизаторе. Гораздо реже, чем отвал моего коннекта с марштуризатором по Ethernet, но всё-таки неприятно. Поэтому я и позвонил в ростелеком, где оставил заявку на проверку кабеля (дожди были, одной из моих версий про разрывы было просачивание воды в распредкоробку), т.к. когда-то уже был аналогичный случай.

Smacker ★★★★★
() автор топика

PS: Нашёл на ютюбе видео с идентичной по симптомам неисправностью. С помощью деревянного шпателя вскрыл наконец-таки корпус своего TD-W8961NB (который дохленький). Вскрытие показало, что больной скончался от вскрытия. Нашёл три электролитических кондёра с круглыми жёппками. Видимо, пойду куплю замену и перепаяю, может и починю. Непонятно зачем, конечно, но не в этом соль.

Smacker ★★★★★
() автор топика
Последнее исправление: Smacker (всего исправлений: 1)

Я продолжаю свой репортаж про никому не нужное железо. Краткое содержание прошлых серий: я грешил на EEE, потом ADSL роутер и вовсе помер, вскрытие выявило вздувшиеся конденсаторы.

Я заказал в чипе-дипе набор конденсаторов для полной замены (аж 87 рублей!), и перепаял все. Заодно выпаял с платы-донора гребенку пинов и распаял TX/RX/GND пины на плате роутера, на случай, если конденсаторы не помогут, и пациент серъезно окирпичился.

Однако мастерство не пропьешь я припаял всё отлично, модем включился с первого раза, и заморгал светодиодами. Кстати, я отметил, что горящие два светодиода — это сигнал первой стадии загрузки, они и сейчас загораются, но потом гаснут. Последовательный порт тоже работает, проверял на шнурке с клоном PL2303 с озона за двести рублёв. Который, в свою очередь, тоже в линуксе работает вообще без вопросов.

Теперь остался эксперимент по смене пола annex-а с B на A, некоторые источники говорят, что это на этом роутере это возможно, некоторые наоборот. Пожуём-увидим.

Smacker ★★★★★
() автор топика
Ответ на: комментарий от Smacker

Итак, финал: паранормальная история.

В TD-W8961NB hw ver 3 (B = «Annex B») есть телнет. И, конечно же, команды в нём.

sys modelcheck off

отключает (на текущую сессию) проверку фирмвари, чтобы можно было прошить, скажем, от TD-W8961ND (Annex A + Detachable Antenna).

команды

wan adsl annex a
wan adsl annex b

переключают его в Annex A / Annex B соответственно. В веб-интерфейсе соответственно изменяется выпадающий список в пункте Advanced Setup → ADSL.

sys save

записывает настройки. Выдаёт кучу ошибок, и не показывает последнюю строку в консоли. Последняя строка это «Do you want to reboot system? (y/n)», и если если нажать что-то ещё, то просто не будет ухода в ребут. Но об этом вы узнаете уже пост-фактум. Занятный баг.

Ну так вот, о чём это я. В интернетах ходят как раз-таки слухи про перепрошивку на версию ...ND ради перехода на Annex A. Но оказалось, что, во-первых, уже само по себе переключение командой выше меняет на обычной прошивке Annex c A на B, и он коннектится.

Но во-вторых ещё интересней. Он коннектится, даже если оставить Annex B. Можно было бы предположить, что на АТС стоит какой-то умный мультиплексор, который умеет менять Annex сам, но он коннектися даже со сплиттером на Annex A.

Короче, я сижу в проводах от модема, и по последовательному порту смотрю, и в телнете, и в веб-админке — и не нахожу объяснения этому феномену. Видимо, паранормальные явления всё-таки существуют, а раз так, то на всё воля божья. За сим откланяюсь.

Smacker ★★★★★
() автор топика