Нейва, скажите пожалуйста, почему у вас инетбанк валится всегда по утрам?
Вчера падал
Сегодня платежи 2 часа висели (техподдержка отвечает, что все нормально, просто очередь :-D ) - видимо, живая
Щас вообще зайти невозможно - систему перегружают :bes::gun::box:
Или
это вы плановые работы в самое рабочее время затеваете? 8(
Да ладно Вам - так уж и "всегда", зачем экстраполировать единичные случаи на всю работу :-)
Хотя и говорят, что в одну воронку дважды снаряд не попадает, но закон подлости опровергает эту максиму: последствия вчерашнего прилетели сегодня. Платежки встали в очередь, пришлось
перезагрузить систему, заняло это 7 минут, сейчас все в нормальном режиме (то есть, летает :-) )
Приносим свои извинения
Кластер ее не допускает... и позволяет наращивать производительность системы...
Гм, видимо я как-то по другому себе кластеры представляю - для меня это в первую очередь решения для обеспечения автоматической устойчивости системы при
сбоях железа и системного ПО - когда на одном узле кластера случается событие "Ж", то вся обработка ложится на второй узел (в штатном режиме работает или один активный узёл, второй в пассивном режиме запущен или оба узла параллельно работают и нагрузка делится пополам, но далеко не все системы
могут работать в таком параллельном режиме). С точки зрения производительности системы кластер ваще никакой роли не играет - тут всё зависит от способности системы в несколько потоков обрабатывать запросы и сколько аппаратных ресурсов на это выделено (а при кластере ещё приходится часть аппаратных
ресурсов тратить на кластеризацию).
Цитата: От пользователя: AlexeyBB
ваша служба ИТ не дорабатывает
может быть - в идеале всё ИТ-хозяйство должно работать так чтобы клиент о нём вобще не задумывался и не ломал голову кластер там или не кластер :-)
кластер влияет не на разгребание, а на время "перезагрузки"
чтобы не
JFYI: рестарт кластера занимает гораздо больше времени, чем рестарт ("перезагрузка") одно-нодового компьютера; равно как и рестарт сервиса на кластере.
p.s. Безмерно радует, что в форуме есть люди, которые не зная ни архитектуры системы, ни подробностей сбоя, делают однозначные выводы и дают советы. Наверное, если бы уних была своя консалтиновая
компания, она бы имела сверх-прибыли.
Небольшой совет, раз уж речь здесь идет о сайте, по вашей главной странице.
Мне кажется, сегодня, спустя три года, упоминание о том, что нейва создана выходцами из казны, устарела и не несет положительных эмоций.
Что для меня "Казна" сегодня? С чем она ассоциируется? Это полулегальное
полукидалово, смс-ки от альфы, дебильные письма в ящике, дурной "запашок" и прочее. И в этом году, по моему, она вообще исчезнет. Человек быстро забывает хорошее, проверено.
А вам, банку то есть, нужно идти своей дорогой. И казна, слава богу, тут уже не при чем.
Как информация в разделе
"история" - самое то. На главной странице - не очень.
Дайте теме опуститься... Вчера БочкаМеда ложку дегтя влила сегодня любители кластеров собрались...
Банк то хороший... не зря же мы его выбрали...
Просто я понимаю, что представители банка должны были написать примерно следующее:
1. Причины сбоя определены...
2.
Виновные наказаны...
3. Проведены мероприятия, чтобы исключить подобные проблемы для пользователей впредь...
Дело то не в кластерах... Все зависит от уровня ответственности людей за конкретные последствия... Когда людям пофиг (не применительно к Нейве, а вообще), что останутся
люди без ИБ на 1-2 минуты или пару часов или задержат платежи на час, два... ничего страшного не случится...
А если от таких задержек гибнут люди и случаются техногенные катастрофы, а на руководство заводят уголовные дела - то все работает без сбоев (практически) и каждое такое событие
тщательно расследуется и разрабатываются меры, чтобы исключить это вновь... Т.е. как все эти проблемы сделать для любимых клиентов невидимыми... И находятся варианты как это все лучше сделать... (дело не в кластерах)
Просто я понимаю, что представители банка должны были написать примерно следующее:
1. Причины сбоя определены...
2. Виновные наказаны...
3. Проведены мероприятия, чтобы исключить подобные проблемы для пользователей
впредь...
Алексей, естественно, это совершенно стандартная последовательность действий, поэтому никому и в голову не пришло это расписывать, поскольку очевидно.
Ну, разве что про наказание виновных - не всегда они есть (аппаратный сбой) или их можно наказать (внешний разработчик,
а в любой лицензии написано "as is").
Цитата: От пользователя: AlexeyBB
Дело то не в кластерах... Все зависит от уровня ответственности людей за конкретные последствия...
Полностью согласен.
При проектировании системы предусмотрели все возможное.
Виртуальные машины на blade-серверах позволяют максимально быстро перезапустить процесс в случае сбоя, есть кластеризация, есть AS (автономная зона адресов и несоклько линков), есть система мониторинга, схемы оповещения о проблеме, порядок восстановления. Но поскольку мы имеем дело не с
"коробочными" продуктами и используем сочетание уникальных технологий, иногда возникают ситуации, на которые нет стандартных алгоритмов разрешения.
В большинстве случаев решение возникающих технических проблем происходит незаметно для клиентов, но иногда (как в последние 2 дня) случается
непредвиденное, да еще по закону подлости выскакивает несколько проблем подряд и они накладываются друг на друга, да еще в самое "горячее" время (когда у клиентов пик активности). И IT-подразделение, естественно, не пьет чай, а оперативно решает проблему, понимая, что клиенты привыкли к нормальному
непрерывному сервису, и его внезапное отсутствие их совсем не радует.
По результатам в любом случае делается "разбор полетов".
А идеальных систем не бывает. Даже если за сбой будет уголовная ответственность. Кусок летящей по цеху инструментальной стали (глюканул контроллер системы
натяжения прокатного стана) - гораздо страшнее даже 2-часового простоя и-банка.
Про системы управления воздушным движением и контроля ядерного производства уже не говорю...
И IT-подразделение, естественно, не пьет чай, а оперативно решает проблему, понимая, что клиенты привыкли к нормальному непрерывному сервису, и его внезапное отсутствие их совсем не радует.
По результатам в любом случае делается "разбор
полетов".
Внимание! сейчас Вы не авторизованы и не можете подавать сообщения как зарегистрированный пользователь.
Чтобы авторизоваться, нажмите на эту ссылку (после авторизации вы вернетесь на
эту же страницу)