Chaos Monkey і ланцюг поставок Netflix

Нещодавно я мав розмову з Карлосом Креспо, головним операційним директором материнської компанії Zara Inditex, у якій він згадав програмний інструмент, створений Netflix понад десять років тому для інституціоналізації стійкості системи. Назва приваблива, і для лідерів ланцюгів постачання, які намагаються переосмислити свої мережі постачання для неспокійних часів, вона непереборна. І все-таки GoogleGOOG
пошук "мавпа хаосу в ланцюзі поставок" дав точний результат одна цитата, з 2012 року.

Чому б нам не застосувати цю ідею до стійкості ланцюжка поставок?

Що таке Chaos Monkey?

Це програмний інструмент, і ширше, інженерний принцип, який випадковим чином вимикає частини складної системи, змушуючи операторів відновлювати роботу. Щось на кшталт неочікуваних протипожежних тренувань, але щодня, у випадкових способах і місцях. Ідея полягає в тому, що набуття успіху в швидкому розв’язанні системних проблем є процесом навчання, який має виграти від крутішої кривої навчання.

Передісторія розповідає про те, як Netflix розширив свій потоковий бізнес на Amazon Web Services, перейшовши від доставки DVD-дисків до порогів клієнтів. На перший погляд, це логічний підхід до планування системного резервування, схожий на те, що ви очікуєте від NASA, але на практиці він використовує культурну норму Netflix, яка дозволяє окремим учасникам вирішувати власні проблеми. Як записано в «Техніка хаосу” у книзі 2020 року Кейсі Розенталь і Нори Джонс, які започаткували цю практику в Netflix, вона зводиться до п’яти принципів:

  • Побудуйте гіпотезу про стаціонарну поведінку
  • Варіювати події реального світу
  • Проведіть експерименти на виробництві
  • Автоматизуйте безперервні експерименти
  • Мінімізуйте радіус вибуху

Поєднання культури та процесу в Netflix є важливим, оскільки воно сприяло та використовувало підхід до вирішення проблем із відкритим кодом, а систематичне обертання колеса випадкових відключень пришвидшило навчання в розширеній команді.

Стійкість ланцюга постачання та розробка хаосу

Цифрове перетворення у ланцюжку постачання цього року було гаряче, оскільки це допомагає ланцюгам постачання підтримувати нові бізнес-моделі та спрямовуватись до сталого функціонування (дивіться дослідження BCG X), а й тому, що він обіцяє «стійкість». На жаль, практичне застосування цифрової трансформації для підвищення стійкості ланцюга постачань все ще зводиться до платформ для кращої «видимості», підкріплених низкою традиційних тактик, таких як буферизація запасів і подвійний пошук. В основі цього підходу лежить ще один рівень аналітичної роботи час відновлення Девід Сімчі-Леві з Массачусетського технологічного інституту та хвиля моделювання з використанням цифрових близнюків. Все це звучить чудово, але чого не вистачає, так це будь-якого систематичного способу експериментувати з реальними збоями в ланцюзі поставок, щоб дізнатися, як найкраще відновлюватися на практиці.

Застосування Chaos Monkey до ланцюгів поставок

Лікарі дають клятву Гіппократа, перш ніж розрізати нас, включаючи знамените «спочатку не нашкодь». Непогана ідея для тих, хто застосовує принципи Chaos Monkey до ланцюгів постачання, що передбачає випадкове вимкнення десь реальної машини. Це нетривіально, і, наскільки я знаю, ще ніде не відбувається.

  • Перший принцип, процитований вище, говорить про те, щоб зосередитися на результатах системи, а не на внутрішніх атрибутах. Перевірте, чи система працює, а не намагайтеся зрозуміти, чому вона працює.
  • Другий принцип говорить про те, щоб ламати різні речі реалістичними способами. Немає потреби імітувати глобальну термоядерну війну, просто вимкніть вимикач або втратите наказ і дізнайтеся, яке рішення працює найкраще.
  • Третій принцип говорить, що найкраще місце для навчання – це виробництво. Навчання на практиці краще, ніж навчання шляхом моделювання, тобто цифрові близнюки чудові, але їх може бути недостатньо для формування культури стійкості.
  • Четвертий принцип інституціоналізує принципи мавпи хаосу, оскільки він дозволяє масштабувати процес експериментування, що веде вас до крутішої кривої навчання. Використовуйте наукові дані для гасіння пожеж.
  • Нарешті, мінімізуйте радіус вибуху. Це означає «не зашкодь» і перекладається на певний тип буферизації (інвентаризації, часу виконання, прискореної доставки), щоб захистити клієнтів від відчуття вашого експерименту. Навчіться керувати контрольованими вибухами.

Можна стверджувати, що останні три роки Covid, війна, трудові хвилювання, і економічні потрясіння були однією великою мавпою хаосу для всіх. Урок Netflix полягав у тому, що така криза — це не просто те, що потрібно планувати, а те, що потрібно освоїти як постійний факт життя.

Ідеальний шторм може ніколи не закінчитися, тому, можливо, нам варто навчитися з цим жити.

Джерело: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/