Runbook incydentowy
Runbook obejmuje najczęstsze incydenty produkcyjne:
- awaria API
- błędy webhooka
- drift stanów magazynowych
1) Szybka diagnoza
- Otwórz
WooCommerce > HFT71 Logi. - Sprawdź ostatnie akcje:
send_order,get_status,webhook,stock_sync. - Zidentyfikuj dominujące kody HTTP:
0/timeout -> problem sieciowy401/403-> autoryzacja404-> zły endpoint/base URL429-> limit requestów5xx-> awaria po stronie API- Zweryfikuj ustawienia i działanie WP-Cron.
2) Scenariusz A - awaria API
Objawy
- Nieudane
send_order/get_status, dużo timeoutów lub5xx. - Zamówienia
processingbez_hft71_order_id.
Mitigacja
- Potwierdź awarię po stronie dostawcy.
- Poinformuj operacje, że handoff do fulfillment jest opóźniony.
- Nie wykonuj masowych ręcznych retry bez kontroli duplikatów.
Odtworzenie
- Potwierdź powrót API (logowanie + testowy endpoint).
- Wylistuj dotknięte zamówienia z okna awarii.
- Wyślij ponownie partiami.
- Potwierdź zapis
_hft71_order_idi brak nowych błędów.
3) Scenariusz B - błędy webhooka
Objawy
- Brak aktualizacji statusów z webhooka.
- Brak wpisów
webhooklub odrzucenia requestów.
Mitigacja
- Zweryfikuj URL:
/wp-json/hft71/v1/order-status. - Zweryfikuj sekret webhooka (header
X-HFT71-Webhook-Secretlub body). - Utrzymuj aktywny polling jako fallback.
Odtworzenie
- Wyślij testowy webhook.
- Sprawdź odpowiedź HTTP 200.
- Potwierdź zmianę statusu zamówienia i wpis w logach.
4) Scenariusz C - drift stocku
Objawy
- Rozjazd ilości między WooCommerce i HFT71.
Mitigacja
- Sprawdź
hft71_stock_sync_enabled. - Zweryfikuj poprawność SKU.
- Uruchom ręczną synchronizację stocku.
Odtworzenie
- Porównaj próbkę SKU (top produkty + losowe).
- Potwierdź aktualizację
_hft71_stock_available. - Zweryfikuj stabilność po pełnym cyklu synchronizacji.
5) Po incydencie
- [ ] Uzupełniony timeline i root cause.
- [ ] Zadania zapobiegawcze dodane do backlogu.
- [ ] Runbook zaktualizowany o wnioski.