Be in IT to firma rekrutacyjna, wyspecjalizowana w poszukiwaniu Specjalistów z branży technologii informatycznych. Obecnie, dla naszego klienta, poszukujemy osoby na stanowisko AI Site Reliability Engineer.
AI Site Reliability Engineer (zdalnie)
Zakres obowiązków:
- Długofalowa współpraca z międzynarodową, topową firmą consultingową, świadcząca usługi IT dla dużych i średnich firm z różnorodnych sektorów jak automotive, healthcare, finanse, bankowość czy produkcja.
- Budowa i utrzymanie centralnego operacyjnego “control tower” dla aplikacji i pipeline AI.
- Projektowanie i wdrażanie monitoringu, alertów i dashboardów - sygnały, progi, routing, runbooki.
- Reagowanie na incydenty (incident response): triage, koordynacja, root cause analysis, post‑mortems i działania prewencyjne.
- Standaryzacja telemetrii pipeline - success/failure, latency, throughput, bottlenecks).
- Optymalizacja CI/CD - jakość wydań, testy automatyczne, reliability gates.
- Współpraca z zespołami inżynieryjnymi w celu zmniejszenia liczby powtarzalnych incydentów.
Oczekujemy:
- Minimum 5 lat doświadczenia jako SRE / Production / Platform Engineer.
- Udokumentowanego doświadczenia w środowiskach produkcyjnych.
- Bardzo dobrej znajomości procesów incident management oraz Root Cause Analysis (RCA).
- Umiejętności budowania praktycznego, a nie teoretycznego monitoringu.
- Praktycznego doświadczenia z Azure DevOps (Boards, Repos, pipeline), Kubernetes (troubleshooting, scaling, operacje produkcyjne), Datadog (metrics, logs, dashboardy, alerting) oraz Azure Portal (operacje środowiskowe i konfiguracja).
- Znajomości narzędzi CI/CD w zakresie optymalizacji pipeline, testów oraz quality gates.
- Proaktywnego działania i samodzielności (self-driven) – identyfikowania problemów, ryzyk i usprawnień bez czekania na instrukcje.
- Podejścia "engaged owner mindset" tj. traktowania stabilności systemów jako własnej odpowiedzialności end‑to‑end.
- Gotowości do pracy "hands-on" tl. regularnej pracy w klastrach, pipeline, monitoringu i kodzie.
- Biegłości w wykorzystywaniu narzędzi AI (Copilot, LLM, automatyzacja, analizy, debugowanie) i zrozumienia wpływu AI na budowę oraz utrzymanie systemów (AI-native).
- Komfortu działania w środowisku dynamicznym, nie w pełni dojrzałym procesowo.
- Mile widziane: doświadczenie z AI / LLM pipeline i ich observability, budowa multi‑app monitoring platforms, praca w skalowanych środowiskach Kubernetes (AKS lub podobne) oraz znajomość Grafany.
- Znajomość języka angielskiego na poziomie B2 lub C1 – umożliwiająca swobodną komunikację w międzynarodowym środowisku.
Mile widziana dostępność ASAP; akceptowalny jest maksymalnie miesięczny okres wypowiedzenia ze skutkiem na koniec miesiąca.
Oferujemy:
- Długofalowa współpraca z wynagrodzeniem w przedziale 130-160 PLN netto/godz. + VAT.
- Wsparcie przy zakładaniu i prowadzeniu działalności gospodarczej, dla osób bez takiego doświadczenia.
- Sprawny proces rekrutacyjny - dwie rozmowy techniczne z managerami, online (każda maksymalnie po godzinie).
- Współpraca w pełni zdalna.
- Benefity - prywatna opieka medyczna, karta Multisport.
- Nowoczesny sprzęt zapewniany przez firmę, wraz z softem i konfiguracją.