DEVOPS · MLOPS

Tomasz Kobus

DevOps & MLOps Engineer

📍 Częstochowa, Polska · Open to remote

Na styku infrastruktury i AI · 20+ serwisów 24/7 · GPU tooling · Open Source

Buduję i utrzymuję skonteneryzowaną infrastrukturę — Docker, Linux, Cloudflare, GPU/CUDA stack dla ML. Piszę tooling w Rust i Pythonie. Twórca CellForge — open-source alternatywy dla JupyterLab.

Infrastruktura × AI.

Inżynier na styku DevOps i MLOps. Prowadzę własną infrastrukturę produkcyjną — 20+ kontenerów, GPU passthrough, zero-trust networking. Piszę własne tooling: CellForge (Rust + React notebook IDE), pipeline do ewaluacji LLM-ów, custom monitoring. Kontrybuuję do open source (InkWatchy — firmware embedded) i uczę programowania w Gigantach Programowania.

Inż. Sieci Komputerowe · Mgr Sztuczna Inteligencja i Data Science (w trakcie) — Politechnika Częstochowska. Praca magisterska: porównanie wybranych dużych modeli językowych pod kątem generowania odpowiedzi tekstowych i kodu.

Co zbudowałem

Self-hosted infrastruktura serwerowa

99.92% uptime

Środowisko produkcyjne 24/7 — 30+ skonteneryzowanych serwisów na Xeon E5-2680v4 + Quadro RTX 4000 + 2 TB storage. Full-stack self-hosted: chmura plików, automatyzacja domu, ML/GPU tooling, serwery gier dla znajomych. Ekwiwalent ~$500+/mc w AWS.

Architektura Docker Compose z YAML anchors, izolowanymi sieciami (internal/external) i health checkami per-serwis
Zero-trust expose przez Cloudflare Tunnel (2 tunele, subdomenowy routing) — brak otwartych portów publicznych
ML/GPU: CellForge (własny notebook IDE) + PyTorch + CUDA 12.6 z NVIDIA Container Toolkit
Self-hosted cloud: Nextcloud (plik/kalendarz/kontakty), Home Assistant, Jellyfin + *arr stack, aplikacja Next.js z Postgres
Gaming: Pelican panel orkiestrujący 6× Minecraft + Terraria + Core Keeper dla znajomych
Monitoring: Uptime Kuma (99.92% za ostatnie 6 mc) + Glances + Watchtower auto-updates, custom Flask power-monitor (RAPL + nvidia-smi)
Cloudflare Workers dla custom error pages, SSH hardening (fail2ban + key-only auth), btrfs snapshoty jako safety net
Docker Docker Compose Ubuntu Server Cloudflare Tunnels Cloudflare Workers NVIDIA Container Toolkit Pelican fail2ban btrfs

CellForge — Notebook IDE w Rust

Alternatywa dla JupyterLab zbudowana od zera w Rust + React — natywna implementacja Jupyter messaging protocol, real-time collaboration, PDF export przez Typst. Działa produkcyjnie na mojej infrastrukturze jako środowisko ML.

Backend: 7 crates Rust (axum + tokio + zeromq-rs) z rozdziałem odpowiedzialności — 186+ testów jednostkowych
Real-time collaboration przez Yjs CRDT — shared editing cel, remote cursors, per-notebook kernel sharing
PDF export przez Typst (~50× szybciej niż LaTeX), single binary, template-based
Reactive execution przez AST dependency analyzer — auto-rerun downstream cells przy zmianie zmiennej
Hub mode: multi-user SQLite + JWT auth, resource limits, plugin system z zipami
CI/CD: GitHub Actions build + push na GHCR, pre-built image z Python 3.12 + PyTorch + CUDA — deployment przez docker compose pull
Rust React 19 TypeScript Monaco Yjs CRDT ZeroMQ Typst GitHub Actions CUDA Open Source

InkWatchy — System internacjonalizacji

Zaprojektowałem i zaimplementowałem kompletny system tłumaczeń wielojęzycznych dla InkWatchy — open source'owego firmware'u zegarka e-ink. Obsługuje EN, PL, DE, SK z compile-time definicjami preprocesora — zero narzutu na embedded hardware.

Framework lokalizacji ze 116+ walidowanymi kluczami tłumaczeń
Walidacja compile-time zapewniająca kompletność tłumaczeń
Format 12h/24h i jednostki Celsius/Fahrenheit
Reużywalny szablon języka dla kontrybutorów
Przepisany moduł kalendarza — import wielu URL, zdarzenia cykliczne, poprawki stref czasowych
Przeprojektowany system QuickAlarm z dynamiczną konfiguracją
C/C++ ESP32 Systemy Embedded Rust Open Source

LLM Benchmark Pipeline — Praca Magisterska

GitHub → Obrona Q4 2026

Wielowymiarowa ewaluacja 10 modeli LLM (6 komercyjnych + 4 lokalne) na 80 zadaniach — 800 wywołań, 4 metryki, własny pipeline w Pythonie z GPU-accelerated evaluation.

4 metryki: Pass@1 (unit tests), CodeBLEU (AST + dataflow), BERTScore (RoBERTa-large), G-Eval w skali 1-100 (LLM-as-a-Judge)
10 modeli: Claude Opus 4.6, GPT-5.2, Gemini 3.1 Pro, Grok 4, DeepSeek V3.2, KIMI K2.5 (API) + Qwen2.5 14B, Gemma3 12B, Mistral-Nemo 12B, Llama3.2 3B (lokalne przez Ollama)
Kluczowy wynik: modele lokalne 12-14B konkurują z komercyjnymi na zadaniach programistycznych (Gemma3 12B = 94% Pass@1, przebija 4/6 modeli API)
Odkrycie metodologiczne: efekt sufitowy w G-Eval skali 1-5 (5/6 modeli = 4,99-5,00), rozwiązany przez powtórną ewaluację w skali 1-100
Sandboxowane wykonywanie kodu z timeout protection · Master pipeline Bash z conda env management i auto-detekcją VRAM
GPU-accelerated ewaluacja (CUDA/PyTorch, BERTScore na RoBERTa-large) z automatycznym fallbackiem na CPU
Python Bash Ollama OpenRouter API PyTorch CUDA HuggingFace conda tree-sitter
Linux (Debian/Arch) Docker & Compose Cloudflare Tunnels NVIDIA / CUDA GitHub Actions SSH Hardening Rust Python PyTorch TypeScript React / Next.js Bash C++ Git
JĘZYKI
Polski (ojczysty) · Angielski C1 (certyfikat Cambridge)

Historia pracy

04.2025 – Obecnie
Instruktor programowania
Giganci Programowania · Częstochowa
Prowadzenie zajęć programowania dla dzieci (9–12 lat) — Scratch, Python, Minecraft Education, Lua
Zarządzanie flotą stanowisk edukacyjnych (konwencja S0-S19, podział trener/student) — setup, patching, Veyon classroom monitoring
Deployment i utrzymanie edukacyjnych serwerów Minecraft na self-hosted infrastrukturze
Live incident response podczas zajęć — szybka diagnostyka issues sprzętowych i sieciowych
Politechnika Częstochowska
Mgr — Sztuczna Inteligencja i Data Science 2025 – Obecnie

Widzenie Komputerowe · Systemy Rekomendacyjne · Inteligentne Systemy Transakcyjne · NLP · Deep Learning · Architektury Obliczeniowe dla AI

Praca magisterska: Porównanie dużych modeli językowych (LLM) na zadaniach tekstowych i kodowych · Obrona Q4 2026

Inż. — Informatyka, Sieci Komputerowe 2020 – 2025

Bezpieczeństwo Systemów Komputerowych · Zarządzanie Infrastrukturą Datacenter · Sieci Bezprzewodowe · Administracja Sieciowymi SO · Systemy Wbudowane · Języki Skryptowe

Cambridge English C1 · 2022

Porozmawiajmy.

Otwarty na role DevOps, MLOps i Infrastructure. Najlepiej pisz na maila.

📍 Częstochowa, Polska