Situace: Růst Slevomatu narazil na limity infrastruktury
Slevomat patří mezi největší e-commerce projekty v ČR. Oproti běžným e-shopům pracuje s výrazně větším množstvím položek a nabídek, což znamená mimořádné nároky na databázi a výkon infrastruktury. Stávající řešení postupně přestávalo stačit:
- Databáze se blížila výkonovému stropu
- Disková kapacita databázových uzlů dosahovala svého limitu
- Zálohování trvalo až 5 hodin
- TTFB dosahovalo 1,35 s
Při dalším růstu by tak hrozilo neúnosné zpomalení systému. Byznys nebyl ohrožen, ale další růst by bez změny nebyl udržitelný.
Podobné limity infrastruktury přitom řeší řada rychle rostoucích e-commerce projektů.
Zadání: Zvýšit výkon a kapacitu bez rizika pro provoz
Původní požadavek zněl jednoduše: „Potřebujeme nové servery.“ Díky naší zkušenosti s virtualizačními clustery jsme ale doporučili řešení, které nepřinese jen krátkodobé navýšení výkonu, ale dlouhodobě lepší výsledky. Cílem bylo:
- zrychlit aplikaci
- navýšit kapacity databáze
- posílit odolnost infrastruktury
„Nešlo jen o výkon serverů. Skutečnou překážkou byla architektura. Proto jsme navrhli infrastrukturu, která odstraní limity a umožní další růst.“
Tomáš Novotný, Solutions Architekt Webglobe
Akce: Nová škálovatelná a vysoce dostupná architektura
Se Slevomatem spolupracujeme prakticky od jeho začátků. Máme detailní znalost jejich infrastruktury i tempa růstu a mezi našimi týmy vznikla silná důvěra. Proto jsme místo pouhé výměny serverů navrhli zásadnější krok.
Vybudovali jsme celý dedikovaný virtualizační cluster určený výhradně pro Slevomat.
Jejich aplikaci jsme rozdělili do samostatných částí (DB, aplikační vrstva, vyhledávání, cache).
Díky tomu se jednotlivé služby už navzájem neblokují a každá může využívat vlastní výpočetní zdroje podle aktuální potřeby. Výsledkem je pružná high-availability infrastruktura, kde výpadek jedné části neznamená výpadek systému.
U projektů velikosti Slevomatu je podobná odolnost klíčová – jejich služby využívají zákazníci po celé ČR a i krátký výpadek by měl okamžitý dopad.
Abychom zajistili plynulý přechod bez rizika výpadku, rozprostřeli jsme migraci do 4 měsíců. Slevomat na nás má non-stop dostupný Slackový kanál, kde jsme každý krok komunikovali v reálném čase.
„Slack s Webglobe adminy je velká výhoda. Stačí napsat a máme okamžitou reakci.”
Jaroslav Hanslík, CTO Slevomat
Výsledek: Měřitelné zlepšení výkonu a odstranění růstových limitů
Nová infrastruktura dnes bez problémů obsluhuje více než 2 miliardy requestů s 8 TB dat měsíčně při průměrné odezvě kolem 0,125 s. Slevomat je připravený na dlouhodobý provoz ve vysoké zátěži.
TTFB webu při prvotním měření kleslo z 1,35 s až na 1,05 s (−22 %)
Nová infrastruktura vytvořila výrazně lepší základ pro rychlou odezvu aplikace.
Operace se zrychlily přibližně o 40 %
Interní i zákaznické procesy jsou plynulejší a systém lépe zvládá špičky.
Zálohování zkrátilo z 5 na 1 h
Provozní zásahy znamenají výrazně menší zásah do běžného provozu.
Databáze má rezervu pro dvojnásobný růst
Slevomat může plánovat další rozvoj bez nutnosti okamžité další investice do infrastruktury.
„Rozdíl jsme viděli okamžitě. TTFB po přesunu webu spadlo z 1,35 na 1,05 sekundy. To nám dává mnohem větší rezervu pro sezónní špičky.“
Jaroslav Hanslík, CTO Slevomat