Pro řadu obchodů existují spolehlivé kanály s aktuální dostupností, cenou i akcemi. Výhodou bývá právní jistota, vysoká kvalita dat a predikovatelné limity. Naučíte se registrovat klíče, respektovat kvóty, cachovat odpovědi a bezpečně ukládat přístupové údaje tak, aby bot fungoval i během krátkodobých výpadků poskytovatele.
Pokud nezbývá než parsovat HTML, dělejte to šetrně: nastavte zpomalení, rotaci User-Agent, respektujte zákazy a minimalizujte počet požadavků. Implementujte robustní selektory tolerantní k menším úpravám šablon a vytvářejte validace proti chybám. Rozumné logování a záchranné retry mechanismy ochrání spolehlivost a předejdou zbytečným konfliktům.
K tomu patří kontrola stavových kódů, detekce CAPTCHA, limity souběhu a automatická pauza při zvýšené chybovosti. Doplňte heuristiky na odhalení anomálií v ceně, dublování položek a náhlých skoků. Pravidelný audit vzorku záznamů a srovnání s ručním ověřením vám pomůže udržet důvěryhodnou databázi.