HTML kódování je proces převodu znaků, které mají v HTML speciální význam (jako <, >, ", & atd.), do odpovídajících HTML entit. Tím se zajistí, že se tyto znaky na webové stránce zobrazí správně, a nebudou interpretovány jako HTML tagy nebo atributy. Například:
< se stane <
> se stane >
& se stane &
Kódování HTML je klíčové pro zajištění správného a bezpečného zobrazení textu obsahujícího speciální znaky v prohlížeči.
Aby se zabránilo útokům HTML injection, jako například Cross-Site Scripting (XSS), kde nedůvěryhodný obsah může narušit strukturu stránky nebo zavést škodlivé skripty.
Aby se zajistilo, že speciální znaky (jako <, >, &, " atd.) budou vykresleny jako text a nebudou prohlížeči interpretovány jako HTML nebo JavaScript.
Aby se bezpečně zobrazoval uživatelsky generovaný obsah ve webové aplikaci bez ohrožení zabezpečení nebo rozvržení.
Kódování HTML se obvykle provádí pomocí vestavěných funkcí v mnoha programovacích jazycích:
V JavaScriptu můžete použít knihovny jako DOMParser nebo si vytvořit vlastní kódovací funkci.
V Pythonu knihovny jako html poskytují funkce jako html.escape().
Mnoho webových frameworků a serverových jazyků nabízí vestavěné funkce pro automatické kódování obsahu.
Proces obvykle zahrnuje nahrazení speciálních znaků odpovídajícími entitami HTML.
Při zobrazování uživatelského vstupu (jako jsou data formuláře, komentáře nebo zprávy) na webové stránce, aby se zabránilo jeho interpretaci jako HTML nebo JavaScript.
Při vkládání speciálních znaků do HTML (jako jsou uvozovky nebo lomené závorky), aby se zajistilo jejich správné zobrazení a nebyly považovány za kód.
Při práci s **dynamický obsah**, který může obsahovat speciální znaky, jež by mohly narušit formátování HTML nebo představovat bezpečnostní rizika.
Při přenosu dat webovými stránkami a zajištění bezpečného vykreslování obsahu bez rušení interpretací HTML prohlížečem.