HTML encode ay ang proseso ng pag-convert ng mga character na may mga espesyal na kahulugan sa HTML (tulad ng <, >, ", &, atbp.) sa kanilang katumbas na HTML entity. Tinitiyak nito na ang mga character na ito ay ipinapakita nang tama sa isang web page sa halip na bigyang-kahulugan bilang mga HTML tag o attribute. Halimbawa:
< nagiging <
> nagiging >
& nagiging &
Mahalaga ang pag-encode ng HTML upang matiyak na ang tekstong naglalaman ng mga espesyal na character ay ipinapakita nang tama at secure sa browser.
Upang iwasan ang mga pag-atake ng HTML injection, gaya ng Cross-Site Scripting (XSS), kung saan maaaring sirain ng hindi pinagkakatiwalaang content ang istraktura ng page o magpakilala ng mga nakakahamak na script.
Upang matiyak na ang mga espesyal na character (tulad ng <, >, &, ", atbp.) ay nai-render bilang text at hindi binibigyang-kahulugan bilang HTML o JavaScript ng mga browser.
Upang ligtas na magpakita ng nilalamang binuo ng user sa isang web application nang hindi kinokompromiso ang seguridad o layout.
Ang HTML encoding ay karaniwang ginagawa sa pamamagitan ng mga built-in na function sa maraming programming language:
Sa JavaScript, maaari kang gumamit ng mga aklatan tulad ng DOMParser o lumikha ng iyong sariling encoding function.
Sa Python, ang mga aklatan tulad ng html ay nagbibigay ng mga function gaya ng html.escape().
Maraming web framework at server-side na wika ang nag-aalok ng mga built-in na function upang awtomatikong mag-encode ng nilalaman.
Ang proseso sa pangkalahatan ay nagsasangkot ng pagpapalit ng mga espesyal na character sa kanilang mga katumbas na HTML entity.
Kapag ipinapakita ang input ng user (tulad ng data ng form, komento, o mensahe) sa isang webpage upang pigilan itong ma-interpret bilang HTML o JavaScript.
Kapag nag-embed ng mga espesyal na character sa HTML (tulad ng mga quote o angle bracket) upang matiyak na ipinapakita ang mga ito nang tama at hindi itinuturing bilang code.
Kapag nagtatrabaho sa dynamic na nilalaman na maaaring naglalaman ng mga espesyal na character na maaaring masira ang pag-format ng HTML o magpasok ng mga panganib sa seguridad.
Kapag nagpapasa ng data sa mga web page at tinitiyak na ligtas na nai-render ang nilalaman nang walang panghihimasok mula sa interpretasyon ng HTML ng browser.