Pretvornik HTML v TSV je orodje, ki izvleče podatke iz vsebine HTML – običajno iz tabel HTML – in jih pretvori v obliko TSV (vrednosti, ločene s tabulatorji). TSV je oblika navadnega besedila, kjer je vsako polje ločeno s tabulatorjem (\t) in se vsaka vrstica konča z novo vrstico. Pogosto se uporablja za uvoz/izvoz strukturiranih podatkov med sistemi, kot so baze podatkov, preglednice ali urejevalniki besedil.
Pretvornik HTML v TSV bi uporabili za:
Izvleček strukturiranih podatkov s spletnih mest ali dokumentov HTML (zlasti tabel).
Pretvorbo spletnih tabelaričnih podatkov v obliko, ki jo je mogoče odpreti v Excelu, Google Preglednicah ali statistični programski opremi.
Čiščenje in poenostavitev podatkov z odstranitvijo oznak HTML in ohranitvijo le besedilne vsebine v strukturirani postavitvi.
Olajševanje analize podatkov, deljenja ali uvoza v baze podatkov ali skripte, ki uporabljajo vhod TSV.
Če želite uporabiti pretvornik HTML v TSV:
Kopirajte vsebino HTML, še posebej, če vsebuje enega ali več elementov