HTML-TSV-muunnin on työkalu, joka poimii tietoja HTML-sisällöstä – yleensä HTML-taulukoista – ja muuntaa ne TSV (Tab-Separated Values)-muotoon. TSV on pelkkää tekstiä sisältävä muoto, jossa jokainen kenttä on erotettu toisistaan sarkaimella (\t) ja jokainen rivi päättyy rivinvaihtoon. Sitä käytetään laajalti strukturoidun datan tuontiin/vientiin järjestelmien, kuten tietokantojen, laskentataulukoiden tai tekstieditorien, välillä.
HTML-TSV-muunninta käytettäisiin seuraaviin tarkoituksiin:
Järjesteltyjen tietojen poimimiseen verkkosivustoilta tai HTML-dokumenteista (erityisesti taulukoista).
Verkkopohjaisten taulukkomuotoisten tietojen muuntamiseen muotoon, joka voidaan avata Excelissä, Google Sheetsissä tai tilasto-ohjelmistossa.
Tietojen puhdistamiseen ja yksinkertaistamiseen poistamalla HTML-tunnisteet ja säilyttämällä vain tekstisisältö jäsennellyssä asettelussa.
Tietojen analysoinnin, jakamisen tai tuonnin helpottamiseen tietokantoihin tai komentosarjoihin, jotka käyttävät TSV-syötettä.
HTML-TSV-muuntimen käyttö:
Kopioi HTML-sisältö, erityisesti jos se sisältää yhden tai useamman