CSV Escape/Unescape – це процес безпечного форматування або відновлення тексту для його коректного збереження або зчитування з CSV (дані, розділені комами) файлу. Ескейпінг означає зміну символів, які можуть порушити формат CSV (наприклад, коми, лапки або символи нового рядка), тоді як скасування екранування означає їх повернення до початкового вигляду під час читання даних.
Щоб запобігти помилкам, коли дані містять коми, подвійні лапки або розриви рядків, які є особливими в CSV.
Щоб забезпечити сумісність з інструментами для роботи з електронними таблицями (наприклад, Excel) або парсерами, що відповідають стандартам CSV.
Щоб зберегти цілісність даних, наприклад, забезпечити, щоб "Doe, John" оброблялося як одне поле, а не два.
Ескейпінг зазвичай включає:
Узяття поля в подвійні лапки, якщо воно містить спеціальні символи.
Подвоєння будь-яких внутрішніх подвійних лапок (" → "") у цих полях.
Скасування екранування виконує зворотний процес під час читання: видалення зовнішніх лапок та заміна подвійних лапок одинарними.
Інструменти та бібліотеки CSV у більшості мов програмування (наприклад, Python, JavaScript, Excel) обробляють це автоматично, але важливо розуміти, як і чому це відбувається.
Під час ручного запису CSV-файлів або програмно, особливо якщо дані містять коми, лапки або розриви рядків.
Під час розбору необроблених даних CSV та потреби вилучення точних значень полів.
Під час забезпечення міжсистемної сумісності між різними програмами або платформами, які по-різному обробляють CSV.