Автоматичне очищення html коду від word тегів

HTML Cleaner - сервіс очистки html тегів від «сміття», який залишається в документі після збереження сторінки в форматі html з програми MS Word .

Давним давно я написав подібний плагін, але він був зроблений на швидку руку, зараз механізм повністю переписаний.

Очищення коду відбувається методом перебору введеної рядки з якої формується нова, що містить «чистий» код . Плагін видаляє абсолютно все з тегів, в тому числі і з тегів html 5 . У непарних тегах проставляється символ / (слеш). Видаляються порожні теги, наприклад конструкція <p> </ p> буде видалена, так як вона нічого не містить.

Є два способи:

  1. У програмі MS Word виберіть дані, які хочете очистити від сміття, щоб вибрати все, натисніть Ctrl + A. Вставте скопійований текст в поле нижче (повинна бути обрана вкладка «Вставити дані MS Office»), натисніть кнопку «Готово».
  2. Перед тим, як оптимізувати код виберіть в Word «Зберегти як ...», далі вкажіть Тип файлу «Веб-сторінка з фільтром», потім відкрийте збережений файл в текстовому редакторі, скопіюйте код і вставте в поле нижче (повинна бути обрана вкладка «Вставити HTML »), натисніть кнопку« Готово ».

В результаті Ви отримаєте невинно чистий html код.
Без змін залишаються наступні атрибути:

'Colspan', 'rowspan', 'href', 'src', 'type', 'value', 'lang', 'tabindex', 'title', 'code', 'alt', 'target', 'dir ',' span ',' action ',' method '

Не забувайте залишати свої коментарі , Які допоможуть мені виправити помилки або зробити доопрацювання.

Пройдіть навчання у мене по HTML & CSS, JavaScript, PHP, Pascal