Аўтаматычная ачыстка html кода ад word тэгаў

HTML Cleaner - сэрвіс ачысткі html тэгаў ад «смецця», які застаецца ў дакуменце пасля колішняга запісу ў фармаце html з праграмы MS Word .

Даўным даўно я напісаў падобны убудова, але ён быў зроблены на хуткую руку, цяпер механізм цалкам перапісаны.

Ачыстка кода адбываецца метадам перабору уведзенай радкі з якой фарміруецца новая, якая змяшчае «чысты» код . Убудова выдаляе абсалютна ўсе з тэгаў, у тым ліку і з тэгаў html 5 . У няпарных тэгах прастаўляецца сімвал / (слеш). Выдаляюцца пустыя тэгі, напрыклад канструкцыя <p> </ p> будзе выдаленая, бо яна нічога не ўтрымлівае.

Ёсць два спосабу:

  1. У праграме MS Word абярыце дадзеныя, якія жадаеце ачысціць ад смецця, каб выбраць усе, націсніце Ctrl + A. Устаўце скапіяваны тэкст у поле ніжэй (павінна быць абраная ўкладка «Уставіць дадзеныя MS Office»), націсніце кнопку «Гатова».
  2. Перад тым, як аптымізаваць код выберыце ў Word «Захаваць як ...», далей пакажыце Тып файла «Вэб-старонка з фільтрам», затым адкрыйце захаваны файл у тэкставым рэдактары, скапіруйце код і ўстаўце ў полі ніжэй (павінна быць абраная ўкладка «Уставіць HTML »), націсніце кнопку« Гатова ».

У выніку Вы атрымаеце цнатліва чысты html код.
Ня кранутымі застаюцца наступныя атрыбуты:

'Colspan', 'rowspan', 'href', 'src', 'type', 'value', 'lang', 'tabindex', 'title', 'code', 'alt', 'target', 'dir ',' span ',' action ',' method '

Не забывайце пакідаць свае каментары , Якія дапамогуць мне выправіць памылкі або зрабіць дапрацоўкі.

Прайдзіце навучанне ў мяне па HTML & CSS, JavaScript, PHP, Pascal