Содержание
Валидация является одним из самых важных аспектов хорошего веб-дизайна. Давайте рассмотрим, что это такое и как проверить HTML код на валидность. В качестве примера возьмем самую распространенную систему управления контентом (CMS) — WordPress. После чего мы поделимся перечнем ошибок, с которыми столкнулись на практике и, самое главное, предложим свои, проверенные, методы по их устранению.
Зачем необходима проверка на валидность сайта
Проще говоря, проверка веб-страницы позволит определить, соответствует ли она стандартам, разработанным Консорциумом Всемирной паутины (W3C). Обычно это делается путем проверки отдельных страниц на валидность с помощью онлайн-сервиса проверки от W3C.
Подобно правилам грамматики на разных языках, есть также правила в программировании. Проверка позволяет увидеть, соответствует ли страница этим правилам, а в случае наличия ошибок и предупреждений будут предоставлены рекомендации по их устранению. Подробнее о необходимости такой проверки рассмотрим ниже.
На что влияет валидность сайта
Вы когда-нибудь задумывались о том, как браузеры “читают” веб-страницу? У них есть “двигатели” для анализа кода и преобразования его в визуальный вид для людей. К сожалению, у каждого браузера есть собственный механизм обработки кода, и это может привести к отображению ваших страниц по-разному.
Некорректная веб-страница может быть прочитана браузерами по-разному. Это приведет к тому, что ваши посетители, возможно, даже не смогут правильно увидеть контент страницы в своих браузерах. Валидация в дальнейшем позволит исправить почти все основные различия и делает вашу веб-страницу доступной для чтения почти всеми веб-браузерами (чаще всего исключением становится Internet Explorer старых версий). Отсюда и появился термин “кроссбраузерная верстка” — т.е. верстка, которая одинаково хороша (совместима) для всех популярных браузеров.
А как же это повлияет на SEO? Важно понимать, что роботы поисковых систем любят семантические веб-страницы. Семантическая верстка, согласно данным Википедии, – это подход к созданию веб-страниц на языке HTML, основанный на использовании HTML тегов в соответствии с их семантикой (предназначением). Кроме того, структурная семантическая веб-страница позволяет поисковым роботам более точно определять значимость, как отдельных элементов веб-страницы, так и всего текста в целом. По заверению Google, валидный код никак не влияет на ранжирование страниц. Но при этом наличие ошибок в коде способно негативно повлиять на сканирование микроразметки и адаптированностью под мобильные устройства.
Материал по теме: https://www.seonews.ru/events/google-validnost-html-ne-vliyaet-na-ranzhirovanie/
Так что, если в SEO-аудите вы встретите рекомендации по устранению ошибок, выявленных в процессе валидации, то лучше их исправить, а как это сделать мы вам расскажем.
Инструменты проверки для вашего сайта
Понимая необходимость отсутствия ошибок валидации на страницах сайта, давайте рассмотрим, как осуществить поиск данных ошибок.
Существует множество бесплатных сервисов для проверки сайта, такие как Markup Validation Service W3C, Web Page Analyzer, Browsershots и другие.
Служба проверки HTML разметки W3C, вероятно, является самым простым и популярным инструментом для проверки валидности веб-страницы. Используя этот инструмент, вы можете обнаружить ошибки валидации, начиная от отсутствующих атрибутов ALT для ваших IMG-тегов и заканчивая размещением элементов блок-уровня внутри встроенных элементов (например, <p> внутри <span>).
Вы можете оценить HTML код, указав адрес своей веб-страницы, загрузив файл HTML или вставив HTML код напрямую.
Сервис проверит указанные вами данные на ошибки и сформирует отчет с их перечнем и рекомендациями по исправлению.
Условно ошибки и предупреждения можно разделить на два основных типа: шаблонные (связанные с выбранной темой и установленными плагинами) и ошибки, допущенные при оформлении уникального контента.
Проверяя веб-страницу в первый раз, не пугайтесь возможному большому количеству ошибок! Как правило, большинство из них многократно повторяются на анализируемой странице. А это значит, что если убрать ошибку в одном месте шаблона или страницы, то она исчезнет и во всех однотипных.
Откуда берутся ошибки
Огромное количество ошибок связано с используемой темой сайта, а также установленными плагинами. Большинство из нас устанавливает бесплатную тему и плагины, не задумываясь, что в них скрыто. Во многих темах при более глубоком изучении приходится сталкиваться с типичными ошибками.
Как исправить ошибки, и улучшить валидность сайта
Исправить выявленные ошибки можно двумя способами: обратиться к специалистам, заплатив N-ную сумму денег, либо исправить их самостоятельно. Рассмотрим последний вариант на реальных примерах и устраним все неточности, следуя подробным инструкциям.
Важно, резервное копирование!!!
Перед осуществлением каких-либо изменений в исходном коде сайта необходимо произвести резервное копирование файлов сайта и базы данных. А нужно это для того, чтобы в случае, если после проведенных манипуляций нормальная работа сайта будет нарушена, восстановить его.
Редактирование файлов шаблона темы.
Редактирование исходников можно осуществлять несколькими способами: редактирование файлов по FTP, через файловый менеджер хостинга либо через административную панель WordPress. Мы рекомендуем использовать последний вариант, т.к. он является самым быстрым и простым.
- Warning: The type attribute is unnecessary for JavaScript resources.
Предупреждение. Атрибут “type” элемента <script> не является обязательным для JavaScript ресурсов.
Warning: The type attribute for the style element is not needed and should be omitted.
Предупреждение. Атрибут “type” для элемента <style> не нужен и его следует опустить.
Для устранения данных двух предупреждений необходимо удалить атрибут ENGINE=”text/javascript” во всех тегах <script>, а также type=”text/css” во всех тегах <style>. В помощь нам приходит простая функция PHP preg_replace в паре с чудесной возможностью фильтрации данных в WordPress. Код выглядит так:
# удаляем атрибут type="text/javascript" во всех тегах <script>, а также type=”text/css” во всех тегах <style> add_filter('style_loader_tag', 'remove_type_attr'); add_filter('script_loader_tag', 'remove_type_attr'); function remove_type_attr($src) { return preg_replace( "/type=['\"]text\/(javascript|css)['\"]/", '', $src ); }
Вставить данный код необходимо в файл functions.php используемой темы. Для этого авторизуемся в административной панели WordPress, выбираем пункт меню “Внешний вид” -> “Редактор” и справа в списке файлов выбираем интересующий нас файл. Код вставляем в самом конце файла. Нажимаем кнопку “Обновить файл”.
Дополнительно удалим данный атрибут в некоторых файлах вашей WordPress-темы.
В меню “Внешний вид” -> “Редактор” выбираем интересующие нас файлы – index.php, header.php, footer.php. Поиск атрибута будем осуществлять с помощью горячих кнопок поиска Ctrl+F, введя в поисковой панели text/javascript. Выявив такую запись заменяем <script type=”text/javascript”> на <script>, т.е. удаляем непонравившийся атрибут type=”text/javascript” и не забываем нажать кнопку “Обновить файл”.
Проверяем результат.
- Error: The center element is obsolete. Use CSS instead.
Ошибка. Тег <center> устарел. Используйте соответствующие CSS стили.
HTML 5 активно взаимодействует с CSS (язык описания внешнего вида документа, написанного с использованием HTML), поэтому запрет на многие теги и атрибуты, начатый в HTML 4 в пользу стилей, только усилился. Такого рода теги и атрибуты уже не поддерживаются некоторыми браузерами и должны исключаться из кода. Одним из таких тегов является тег <center>, а также атрибут “frameborder” тега <iframe>. При решении данных ошибок нам необходимо будет немного “поколдовать” над нашей Базой данных сайта.
Для этого необходимо зайти в панель управления вашего хостинга, перейти по ссылке в phpMyAdmin и авторизоваться.
Первым делом экспортируем всю базу данных в качестве резервной копии! Для этого нажимаем кнопку “Экспорт” в панели веб-интерфейса для администрирования. Далее выбираем закладку “SQL” для осуществления SQL запросов к базе данных, в нашем случае поиск и замена устаревших тегов и атрибутов. Прописываем следующие запросы:
#поиск и замена открывающегося тега <center> на контейнер <div> UPDATE wp_posts SET post_content = REPLACE (post_content, '<center>', '<div class="ag_center">'); #поиск и замена закрывающегося тега <center> на контейнер <div> UPDATE wp_posts SET post_content = REPLACE (post_content, '</center>', '</div>'); #поиск и замена атрибута “frameborder” на стилевой класс “ag_border_zero” UPDATE wp_posts SET post_content = REPLACE (post_content, 'frameborder="0"', 'class="ag_border_zero"');
Рассмотрим более подробно выше представленные SQL запросы.
Первой строчкой заменяем устаревший тег на контейнер <div> и сразу же задаем класс “ag_center”. Данный стилевой класс позволит нам выровнять содержимое контейнера по центру. Для этого заходим в админ панель WordPress, выбираем пункт меню “Внешний вид” -> “Редактор” -> файл style.css нашей темы. В конец файла добавляем следующие строки кода:
.ag_center {text-align:center;} .ag_border_zero {border=0;}
Второй строчкой SQL запроса заменяем закрывающийся тег </center> на закрывающийся </div>. А третьей — производим замену атрибут frameborder=”0” на класс “ag_border_zero” элемента <iframe>.
SQL запросы можно оптимизировать, сведя в один, однако проще для понимания и наглядности разбить задачу на несколько запросов, как мы это и сделали. Вам, конечно, могут попасться другие устаревшие теги, которые необходимо будет заменить на универсальный тег <div> и перенести прямое его назначение в стилевой файл.
Перечень тегов, которые более не поддерживаются и должны исключаться из кода:
<applet>, <acronym>, <bgsound>, <dir>, <frame>, <frameset>, <noframe>, <isindex>, <listing>, <xmp>, <nextid>, <noembed>, <plaintext>, <rb>, <strike>, <basefont>, <big>, <blink>, <center>, <font>, <marquee>, <multicol>, <nobr>, <spacer>, <tt>, <u>.
Проверяем результат.
- Error: The width attribute on the th element is obsolete. Use CSS instead.
Ошибка. Атрибут “width” элемента <th> устарел. Используйте соответствующие CSS стили.
Аналогично предыдущей ошибке, атрибут “width” элемента <th> также является устаревшим. Исправить данную ошибку можно двумя способами — заменить width=»10%» на style=»width:10%;». Либо, чтобы не описывать каждый раз стиль внутри тега, можно выделить стиль во внешнюю таблицу стилей. Т.е. в элемент <th> добавляем class=»width_ten_percent», а в файл style.css нашей темы .width_ten_percent {width:10%;}. Какой способ проще, выбирать вам!
В случае если данная ошибка несет массовый характер в статьях вашего проекта, воспользуемся поиском и заменой атрибута “width” в панели phpMyAdmin следующим SQL запросом:
#поиск и замена атрибута "width" на "style="width:10%;"" UPDATE wp_posts SET post_content = REPLACE (post_content, 'width=”10%”', 'style="width:10%;"'); Либо: #поиск и замена атрибута "width" на стилевой класс "width_ten_percent" UPDATE wp_posts SET post_content = REPLACE (post_content, 'width=”10%”', 'class=”width_ten_percent”');
После чего необходимо добавить стилевой класс width_ten_percent в файле style.css:
.width_ten_percent {width:10%;}
Следует отметить, что при массовой замене устаревших атрибутов на стилевые классы в панеле phpMyAdmin, при наличии уже прописанного класса у элемента (например, <img class=»width_twenty_percent» class=»width_ten_percent» />), может возникнуть другая ошибка — дублирование атрибута “class”. Подобная ситуация обстоит и с атрибутом “style” (например, <img style=»width: 300px» style=»height: 200px»>). Поэтому, нужно быть уверенным в отсутствии ранее указанного другого атрибута “class” / “style”, либо отказаться от редактирования БД SQL запросами в пользу ручной проверки и редактирования каждой отдельной статьи в редакторе админ панели WordPress.
Для примера, рассмотрим добавление дополнительного класса / свойства атрибута “style”, придерживаясь стилевых правил. Добавим дополнительный класс width_ten_percent к уже имеющемуся color_red (class=»color_red»), и получаем: class=»color_red width_ten_percent» (перечисляем имена классов через пробел). Добавим ширину в 10% к уже имеющемуся style=»color: red;», в итоге у нас должно получиться так: style=»color: red; width: 10%;» (стилевые свойства разделяются между собой точкой с запятой и пробелом).
Также хотелось бы отметить частое ошибочное использование атрибута “width” для элемента <tr>, атрибута “height” для элемента <td>.
Периодически проверяйте новый контент на наличие данных ошибок, и в случае необходимости повторите процедуру исправления.
Устаревшие атрибуты | Элемент |
---|---|
charset, coords, shape, methods, name, rev, urn | <a> |
nohref | <area> |
alink, bgcolor, link, marginbottom, marginheight, marginleft, marginright, margintop, marginwidth, text, vlink | <body> |
clear | <br> |
name | <embed> |
profile | <head> |
version | <html> |
longdesc | <iframe> |
longdesc, lowsrc, name | <img> |
usemap | <input> |
charset, methods, rev, target, urn | <link> |
scheme | <meta> |
name | <option> |
archive, classid, code, codebase, codetype, declare, standby | <object> |
type, valuetype | <param> |
event, for, language | <script> |
datapagesize | <table> |
abbr, axis | <td> и <th> |
Проверяем результат.
- Error: Bad value 300px for attribute width on element img: Expected a digit but saw px instead.
Ошибка. Неприемлемое значение “300px” для ширины атрибута в элементе <img>: Ожидалась цифра, но вместо этого прочитал “px”.
Атрибуты элементов являются важной частью HTML разметки. Некоторые атрибуты элементов могут принимать практически любое значение, другие могут принимать только значения определенного типа, а третьи — принимать значение только из заранее определенного набора.
В контексте <img width=»300px» /> атрибутом “width” допускается принимать любое целое положительное число. Необходимо установить допустимое значение для правильной разметки, а именно 285, без указания единицы измерения (px).
Выявленные ошибки могут находиться не только в записях, настройках WordPress темы, но и в содержимом HTML кода виджетов сайдбара. В таких случаях для устранения ошибки заходим в меню “Внешний вид” -> “Виджеты” -> Сайдбар слева (справа/подвал) и в настройках виджета находим ошибочно указанный атрибут “width” удалив единицу измерения (px).
Дополнительно встречается ошибочное указание параметра атрибута “height” элемента <img>.
Проверяем результат!
- Error: Dublicate ID id_name.
Использование имени стилевого идентификатора (id=“имя”) более одного раза на одной странице.
Стилевой идентификатор — уникальное имя элемента, которое используется для изменения его стиля и обращения к нему через скрипты. Идентификатор в коде документа должен быть в единственном экземпляре, т.е. встречаться только один раз.
- Имя класса и идентификатора должны обязательно начинаться с латинского символа (A–Z, a–z).
Имя класса и идентификатор должен обязательно начинаться с латинского символа (A–Z, a–z). Может содержать цифры (0–9), символ дефиса (-) и подчеркивания (_), но не в начале слова. Использование русских букв в именах идентификатора недопустимо.
- Ошибочное использование тега noindex по синтаксису.
Тег noindex используется для исключения контента, который необходимо скрыть от поисковой системы Яндекс. Например, дубли элементов навигации. Однако многие используют его неверно:
<noindex>Текст или код, который нужно исключить из индексации</noindex>
Для того, чтобы сделать код с noindex валидным, рекомендуется использовать следующую конструкцию:
<!––noindex––>Текст или код, который нужно исключить из индексации<!––/noindex––>
- Error: No p element in scope but a p end tag seen.
Отсутствует открывающий или закрывающий тег.
В синтаксисе тегов обычно используются парные теги для обозначения начала и конца элемента. Закрывающий тег похож на открывающий, но содержит слэш (/) внутри угловых скобок и указывается сразу за открывающейся скобкой. Если вы открыли тег в HTML документе, его необходимо закрыть в соответствующем месте. В противном случае, это может вызвать проблемы с корректным отображением элемента в браузере.
- Error: Element p not allowed as child of element span in this context. (Suppressing further errors from this subtree.)
Блочные элементы внутри строчных.
Согласно спецификации блочный элемент запрещено вставлять внутрь строчного. Например, <span><p>Lorem ipsum…</p></span> не пройдёт валидацию, правильно вложить теги наоборот — <p><span>Lorem ipsum…</span></p>.
Наиболее часто используемыми блочными элементами являются:
<address>, <article>, <aside>, <blockquote>, <dd>, <div>, <dl>, <dt>, <details>, <fieldset>, <figcaption>, <figure>, <footer>, <form>, <h1>-<h6>, <header>, <hr>, <iframe>, <li>, <legend>, <nav>, <noscript>, <ol>, <output>, <optgroup>, <option>, <p>, <pre>, <section>, <summary>, <table>, <ul>
Встроенные (строчные) элементы:
<a>, <area>, <b>, <bdo>, <bdi>, <cite>, <code>, <dfn>, <del>, <em>, <i>, <img>, <ins>, <kbd>, <label>, <map>, <mark>, <s>, <samp>, <small>, <span>, <strong>, <sub>, <sup>, <time>, <q>, <ruby>, <u>, <var>
- Error: An img element must have an alt attribute, except under certain conditions. For details, consult guidance on providing text alternatives for images.
Отсутствует атрибут “alt” у изображения.
Каждое изображение (даже если оно служит для дизайнерских целей) в документе HTML должно иметь атрибут “alt” с описанием содержания картинки. Данный атрибут индексируется поисковыми роботами и используется ими для определения содержимого обнаруженных картинок. А это, в свою очередь, важно как для улучшения релевантности веб-страниц, так и для привлечения на сайт дополнительного трафика из «поиска по картинкам».
Памятка для контент-менеджеров
Для наших контент-менеджеров мы подготовили памятку о том, как правильно оформить веб-страницу, используя валидный код. Делимся ею и с вами, пользуйтесь на здоровье:
Завершение
Результатом кропотливой работы над ошибками мы должны увидеть следующее: Проверка документа завершена. Каких-либо ошибок и предупреждений не выявлено (“Document checking completed. No errors or warnings to show.”).
Что вы думаете о важности валидации? С какими ошибками сталкивались Вы и как их решали? Добавьте к этой статье свои комментарии!
7 комментариев
У меня ошибки в градиенте. Пишет
CSS: background: The first argument to the linear-gradient function should be to top, not top.
Код
background:linear-gradient(left top,#0f2d4d,#2880c3);
Не подскажете, на что ругается?
Здравствуйте, Milka.
Ответ на ваш вопрос кроется в синтаксисе написания линейного градиента, а именно: отсутствует частичка to. Правильный код, в вашем случае, должен выглядеть следующим образом:
background: linear-gradient(to left top,#0f2d4d,#2880c3);
Здравствуйте. Я сделал вот так — 2 3 4 5 6 # удаляем атрибут ENGINE=»text/javascript» во всех тегах , а также type=”text/css” во всех тегах add_filter(‘style_loader_tag’, ‘remove_type_attr’); add_filter(‘script_loader_tag’, ‘remove_type_attr’); function remove_type_attr($src) { return preg_replace( «/type=[‘\»]text\/(javascript|css)[‘\»]/», », $src ); }
а теперь не могу зайти в админку вордпресс — совсем не появляется страница для входа (с логином и паролем)
Что мне теперь делать?
Лучше всего откатить изменения. Можно с помощью ftp найти нужный файл и удалить внедренный код.
Очень сложно сказать, что вызвало у вас ошибку. Это может быть как конфликт с другим кодом так и неверное его внедрение.
Добрый день!
На сайте проверки CSS ругается на данное :
Value Error : background linear is not a background value : linear,top,rgb(0, 0, 0, 0.1) 0,#000 100%
Как исправить в данном случае? вместо linear?
Спасибо за ответ
Здравствуйте, Мария!
Дело в синтаксисе. Свойство background может использовать css функцию «linear-gradient()», которое в свою очередь имеет значение «to top». Из описания ошибки предположу, что правильный код будет:
background: linear-gradient(to top,rgb(0, 0, 0, 0.1) 0, #000 100%);
Да, тоже также подумала. Спасибо большое за ответ!)