Мета теги используются для описания свойств HTML документа и должны находится в рамках тега HEAD. Если в документе используется тег TITLE, то мета теги рекомендуется вставлять в документ после него.
Мета теги имеют очень широкую функциональную направленность, но многое еще не стандартизировано или находится на стадии разработки.
Мета теги могут идентифицировать авторство HTML документа, его адрес и как часто он обновляется. Поисковые системы используют мета теги для индексации и формирования заголовков HTML документов.
Мета теги могут влиять на режим отображения HTML документов, хотя сами на экран не выводятся.
Далее будут описаны мета теги, принятые большинством поставщиков услуг и программ для сети интернет. Мета теги делятся на две группы: NAME и HTTP-EQUIV.
Мета теги типа NAME содержат текстовую информацию о документе, его авторе и некоторые рекомендации для поисковых машин. Например: Robots, Description, Keywords, Author, Copyright.
Мета теги типа HTTP-EQUIV влияют на формирование заголовка документа и определяют режим его обработки.
Описание мета тегов группы NAME:
* Мета тег Author
* Мета тег Copyright
* Мета тег Description
* Мета тег Document-state
* Мета тег Generator
* Мета тег Keywords
* Мета тeг Resource-type
* Мета тeг Revisit
* Мeтa тeг Robots
* Мeтa тeг Subject
* Мeтa тeг URL
Описание мета тегов группы HTTP-EQUIV:
* Мeтa тeг Content-Language
* Мeтa тeг Content-Script-Type
* Мeтa тeг Content-Style-Type
* Мeтa тeг Content-Type
* Мeтa тeг Expires
* Мeтa тeг PICS-Label
* Мeтa тeг Pragma
* Мeтa тeг Refresh
* Мeтa тeг Set-Cookie
* Мeтa тeг Window-target
Author, Copyright
Эти теги не отражаются броузерами, но обрабатываются некоторыми поисковыми машинами. Как правило, нет необходимости использовать эти теги одновременно. В большинстве случаев достаточно одного информационного тега, позволяющего идентифицировать автора или принадлежность документа.
Тег Author должен содержать имя автора, если сайт принадлежит организации, имеет смысл использовать тег Copyright. Информация обязательно должна заключаться в кавычки, например <META Name= Author content="Смирнов Сергей">.
Дополнительно информационные теги могут содержать атрибут "Lang", указывающий язык, на котором написано значение свойства.
Пример: <META Name= Author Lang="ru" content="Смирнов Сергей">.
Description
Мета тег Description - служит для краткого описания странички.
Он используется поисковыми машинами для индексации и в качестве краткой аннотации при ссылке в ответе на запрос. И именно по содержанию этого тега пользователь поисковой системы будет оценивать, соответствует ваш сайт его ожиданиям или нет.
Если тег Description отсутствует, то в качестве описания поисковые машины используют первую строку текста или отрывок из текста с найденным ключевым словом.
Желательно чтобы длина описания не превосходила 80 символов.
Пример: <META Name="Description" content= ". . .">
Document-state
Мета тег Document-state - предназначен для управления индексацией поисковых роботов. Может иметь два значения:
* Static - Нет необходимости индексировать эту страницу в будущем.
* Dynamic - Индексировать эту страницу регулярно (по умолчанию).
Режим "Static" предназначен для страниц, которые не меняются в принципе. Если содержание вашей страницы периодически меняется, то использовать этот тег необязательно.
Пример: <META Name="Document-state" content ="Dynamic">
Generator
Мета тег Generator - это всего лишь один из "славного" семейства тегов широко используемых генераторами HTML кода в своих целях. Как правило, для владельца сайта эти теги не несут полезной нагрузки.
Keywords
Мета тег Keywords используется поисковыми машинами для оценки релевантности.
Слова, содержащиеся в теге Keywords, рассматриваются поисковыми машинами как рекомендация, но иногда именно этой капли не хватает, чтоб перевесить чашу.
При формировании списка ключевых слов для мета тега Keywords необходимо использовать слова, содержащиеся в тексте документа. Слова, не содержащиеся в тексте, можно использовать в очень небольших количествах, два - три слова. Вставлять их надо в конец списка.
Ключевые слова не должны повторятся в теге Keywords, в крайнем случае, не более двух раз.
В мета теге Keywords имеет смысл использовать не более 10 слов, большее количество релевантности не увеличит.
В Большинстве случаев поисковые машины находят ключевые слова, стоящие во множественном числе (cats), даже если поиск задан в единственном числе (cat). Поэтому рекомендуется в тег Keywords заносить английские существительные во множественном числе.
Роботы некоторых поисковых машин не переходят к новой строке при анализе мета тега Keywords, поэтому не рекомендуется разбивать его на несколько строк.
Пример: <META Name="Keywords" content="пример, meta, тега">
Если документ написан на нескольких языках, можно использовать добавочный атрибут lang для выбора кодировки (смотри описание мета тега Content-Language).
Пример:
<META Name="Keywords" lang="ru" content="пример, meta, тега">
<META Name="Keywords" lang="en-us" content="meta tegs, example">
Но более предпочтительно сделать отдельные страницы, каждая на своем языке с переходами с одной на другую, с помощью тегов <A> и <Link>.
Resource-type
Мета тег Resource-type - описывает состояние данного документа. Если его значение отлично от “Document”, то поисковые системы не будут его индексировать.
Предназначен для использования в крупных проектах, с множеством документов разного типа.
Некоторые возможные значения:
* Build
* Classification
* Creation
* Document - Принимается по умолчанию.
* Formatter
* Host
* Operator
* Random text
* Rating
* Site-languages
* Subject
* Template
* Version
Пример: <META Name="Resource-type" content ="Document">
Revisit
Мета тег Revisit - указывает поисковому роботу, через сколько дней ему нужно вернуться и переиндексировать данный документ.
Пример (приходить раз в неделю): <META Name="Revisit" content="7">
Robots
Мета тег Robots - содержит указания для роботов поисковых машин, собирающих информацию о HTML документах в сети.
Значение свойства Robots может состоять из следующих директив, разделенных запятыми:
* Index - эта страница должна быть индексирована.
* Noindex - эта страница не должна индексироваться.
* Follow - прослеживать гиперссылки на странице.
* Nofollow - не прослеживать гиперссылки на странице.
* All - = index, follow (принято по умолчанию).
* None - = noindex, nofollow.
Тег <META name=Robots content="all"> ничего не меняет в работе робота поисковой машины, так как значение "all" принято по умолчанию.
Но если эта страница создается динамически или очень часто обновляется, то нет смысла ее индексировать, так как информация о странице в поисковой машине и ее истинное содержание будут разными. В этом случае можно рекомендовать поисковой машине не индексировать эту страницу, а только отслеживать на ней гиперссылки, что бы проиндексировать остальную часть сайта <META name=Robots content="noindex,follow">.
При использовании тега, запрещающего отслеживание гиперссылок <META name=Robots content="index,nofollow"> часть сайта может остаться не проиндексированной, так как внутри сайта роботы перемещаются по гиперсылкам. И те страницы, переход на которые заблокирован, не будут индексированы.
Мета тег Robots имеет приоритет над директивами управления, заданными в файле robots.txt.
Subject
Мета тег Subject используется поисковыми машинами для определения тематики документа. Но до тех пор, пока поисковые системы не согласуют классификационные таблицы, использование этого тега не всегда оправдано.
URL
Мета тег URL - служит для исключения из индексации генерируемых страниц и зеркал. Встретив этот тег, робот поисковой машины должен прекратить индексацию текущего документа и перейти по указанной ссылке.
Пример: <META Name="URL" content= "http://www.Main-Site.com">
Content-Language
Мета тег Content-Language - это указание языка документа. Используется поисковыми машинами при индексировании. Хотя большинство из них умеют различать язык по тексту.
Некоторые возможные значения (стандарт [ISO639], [ISO3166]):
de
el
en
en-GB
en-US
en-cockney
es
fr
it
i-navajo
ja
he
nl
ru
pt
x-klingon
zh - Немецкий.
- Греческий.
- Английский.
- Английский - Великобритания.
- Английский, Американская версия.
- Английский, диалект кокни.
- Испанский.
- Французский.
- Итальянский.
- Навахо (Северная Америка).
- Японский.
- Иврит.
- Голландский.
- Русский.
- Португальский.
- Код "x" обозначает экспериментальный код языка.
- Китайский.
Пример: <META HTTP-EQUIV="Content-language" content ="ru">
В спецификации HTML 4.0 есть альтернативная возможность явного указания языка - <html lang="en">
Content-Script-Type
Meta тег Content-Script-Type - Определение языка программирования сценариев.
Некоторые из возможных значений:
text/javascript
text/perlscript
text/tcl
text/vbscript - JavaScript (значение по умолчанию).
- PerlScript.
- TCL.
- VBScript.
Пример: <META HTTP-EQUIV="Content-Script-Type" content="text/javascript">
Если тег Content-Script-Type не используется, то тип языка программирования сценариев, отличный от принятого по умолчанию, должен быть указан непосредственно в каждом теге <SCRIPT>, пример <SCRIPT type="text/javascript">.
В одном документе допускается использование нескольких языков программирования сценариев. Указание языка в теге <SCRIPT> имеет более высокий приоритет, в рамках текущего тега <SCRIPT>.
Content-Style-Type
Мета тег Content-Style-Type - указавает язык таблицы стилей, значение "text/css" принимается по умолчанию, если оно вас устраивает и вы не используете в этом документе теги <Style> и <Span>, то использовать этот тег необязательно.
Пример: <META HTTP-EQUIV="Content-Style-Type" content="text/css">
Броузеры определяют язык таблиц стилей по следующему алгоритму:
* Если в объявлении МЕТА задается язык таблиц стилей, то определяет последнее объявление в потоке символов.
* Если язык таблиц стилей задается в объявлении STILE, язык таблиц стилей определяет последний заголовок в потоке символов.
* Если язык таблиц стилей не задан, по умолчанию используется язык "text/css".
Content-Type
Мета тег Content-Type - Отвечает за указание типа документа и кодировки символов.
Использовать мета тег Content-Type надо только с учетом некоторых нюансов.
Во - первых, кодировка символов текста должна соответствовать кодировке, указанной в теге.
Во - вторых, сервер не должен менять кодировку текста при обработке запроса броузера.
В - третьих, если сервер меняет кодировку текста, он должен скорректировать или удалить мета тег Content-Type.
Несоблюдение этих требований может привести к следующему: web-сервер автоматически определит кодировку запроса клиента и отдаст страничку web-броузеру перекодированной. Броузер, в свою очередь, будет читать документ в соответствии с мета тегом Content-Type. И если кодировки не совпадут, то прочитать документ можно будет только после ряда замысловатых манипуляций. Особенно это характерно для старых броузеров IE 3.x - 4.x и Netscape 4.x.
Внимание! Мета тег Content-Type очень часто вставляется генераторами HTML кода.
Некоторые из возможных типов кодировки (стандарт [ISO10646]):
ISO-8859-1
Windows-1251
KOI8-r
cp866
Windows-1252
Windows-1250
shift_jis - Latin-1, для большинства западноевропейских языков.
- Кириллица (Windows).
- Кириллица (КОИ8-Р).
- Кириллица (DOS).
- Западная Европа (Windows).
- Центральная Европа (Windows).
- Япония (Windows).
Пример: <META HTTP-EQUIV=”Content-Type” content="text/html; charset=windows-1251">
Expires
Мета теги Expires - управляет кэшированием. Если указанная в теге дата прошла, то броузер должен сделать повторный сетевой запрос, а не использовать копию из кэша. Если изначально указать прошедшую дату, то документ не будет кэшироваться.
Некоторые поисковые роботы могут отказаться индексировать документ с устаревшей датой.
Дата должна указываться в стандарте [RFC850].
Пример: <META HTTP-EQUIV="Expires" content="Wed, 26 Feb 1999 08:21:57 GMT">
PICS-Label
Мета тег PICS-Label - (Platform-Independent Content rating Scheme Label) ) определяет уровень доступности сайта (sex, violence), но может использоваться и в других целях.
Pragma
Pragma - Контроль кэширования. При значении “no-cache” кэширование данного не рекомендовано. Предназначен для документов, получаемых в результате работы скрипта.
Пример: <META HTTP-EQUIV="Pragma" content ="no-cache">
Refresh
Мета тег Refresh - определение задержки времени в секундах, после которой броузер автоматически обновляет документ. Дополнительная возможность - автоматическая загрузка другого документа.
Пример: <META HTTP-EQUIV="Refresh" content ="4; URL=http://www.name.com/">
Если нужно просто обновить документ, то URL указывать не обязательно.
Set-Cookie
Set-Cookie - Настройка cookie броузера.
Пример: <META HTTP-EQUIV="Set-Cookie" content="NAME=value; EXPIRES=date; DOMAIN=domain_name; PATH=path; SECURE">
Атрибуты EXPIRES, DOMAIN, PATH и SECURE при необходимости можно опустить.
Пример: <META HTTP-EQUIV="Set-Cookie" content="NAME=value;">
NAME
Имя cookie, не может содержать символы перевода строки, пробелов, точки с запятой (;) и табуляции.
EXPIRES
Время хранения cookie. После указанной даты (в формате "Wdy, DD-Mon-YYYY HH:MM:SS GMT") истекает время хранения cookie.
Если этот атрибут не указан, то cookie хранится в течение одного сеанса, до закрытия броузера.
DOMAIN
Домен, для которого задается значение cookie. Для доменов COM, EDU, NET, ORG, GOV, MIL, INT значение можно задавать сокращенно "MY.COM", оно будет распространяться и на домен "WWW.MY.COM". Для всех остальных (в том числе и RU) значение надо задавать полностью "WWW.MY.RU".
Если этот атрибут опущен, то по умолчанию используется доменное имя сервера, с которого было выставлено значение cookie.
PATH
Устанавливает подмножество документов, на которые распространяется действие cookie. При значение "/doc" действие cookie будет распространено на все файлы и каталоги в этой директории начинающееся на "doc" (/doc/, /document/, /doc2/, docs.html, doc-test.htm).
Если этот атрибут опущен, то значение cookie распространяется только на документы директории, в которой расположен текущий документ.
SECURE
Указывает, что информация о cookie должна пересылается через HTTPS (HTTP с использованием SSL). В противном случае информация о cookie будет пересылается по протоколу HTTP.
Перед запросом к серверу, броузер проверяет cookie. И если атрибуты NAME, DOMAIN и PATH совпадают, броузер посылает cookie серверу.
Если cookie принимает новое значение, старое значение удаляется.
Броузер имеет ряд ограничений по работе с cookie:
* Единовременно может храниться не более 300 значений cookie.
* Cookie не может превышать 4 Кбайт.
* От одного сервера (домена) не может быть более 20 cookie.
Эти ограничения могут быть несколько иными, в зависимости от настройки и типа броузера.
Если происходит превышение лимита (общего или по домену) удаляется первая по времени запись. Удаление происходит, не зависимо от значения атрибута EXPIRES.
При превышении 4 Кбайт, cookie усекается.
Пример: <META HTTP-EQUIV="Set-Cookie" content="NAME=cookexample; EXPIRES=Monday, 22-FEB-02 21:11:51 GMT; DOMAIN=WWW.MY.RU; PATH=/; SECURE">
Window-target
Мета тег Window-target - определяет окно текущей страницы. Приведенный пример может быть использован для прекращения появления новых окон броузера при применении фреймовых структур. Действует для многих (но не для всех) броузеров.
Пример: <META HTTP-EQUIV="Window-target" content ="_top">