Русские документы
Ежедневные компьютерные новости RSS rusdoc.ru  Найти :
Новости
Последние поступления
Книжный магазин
  Hardware:
Видеоустройства
Системные платы
Процессоры
Мобильные устройства
Аудиосистема
Охлаждение системы
Накопители информации
КПК и ноутбуки
Телефоны и связь
Периферия
Система
Сети
Разные устройства
 
  Programming:
Web-разработка
Языки программирования
Технологии и теория
Разработка игр
Программная инженерия
 
  Software:
Операционные системы
Windows 7
Базы данных
Обзоры программ
Графика и дизайн
   
  Life:
Компьютерная жизнь
Разные материалы
   
Партнеры
Публикация
Правовая информация
Реклама на сайте
Обратная связь
Экспорт в RSS Экспорт в RSS2.0
    Читать в Яндекс.Ленте



Альтернативная карта сайта или технология Sitemaps

Раздел: Programming / Вебмастеру @ 27.10.2007 | Ключевые слова: карта сайта sitemaps версия для печати

Автор: Демьянчук Виталий
Источник: dataword.info

SitemapsВо многих статьях, описывающих эффективные методы индексации сайта, не раз говорилось, что путь к сердцу любой поисковой системы – это карты сайта.

И это действительно верно, т. к. основной принцип нахождения новых страниц поисковыми системами – это переход по ссылкам, опубликованным на странице.
Так происходило раньше, да и что скрывать, сейчас этот метод не утратил своей значимости, даже ввиду внедрения новых более эффективных методов сбора новых URL.

Сколько себя помнит Интернет, веб-мастеры всегда пытались угодить поисковым паукам -  помочь им собрать детальную информацию о структуре продвигаемого сайта.

Первым, самым древним и вполне естественным способом было создание специальной страницы, на которой помещались все ссылки сайта. Назывались и называются такие страницы картами сайта. Принцип их работы прост: поисковый робот при визите на эту страницу автоматически пройдёт по опубликованным там ссылкам и занесёт их в индекс.

Подобная схема была удобна до поры до времени. Позже, когда сайты перестали собой представлять исключительно статические страницы с малым количеством страниц, возникла новая проблема, связанная с неэффективностью метода публикации классического варианта карты сайта, т. к. мест для ссылок не хватало, страницы получались большими по размеру, неудобными.

На некоторых сайтах число страниц перевалило за 1 000, естественно, что абсолютно все ссылки разместить на карте сайта стало невозможно. Коэффициент проиндексированности таких сайтов стал снижаться. Мир нуждался в новом эффективном решении возникшей проблемы.

И проблема была решена. В июне 2005 года компанией Google был создан новый удобный формат описания новых страниц сайта для улучшения качества их индексации поисковыми системами.

Стандарт получил название Sitemaps 0.84. За основу был принят принцип текстовой базы данных XML, позволяющий компактно в текстовом файле описать структуру сайта, включая новые и опубликованные ранее страницы сайта с возможностью указания дополнительной META-информации. Эффективное решение Sitemaps, предложенное Google стало, пользоваться бешеной популярностью.

Популярность сказалась и на мнении других поисковых систем к новому подходу создания карт сайта. Так в ноябре 2006 года к поддержке стандарта присоединились такие поисковые гиганты, как MSN и Yahoo, а в апреле и Ask.com. На радостях формат Sitemaps получил новую версию Sitemap 0.90, расширяющую функциональные возможности.

В мае 2007 года было официально объявлено о поддержке подключения стандарта Sitemaps в файле robots.txt поисковиками Ask, Google и Yahoo, т. е. найти карту сайта Sitemap стало проще: достаточно указать его местоположение в этом файле, а за источник информации для Sitemap использовать RSS-ленты или обычные текстовые файлы.

Особенности карты сайта по технологии Sitemap:

Технология Sitemap, как и было сказано выше, реализуется при помощи текстовых баз данных XML, позволяющих компактно хранить данные в удобном для человека и программы виде. Сам файл XML именуется sitemap.xml, корректно также и создание сжатого gzip файла (sitemap.xml.gz).

Стандартом Sitemap предусмотрены следующие возможности и ограничения:

- один xml-файл может содержать в себе не больше 50 000 адресов и быть объёмом не больше 10 мегабайт;
- в случае если ваш сайт содержит более 50 000 страниц, а объём самого файла превышает 10 мегабайт, можно воспользоваться подключением нескольких файлов sitemap.xml. В этом случае один файл делается индексным, описывающим все адреса к остальным файлам sitemap.
- Стандартом предусмотрена вложенность: в каждой директории может быть свой sitemap.xml, описывающий файлы в директории и в поддиректориях. Ссылок на директории, выше существующей, а также на посторонние домены (в этом списке и поддомены основного домена) быть не должно.
- Сам xml-файл должен быть в международной кодировке UTF-8.
- Все специальные XML-символы, если они не используются по назначению (т. е. не части тегов и параметров), должны быть закодированы (выполните маскирование). Это относится к амперсанду (&), одинарной кавычке (`), двойной кавычке ("), знак меньше (<) и знак больше (>).
- Все адреса и пути должны быть полными, включая префикс http://

Синтаксис карты сайта технологии Sitemap:

Пример файла Sitemap:


http://www.site.ru/index.html
2005-01-01
monthly
0.8

Sitemap работает на основе технологии XML, поэтому в начале каждого сайта, по традиции, составляется xml-пролог:

Указывающий версию xml и кодировку документа

Затем идёт ряд обязательных тегов:
- используется для указания начала и конца информации с данными о страницах, описанных в файле Sitemap (используя вложенные в него теги ), а также несёт дополнительную информацию обработчику (поисковой системе) через параметр xmlns, с каким стандартом он имеет дело и в случае чего URL, который описывает особенности определённого стандарта (схемы стандарта).
- контейнер, содержащий информацию об определённой странице сайта.
- тег адреса описываемого документа, здесь мы пишем URL страницы.

В контейнер также входит ряд необязательных тегов:
- дата последней модификации документа, используется формат год-месяц-число. Все данные в числовой форме. (Используйте этот тег с умом: не пишите здесь ложные значения, т. к. это приведёт лишь к излишней нагрузке на сервер)
- частота обновления страницы со следующими значениями: always,
Hourly, daily, weekly, monthly, yearly, never
.
- приоритет страницы над другими страницами сайта, т. е. ваше мнение об её важности относительно других страниц вашего сайта. Используется числовой формат из диапазона 0,0 – 1,0.

Важно помнить, что необязательные теги никак не влияют на ранжирование информации в Интернете. Эти данные всего лишь помогают определить субъективное авторское мнение о проекте.

Пример индексного файла Sitemap:


http://www.example.com/sitemap1.xml.gz
2005-01-02

http://www.example.com/sitemap2.xml.gz
2005-01-01

Здесь всё по аналогии: выполняет схожие функции, что и < urlset >. Основное отличие этого тега в том, что он описывает ссылки на sitemap-документы, а не на ссылки, как в случае с < urlset >.
- описывает ссылку на другой файл sitemap.
- указывает на время обновления файла sitemap.

Как сказать поисковой системе о моей карте сайта Sitemap?

1) В поисковой системе Google в центре веб-мастеров указать URL вашего файла Sitemap
2) Поместить сам файл в корне сайта, дав ему имя sitemap.xml или sitemap.gz
3) Опубликовать в файле robots.txt информацию о вашей карте сайта. (Как это сделать, читайте здесь: http://dataword.info/robots.php)

Как создать карту сайта Sitemap?

1) Вручную написать синтаксис: очень неудобно, зато надёжно. Вы всегда будете в курсе дела.
2) Использовать специальные онлайн-сервисы генерации файлов Sitemap:
Например, можно это сделать здесь: http://www.sitemapspal.com/
3) Использовать CMS, которая это будет делать автоматически. Например, на CMS Wordpress можно подключить плагин, который будет автоматически генерировать карту сайта, сжимать её, сохранять на диске и отправлять в Google.

Дополнительная информация по стандарту Sitemaps:

1) http://www.sitemaps.org/ru/ - официальный сайт стандарта Sitemaps
2) http://ru.wikipedia.org/wiki/Sitemaps - информация о стандарте Sitemaps на Wikipedia

Это интересно:








версия для печатиРаспечатать статью


Вернуться в раздел: Programming / Вебмастеру


Реклама:
Читать наc на:

Add to Google
Читать в Яндекс.Ленте






Rambler's Top100
© Copyright 1998-2012 Александр Томов. All rights reserved.