Sitemap для изображений бесплатно
Содержание:
- В каких случаях сайту нужен файл XML Sitemap
- Массив всех ссылок сайта для карты xml из базы данных
- Что такое карта сайта и для чего нужна
- Как сделать файл Sitemap доступным для Google
- Extending the Sitemaps protocol
- Что такое Sitemap
- Составление файла sitemap.xml
- Одной карты мало, дайте две!
- Разновидности карты сайта
- Местоположение файла Sitemap
- Способ 1: MySitemapGenerator
- Типы Sitemap
- Validating your Sitemap
- Как создать карту сайта
- Формат Sitemap
В каких случаях сайту нужен файл XML Sitemap
Google: файл Sitemap не является обязательным для сайтов
Согласно Google, файл Sitemap не является обязательным для сайтов, а использовать его следует, если ресурс попадает в одну из трёх категорий:
- Крупный сайт с большим количеством страниц
- Изолированные страницы на сайте
- Новый сайт или сайт, который часто обновляется
Может ли Google найти страницы без файла Sitemap?
Обычно, если сайт относительно небольшой, а страницы должным образом перелинкованы, то найти контент роботу Googlebot не составит труда.
Если же сайт попадает в одну из трёх категорий, приведённых выше, то использование файла Sitemap поможет Googlebot найти новый контент и покажет, где искать изолированные страницы.
Файл Sitemap (карта сайта) также может использоваться для приоритизации сканирования – чтобы указать, какие страницы следует сканировать в первую очередь, что полезно для крупных сайтов.
При этом Sitemap ничего не гарантирует. Другими словами, Google не всегда сканирует каждый URL, добавленный в этот файл.
Обратное тоже верно: если URL не добавлены в файл Sitemap, то это не гарантирует, что Google их не будет сканировать. Google способен находить страницы независимо от того, включены они в карту сайта или нет.
Отсутствие файла Sitemap ничем не грозит сайту
Если у сайта нет файла Sitemap, то ничего страшного в этом нет.
Если вы сомневаетесь, нужен ли сайту файл Sitemap, то чтобы не ошибиться, его можно создать на всякий случай. В большинстве случаев сайт от этого только выиграет.
Google рекомендует автоматически генерируемые файлы Sitemap
Что касается создания файла XML Sitemap, то Google рекомендует использовать автоматически генерируемые карты сайта вместо тех, которые нужно составлять вручную.
Есть CMS, которые создают файлы Sitemap автоматически. Также существуют WordPress-плагины которые позволяют выполнить эту задачу.
Массив всех ссылок сайта для карты xml из базы данных
$array_Urlздесь
До начала цикла, перед строкой
while ($row=mysql_fetch_array($result))
Пишем такую запись:
$array_Url = array();
// выводим данные}$array_Url[] = $row;
У вас должно получиться примерно так:
$sdd_db_host=»localhost»;
$sdd_db_name=»НАЗВАНИЕ-БАЗЫ-ДАННЫХ»;
$sdd_db_user=»ПОЛЬЗОВАТЕЛЬ»;
$sdd_db_pass=»ПАРОЛЬ»;
@mysql_connect($sdd_db_host,$sdd_db_user,$sdd_db_pass);
@mysql_select_db($sdd_db_name);
$result=mysql_query(«SELECT * FROM `НАЗВАНИЕ ТАБЛИЦЫ`»);
$array_Url = array();
while ($row=mysql_fetch_array($result))
{
$array_Url[] = $row;
}
mysql_close();
Что такое карта сайта и для чего нужна
Sitemap — это карта сайта, каталог ссылок на категории, подкатегории, страницы проекта с поддержкой заложенной иерархии (уровня вложенности). При помощи Sitemap.xml можно сообщить поисковым системам Google и Яндекс актуальную структуру, уровень вложенности, количество страниц и ссылки на них.
Пример карты сайта
Наиболее подробная информация по необходимости использования Sitemap.xml представлена в справочнике Яндекс.Вебмастер и Google Webmasters.
Различия рекомендаций по использованию карты сайта от Google и Яндекс:
- Гугл поддерживаются четыре формата карт сайта — .txt, RSS, .xml и «Сайты Google» (если ресурс сделан с помощью одноименного сервиса корпорации добра). Яндекс поддерживает только .xml карты.
- Google не поддерживает тег <priority>.
- Для Гугл обязательно добавление ссылки на карту сайта в файле robots.txt – для обозначению ее доступности к просмотру.
Для указания пути к файлу Sitemap.xml можно использовать кабинет вебмастера или указать ссылку в файле robots.txt. Лучше сделать и то, и другое. Если у вас сайт с огромным количеством страниц, карт сайта может быть несколько. Стандартные ограничения Google:
- Размер Sitemap-файла до 50 мегабайт.
- Количество ссылок не более 50 000 штук.
Аналогичные требования предъявляет поисковая система Яндекс.
Важность карты сайта нельзя недооценивать. Она и сегодня является одним из первых шагов при начале работы над SEO-продвижением сайта.
Виды карт
Можно выделить два типа карта сайта:
- XML Sitemaps – рассчитана на поисковых роботов, для сбора и обработки всех ссылок – категорий, подкатегорий, отдельных страниц. Представляет из себя набор тегов, внутри которых находятся ссылки на страницы и статьи.
- HTML карта сайта – для пользователей. Является отдельной страницей, состоящей из ссылок, разбитых в соответствии с категориями и подкатегориями. Реже – в качестве обычного каталога имеющихся статей, если сами категории не несут практической пользы. Нередко на нее можно перейти из меню на главной странице.
Также карты, можно подразделить на созданные вручную и сгенерированные с помощью онлайн-сервисов, плагинов или модулей.
Это интересно: Как увеличить посещаемость сайта
Как сделать файл Sitemap доступным для Google
Файл Sitemap анализируется только при первом его обнаружении, а не при каждом сканировании сайта. Чтобы файл был обработан повторно, вам необходимо сообщить нам о том, что данные в нем изменились. Это делается с помощью запроса ping. Не добавляйте несколько раз одинаковые файлы Sitemap и не отправляйте запросы ping, если в файл не вносились изменения и он не новый.
Предоставить роботам Google доступ к файлу Sitemap можно несколькими способами:
- Отправьте его в Google через Search Console
- Вставьте строку с путем к файлу Sitemap в любом месте файла :
- Сообщите нам о том, что файл Sitemap нужно просканировать. Для этого отправьте такой HTTP-запрос GET:
Пример:
Extending the Sitemaps protocol
You can extend the Sitemaps protocol using your own namespace. Simply specify this
namespace in the root element. For example:
<?xml version='1.0' encoding='UTF-8'?> <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:example="http://www.example.com/schemas/example_schema"> <!-- namespace extension --> <url> <example:example_tag> ... </example:example_tag> ... </url> </urlset>
Что такое Sitemap
Sitemap — это xml-документ со списком страниц сайта. Точнее, в нём указаны URL страниц. Говоря простым языком, это своеобразный путеводитель для поисковиков, который подсказывает им, какой контент доступен на сайте и как его найти. Краулер Яндекс или Google сэкономит много времени, один раз прочитав sitemap.xml, вместо того, чтобы заходить на каждую из указанных в нём страниц по отдельности.
Наши продукты помогают вашему бизнесу оптимизировать расходы на маркетинг Узнать подробнее
Такая особенность весьма полезна для тех сайтов, у которых:
- Разветвлённая структура и тысячи страниц;
- Страницы часто добавляются и обновляются;
- Слабая внутренняя перелинковка (читайте, как настроить качественную внутреннюю перелинковку, в нашем блоге);
- Недостаток внешних ссылок.
Поисковики, разумеется, могут найти все страницы и без помощи sitemap.xml, но создавая этот файл, вы демонстрируете, что прописанные в нём URL — потенциальные страницы входа для пользователей.
В то же время, наличие страницы в sitemap не гарантирует её своевременное нахождение поисковиком и индексацию, тем не менее, шансы на это сильно увеличиваются.
Составление файла sitemap.xml
Составлять карту сайта можно 3 способами:
- Вручную;
- Автоматически, с помощью специальных сервисов;
- Автоматически, с помощью готовых решений в виде плагинов к CMS и т.п.
Процесс приготовления карты сайта следующий:
- Составляем карту сайта одним из способов, перечисленных выше;
- Проверяем на валидность с помощью сервисов поисковых систем (https://webmaster.yandex.ru/sitemaptest.xml);
- Размещаем файл на сайте;
- Указываем путь к карте сайта для поисковых роботов в файле robots.txt (Кстати, есть отдельная статья о том, как правильно составить файл robots.txt);
- Указываем Sitemap в панели вебмастеров Яндекс и Google.
Итак, как составлять файл карты сайта?
Разберем пример составления файла вручную. Если вы хотите добавить в карту сайта 5 страниц вашего сайта:
- http://site.ru/url-o_kompanii/
- http://site.ru/url-uslugi/
- http://site.ru/url-produkty/
- http://site.ru/url-dostavka/
- http://site.ru/url-kontakty/
Вот так должна выглядеть карта сайта в формате XML:
<urlset> <url> <loc>http://site.ru/url-o_kompanii/</loc> </url> <url> <loc>http://site.ru/url-uslugi/</loc> </url> <url> <loc>http://site.ru/url-produkty/</loc> </url> <url> <loc>http://site.ru/url-dostavka/</loc> </url> <url> <loc>http://site.ru/url-kontakty/</loc> </url> </urlset> |
При необходимости добавляем необязательные теги из памятки, которую я привел выше. Дополнительные теги прописываются в контейнере <url>, после указания URL-адреса страницы в теге <loc>. Например:
<?xml version=»1.0″ encoding=»UTF-8″?> <urlset xmlns=»http://www.sitemaps.org/schemas/sitemap/0.9″> <url> <loc>http://site.ru/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset> |
Приведенный выше код, указывает поисковой системе, что страница http://site.ru/
в последний раз изменилась 1 января 2005 года. Обновляется с частотой раз в месяц. И приоритет у данной страницы 0.8 (максимально возможный 1).
Рекомендую пользоваться текстовыми редакторами, которые поддерживают синтаксис языка XML, например, Notepad++. Вот так выглядит XML-код в данном редакторе:
Особенно удобен функционал подсветки парных тегов.
Сервисы для генерации Sitemap
В случае, если на вашем сайте много полезных страниц и вы не хотите тратить время на составление файла вручную, то вам помогут следующие сервисы:
- http://www.mysitemapgenerator.com/
- http://sitemapgenerator.ru/
- https://www.xml-sitemaps.com/
Таких сервисов много. Я использую https://www.xml-sitemaps.com/.
Поясню вкратце все настройки:
Поисковая система Google рекомендует использовать https://code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki
Плагины для CMS
Существует огромное количество плагинов и готовых решений для систем управления сайтов. Например:
CMS |
Плагин |
WordPress |
|
Bitrix |
|
Joomla |
|
ModX |
Валидность
После составления карты сайта нужно проверить ее на наличие ошибок. Для проверки используйте сервис https://webmaster.yandex.ru/sitemaptest.xml
После успешной проверки заливаем наш файл на сайт.
Расположение файла
В отличие от файла robots.txt, файл sitemap.xml может располагаться в любом месте вашего сайта. Например, в корневой папке сайта файл будет доступен по следующему адресу:
http://ВАШ_САЙТ/sitemap.xml
Если вы разместили файл в папке /files/, то он будет доступен по такому адресу:
http://ВАШ_САЙТ/files/sitemap.xml
После успешной загрузки файла, обязательно укажите поисковым роботам как найти этот файл. Делается это очень просто. В файле robots.txt (подробная инструкция по составлению) в директиве Sitemap пропишите полный адрес к файлу. Например, файл robots.txt может выглядеть следующим образом:
Важно! В отличии от robots.txt файлов Sitemap может быть несколько. В таком случае необходимо указывать в robots и вебмастерах полный адрес ко всем файлам Sitemap
Search Console и панель Яндекс.Вебмастера
Остался последний этап. Указать путь к карте сайта в панелях вебмастеров поисковых систем.
В Search Console (панель вебмастера Google):
- Сканирование
- Файлы Sitemap
- Добавление/Проверка файла Sitemap
В панели Яндекс.Вебмастер:
- Настройка индексирования
- Файлы Sitemap
- «Проверить» и «Добавить»
Следует отметить ограничения в XML-карте сайта:
- В одном файле можно указать не более 50000 URL-адресов
- Вес файла не более 10 мегабайт (поисковые системы не индексируют документы, превышающие размер в 10 мегабайт). При необходимости файл можно сжать с помощью архиватора .gzip.
- Кодировка файла только в UTF-8
Одной карты мало, дайте две!
Как уже говорилось выше,
карта сайта может использоваться не только роботами, но и пользователями.
Поэтому большинство современных ресурсов содержит две карты: XML и
HTML.
Sitemap
в формате XML используется исключительно поисковыми роботами.
Ее роль сводится к предоставлению «паукам» достоверной информации о структуре
сайта и ее обновлении. Именно благодаря карте, роботы оперативно индексируют
новые страницы, и заносят их в поисковую базу. Если же объемный сайт не
содержит файла Sitemap.xml, многие его страницы могут
быть не проиндексированы месяцами, а иногда даже на протяжении нескольких лет.
HTML карта
используется для визуального представления структуры сайта. От ее простоты и
наглядности зависит, сможет ли пользователь найти интересующий его раздел или
нет. Создание HTML карты имеет смысл лишь в том случае, когда вам
необходимо организовать юзабилити крупного интернет-проекта, чьи разделы и
подразделы не умещаются в главное меню.
Некоторые неопытные
пользователи довольно часто используют в качестве инструмента перелинковки HTML
карту. Это очень грубая ошибка. Объясним почему. Во-первых, HTML
карта сайта не может быть представлена как полноценный Sitemap: в лучшем случае,
поисковая машина воспримет страницу с картой, как огромный набор ссылок на
внутренние страницы сайта, в худшем — пессимизирует ее значение из-за большого
количества ссылок, даже не смотря на то, что они не являются внешними.
Во-вторых, даже если поисковый робот не отнесет вашу карту к категории спама,
он может не учесть определенный процент ссылок, из-за чего некоторые страницы
вашего ресурса могут быть непроиндексированы.
Разновидности карты сайта
Итак, справившись с вопросом, что же это такое — карта сайта, самое время перейти к тем нюансам, которые определяют ее формат, в зависимости от того, кто затребовал информацию, человек или поисковик. Для этого существует две разновидности карты сайта: HTML для человека и XML для поисковых систем. Большинство ресурсов современной сети и все крупные интернет-порталы рассчитаны как для человека, так и для поискового робота, потому и содержат обе карты. Если крупный интернет-ресурс вдруг окажется без карты, его позиции в выдаче, скорее всего, быстро просядут. Именно благодаря карте поисковики получают оперативную информацию обо всех обновлениях, происходящих на сайте, об изменении приоритетов индексации или появлении новых страниц, которые необходимо занести в базу поиска. Иначе интернет-ресурс быстро теряется в онлайн-пространстве со всем своим множеством давно не индексированных страниц.
Местоположение файла Sitemap
Местоположение файла Sitemap определяет набор URL-адресов, которые можно включить
в этот Sitemap. Файл Sitemap, расположенный в каталоге http://primer.ru/catalog/sitemap.xml,
может включать любые URL-адреса, начинающиеся с http://primer.ru/catalog/, но не
должен включать URL-адреса, начинающиеся с http://primer.ru/images/.
Если у Вас есть разрешение на изменение файла http://primer.org/path/sitemap.xml,
можно предположить, что у Вас также имеется разрешение на предоставление информации
для URL с префиксом http://primer.org/path/. Примеры допустимых URL в http://primer.ru/catalog/sitemap.xml
включают:
http://example.com/catalog/show?item=23 http://example.com/catalog/show?item=233&user=3453
К недопустимым URL-адресам в файле http://primer.ru/catalog/sitemap.xml относятся
следующие:
http://example.com/image/show?item=23 http://example.com/image/show?item=233&user=3453 https://example.com/catalog/page1.html
Это значит, что все URL-адреса, перечисленные в файле Sitemap, должны использовать
один и тот же протокол (в данном случае — HTTP) и должны быть размещены на том же
хосте, что и файл Sitemap. Например, если файл Sitemap расположен по адресу http://www.primer.ru/sitemap.xml,
в нем могут быть указаны URL-адреса из субдомена http://subdomen.primer.ru.
URL-адреса, которые считаются недопустимыми, исключаются из дальнейшего рассмотрения.
Настоятельно рекомендуется поместить файл Sitemap в корневой каталог Вашего веб-сервера.
Например, если адрес Вашего сервера — primer.ru, Ваш файл индекса Sitemap должен
быть размещен по адресу http://primer.ru/sitemap.xml. Возможно, в некоторых случаях
нужно будет создать различные файлы Sitemap для различных путей на Вашем сайте (например,
если полномочия доступа в Вашей организации установлены таким образом, что доступ
с правом записи к различным каталогам предоставляется отдельно).
Если при передаче файла Sitemap используется путь, содержащий номер порта, необходимо
включить этот номер порта в путь в каждом URL, перечисленном в файле Sitemap. Например,
если Ваш файл Sitemap находится в http://www.primer.ru:100/sitemap.xml, то каждый
URL, перечисленный в файле Sitemap, должен начинаться с http://www.primer.ru:100.
Файлы Sitemap и перекрестная отправка
Чтобы отправить файлы Sitemap на несколько узлов с одного, необходимо «подтвердить»
владение узлом(-ами) для которого URL-адреса отправляются в файле Sitemap. Ниже
приведен пример. Допустим, необходимо отправить файлы Sitemap на 3 узла:
www.host1.com с файлом Sitemap sitemap-host1.xml www.host2.com с файлом Sitemap sitemap-host2.xml www.host3.com с файлом Sitemap sitemap-host3.xml
Более того, необходимо разместить все три файла Sitemap на одном узле: www.sitemaphost.com.
Таким образом, URL-адреса Sitemaps будут следующими:
http://www.sitemaphost.com/sitemap-host1.xml http://www.sitemaphost.com/sitemap-host2.xml http://www.sitemaphost.com/sitemap-host3.xml
По умолчанию это приведет к ошибке «перекрестная отправка», так как была произведена
попытка отправить URL-адреса для узла www.host1.com через файл Sitemap, который
расположен на узле www.sitemaphost.com (то же самое и для двух других узлов). Первый
способ избежать этой ошибки — это доказать свое владение (например право изменять
файлы) узлом www.host1.com. Это можно сделать, изменив файл robots.txt на узле www.host1.com,
чтобы указать на файл Sitemap на узле www.sitemaphost.com.
В этом примере файл robots.txt на узле http://www.host1.com/robots.txt содержал
бы строку «Sitemap: http://www.sitemaphost.com/sitemap-host1.xml». Изменив файл
robots.txt на узле www.host1.com с указанием на файл Sitemap на узле www.sitemaphost.com,
вы косвенно доказали, что являетесь владельцем узла www.host1.com. Другими словами,
кто бы не управлял файлом robots.txt на узле www.host1.com, он доверяет файлу Sitemap
на узле http://www.sitemaphost.com/sitemap-host1.xml на предмет содержания URL-адресов
для узла www.host1.com. Эту же процедуру можно повторить для двух других узлов.
Теперь можно отправлять файлы Sitemap на узел www.sitemaphost.com.
Если в файле robots.txt указан определенный узел, например http://www.host1.com/robots.txt,
это указывает на файл Sitemap или файл индекса Sitemap на другом узле. Скорее всего
это означает, что для каждого конечного файла Sitemap, например http://www.sitemaphost.com/sitemap-host1.xml,
все URL-адреса принадлежат узлу, который на них указывает. Это происходит потому,
что, как было указано ранее, ожидается, что файл Sitemap будет содержать URL-адреса
только с одного узла.
Способ 1: MySitemapGenerator
Онлайн-сервис под названием MySitemapGenerator обладает самой широкой функциональностью из всех, представленных в статье, позволяя бесплатно обработать до 500 URL, что подойдет для большинства сайтов или хотя бы для проверки процесса взаимодействия с данным веб-ресурсом.
- Воспользуйтесь ссылкой выше, чтобы перейти на главную страницу сайта, где сразу же можно ввести адрес веб-ресурса для создания карты, выбрать ее тип и перейти к генерированию.
За это же действие отвечает и кнопка «Simemap бесплатно», только тогда вы окажетесь сразу же на странице, где присутствует ограничение на индексацию.
Введите адрес сайта или конкретный поддомен, который хотите скопировать, в стандартном виде. Обязательно проверьте его правильность.
На странице редактирования параметров убедитесь в том, что выбран необходимый формат карты сайта.
После этого можно переходить к настройке дополнительных параметров, начав с «Источник данных». Разверните эту область и активируйте опцию загрузки данных из CSV, если хотите импортировать их для автоматической обработки.
Затем переходите в «Параметры индексации», где присутствует несколько полезных функций. С помощью них можно выбрать режим индексации, ее скорость и ограничение по времени обработки. По умолчанию стоит режим турбо, который и рекомендуют использовать разработчики.
Следом идет раздел «Параметры обработки ссылок и веб-страниц». Здесь каждый пункт активируйте или отключайте только на личное усмотрение, предварительно ознакомившись, за что отвечает каждый из них.
В «Параметры генерации» можете отказаться от формирования priority с рассмотрением файловой структуры, отключить lastmod по времени или активировать опцию changefreq, которая отвечает за разбивку карты сайта на части с определенным количеством URL.
Скорее всего, sitemap создается под формат расширения XML, поэтому в отдельном разделе вы можете настроить подключение дополнительных файлов, например, встроенных изображений или создание файла robots.txt.
Если есть определенные URL, которые вы не хотите включать в карту сайта, обязательно задайте исключения через последнюю настройку перед запуском генерации. Она поддерживает неограниченное количество пунктов, поэтому с редактированием не должно возникнуть никаких трудностей.
По завершении настройки прокрутите страницу вверх, введите проверочный код и запустите генерацию карты сайта.
Этот процесс может занять довольно длительное время, что зависит от количества обрабатываемых страниц.
Следите за прогрессом, чтобы понимать, сколько URL было найдено и обработано, а сколько еще ожидают своей очереди. Не закрывайте текущую вкладку до конца создания рассматриваемого файла.
Как только процесс закончится, на экране появится соответствующее уведомление и кнопка «Скачать», по которой и следует кликнуть для начала загрузки.
Подтвердите скачивание файла в новой вкладке.
Дождитесь конца загрузки и сразу же откройте XML-документ через любое удобное средство для просмотра содержимого.
Убедитесь в том, что создание карты сайта прошло успешно и она удовлетворяет ваши требования.
Если размер сайта не укладывается в бесплатный тарифный план, на экране отобразится предложение о покупки подписки на сервер. Вы можете решить для себя, стоит ли заплатить один раз или вам необходим постоянный неограниченный доступ к этому веб-ресурсу, чтобы в любой момент сформировать sitemap любого размера.
Типы Sitemap
Файл индекса Sitemap
Существует пара ограничений для данного файла:
- Не более 50 000 URL;
- Вес файла без сжатия не должен превышать 50 Мб.
Sitemap можно сжимать через gzip (итоговый файл будет называться, например, sitemap.xml.gz), чтобы не перегружать пропускную способность сервера. Будучи распакованным, sitemap также должен отвечать требованиям, не превышая лимиты. В случае, если файл слишком большой, его следует разделить — то, есть перераспределить URL между несколькими sitemap.
В свою очередь, отдельные файлы могут быть объединены в единый «sitemap sitemap’ов». Исключительно большие сайты иногда предполагают сразу несколько таких объемлющих списков. В нашем случае основной файл находится по адресу calltouch.ru/sitemap.xml, а внутри него указаны URL частных карт сайта — например, calltouch.ru/sitemap_iblock_5.xml.
Для оптимальной работы поисковых систем с вашими файлами sitemap вам понадобится:
- Добавить файл индекса в Google Search Console и Яндекс.Вебмастер
- Указать полный путь к файлу в robots.txt, разрешив поисковикам работу с ним. Чтобы лучше понять, как это сделать, читайте руководство по настройке robots.txt.
XML Sitemap для изображений
Данный тип карт сайта создан для улучшения индексации графического контента.
В настоящее время, по актуальным стандартам SEO, изображения с их атрибутами встроены в контент страницы, поэтому они будут считаны одновременно со всей страницей.
Более того, лучше использоваться JSON-LD разметку schema.org/ImageObject для вызова свойств изображения. Она помогает поисковым движкам получить больше атрибутов, чем из XML sitemap. Именно из-за этого sitemap для изображений не актуален для большинства сайтов.
Исключение — сайты, которые развиваются за счёт графики, например, стоки картинок.
XML Sitemap для видео
Так же, как и в случае с картинками, если ваш сайт предоставляет преимущественно видео-контент, создание соответствующей карты сайта станет верным решением.
Sitemap для Google Новостей
Эта опция целесообразна только для сайтов, зарегистрированных в Google Новостях. Если ваш сайт подключен к ним, добавьте в sitemap материалы, опубликованные за последние 2 дня, но не более 1000 URL на один файл. По мере обновления материалов обновляйте и файл.
Обратите внимание, что вопреки некоторым рекомендациям, не стоит подключать к Google Новостям sitemap для изображений. В действительности система их не поддерживает
Сам Google советует использовать schema.org image или og:image для добавления миниатюр из новостей.
Мобильный Sitemap
Не обязателен и даже излишен — по большому счёту, является устаревшим, так как предназначался для кнопочных телефонов. Использовать его для смартфонов нет нужды, тег не про адаптивность.
HTML Sitemap
XML карты сайта предназначены для поисковым систем — их читают роботы в целях индексации. HTML версии годятся только для пользователей — это наглядные карты сайтов, ссылки на которые представлены в основном футере. Сами же карты, если сайт большой, могут располагаться на отдельных страницах.
Скорее всего, вы обнаружите, что посещаемость страницы с развёрнутой картой сайта или же просмотр данного блока на других страницах составляет статистическую погрешность. Так, стоит ли тратить время и усилия на создание sitemap, который не представляет особой ценности для пользователей? Вряд ли.
Динамический XML Sitemap
Можно сделать карту сайта статичной, но проблема в том, что как только вы удалите любую из страниц или добавите новую, она сразу устареет. То же касается и добавления нового контента — атрибут Lastmod не перепишется автоматически, оставшись неизменным.
Таким образом, вместо того, чтобы раз за разом обновлять и загружать новые карты сайта, лучше сразу создать карту сайта, которая обновляется сервером автоматически при внесении изменений в структуру и содержимое страниц.
Validating your Sitemap
The following XML schemas define the elements and attributes that can appear in
your Sitemap file. You can download this schema from the links below:
For Sitemaps:
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsdFor Sitemap index files:
http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd
There are a number of tools available to help you validate the structure of your
Sitemap based on this schema. You can find a list of XML-related tools at each of
the following locations:http://www.xml.com/pub/a/2000/12/13/schematools.html
In order to validate your Sitemap or Sitemap index file against a schema, the XML
file will need additional headers as shown below.
Sitemap:
<?xml version='1.0' encoding='UTF-8'?> <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> ... </url> </urlset>
Sitemap index file:
<?xml version='1.0' encoding='UTF-8'?> <sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> ... </sitemap> </sitemapindex>
Как создать карту сайта
Чтобы создать Sitemap XML, можно использовать различные методы — прописывать необходимые данные вручную, создать файл посредством программного кода, использовать специальные модули и программы. Мы детально рассмотрим, как создать XML вручную и с помощью инструмента «Генератор Sitemap» в Netpeak Spider.
2.1. Создание XML Sitemap вручную
Для создания небольшой по объёму XML карты сайта воспользуйтесь любым текстовым редактором. Создайте файл с именем Sitemap, поменяйте в нём расширение на .xml и пропишите в документе абсолютные URL-адреса страниц, которые необходимо индексировать.
Используйте в карте обязательные XML-теги, описанные в предыдущем разделе, при необходимости также заполните дополнительные. На выходе должен получиться файл такого вида:
Для создания объёмных XML-карт потребуются навыки программирования. В таком случае скрипт генерации Sitemap добавляется в CRON — инструмент для регулярного автоматического выполнения определённых заданий.
Чтобы максимально упростить задачу по созданию XML-карты сайта, воспользуйтесь специальными генераторами. Я покажу, как создать файл в краулере Netpeak Spider.
2.2.1. Сканирование сайта
В программе выполните следующие действия:
-
Откройте «Настройки» → «Основные». Чтобы ускорить сканирование сайта, оставьте чекбоксы на этой вкладке пустыми.
- На вкладке «Продвинутые» используйте настройки по умолчанию.
-
В «Параметрах» на боковой панели убедитесь, что отмечены параметры: «Last-Modified», «Индексируемость», «Разрешён в robots.txt», «Входящие ссылки», «Исходящие ссылки», «Hreflang», «Изображения». Остальные параметры можно убрать.
- В адресной строке укажет начальный URL сайта и запустите сканирование.
- В результате вы получите список страниц сайта.
2.2.2. Генерация XML карты сайта
- Перейдите в меню «Инструменты» → «Генератор Sitemap».
-
Оставьте отмеченным только чекбокс возле «XML Sitemap» и установите нужные параметры: дату последнего изменения, частоту изменений и приоритет страниц. После этого нажмите «Сгенерировать».
Формат Sitemap
Sitemap.xml одностраничника, в котором использованы все доступные теги, будет выглядеть так:
Но какой смысл несут все эти атрибуты и полезны ли они для SEO?
Loc (Location)
Этот обязательный тег содержит абсолютный путь к странице, который по-другому называется каноническим URL. В нём прописывается актуальный протокол http:// или https://, а также www, если он есть в адресе.
Для международных сайтов здесь же прописывается hreflang. С помощью атрибута xhtml:link, определяющего язык и регион, для каждой конкретной страницы снижается время загрузки. Такую возможность не могут предложить другие элементы в <head> или HTTP-заголовки.
Lastmod (Last Modified)
Необязательный тег, который, тем не менее, крайне рекомендуется устанавливать. Он помогает поисковым системам определить не только «свежесть» контента, но также, являетесь ли вы его автором. Во всяком случае, не стоит им злоупотреблять — лучше прописывать Lastmod для более значимых изменений, так как разные уловки могут негативно сказаться на ранжировании вплоть до получения санкций от поисковых систем.
Priority
Необязательный тег, служащий для указания веса страницы среди остальных. Может принимать значения от 0 до 1. Обычно SEO-специалистов, как и поисковики, не сильно заботит наличие тега Priority и его значения, поэтому он почти не применяется.