Операторы поисковых систем google и «яндекс»
Содержание:
- Эволюция функции «Поиск»
- Особенности поиска в Яндекс
- Ссылки и поиск с ограничениями
- Дальнейшего уточнения результатов
- Символы в поисковых запросах
- Что отсекать сразу
- Язык поисковых запросов
- Быстрая замена знаков
- Как устроен поиск в Яндекс?
- Поиск и замена в таблицах
- Что такое поисковая выдача?
- Формирование выдачи на основе поискового запроса
- Как искать страницы по дате
- По какому принципу распределяются места
- Основные принципы работы поисковых систем: формулы
Эволюция функции «Поиск»
Первоначально поговорим об эволюции поисковой функции с появлением новых версий Windows. Помните XP? Окно поиска было отдельным. Ещё там сидел симпатичный помощник – собачка или кто-то другой. Попасть в него можно было через «Пуск».
В левую часть окна были вынесены настройки поиска:
- По имени (полностью или частично).
- По фразе или одному слову в тексте.
- По дате последних изменений.
- По размеру документа.
- Можно было искать на всём компьютере или в конкретной директории.
Результаты отображались в правой части окна. На мой взгляд, очень удобно всё было устроено.
В новых версиях Windows – 7, 8 и 10 функция претерпела косметические изменения. Почему косметические? Да потому что её действие осталось прежним, но только параметры поиска задаются автоматически, когда в строку, расположенную и сразу в меню Пуск, и в каждой папке, вы вписываете значение для поиска. Либо их можно также настроить, но совершенно в другом месте. Исключение – только поиск по содержанию документа, но и это легко решаемо. Пока непонятно? Рассмотрим подробнее по каждому параметру чуть ниже. Зачем разработчики всё усложнили, точнее, упростили? Видимо, они заботились о нас вечно занятых пользователях.
Вот как выглядит поисковая строка в Windows 10.
А вот так в восьмой точка один версия ОС.
Поскольку с XP всё понятно, я буду рассказывать о различных возможностях поиска на примере «восьмёрки», тем более «семёрка» и «десятка» от неё в этом вопросе практически не отличаются.
Особенности поиска в Яндекс
Предыдущая статья была посвящена тонкостям поиска в Google. Поисковая система Яндекс тоже имеет расширенные возможности поиска и продвинутые операторы. У Яндекс очень хороший охват русскоязычных сайтов, поэтому если целевой сайт на русском языке, то на этапе сбора информации имеет смысл воспользоваться также и Яндексом.
Синтаксис запросов в Яндекс отличается от Google: операторы называются по-другому и логика их работы отличается, аналоги каких-то гугловских операторов отсутствуют вовсе, а какие-то, напротив, являются уникальными только для Яндекса.
Пожалуй, главным отличием поиска Яндекса является свой собственный индекс, с огромным охватом сайтов на русском языке. А также свои собственные алгоритмы определения релевантности (насколько страница соответствует поисковому запросу) и ранжирования (как высоко в результатах поисковой выдачи должна находиться страница).
И хотя операторы поиска в Яндекс работают иначе чем в Google, они довольно гибкие для составления в том числе и сложных запросов по нескольким критериям. Я покажу несколько примеров Яндекс-дорков, с помощью которых можно найти пароли и другую очень интересную для пентестера информацию.
Итак, давайте познакомимся с продвинутыми приёмами поиска Яндекс, которые в любом случае пригодятся всем, кто что-то ищет в Интернете (то есть всем) – даже если вы не занимаетесь расследованиями на основе открытых источников.
Ссылки и поиск с ограничениями
Еще в середине 2007 года Яндекс отменил операторы link и anchor, которыми пользовались SEOшники. Но Google сохранил возможность искать бэклинки и ссылки, анкоры которых содержат определенные слова.
Обе поисковые системы предлагают пользователю использовать специальный язык запросов для того, чтобы осуществить поиск на определенном сайте; поиск конкретного типа документа; поиск слов запроса в тайтле страницы. У Яндекса есть функция поиска документа только на определенном пользователем языке. У Google есть несколько операторов, которыми не располагает российский поисковик: просмотр закешированной страницы и поиск слов запроса в тексте урла.
Действия |
Яндекс |
|
Поиск определенного типа файла |
||
Поиск по сайту |
||
Поиск всех слов запроса в тайтле |
||
Поиск первого слова запроса в тайтле, остальных — в документе |
— |
|
Поиск документов на определенном языке |
— |
|
Поиск закешированной версии страницы |
— |
|
Поиск всех слов запроса в тексте урла |
— |
|
Поиск первого слова запроса в тексте урла, остальных — необязательно |
— |
Помимо вышеперечисленных функций у Яндекса есть несколько интересных фич. Цветовой спектр, с которым можно провести несколько приятных минут, выясняя, как выгляди , или . На запрос, содержащий название праздника, Яндекс предложит перейти к Открыткам, чтобы пользователь поздравил своих друзей.
Действия |
Яндекс |
|
Точное время в своем городе |
||
— |
||
Время в каком-либо городе |
||
Разница во времени |
— |
|
Открытки |
— |
|
Цвет на цветовом спектре |
— |
Update: Полную таблицу исследования вы можете посмотреть (Excel).
Дальнейшего уточнения результатов
Пример 11:
cats -musical
Знак минус
(-) перед ключевым словом удаляет любые
результаты с этим словом. Опять же, это
поможет отфильтровать результаты, когда
запрос может быть неоднозначным. Если
вы ищете информацию о кошках как о
животных, но в вашем городе есть мюзикл
«Кошки», вы можете искать cats -musical,
чтобы удалить результаты о театральной
постановке.
Пример
12: intitle:keyword
-site:yourdomain.com
Вы также
можете использовать знак минус (-)
перед командой поиска. Вышеприведенный
пример находит веб-страницы с вашим
ключевым словом в теге title, исключая те,
которые находятся на вашем собственном
сайте. Это уменьшает беспорядок при
проведении исследований конкурентов.
Символы в поисковых запросах
В зависимости от результата, который Вы хотите получить в выдаче, можно использовать как отдельные операторы, так и несколько разных в одной фразе. Разберем на примерах, в каких случаях и какие из символов необходимы для получения определенных результатов поиска.
Обязательное присутствие нужных слов
Во всем тексте.
Например, если Вы ищете информацию в контексте определенного региона, или связанную с какой-то частностью, к поисковому запросу можно добавить необходимое слово, а перед ним без пробела символ двойной амперсанд &&, в этом случае оно обязательно будет присутствовать в тексте сайтов, показанных в выдаче
Это важно и в ситуации, когда одно слово имеет несколько значений — приписываете к поисковому запросу необходимое уточнение с двойным знаком и даете системе ориентир поиска, например «органы &&человека». В одном предложении
В одном предложении
Эту задачу решает применение одинарного символа &. Например, по запросу «настройки &ретаргетинга» в результатах выдачи будут сайты, в предложениях которых есть оба слова — «Пошаговые настройки поискового ретаргетинга», «Ретаргетинг ВКонтакте — настройки» и т.п.
Это бывает необходимо для получения большего охвата ресурсов с нужной информацией — не на всех из них могут присутствовать фразы с точным вхождением, а с их разбросом в предложении достаточно.
Исключение
Когда есть необходимость исключить из поиска вложения с определенными словами, перед ними ставится знак минус.
К примеру, Вы интересуетесь машиной времени, а в выдаче видите информацию о группе Макаревича.
Оформляете словосочетание «машина времени -Макаревич -группа» и результаты поиска очистятся от нерелевантных Вашим желаниям сайтов.
Сохранение словоформы
Восклицательный знак перед словом указывает системе на условие его присутствия в нужном падеже и склонении. Например, «дорога !домой» исключит из ответов «дорога к дому» или «дом по дороге».
Обязательное присутствие
Символ «+» обычно ставят к предлогам, которые не учитываются поисковиками — в, на, из, но без них смысл поискового запроса меняется. Пример — «маршрут +в Тверь» уберет из выдачи «маршруты Твери» и подобные.
Но и в других случаях употребление оператора бывает уместно.
Порядок слов
Зачастую важна фиксация словосочетания в определенном порядке, иначе искажается смысл поиска — система не обращает на этот параметр внимания при анализе и выборе ресурсов. Классический пример — при вопросе «маршрут из Твери в Новгород» система выдаст, в том числе, «маршрут из Новгорода в Тверь».
При включении запроса в квадратные скобки Вы получите желаемый ответ.
Точная фраза
Для получения в выдаче сайтов, в тексте которых присутствует точное словосочетание запроса, вокруг него ставят символы «…».
Например, такой ответ получен без использования кавычек
А такой с использованием
Оператор |
Например, такая конструкция туфли от Aldo | Allora | Fabi дает задание поисковику найти в текстах сайтов соответствие запросу с любым из перечисленных до и после символа | слов. Это применимо для системы Яндекс.
Для поиска в Гугле для аналогичных целей используется оператор or (или).
Напоследок еще один прием для Google.
Символ звездочка в запросе
У Вас были ситуации, когда Вы не могли вспомнить слово из песни, из названия чего либо? Решается вопрос просто — пишете в поисковой строке необходимую фразу, а в нужном месте вставляете символ * — оператор «пропущенное слово».
В выдаче Вы получите разные варианты с сайтов с полными фразами — выбирайте подходящий.
Другие популярные символы для включения в поисковые запросы я рассмотрел в статье по использованию операторов при подборе ключевых фраз.
Что отсекать сразу
Во-первых, все информационные запросы – на поиске они только сливают бюджет. К ним относятся все фразы со словами «фото / видео», «своими руками», «инструкция», «скачать», «как» и т.д.
Во-вторых, запросы, выдача по которым не призывает к продаже / заказам. То, что мы рассматривали в параграфе выше.Те же информационные запросы, замаскированные под коммерческие.
Тут всё очевидно, чисто информационный интерес со стороны пользователей. А есть неочевидные вещи – рассмотрим их на конкретных примерах.
Пример 1: пользователь ищет инструкцию по тому, как сделать самостоятельно, а не готовую услугу
Проект наших клиентов – регистрация юридических лиц. По фразе «Регистрация ООО» конверсий была уйма, по «Зарегистрировать ООО» – ни одной. Дело в том, что во втором случае люди хотят решить свою задачу самостоятельно, а не платить кому-то деньги.
Бывает и наоборот.
Пример 2: пользователь ищет готовую услугу под ключ, а не товар, чтобы его купить и самостоятельно доводить до ума
Актуально для автотематики. Поясним на примере по продаже усиленны пружин для авто с доставкой по нескольким регионам. Есть фраза «Пружина усиленная Kia Cerato», а есть – «Усилить пружины Kia Cerato».
Казалось бы, практически одинаковые запросы, но разница в формулировке решает всё. В нашем примере пружины продаются с доставкой, поэтому трафик по запросам со словом «Усилить» – мимо кассы. Бизнес-процессы продавца не заточены под это.
Пример 3: вы предлагаете что-то конкретное по слишком широким запросам, под которые попадают несколько товаров / услуг / технологий.
Например, продавец входных шумоизоляционных дверей рекламируется по ключевикам типа «Звукоизоляция квартиры».
В чем подвох? Клиентам не нужны двери. Под звукоизоляцией квартиры они понимают стены / потолок.
Язык поисковых запросов
Каждая поисковая система имеет свой язык запросов. Это помогает более точно сформулировать свой вопрос и получить, соответственно, более точный на него ответ. Ниже приведены наиболее популярные операторы языка поиска Google и Яндекс.
Язык поисковых запросов
Назначение | Оператор |
Поиск по определенному сайту или его страницах | Site:(url сайта) |
Поиск обратных ссылок | link: |
Поиск страниц с похожим или аналогичным содержанием | related: |
Поиск по нескольким запросам. К примеру, Дата крещения Руси 988 OR899 | OR |
Информация о ссылке | info: |
Информация из кэша (последняя индексация сайта) | cache: |
Язык поисковых запросов Яндекса
Назначение | Оператор |
Сортировка или поиск по заголовкам документа. | title: |
Поиск по URL | url: |
Поиск по хосту | host: |
Поиск по определенному сайту или странице | site: |
Сортировка с ограничением по языку | lang: |
Поиск по домену | domain: |
Поиск по дате | date: |
Кроме того, Google и Яндекс предоставляют функцию расширенного поиска, где пользователь на интуитивном уровне может ввести дополнительные критерии: язык, регион, дата обновления и формат документа.
Кстати, проверить позиции своего сайта по запросам вы можете в SE Ranking.
Просмотры:
14 366
Кристина Загорулько
Кристина — опытный копирайтер, пишет полезные статьи об IT, SEO и маркетинге. Cтарается нести актуальное и креативное в текстах.
Быстрая замена знаков
Кроме поиска и выделения с последующим форматированием, возможен поиск в «Ворде» с заменой. Если в окне поиска нажать на вторую вкладку – «Заменить», то можно увидеть две строки. В одну нужно вписать то сочетание знаков, которое нужно найти, а во вторую – то, на которое нужно поменять найденное. При этом как поиск, так и замена, помимо сочетания знаков, могут учитывать и их форматирование («Больше» – «Формат»…).
Скажем, в объемном тексте перед печатью или редактированием нужно поменять все дефисы на тире, чтобы не делать эти замены при редактуре вручную. Для этого в строку поиска нужно вбить пробел, дефис, пробел, а в строку замены – пробел, тире, пробел. Если нажать клавишу «Заменить все», то все дефисы, окруженные пробелами, будут заменены на тире, окруженные пробелами.
Дефисы на месте тире часто содержат тексты, скопированные из браузера. На многих интернет-страницах тире подменяются даже не просто дефисами, а двойными дефисами. Их корректировка вручную была бы очень утомительной. С помощью функции поиска с одновременной заменой эта проблема решается в несколько действий: в строку поиска вписывается пробел, двойной дефис и еще один пробел, а в строку замены – пробел, тире и еще один пробел. Нажатие кнопки «Заменить все» устраняет все двойные дефисы в тексте, меняя их на тире.
Поиск в «Ворде» с выделением и с поэтапной или одновременной заменой сложно переоценить, когда нужно работать с текстами больших объемов и устранять повторяющиеся ошибки и недочеты.
Как устроен поиск в Яндекс?
Весь процесс работы можно описать в такой последовательности (как и в поисковой системе Google):
- Сканирование
- Индексирование
- Ранжирование
Если описывать более подробно, то процесс поиска и ранжирования веб-страниц сайтов устроен следующим образом:
- Собирается список ссылок для сканирования
- Планировщик определяет этот список
- Происходит сканирование или краулинг запланированных страниц по списку ссылок
- Далее происходит скачивание полезных документов и размещение их в сохраненной копии
- После этого индексация этих документов, определение его языка, слов и ссылок в нем
- И далее на страницу результатов поисковой выдачи
Поиск и замена в таблицах
- Откройте файл в Google Таблицах на компьютере.
- Выберите Правка Найти и заменить.
- В поле «Найти» укажите нужное слово. Чтобы изменить его, введите новый текст в поле «Заменить на».
- Нажимайте Найти, чтобы перемещаться между результатами поиска.
- Чтобы уточнить поисковый запрос, используйте следующие параметры:
- Учитывать регистр. Поиск с учетом прописных и строчных букв.
- Совпадение с полным содержанием ячейки. Поиск ячеек с полным совпадением текста.
- Поиск с использованием регулярных выражений. Поиск ячеек по определенному шаблону.
- Поиск по формулам. Поиск с учетом формул.
- Чтобы заменить выделенный текст, нажмите Заменить. Чтобы исправить все результаты поиска, нажмите Заменить все.
Что такое поисковая выдача?
Наверное, уже каждый человек в этой вселенной хотя бы раз пользовался поисковиком. Взять любимый многими Яндекс, куда поступают в день миллиарды запросов. Люди ищут в поисковике то, что интересует их в данный момент времени. “Купить слона/собаку/ежа (красного/полосатого/в клеточку — выбрать по вкусу)”, “Почему девушки не дают” (посмотрели бы мы на того, кто это спрашивает) и даже “Что делать, если я дура“ (и правда, что?) Те сайты, которые выдает поисковик, и называются поисковой выдачей.
Что такое поисковая выдача
Наиболее “козырные” сайты находятся на первой или второй странице — как правило, далее пользователь не листает, поскольку находит то, что хотел. А уж оказаться в первых строках — гарантированный профит: люди проходят по ссылкам и привлекают на сайт трафик.Если внимательно присмотреться, верхние три и нижние четыре сайта в поисковой выдаче будут с пометкой “Реклама”. Это контекстная реклама, которой мы посвятим отдельную статью нашей азбуки.
Контекстная реклама
Итак, поисковая выдача — это сайты, которые выдает поисковик на запрос пользователя. Чем выше сайт в топе — тем больше трафика он привлечет.
Формирование выдачи на основе поискового запроса
Как формируется выдача на основе поискового запроса? Вот основные шаги:
- Пользователь задает запрос к поисковой системе
- Поисковые роботы находят все проиндексированные страницы, в которых запрос выделен в качестве ключевого выражения или его части
- Формируется список-выдача ссылок на сайты, релевантных запросу
Релевантность — это мера, выражающая соответствие содержания сайта или страницы вопросу, поставленному пользователем с помощью поискового запроса.
То есть релевантная страница, это как раз та страница, которую хочет получить пользователь, введя запрос в поисковую строку.
Как искать страницы по дате
Если пользователю необходимо найти статью, которая сделана в определенную дату, то он также может воспользоваться специальным оператором в Яндекс браузере. Это оператор даты, с помощью которого можно найти определённый запрос, причем страничка будет создана именно в то время, которое укажет пользователь.
Для того, чтобы применить этого оператора, необходимо вбить запрос, а после написать оператора «date». Теперь стоит поставить двоеточие и вбить определенную дату без пробелов и точек, начиная с года. Если же необходим промежуток, то стоит поставить троеточие. Таким образом можно достаточно быстро и легко найти статьи в определённое время.
По какому принципу распределяются места
Возможно вы заметили, что публикации в выдаче распределены не в хронологическом порядке, не по алфавиту, автору или любому другому привычному человеческому разуму способу. Как же в таком случае происходит присваивание места?
Разработчики Google и Яндекс озабочены удобством для пользователя в первую очередь. Они трудятся нам тем, чтобы выдача была максимально полезной, а читатель получил нужную информацию быстро. Вот почему, к примеру, вводя слово «красный» в Яндекс вы получаете палитру с обозначением цветов и наименованиями оттенков.
Если же, вы ищете перевод какого-то слово на английский, то не успеете дописать, как перед вашими глазами появится результат (ответ на ваши искания).
Как же поисковые системы поступают, когда дело касается более важной информации? Я имею ввиду тексты на сайтах. Неужели кто-то их перечитывает, проверяет и анализирует пользу? Естественно нет
Программисты разработали многочисленные алгоритмы, которые помогают машинам присвоить место сайту. Вы можете почитать статью о том, что такое оптимизация, если пожелаете узнать подробности этой темы. Я же лишь вкратце освещу эту тему.
Ваш запрос поисковой системе в профессиональных кругах веб-мастеров называется «ключевое слово». Что это такое и как выбирать их для сайта я тоже уже рассказывал. Так вот
Самое важное использовать их в тексте. Тогда поисковый робот поймет, о чем написана статья и кому из пользователей ее стоит показывать
Множество людей запрашивают примерно одинаковые слова: «фильмы онлайн», «100 долларов в рублях» и так далее. Иногда одинаковые запросы могут выглядеть по-разному. К примеру, «поисковая выдача это» или «что такое поисковая выдача». Благо, существуют десятки сайтов, и каждый мастер выбирает свои ключевые запросы, под которые пишет текст.
Информация имеет свойство устаревать, так что обновление происходит довольно часто и повыше находятся те статьи, которые «выпущены» не так давно. Редкий случай, когда на первой странице Гугла или Яндекса вы встретите текст, написанный 5-10 лет назад. Хотя и такое случается.
Поисковые роботы стараются анализировать еще и сам проект, на котором написан текст. Он должен внушать доверие: насколько хорошо написан код, цитируют ли его другие сайты (здесь речь идет о внешней оптимизации) и так далее.
Документные операторы Google
Оператор |
Предназначение |
Примечание |
site: |
Поиск по сайтам и доменным зонам. Пример: продвижение сайтов site:com Для поиска по нескольким доменам используйте совместно с оператором OR. Пример: site:org OR site:info. Для поиска поддоменов в индексе Google исключите основной домен из поиска. Пример: site:seointellect.ru -inurl:http://seointellect.ru. |
|
related: |
Поиск похожих сайтов. Данный оператор позволяет найти и проанализировать сайты конкурентов. Результаты могут быть интересными, так как оператор показывает похожие сайты с точки зрения Google. Пример: related:seointellect.ru |
Работает не для всех ресурсов. Нельзя сочетать с другими операторами поиска. |
info: |
Получение информации о сайте, которую хранит Google: описание, ссылки на похожие ресурсы, страницы, упоминающие сайт, кешированная версия. Пример: info:google.com. |
Оператор не всегда работает корректно. |
cache: |
Поиск кешированной версии страницы. Пример: cache:seonews.ru. |
|
filetype: |
Поиск документов по типу файлов. Google позволяет искать форматы pdf, ps, dwf, kml, kmz, xls, ppt, doc, rtf,swf. Пример: чек лист продвижение сайтов filetype:pdf |
Позволяет найти интересные файлы, которые в обычном поиске по запросу, вы могли бы не увидеть. |
allintitle: |
Поиск документов, содержащих указанные в запросе слова в теге title. Пример: allintitle:поисковое продвижение |
|
intitle: |
Поиск указанного в запросе слова или фразы по title. Пример: intitle:»продвижение сайтов» Комбинация с оператором site: позволяет осуществлять точный поиск по сайту. Пример: продвижение сайтов site:seointellect.ru intitle:самостоятельное |
С помощью данного оператора можно искать дубли заголовков или страниц, проверять, не был ли кем-то скопирован ваш контент. Если используете оператор для поиска фразы, применяйте кавычки. |
allinurl: |
Поиск документов, которые содержат все слова из запроса внутри указанного URL. Пример: allinurl:seo optimizatsiya |
|
inurl: |
Поиск по вхождению в URL. Пример: inurl:forum Чтобы собрать списки сайтов, можно использовать поиск по вхождению в URL в определенной доменной зоне/ Пример: inurl:addcomment site:ru Поиск текста с вхождением в URL можно усовершенствовать для поиска ресурсов под простановку крауд-ссылок. Пример: добавить комментарий inurl:forum |
|
allintext: |
Поиск страниц, которые содержат все входящие в запрос слова. Пример: allintext:seo smm |
|
intext: |
Поиск слова или фразы в текстах. Пример: intext:»продвижение сайтов» Поиск по текстам среди двух сайтов. Пример: intext:»продвижение сайтов» site:seointellect.ru OR site:yandex.ru |
|
allinanchor: |
Поиск по документам, которые содержат указанные ключевые слова в тексте ссылок. Пример: allinanchor:поисковое продвижение |
|
inanchor: |
Поиск по анкорам входящих ссылок. Пример: inanchor:»seointellect» |
Полноценно не работает. |
define: |
Поиск документов, содержащих определение указанного слова. Пример: define:sem. |
Основные принципы работы поисковых систем: формулы
Каждая поисковая система применяет свои уникальные алгоритмы поиска и ранжирования страниц и сайтов, но при этом принципы работы у всех поисковиков одинаковые.
Процесс поиска информации, соответствующей запросу пользователя, состоит из нескольких этапов: сбора данных в Интернете, индексации сайтов, поиска по ключевым словам и ранжирования полученных результатов. Рассмотрим подробнее каждый этап.
- Сбор данных.
После того как сайт готов, нужно сделать так, чтобы роботы поисковой системы узнали о его появлении. Можно разместить внешние ссылки на ваш интернет-ресурс или воспользоваться другими способами. Как только робот зайдет на сайт, он станет собирать данные на каждой странице. Этот процесс называется crawling. Сбор информации с сайта происходит не только после его создания. Робот будет периодически просматривать интернет-ресурс, чтобы проверить актуальность информации и обновить имеющиеся данные.
И для вас, и для бота (робота) подобное взаимодействие должно быть взаимовыгодным и комфортным. Вы, как владелец сайта, заинтересованы в том, чтобы бот выполнял свою работу быстро, не перегружая сервер, при этом максимально полно собирал данные со всех страниц
Боту также важно сделать все как можно быстрее, чтобы перейти к сбору данных со следующего сайта в его списке. Со своей стороны, вы можете проверить, что сайт работает, нет проблем с навигацией, отсутствуют страницы, выдающие ошибку 404 и т
д.
- Индексация.
Даже если робот побывал на вашем сайте не один раз, это еще не означает, что интернет-ресурс мгновенно станет виден поисковой системе и будет появляться в выдаче. После сбора данных следующий этап процесса обработки сайта — его индексация (создание для каждой страницы инвертированного файла индекса). Индекс нужен для быстрого поиска. Как правило, он состоит из перечня слов из текста и сведений о них (позиции в тексте, вес и т. д.).
После завершения индексации сайт и отдельные страницы появляются в выдаче поисковика по поисковым запросам пользователей. Обычно процесс индексации не занимает много времени.
- Поиск информации.
На этом этапе осуществляется непосредственно поиск информации по поисковым запросам пользователей. Сначала поисковая система анализирует запрос, определяет вес каждого из ключевых слов. Затем ищет соответствия по инвертированным индексам, отбираются все документы в базе данных поисковика, отвечающие поисковому запросу.
Соответствие документа запросу определяется по специальной формуле:
similatiry(Q,D) = SUM(wqk * wdk),
где similatiry(Q,D) — схожесть запроса Q документу D; wqk — вес k-го слова в запросе; wdk — вес k-го слова в документе.
Документы, больше всего схожие с запросом пользователя, отражаются в поисковой выдаче.
- Ранжирование.
На последнем этапе поисковая система группирует полученные результаты таким образом, чтобы вначале пользователь видел ссылки на наиболее релевантные страницы. У каждого поисковика своя уникальная формула ранжирования, в которой учитывается влияние следующих параметров:
- веса страницы (индекс цитируемости, PageRank);
- авторитетности домена;
- релевантности текста запросу;
- релевантности текстов внешних ссылок запросу;
- а также множества других факторов ранжирования.
Для примера рассмотрим упрощенную формулу ранжирования:
Rа(x) = (m * Tа (x) + p * Lа (x)) * F(PRa),
Где Rа(x) — итоговое соответствие документа а запросу x, Tа(x) — релевантность текста (кода) документа а запросу x, Lа(x) — релевантность текста ссылок с других документов на документ а запросу x, PRа — показатель авторитетности страницы а, константа относительно х, F(PRa) — монотонно неубывающая функция, причем F(0) = 1, можно допустить, что F(PRa) = (1 + q * PRа), m, p, q — некие коэффициенты.
Таким образом, на место страницы в поисковой выдаче влияют различные факторы, которые как имеют отношение к поисковому запросу, так и никак с ним не связаны.
Вас также может заинтересовать: Проверка тИЦ сайта: 3 способа