Яндекс (поисковая система)

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
(перенаправлено с «Yandex.ru»)
Яндекс Поиск

Скриншот программы Яндекс ПоискГлавная страница сайта
Тип поисковая система
Страна  Россия, Москва
Разработчик МКАО «Яндекс»
Языки интерфейса многоязычный
Первый выпуск 1997
Последняя версия «Y2» (28 ноября 2022)
Состояние активное
Ссылки
Сайт yandex.ru (до 12 сентября 2022 года; с 12 сентября 2022 года — dzen.ru)[a], ya.ru, яндекс.рф
yandex.com.tr (тур.)
yandex.com (англ.)
yandex.by (белор.)
yandex.kz (казах.)

«Я́ндекс» — поисковая система, принадлежащая российской корпорации «Яндекс», основной продукт компании.

Доля «Яндекс.Поиска» в целом составляет 49 % в Рунете (декабрь 2022 года), а на десктопах — 55,22%[2], 29 % в Белоруссии (декабрь 2022), 16 % в Казахстане (декабрь 2022), 10 % в Узбекистане (декабрь 2022)[3].

Функциональность

Илья Сегалович представляет новый поисковый механизм «Яндекса» «Острова»

Основная информация

Поисковая машина состоит из трёх основных компонентов[4]:

  • Агент — это поисковый робот. Он обходит сеть, скачивает и анализирует документы. В случае обнаружения новой ссылки при анализе сайта она попадает в список веб-адресов робота. Поисковые роботы бывают следующих типов: пауки (англ. Spider) — загружают сайты подобно браузерам пользователя; «путешествующие» пауки (англ. Crawler) — обнаруживают новые, ещё неизвестные ссылки на основе анализа уже известных документов; индексаторы — занимаются анализом обнаруженных веб-страниц и добавляют данные в индекс. Множество выкачанных документов разбивается на непересекающиеся части и очищается от разметки.
  • Индекс — база данных, собранная роботами-индексаторами поисковых машин. По индексу и осуществляется поиск документов.
  • Поисковый механизм.

Поисковый запрос от пользователя после анализа загруженности поисковой системы отправляется на наименее загруженный сервер[5][6]. Для обеспечения такой возможности серверы «Яндекса» объединены в кластеры и даже кластеры кластеров. Затем пользовательский запрос обрабатывается программой под названием «Метапоиск». Метапоиск осуществляет анализ запроса в реальном времени: определяет географическое положение пользователя, проводит лингвистический анализ и т. д. Также программа определяет, относится ли запрос к категории наиболее популярных или недавно заданных. Выдача на такие запросы некоторое время хранится в памяти (кэше) метапоиска, и в случае совпадения показываются заранее сохранённые результаты[6]. Если запрос является редким и совпадений в кэше не найдено, система перенаправляет его на программу «Базового поиска». Тот анализирует индекс системы, также разбитый по разным дублирующимся серверам (это ускоряет процедуру). Затем полученная информация снова попадает на метапоиск, данные ранжируются и показываются пользователю в готовом виде[5].

Индексирование

В целом «Яндекс» индексирует следующие типы файлов[7]: html, pdf, rtf, doc, xls, ppt, docx, odt, odp, ods, odg, xlsx, pptx.

Поисковая система способна также индексировать текст внутри объектов Shockwave Flash (если текст не помещён на само изображение), если эти элементы передаются отдельной страницей, имеющей MIME-тип application/x-shockwave-flash, и файлы с расширением .swf[8].

В «Яндексе» работают 2 сканирующих робота — «основной» и «быстрый». Первый отвечает за интернет в целом, второй индексирует сайты с часто меняющейся и обновляемой информацией (новостные сайты и информационные агентства). В 2010 году «быстрый» робот получил новую технологию под названием «Orange», разработанную совместно калифорнийским и московским подразделениями «Яндекса»[8].

В логах сервера роботы «Яндекса» представляются следующим образом[8][9]:

  • Mozilla/5.0 (compatible; YandexBot/3.0) — основной индексирующий робот.
  • Mozilla/5.0 (compatible; YandexBot/3.0; MirrorDetector) — робот, определяющий зеркала сайтов. Если найдутся несколько сайтов с одинаковым содержимым, в результатах поиска будет показан только один.
  • Mozilla/5.0 (compatible; YandexImages/3.0) — индексатор «Яндекс. Картинок».
  • Mozilla/5.0 (compatible; YandexVideo/3.0) — индексатор «Яндекс. Видео».
  • Mozilla/5.0 (compatible; YandexMedia/3.0) — робот, индексирующий мультимедийные данные.
  • Mozilla/5.0 (compatible; YandexBlogs/0.99; robot) — робот поиска по блогам, индексирующий комментарии постов.
  • Mozilla/5.0 (compatible; YandexAddurl/2.0) — робот, обращающийся к странице при добавлении её через форму «Добавить URL».
  • Mozilla/5.0 (compatible; YandexFavicons/1.0) — робот, индексирующий иконки сайтов (favicons).
  • Mozilla/5.0 (compatible; YandexDirect/3.0) — робот, индексирующий страницы сайтов, участвующих в «Рекламной сети „Яндекса“» (РСЯ).
  • Mozilla/5.0 (compatible; YandexDirect/2.0; Dyatel) — «простукивалка»[прояснить] «Яндекс. Директа».
  • Mozilla/5.0 (compatible; YandexMetrika/2.0) — робот «Яндекс. Метрики».
  • Mozilla/5.0 (compatible; YandexCatalog/3.0; Dyatel) — «простукивалка» «Яндекс. Каталога».
  • Mozilla/5.0 (compatible; YandexNews/3.0) — индексатор «Яндекс. Новостей».
  • Mozilla/5.0 (compatible; YandexAntivirus/2.0) — антивирусный робот «Яндекса».

С 2009 года «Яндекс» поддерживает технологию Sitemaps[8].

Поисковые запросы

Интерфейс «Яндекса» располагает довольно сложным языком запросов, позволяющим ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

Для настройки используются следующие символы-джокеры[10]:

  • "" — точная цитата
  • | — ставится между словами, если нужно найти одно из них
  • * — ставится между словами, если между ними пропущено какое-то слово
  • site: — поиск на определённом сайте
  • date: — поиск документов по дате, например, date:2007
  • + — ставится перед словом, которое обязательно должно присутствовать в документе
  • и др.

«Яндекс» автоматически, наряду с оригинальной «точной формой» запроса, ищет его различные вариации и формулировки[11].

Поиск «Яндекса» учитывает морфологию русского языка, поэтому вне зависимости от формы слова в поисковом запросе выдача будет производиться по всем словоформам. Если морфологический анализ нежелателен, можно перед словом поставить восклицательный знак (!) — поиск в этом случае покажет только конкретную форму слова. Кроме того, при поисковом запросе практически не учитываются так называемые стоп-слова, то есть предлоги, знаки препинания, местоимения и т. д., ввиду их большого распространения[4].

Как правило, автоматически раскрываются аббревиатуры, действует транслитерация (например, «Рено — Renault»), исправляется орфография. Также производится поиск по синонимам (мобильный — сотовый) и различным словоформам (Воронеж — воронежский). Расширение или нет исходного пользовательского запроса зависит от контекста. Расширение не происходит при наборе узкоспециальных терминов (к запросу «монтёрская кошка» не будет добавлено слово «кошачий»), имён собственных, названий компаний (к примеру, ОАО «Бегемот» — ОАО «Гиппопотам»), при добавлении слова «цена», в точных цитатах (это запросы, выделяемые машинописными кавычками)[11].

Защита от спама и вирусов

По состоянию на 2013 год «Яндекс» является самой безопасной поисковой машиной на планете и третьим по степени защищённости среди всех веб-ресурсов[12].

Проверка веб-страниц и предупреждение пользователей появились на «Яндексе» в 2009 году: с тех пор на странице результатов поиска рядом с опасным сайтом появляется пометка «Этот сайт может угрожать безопасности вашего компьютера»[13]. Для обнаружения угроз используются сразу две технологии. Первая куплена у американского антивируса «Sophos» и основана на сигнатурном подходе: то есть при обращении к веб-странице антивирусная система обращается к базе данных уже известных вирусов и вредоносных программ. Такой подход отличается высокой скоростью, но практически бессилен перед новыми вирусами, ещё не попавшими в базы данных. Поэтому «Яндекс» использует наряду с сигнатурным ещё и свой собственный антивирусный комплекс, основанный на анализе поведенческого фактора. Программа «Яндекса» при обращении к сайту проверяет, запрашивал ли последний у браузера дополнительные файлы, перенаправлял ли на посторонний ресурс и т. д. Таким образом, если получены данные, что сайт начинает выполнение неких действий (запускаются каскадные таблицы стилей, модули Java Script и полноценные программы) без ведома пользователя, он помещается в «чёрный список» и базу вирусных сигнатур[14]. Информация о заражении сайта появляется в результатах поиска, и через сервис «Яндекс.Вебмастер» соответствующее уведомление получает владелец сайта. После первой проверки «Яндекс» делает вторую, и если информация о заражении во второй раз подтвердится, проверки будут проходить чаще, пока угроза не будет устранена. Общее число заражённых сайтов в базе «Яндекса» не превышает 1 %[13].

Ежедневно в 2013 году «Яндекс» проверяет 23 млн веб-страниц (обнаруживая при этом 4300 опасных сайтов) и показывает пользователям 8 млн предупреждений[14]. Ежемесячно проверяется примерно миллиард сайтов[13].

Поисковая выдача и ранжирование

Поисковая выдача для каждого пользователя формируется индивидуально на основе его местоположения, языковых запросов, интересов и предпочтений по результатам предыдущих и текущей поисковой сессии[15]. Тем не менее, ключевым фактором при ранжировании поисковых результатов является их релевантность, соответствие поисковому запросу. Релевантность определяется на основе формулы ранжирования, которая постоянно обновляется на основе алгоритмов машинного обучения.

Долгое время ключевым фактором ранжирования у «Яндекса» было количество сторонних ссылок на конкретный сайт. Каждой странице в Интернете присваивался своеобразный индекс цитирования, аналогичный индексу для авторов научных статей: чем больше ссылок, тем лучше. Подобный механизм работал как в тИЦ «Яндекса», так и в PageRank поисковой системы Google. Тем не менее, в настоящий момент в целях предотвращения «накрутки» «Яндекс» применяет многофакторный анализ, из восьмисот факторов ранжирования которого на ссылочные приходится лишь 70. Сегодня гораздо бо́льшую роль играет содержание сайта и наличие-отсутствие там ключевых слов, удобство чтения текста, название домена и его история, наличие мультимедийного контента. 5 декабря 2013 года «Яндекс» объявил о полном отказе от учёта ссылочного фактора в будущем[16].

Поиск производится на русском, английском, французском, немецком, украинском, белорусском, татарском, казахском языках.


Результаты поиска можно отсортировать по релевантности и по дате (кнопки снизу поисковой выдачи).

Страница с результатами поиска состоит из 10 ссылок с короткими аннотациями — «сниппетами». Последний включают в себя текстовый комментарий, ссылку, адрес, популярные разделы сайта, страницы в соцсетях и пр.[17] В качестве альтернативы сниппетам «Яндекс» ввёл в 2014 году новый интерфейс под названием «Острова»[18].

В «Яндексе» реализован механизм «параллельных поисков», когда вместе поиском по вебу производится поиск по сервисам «Яндекса», таким, как Каталог, Новости, Маркет, Энциклопедии, Картинки и др. В результате в ответ на запрос пользователя система выдаёт не только текстовую информацию, но и ссылки на видеофайлы, картинки, словарные статьи и пр.[19].

Отличительной особенностью поисковика являются также технологии «интентного поиска» (от англ. intent — намерение, желание), то есть поиска, нацеленного на решение задачи[20]. Среди элементов такого поиска — наличие диалоговых подсказок при неоднозначном запросе, автоматический перевод текста, показ информации о характеристиках автомобиля и т. д. Для примера, при запросе «Борис Гребенщиков — Город золотой» система покажет форму для онлайн-прослушивания музыки из сервиса «Яндекс.Музыка», при запросе «ул. Королёва,12» будет показан фрагмент карты с отмеченным на ней объектом.

Информационные блоки между строкой запроса и результатами называются «колдунщиками». Полный их список:

Поисковые подсказки

По мере набора пользователем запроса в строке поиска поисковая машина предлагает подсказки в виде ниспадающего списка. Подсказки появляются ещё до перехода на страницу результатов поиска и позволяют уточнить запрос, исправить раскладку или опечатку или перейти сразу на искомый сайт. Для каждого пользователя подсказки формируются в том числе на истории его поисковых запросов (сервис «Мои находки»). В 2012 году появились так называемые «Умные поисковые подсказки», которые моментально выдают информацию об основных константах (длина экватора, скорость света и так далее), пробках на дорогах, и имеют встроенный калькулятор. Кроме того, в «подсказки» встроен переводчик (запрос «любовь по-французски» моментально выдаёт amour, affection), расписание и результаты футбольных матчей, курсы валют, прогноз погоды и другое. Можно узнать точное время запросом «который час». В 2011 году подсказки в поиске «Яндекса» стали полностью локальными для 83 регионов России.

Помимо собственно поиска, подсказки встроены в собственные поисковики «Яндекс. Словарей», «Яндекс. Маркета», «Яндекс. Карт» и других сервисов «Яндекса».

Функция является развитием технологии интентного поиска и впервые появился на «Яндекс.Баре» в августе 2007 года, а в октябре 2008 был внедрён на главной странице поисковика[21]. Доступен как в настольной, так и в мобильной версии сайта. «Яндекс» показывает своим пользователям более миллиарда поисковых подсказок в день[22].

Другое

Первоначальный логотип поисковика.

«Яндекс» предлагает ещё несколько видов поиска:

  • Дзен-Поиск — «медитативный поиск» «Яндекса». На данный момент закрыт, а по ссылке dzen.yandex.ru идёт перенаправление на Яндекс.Дзен
  • Расширенный поиск — позволяет ограничивать поисковую выдачу географией, языком, отдельным сайтом, расширением документов, последним обновлением, количеством результатов на странице.
  • Семейный поиск — поиск безопасного для детей содержимого.
  • Поиск для слабовидящих

Летом 2017 года в рамках совместного проекта Банка России и компании Яндекс в поисковой выдаче системы Яндекс появился специальный «маркер» (зелёный кружок с галочкой и надписью «Реестр ЦБ РФ»), информирующий потребителя о том, что на промаркированном сайте предлагаются финансовые услуги компании, которая имеет статус микрофинансовой организации.[23][24][25]

Логотип «Яндекса»

Логотип «Яндекса» может менять свой дизайн в честь некоторых памятных дат, к примеру, 75-летию Владимира Высоцкого был посвящён музыкальный логотип[26].

История

Историю поиска «Яндекса» можно условно разделить на три этапа. До 2005 года поисковые технологии «Яндекса» были эффективными, но достаточно простыми: можно было создать сайт, состоящий из сотен страниц, на которых нет ничего, кроме ключевых слов, и «Яндекс» такой сайт нормально ранжировал. Начиная примерно с 2005 года в Рунете активизировался поисковый спам, и вскоре стало очевидно, что он является реальной угрозой бизнесу компании, могущей за короткий срок свести популярность поискового сервиса на нет. Это привело к тому, что в «Яндексе» всерьёз задумались об улучшении технологий поиска, вложили в это направление много ресурсов. Наконец, с осени 2007 года «Яндекс» уделяет много внимания качеству поиска и проводит научные разработки в области поисковых технологий.[источник не указан 3837 дней]

Изменения в поисковой машине долгое время широко не афишировались и оставались безымянными. И лишь с начала 2008 года, когда было объявлено о запуске алгоритма 8 SP1, «Яндекс» заявил о том, что впредь новые алгоритмы ранжирования будут носить названия городов[27].

1990-е

Дизайн «Яндекса» в декабре 1998 года.

Поисковая система yandex.ru была анонсирована компанией CompTek 23 сентября 1997 года[28] на выставке Softool, хотя отдельные разработки в области поиска (индексация Библии, поиск документов на CD-ROM, поиск по сайту) проводились компанией ещё раньше.

Название системы — «Яндекс», «Яndex», — придумали вместе Аркадий Волож и Илья Сегалович[29].

Слово расшифровывалось как yet another indexer («ещё один индексатор; очередной индексатор») или как «Языковой Индекс». По трактовке Артемия Лебедева, название поисковика созвучно «Яньдекс», где ян — мужское начало[30]. Согласно ещё одной версии, название «Яndex» произошло от слова «Index» путём замены первой буквы[29].

Первый индекс содержал информацию по 5 тыс. серверов и занимал 4,5 ГБ[31].

В том же 1997 году поиск «Яндекса» стал использоваться в русскоязычной версии Internet Explorer 4.0[32]. Стало возможным задавать запрос на естественном языке[33].

В 1998 году появилась функция «найти похожие документы» для каждого результата поиска[34].

«Яндекс. Поиск» по состоянию на 1998 год работал на трёх машинах, работавших на FreeBSD под Apache: одна машина обходила Интернет и индексировала документы, одна машина поисковая и одна машина дублировала поисковую машину[35].

В 1999 году появился поиск в категориях — поиск, сочетание поисковой системы и каталога[36]. Обновлена версия поисковой машины[37].

2000

6 июня 2000 года была представлена вторая версия поисковика[38].

Был внедрён механизм параллельного поиска, когда наряду с выдачей из веба предлагается информация из крупных источников. Пользователи получили возможность ограничить поисковую выдачу выбранной темой. Появилась рубрика «Популярные находки» — слова, уточняющие поиск[39].

К декабрю 2000 года объём проиндексированной информации достиг 355,22 Гб[40].

2001

2001 год стал для «Яндекса» значимым, поскольку тогда он обогнал другой российский поисковик, «Рамблер», по посещаемости и с тех пор является ведущей поисковой системой Рунета[41].

«Яндекс» стал понимать запросы на естественном языке, заданные в вопросительной форме. Система научилась распознавать опечатки и предлагать исправлять их. Изменился дизайн[42].

2002

Количество ежедневных запросов к поисковой машине «Яндекс» превысило 2 млн[43].

2003

Запущена индексация документов .rtf и .pdf[44]

Результаты поиска стали выдаваться в том числе и в формате XML[45].

2004

Изменился алгоритм ранжирования[46].

Стартовала индексация документов в формате .swf («флэш»)[47], .xls и .ppt[48].

В конце года было выложено в открытый доступ исследование «Некоторые аспекты полнотекстового поиска и ранжирования в Яндекс» (авторы Илья Сегалович, Михаил Маслов), раскрывшее отдельные детали ранжирования в поисковике[49].

2005

Летом был запущен так называемый «быстрый» поисковый робот, работающий параллельно с основным и предназначенных для индексации актуальных страниц. База «быстрого робота» обновляется каждые 1,5—2 часа[50].

Был усовершенствован алгоритм ранжирования для увеличения точности поиска[51].

Возможности поиска были расширены с помощью сервисов «Яндекс. Словари» и «Яндекс. Lingvo». Поисковик научился понимать запросы типа «как [что-то] по-испански» и автоматически переводить их.

Стало возможным ограничить поисковую выдачу по региону[52].

2006

С мая 2006 в результатах поиска стали отображаться пиктограммы сайтов[53].

В начале декабря рядом с каждой ссылкой в выдаче появился пункт «Сохранённая копия», кликнув по которой, пользователь переходит на полную копию страницы в отдельной архивной базе («Яндекс-кэш»)[54].

Появилась геоклассификация сайтов[55].

2007

Был изменён алгоритм ранжирования[56].

с 2008 года

В 2008 году компания «Яндекс» впервые стала открыто объявлять об изменениях в поисковом алгоритме и давать им имена:

Чтобы изменения не дезориентировали пользователей, Яндекс с лета прошлого года начал их анонсировать. Загвоздка в том, как эти изменения называть, ведь к дате привязываться неудобно. Решили давать новым программам названия российских городов.[57]

Название «города» каждого следующего алгоритма начинается на ту букву, на которую оканчивалось название предыдущего[58].

История версий «Яндекс. Поиска»
Изображение Название Дата выпуска Описание
Версия 7 2 июля 2007 года Изменения в алгоритме ранжирования[59].
Версия 8 20 декабря 2007 года Улучшен поиск адресов сайтов (например, запрос [студия Лебедева] подразумевает адрес www.artlebedev.ru), снижено влияние ссылочных накруток, лучше стал восприниматься тип запроса[56].
8sp1 17 января 2008 года[57]
«Магадан» 17 января 2008 года Вдвое увеличено число факторов ранжирования, улучшена обработка многословных запросов, поисковая система научилась понимать аббревиатуры[60], транслитерации, некоторые типы переходов из одной части речи в другую («гамбург» -> «гамбургский»)[61]. Изменён механизм работы с русскоязычными текстами, запущен поиск текстов с дореволюционной орфографией, увеличена точность распознавания фамилий и географических названий[62][63]. Появились «колдунщики» — информационные блоки между поисковой выдачей и результатами поиска; улучшена скорость поиска по запросам, по которым находится большое число документов[64]. С целью поддерджки и тестирования алгоритма был создан сайт buki.yandex.ru
«Магадан» 2.0 2 июля 2008 года Нововведения в алгоритме ранжирования: улучшено распознавание уникальных документов, введение классификатора коммерциализированности и геоклассификатора и др[65].
«Находка» 11 сентября 2008 года Изменился учёт стоп-слов (слов, не несущих, по мнению поисковой машины, никакой смысловой нагрузки — цифры, местоимения и междометия, знаки препинания и т. д.) и разработан новый алгоритм машинного обучения, расширен тузаурус[66].
«Арзамас»
(ранее назывался «Анадырь»)
10 апреля 2009 года Улучшено понимание морфологии русского языка путём разрешения неоднозначности слов в запросах и понимания омонимов[67]. Поиск стал учитывать регион пользователя; несмотря на то, что возможность ограничить выдачу сайтами определённого региона появилась раньше, теперь система пытается сама определить, нужно ли в данном конкретном случае ограничивать выдачу по географии или нет. Местоположение пользователя вычисляется по IP-адресу, но его также можно задать вручную. Специально настроенная формула ранжирования есть для Москвы и Санкт-Петербурга, а также для некоторых стран СНГ[55]. Улучшено понимание запросов, в которых необходим показ картинок, сами картинки теперь показываются в информере над поисковой выдачей.
«Арзамас» 1.1 17 июня 2009 года[68]
«Арзамас» 1.2 17 июля 2009 года Улучшен классификатор геозависимости запросов[69].
«Арзамас» 1.3 20 августа 2009 года Улучшен классификатор геозависимости запросов[70].
«Арзамас+16» 31 августа 2009 года Региональное ранжирование для ещё 16 городов России (Новосибирск, Красноярск, Омск, Ростов-на-Дону, Краснодар, Нижний Новгород, Уфа, Пермь, Казань, Самара, Челябинск, Владивосток, Кемерово, Иркутск, Барнаул и Воронеж)[71].
«Арзамас» 1.5 23 сентября 2009 года Улучшенная общая формула ранжирования[72].
«Арзамас» 1.5 SP1 28 сентября 2009 года Улучшенная региональная формула ранжирования вдобавок к анонсированной в версии 1.5 общей формуле[73].
«Снежинск» 17 ноября 2009 года Заработал новый механизм машинного обучения — «Матрикснет», учитывающий тысячи параметров при поисковом ранжировании и отличающийся высокой скоростью работы[74][75].
АГС-17 вторая половина 2009 года Алгоритм, направленный на ограничение присутствия в выдаче некачественных сайтов, ориентированных в первую очередь на продажу ссылок[76].
АГС-30 18 декабря 2009 года Алгоритм, направленный на ограничение присутствия в выдаче некачественных сайтов, ориентированных в первую очередь на продажу ссылок[76].
«Конаково» 22 декабря 2009 года Обновлённая версия «Снежинска». Внедрено локальное ранжирование для 1250 городов России (в «Арзамасе» региональный поиск работал для 19 регионов), ещё шире используются возможности технологии «Матрикснет»[77].
«Снежинск» 1.1 10 марта 2010 года Улучшена общая формула ранжирования для пользователей из России по геонезависимым запросам.
Поиск для Белоруссии 14 апреля 2010 года Открыт портал www.yandex.by с новым механизмом поискового ранжирования, основанным на алгоритме «Матрикснет»[78].
Поиск по мировому интернету 19 мая 2010 года Открытие сайта www.yandex.com и возможности на основном портале поиска только по зарубежным страницам[79].
«Полтава» 27 июля 2010 года Геоориентированный поиск для Украины; построен на технологии «Матрикснет»[80].
Поиск для Республики Татарстан 30 июня 2010 года Версия на татарском языке, которая использует региональную формулу ранжирования[81].
«Обнинск» 6 августа 2010 года[82] Улучшено ранжирование для геонезависимых запросов в России, выросла сложность формулы ранжирования[83].
«Краснодар» 15 декабря 2010 года Запущена поисковая технология «Спектр», в которой улучшено определение неявно сформулированных запросов пользователей (например, в случае многозначных запросов, таких, как «аквариум» [ёмкость] и «аквариум» [музыкальная группа], система выстраивает поисковую выдачу на основе статистических данных о предпочтениях большинства пользователей)[84].
«Рейкьявик» 17 августа 2011 года Персонализация на основе языковых предпочтений: для пользователей, чаще ищущих англоязычные документы, поисковая система будет отдавать предпочтение сайтам именно на этом языке (алгоритм персонализирует выдачу только на английском)[85].
«Калининград» 12 декабря 2012 года Технология персонализированного поиска: поисковая машина старается определить каждого конкретного пользователя на основе его поискового поведения[20]. В целом каждый пользователь на основе истории запросов относится к одному из определённых системой 400 000 типов и по мере изменения предпочтений может переходить от одного поведенческого типа к другому[15].
«Острова» 16 мая 2013 года Интерфейс поисковой выдачи в виде отдельных интерактивных блоков с возможностью предпросмотра[86].
«Дублин» 30 мая 2013 года Персонализированная поисковая выдача на основе сиюминутных предпочтений пользователя[87].
АГС-40 6 ноября 2013 года Алгоритм, направленный на ограничение присутствия в выдаче некачественных сайтов, ориентированных в первую очередь на продажу ссылок[88].
Объектный ответ апрель 2015 года Семантическая поисковая технология.
«Минусинск» 15 мая 2015 года Алгоритм, направленный на пессимизацию сайтов, закупающих платные SEO-ссылки[89].
«Владивосток» 2 февраля 2016 года Введена новая формула ранжирования, учитывающая пригодность веб-страниц для мобильных устройств. Теперь при работе через смартфоны оптимизированные для них сайты будут располагаться в поисковой выдаче выше[90].
«Палех» 2 ноября 2016 года За сопоставление смысла запросов и документов отвечает поисковая модель на основе нейронных сетей[91].
«Баден-Баден» 22 марта 2017 года Новый алгоритм определения переоптимизированных текстов[92].
Королёв 22 августа 2017 года Новый алгоритм поиска с использованием нейронной сети.[93]

2017

В сентябре 2017 года «Яндекс» отметил свой 20 день рождения. По этому случаю в офис «Яндекса» приехал Президент РФ В. В. Путин.

Значение «Яндекса»

Состояние, когда местные поисковые компании не уступают американским брендам, является в мире почти уникальным, если не учитывать опыт Китая, где Google в 2010 году был заблокирован, взламываются почтовые ящики правозащитников, а местные провайдеры часто перенаправляют адрес www.google.cn на сайт Baidu[41][94]. Россия является единственной страной в мире, за исключением США, которой удалось без протекционистских мер создать более одной успешной поисковой технологии с заметной долей рынка (см. также «Рамблер»)[95].

По словам медиа-эксперта Михаила Гуревича, «Яндекс» — «национальное достояние», «стратегический продукт»[96].

Данный факт осознали и в Государственной Думе Российской Федерации, где в мае 2012 года появился законопроект, в котором «Яндекс» и «ВКонтакте» признаются стратегическими предприятиями как общенациональные трансляторы информации[97]. Ещё в 2009 году Президент России Дмитрий Медведев инициировал покупку «Сбербанком» «золотой акции» «Яндекса» с целью избежать попадания предприятия общегосударственной важности в руки иностранцев[98].

В 2012 году «Яндекс» обогнал «Первый канал» по численности ежедневной аудитории, что сделало российский интернет-гигант лидером отечественного медиарынка[97]. В 2013 году «Яндекс» подтвердил этот статус, обогнав «Первый» по выручке[99].

В 2008 году «Яндекс» был девятым поисковиком в мире[100], в 2009 — седьмым[101], в 2013 — четвёртым[102].

Одной из составляющих такого положения служит наличие в России достаточного количества математически подкованных специалистов, обладающих научным чутьём[103][104]. Имеет значение языково-культурный барьер[29].

Россия — одна из немногих стран, у которых есть собственный поисковик, занимающий первое место в стране, есть свои соцсети, держащие первенство. […] В ближайшие 3—5 лет иностранцы смогут претендовать только на третье-четвёртое места[105].

К 2002 году слово «Яndex» стало настолько общеупотребительным, что, когда компания Аркадия Воложа потребовала вернуть ей домен yandex.com, выкупленный третьими лицами, ответчик заявил, что слово «Яндекс» является уже синонимом справочника и стало нарицательным[106].

С осени 2012 года поисковая система «Яндекс» обогнала по числу пользователей Google на браузере Google Chrome в России.[107][108][109].

Прочие поисковые услуги

  • Помимо собственно веб-поиска, компания «Яндекс» ищет по картинкам, блогам, видео, картам, новостям, персоналиям, товарам и т. д.
  • В течение некоторого времени «Яндекс» предлагал программу «Персональный поиск» для локального поиска на ПК пользователя.

Примечания

Комментарии
  1. С 12 сентября 2022 года происходит автоматическое перенаправление на dzen.ru в рамках сделки «Яндекса» по продаже компании VK сервисов «Дзен» и «Новости»[1].
Источники
  1. С бывшей главной страницы «Яндекса» началась переадресация на «Дзен». rbc.ru (12 сентября 2022).
  2. Как в 2022 году изменились доли «Яндекса» и Google в России и мире
  3. https://www.cossa.ru/news/316748/ Исследование digital-рынков Беларуси, Казахстана, Узбекистана: Wunder Digital
  4. 4,0 4,1 Абрамзон Михаил. Яндекс для всех. — СПб.: БХВ-Петербург, 2007. — 544 с. — ISBN 978-5-9775-0144-6.
  5. 5,0 5,1 Технологии Яндекса. tech.yandex.ru. Дата обращения: 11 декабря 2018.
  6. 6,0 6,1 Архитектура ответа на вопрос. Компания Яндекс. Дата обращения: 11 декабря 2018.
  7. По данным страницы «Расширенного поиска»
  8. 8,0 8,1 8,2 8,3 Поисковая система Яндекс (копия Архивная копия от 27 октября 2018 на Wayback Machine)
  9. Помощь вебмастеру - Вебмастер. Помощь. yandex.ru. Дата обращения: 11 декабря 2018.
  10. Частые вопросы в Яндекс.Поиске. Поиск. Помощь. Дата обращения: 11 декабря 2018.
  11. 11,0 11,1 Искусство понимать с полуслова. Расширение запроса в Яндексе. habr.com. Дата обращения: 11 декабря 2018.
  12. Американские эксперты: Google в шесть раз опаснее, чем «Яндекс». CNews.ru. Дата обращения: 11 декабря 2018.
  13. 13,0 13,1 13,2 Антивирусные технологии. Компания Яндекс. Дата обращения: 11 декабря 2018.
  14. 14,0 14,1 Безопасность в интернете: вирусы. www.comss.info. Дата обращения: 11 декабря 2018.
  15. 15,0 15,1 Персональный поиск. Компания Яндекс. Дата обращения: 11 декабря 2018.
  16. Не на кого сослаться. Lenta.ru (11 декабря 2013). Дата обращения: 11 декабря 2018.
  17. «Острова» Яндекса: техническая сторона и API. habr.com. Дата обращения: 11 декабря 2018.
  18. Высадка на острова. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  19. Что вы знаете про параллельные поиски?. Блог Яндекса. Дата обращения: 11 декабря 2018.
  20. 20,0 20,1 Яндекс дает персональный ответ. Компания Яндекс (12 декабря 2012). Дата обращения: 11 декабря 2018.
  21. Яндекс понимает пользователя с полуслова. Компания Яндекс (15 октября 2008). Дата обращения: 11 декабря 2018.
  22. Поисковые подсказки. Компания Яндекс. Дата обращения: 11 декабря 2018.
  23. Событие. Банк России. Дата обращения: 28 июня 2017.
  24. «Яндекс» начал маркировать микрофинансовые организации в рамках проекта ЦБ, Рамблер (28 июня 2017). Дата обращения 28 июня 2017.
  25. Центробанк начал маркировать в Интернете легальные МФО, Банки.ру. Дата обращения 28 июня 2017.
  26. «Яндекс» посвятил Высоцкому музыкальный логотип. Lenta.ru (25 января 2013). Дата обращения: 11 декабря 2018.
  27. Эволюция поисковых алгоритмов «Яндекса» (копия копия Архивная копия от 18 ноября 2018 на Wayback Machine)
  28. История. Компания Яндекс. Дата обращения: 11 декабря 2018.
  29. 29,0 29,1 29,2 Аналитическая программа «Рунетология» // Сооснователь и директор по технологиям и разработке компании «Яндекс» Илья Сегалович (Текст (копия Архивировано 20 июля 2017 года.))
  30. Яндекс: найдётся всё Архивная копия от 25 октября 2012 на Wayback Machine (копия Архивная копия от 25 октября 2012 на Wayback Machine)
  31. Яндекс: прошлое, настоящее, будущее.... all-forum.ru. Дата обращения: 11 декабря 2018.
  32. Yandex.ru становится стандартным средством поиска в русскоязычной версии Internet Explorer 4.0 (недоступная ссылка). Дата обращения: 3 марта 2013. Архивировано 9 сентября 2011 года.
  33. Новое лицо yandex.ru. Естественно-языковый запрос.. Компания Яндекс (18 ноября 1997). Дата обращения: 11 декабря 2018.
  34. Портрет от yandex.ru. Поиск "по аналогии".. Компания Яндекс (14 января 1998). Дата обращения: 11 декабря 2018.
  35. Как раскрутить проект в Интернете. Реклама в Интернет на примере рекламных возможностей поисковой машины Яndex.ru. citforum.ru. Дата обращения: 11 декабря 2018.
  36. Yandex.Ru - теперь категорически!. Компания Яндекс (2 августа 1999). Дата обращения: 11 декабря 2018.
  37. Star Wars. Новый Яndex — Борьба с хаосом (недоступная ссылка). Дата обращения: 3 марта 2013. Архивировано 30 июня 2011 года.
  38. Три поисковика Рунета, не считая Google (недоступная ссылка). Дата обращения: 3 марта 2013. Архивировано 7 апреля 2014 года.
  39. Yandex - новая версия поисковой машины. Компания Яндекс (6 июня 2000). Дата обращения: 11 декабря 2018.
  40. Yandex в 2000 году Архивная копия от 28 марта 2014 на Wayback Machine (копия Архивная копия от 28 марта 2014 на Wayback Machine)
  41. 41,0 41,1 Бороться и искать (англ.). Forbes.ru (3 апреля 2008). Дата обращения: 11 декабря 2018.
  42. Новый поиск Яндекса. Точность - вежливость королей.. Компания Яндекс (23 мая 2001). Дата обращения: 11 декабря 2018.
  43. Количество ежедневных запросов к поисковой машине Яндекс превысило 2 миллиона. Компания Яндекс (12 апреля 2002). Дата обращения: 11 декабря 2018.
  44. Яндекс копает глубже. Компания Яндекс (20 февраля 2003). Дата обращения: 11 декабря 2018.
  45. Яндекс предоставляет результаты поиска в формате XML. Компания Яндекс (13 ноября 2003). Дата обращения: 11 декабря 2018.
  46. Новый алгоритм ранжирования. Компания Яндекс (26 марта 2004). Дата обращения: 11 декабря 2018.
  47. Яндекс индексирует Flash. Компания Яндекс (29 сентября 2004). Дата обращения: 11 декабря 2018.
  48. Яндекс индексирует XLS и PPT. Компания Яндекс (16 декабря 2004). Дата обращения: 11 декабря 2018.
  49. Yandex ludens. Библиотека I2R. Дата обращения: 11 декабря 2018.
  50. Теперь мы индексируем быстрее!. Блог Яндекса. Дата обращения: 11 декабря 2018.
  51. А у нас новое ранжирование результатов поиска. Блог Яндекса. Дата обращения: 11 декабря 2018.
  52. Регионы на расширенном поиске. Блог Яндекса. Дата обращения: 11 декабря 2018.
  53. Вот мы взяли краски в руки!. Блог Яндекса. Дата обращения: 11 декабря 2018.
  54. Смотрите найденные слова в сохраненной копии. Блог Яндекса. Дата обращения: 11 декабря 2018.
  55. 55,0 55,1 Арзамас-2. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  56. 56,0 56,1 Что случилось 20 декабря?. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  57. 57,0 57,1 Позови меня тихо по имени.... Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  58. С начала года зарплата региональных чиновников в стране выросла на 12,8%. 39.ru. Дата обращения: 11 декабря 2018.
  59. Изменения в алгоритме ранжирования «Яндекса»
  60. Подлетая к "Магадану". Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  61. Расширение запросов
  62. «Яндекс» для вебмастеров — «Магадан»
  63. "Магадан". Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  64. Прюнинг. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  65. Магадан 2.0. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  66. Находка. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  67. Арзамас. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  68. Тестируйте Арзамас 1.1: новая формула для России. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  69. Тестируйте Арзамас 1.2 c новым классификатором гео-зависимости запросов. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  70. Арзамас 1.2 c новым классификатором -- на www.yandex.ru. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  71. Тестируйте Арзамас+16. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  72. Арзамас 1.5 -- тестируйте новую общую формулу. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  73. Тестируйте Арзамас 1.5 SP1 -- улучшенную региональную формулу. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  74. Снежинск на www.yandex.ru. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  75. Машинное обучение улучшило «Яндекс». www.nnre.ru. Дата обращения: 11 декабря 2018.
  76. 76,0 76,1 АГС-30. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  77. Поиск Яндекса в каждом городе. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  78. Яндекс для Беларуси. Компания Яндекс (14 апреля 2010). Дата обращения: 11 декабря 2018.
  79. Яндекс ищет по мировому интернету. Компания Яндекс (19 мая 2010). Дата обращения: 11 декабря 2018.
  80. Поиск Яндекса в каждом регионе Украины. Компания Яндекс (27 июля 2010). Дата обращения: 11 декабря 2018.
  81. Yandex.ru для Республики Татарстан. Компания Яндекс (30 июня 2010). Дата обращения: 11 декабря 2018.
  82. Тестируйте «Обнинск» — новое ранжирование для гео-независимых запросов в России. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  83. «Обнинск» — новое ранжирование для гео-независимых запросов в России. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  84. Поиск Яндекса угадывает желания. Компания Яндекс (15 декабря 2010). Дата обращения: 11 декабря 2018.
  85. Рейкьявик — новая поисковая платформа Яндекса. Компания Яндекс (17 августа 2011). Дата обращения: 11 декабря 2018.
  86. «Острова»: интерактивные ответы в результатах поиска. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  87. Новый персональный поиск Яндекса. Компания Яндекс (30 мая 2013). Дата обращения: 11 декабря 2018.
  88. АГС-40. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  89. Новый этап в борьбе со ссылочным спамом. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  90. Как важно быть мобильным. Блог Яндекса. Дата обращения: 11 декабря 2018.
  91. Алгоритм «Палех»: как нейронные сети помогают поиску Яндекса. Блог Яндекса. Дата обращения: 11 декабря 2018.
  92. Баден-Баден - новый алгоритм определения переоптимизированных текстов. Блог Яндекса для вебмастеров. Дата обращения: 11 декабря 2018.
  93. Поиск, который мы делаем вместе. Блог Яндекса (22 августа 2017). Дата обращения: 22 августа 2017.
  94. В Китае заблокированы поисковые сервисы Google. habr.com. Дата обращения: 11 декабря 2018.
  95. «Яндекс» попрощался с «Рамблером». www.sfors.ru. Дата обращения: 11 декабря 2018.
  96. Интервью / Яндекс вышел на 4-е место среди глобальных поисковиков Россия вошла в ТОР-5 по венчурному финансированию Никита Белых стал самым читаемым в интернете губернатором / Михаил Гуревич, Григорий Бакунов. Эхо Москвы. Дата обращения: 11 декабря 2018.
  97. 97,0 97,1 «Яндекс» и «ВКонтакте» признают стратегическими предприятиями. При чём тут стартапы?
  98. Все нашёл. Коммерсантъ (3 декабря 2012). Дата обращения: 11 декабря 2018.
  99. «Яндекс» — крупнейшее медиа страны в этом году
  100. «Яндекс» — девятый поисковик мира. habr.com. Дата обращения: 11 декабря 2018.
  101. Яндекс – седьмой поисковик в мире. Searchengines.ru (1 апреля 2011). Дата обращения: 11 декабря 2018.
  102. «Яндекс» обогнал Microsoft по числу поисковых запросов. Ведомости (7 февраля 2013). Дата обращения: 11 декабря 2018.
  103. Руководитель Google Россия Владимир Долгов/ Аналитическая программа «Рунетология». PodFM.ru. — «В. ДОЛГОВ: Что значит повезло? России не повезло, что в ней появился „Яндекс“, потому что Россия — это страна, в которой есть достаточно хорошие специалисты, особенно в области разработки программного обеспечения. То, что в России появился „Яндекс“ — это следствие той системы образования, которая была в стране, и надеюсь, есть до сих пор.». Дата обращения: 11 декабря 2018.
  104. Почему на интернет-рынке России доминируют локальные компании? (недоступная ссылка). SearchEngines.ru (21 мая 2012). Дата обращения: 3 марта 2013. Архивировано 15 сентября 2012 года.
  105. Не Facebook`ом единым...: Голос России (21 июля 2011). Дата обращения: 3 марта 2013. Архивировано 15 сентября 2012 года.
  106. Что нашлось у «Яндекса». Коммерсантъ (20 января 2003). Дата обращения: 11 декабря 2018.
  107. Пользователи Google Chrome выбирают Яндекс. megaseo.ru. Дата обращения: 11 декабря 2018.
  108. «Яндекс» обогнал Google внутри браузера Chrome (недоступная ссылка). Дата обращения: 3 марта 2013. Архивировано 23 мая 2013 года.
  109. "Яндекс" вписался в браузер конкурента. Ведомости (12 апреля 2013). — «Впрочем, даже среди пользователей Chrome самым популярным поисковиком уже несколько месяцев является „Яндекс“: на неделе, завершившейся 7 апреля, он обработал 52,9 % всех поисковых запросов внутри Chrome». Дата обращения: 11 декабря 2018.

Литература

Ссылки

Статьи и интервью