Яндекс и первые шаги поиска

20.05.2013 Аналитика и юзабилити

segalovich.jpgИлья Сегалович, один из сооснователей Яндекса, провел встречу в Европейском университете Санкт-Петербурга и разобрал вопрос пользы лингвистики для поисковых систем, в частности - для разбора запроса пользователя.

Любой запрос, поступивший от пользователя, нужно не только правильно истолковать, но и определить основной посыл, чтобы предоставить максимально релевантную информацию. О том, как эта задача решается в Яндексе, и рассказал Сегалович в своём докладе.

Прежде всего, нужно помочь пользователю с набором запроса. Составление поисковых подсказок позволяет начать поиск с первых двух-трех букв, без ввода всей фразы. В Яндексе над этой задачей работает целая команда, следящая за актуальностью подсказок. Как правило, запросы пользователей не отличаются "оригинальностью", и все простые варианты вроде "скачать", "купить" и "цена" подбираются моментально.

подсказки.jpg

На следующем этапе пользователи делятся на несколько категорий, основываясь на истории поисковых сессий. Так, частому посетителю соцсетей будет по букве "в" предложен запрос "ВКонтакте", а меломанам - "Виктор Цой" или "Валерий Меладзе". Все возможные варианты разбиты на 400 тысяч категорий или интересов, и каждый из них имеет собственные шаблоны выдачи.

После завершения запроса необходимо определить язык, на котором он сделан. Для разных языков характерно использование разных символов, например, "i" и русские символы - для украинского. Также имеются шаблоны слов и последовательностей из них, позволяющие точно определить язык, а для точности дополнительно применяется геолокация по IP пользователя. В учет принимаются и язык, установленный в браузере и на странице поиска, и адрес страницы (Яндекс имеет несколько доменов в различных зонах). На основе этих данных выполняется построение классификатора, уникального для каждого языка, поэтому обработка запроса на разных языках ведется по-разному.

суржик.jpg

Яндекс экспериментировал с мультиязычной выдачей, например, для украинских пользователей. В проекте "Суржик" алгоритмы определяли, знаком ли посетитель с русским, и выводили для него результаты на обоих языках. Спустя год аналогичный проект был создан Google для Филиппин, объединив английскую и тагальскую (основной язык филиппинцев – тагальский) выдачу, однако массовым явлением подобные эксперименты не стали. 

 
Больше интересных статей

Оставьте номер телефона, чтобы наш менеджер связался с вами в удобное для вас время

Ваше имя*
Ваш номер телефона*
Тема для обсуждения
Выберите удобное время для звонка
9:00 9:15 9:30 9:45 10:00 10:15 10:30 10:45 11:00 11:15 11:30 11:45 12:00 12:15 12:30 12:45 13:00 13:15 13:30 13:45 14:00 14:15 14:30 14:45 15:00 15:15 15:30 15:45 16:00 16:15 16:30 16:45 17:00 17:15 17:30 17:45
Виды услуг
ОбзорМаксимальный размер файла - 10 мб