Социальный поиск Facebook в деталях. Адаптация

10.04.2013 Соцсети

Начало статьи: 

Социальный поиск Facebook в деталях. Предпосылки

Социальный поиск Facebook в деталях. Тестирование и внедрение

Разработчики Unicorn подчеркнули, что их детище является мощной системой, способной невероятно ускорить процесс поиска для каждого пользователя.

В качестве примера привели индексацию пяти пользователей - Марка Цукерберга (fbid=4), Рэнди Цукерберг (fbid=13755), Марка Дэвида Джонсона (fbid=1001), Рэнди Джонсон (fbid=5542) и Дэвида Джонсона (fbid=10003).

Индексы, присвоенные пользователям, станут следующими:

mark > 4

zuck > 4

randi > 13755

zuck > 13755

mark > 1001

david > 1001

johnson > 1001

randi > 5542

johnson >5542

david > 10003

johnson > 10003

В графическом представлении:

Вертикальные линии являются списками взвешенных значений, или индексом fbid. Так, для профиля "mark" включены индексы 1001 и 4. Горизонтальные же линии описывают объекты, представляя, например, объект с fbid=4 как "mark" и "zuck". Аналогично проводится присвоение атрибутов всем другим профилям и связям.

Unicorn также занимается сопоставлением и поиском объектов:

единорог.png

(mark) относится ко всем профилям, где содержится имя "mark", поэтому все подобные пользователи получат присвоенный fbid=4 и 1001.

(david johnson) относится к профилям пользователей по имени "david" и по фамилии "johnson". При найденном совпадении узлы получат присвоенные fbid=1001 и 1003.

(zuck randi) относится к профилям, в которых содержится "zuck" или "randi", что позволит приписать к таким пользователям fbid 4, 5542, 13755.

Эта сетка и является основой для ранжирования объектов. Для обеспечения более релевантных результатов информация также сортируется с учетом даты создания, её важности и других свойств. Facebook также использует несколько запросонезависимых сигналов, обеспечивающих надежные показатели важности и ценности контента для конкретного пользователя.

Например, ввод в строку поиск имени и фамилии человека продемонстрирует сперва профили тех пользователей, которые каким-либо образом связаны с инициатором запроса. Таким образом, человек увидит не незнакомцев с подходящими именем и фамилией, а, скорее всего, тех, кого и хотел найти.

Для этого алгоритм имеет параметр static rank, являющийся фильтром, позволяющим находить важные для пользователя узлы в зависимости от его предпочтений.

Индексация учитывает все ограничения и особенности соцсети. Алгоритмы постоянно совершенствуются и развиваются, что обусловлено постоянным ростом Facebook. Каждый день в нём появляется более двух млрд. страниц с новым контентом и проставляется 2.7 млрд. "Like". Алгоритм поддерживает работу с постоянно обновляемыми данными и вносит в индекс каждую новую страницу сразу же при её появлении.

Еще несколько слов о Unicorn и социальном поиске Facebook можно услышать в официальном видеоролике.

 
Больше интересных статей

Оставьте номер телефона, чтобы наш менеджер связался с вами в удобное для вас время

Ваше имя*
Ваш номер телефона*
Тема для обсуждения
Выберите удобное время для звонка
9:00 9:15 9:30 9:45 10:00 10:15 10:30 10:45 11:00 11:15 11:30 11:45 12:00 12:15 12:30 12:45 13:00 13:15 13:30 13:45 14:00 14:15 14:30 14:45 15:00 15:15 15:30 15:45 16:00 16:15 16:30 16:45 17:00 17:15 17:30 17:45
Виды услуг
ОбзорМаксимальный размер файла - 10 мб