Поисковые системы будущего: тренировка на кошках

14.06.2013 Аналитика и юзабилити

Оригинал статьи был написан Томом Вандербильтом, журналистом из США. Он также ведет свой блог, где освещает новости науки, технологий и дизайна. Выпустил бестселлер "Traffic: Why We Drive the Way We Do (and What It Says About Us)".

Google-3.jpg

Как известно, в миллионах роликов YouTube главными героями выступают кошки. Найти подобные видео просто - достаточно вбить в поиск "кошки", и все загруженные файлы с соответствующим тегом появятся на странице результатов. Но что, если нас не устраивает найденное, а хочется увидеть вообще все видео с участием братьев наших меньших?

Давайте поможем YouTube найти всех кошек

Разумеется, при создании нейронной сети самостоятельного неконтролируемого обучения Google Джефф Дин не планировал искать именно кошек на YouTube. Однако эта система была обучена распознавать лица людей, и даже в том случае, если они не были упомянуты в тегах к видео. Алгоритм основывается на миллиардах параметров, а его сложность даже оценить тяжело - в обработке задействованы миллионы компьютеров. По словам Дина, система всего лишь имитирует часть зрительной коры мозга человека, где каждый нейрон "смотрит" на маленькую часть изображения. Входные данные - наборы пикселей и сопутствующие им математические функции, благодаря которым нейрон "узнает" аналогичные элементы. Нейроны бывают разные, с различным весом, для распознавания разных элементов.

Все нейроны объединены в некие слои. Если нижние слои занимаются грубым распознаванием конкуров объекта, то, с повышением уровня, распознаются все новые и новые свойства объекта. Дин привел в качестве примера мозг новорожденного - первое время он получает массу визуальных стимулов и лишь потом начинает различать объекты, деля их на паттерны. Именно лица становятся первичным объектом, который учатся распознавать младенцы.

Вскоре происходит формирование ассоциаций, например, повышение важности объекта при увеличении частоты его появления. В начале работы Google показали системе 10 млн кадров, взятых из различных роликов, находящихся на сервисе YouTube. Как позже выяснилось, нейроны начали четко идентифицировать кадры с лицами, которые часто встречали ранее, хотя до начала эксперимента система вообще не знала, на что похожи лица. Дин также показал, что нейроны обучали и на необычных объектах - несколько лиц были с заретушированными глазами, что заставило систему "задуматься". Напомним, что ключевыми сигналами о том, что объект - лицо, служат глаза, скулы, нос и овальная форма.

Некоторые нейроны стали более чувствительны к котам, так как этих животных на сделанных фотографиях также было немало. Система предположила, что, раз коты появляются и на других кадрах, то следует оптимизировать их распознавание в будущем. Именно это и является сутью поиска, и поэтому сам термин "неконтролируемое обучение" можно было бы перефразировать как "неконтролируемый поиск". Нейроны не просто ищут, но и самостоятельно распознают найденное, формируя алгоритмы для самих себя.

Дин также полагает, что нейронные сети можно обучить и для работы со словами, представив слова векторами в многомерном пространстве. Но, например, для представления в подобном пространстве слова "дельфин" понадобится 100-мерное пространство, что даже вообразить невозможно. Дин полагает, что со временем слова в этом пространстве будут сближаться, а расстояние между несвязанными друг с другом - увеличиваться. Благодаря множеству осей получится отдалять слова друг от друга, не меняя расстояния между другими словами, связанными с ними. В данном случае расстояние будет напрямую определять контекст и значимость одного объекта (слова) для другого.

Данное описание похоже на представленный Тимом Бернерсом-Ли семантический веб - "паутина данных, напрямую или косвенно обрабатываемых вычислительными устройствам". Однажды Грег Линден, создавший Findory и рекомендации для Amazon, заметил, что едва ли человечество попадет в семантический веб с детальными метками и описаниями страниц, однако приблизится к этому при помощи ИИ и систем распознавания естественной речи. По его мнению, Google решил пойти другим путем и сперва передать установку меток на веб-страницах в "руки" машин. В будущем Google будет проводить поиск на основе обширных знаний о взаимодействии пользователя с системой, что, в свою очередь, поможет совершенствовать Граф знаний и улучшать искусственный интеллект.

 
Больше интересных статей

Оставьте номер телефона, чтобы наш менеджер связался с вами в удобное для вас время

Ваше имя*
Ваш номер телефона*
Тема для обсуждения
Выберите удобное время для звонка
9:00 9:15 9:30 9:45 10:00 10:15 10:30 10:45 11:00 11:15 11:30 11:45 12:00 12:15 12:30 12:45 13:00 13:15 13:30 13:45 14:00 14:15 14:30 14:45 15:00 15:15 15:30 15:45 16:00 16:15 16:30 16:45 17:00 17:15 17:30 17:45
Виды услуг
ОбзорМаксимальный размер файла - 10 мб