Про поиск, подсказки и полезные ягоды

в 11:17, , рубрики: Блог компании Яндекс, яндекс

Работая над качеством поиска, я стараюсь представлять себе людей, задающих в Яндекс всякие разные запросы. Кто они, как проходит их день, чем они интересуются. Зачем они у нас именно это спрашивают, какие ответы хотят получить. Это позволяет отвлечься от структур данных и математических моделей и тем самым уменьшает мои шансы постепенно превратиться в типичного сумасшедшего учёного.

Вот, например, запрос [голубика]. Почему-то мне сразу представляется бабушка, которой объяснили, что такое интернет и как в нём ищут всякие полезные штуки. Бабушка поправляет очки и указательным пальцем набирает название самой полезной штуки, которую знает, поглядывая то на экран, то в клавиатуру, после чего подводит мышь к кнопке «найти». Что она имеет в виду? Где достать голубику в большом городе, что из неё приготовить, или от каких болезней она спасает? Она нам не сказала.

Нехорошо заставлять бабушку искать нужный ей результат по всей странице или ждать, что она наберёт запрос снова, на этот раз с уточнениями. Ей, может, и в первый раз было непросто. Лучше, чтобы ей осталось только кликнуть мышкой. Работая над улучшением выдачи по расплывчатым, допускающим множество различных ответов запросам, я привык думать об этой воображаемой бабушке.

За основу для диалоговых подсказок мы взяли технологию «Спектр», которая автоматически анализирует миллиарды пользовательских сессий и кластеризует схожие поисковые паттерны. Чтобы удостовериться, что она правильно угадывает, какой выбор предложить пользователю, и умеет сформулировать его по-человечески, мы для тысяч запросов вручную отсматривали, какие кластеры пользовательских интересов формируются, исправляли алгоритм, чтобы устранить найденные недочеты, и повторяли этот процесс до тех пор, пока результат не стал нравиться нам самим. Постепенно мы стали понимать, что нечеткие запросы, предполагающие множество разных ответов — не исключение, а правило: их задают миллионы самых разных пользователей.

Вот, например запрос [include], предполагающий выбор из нескольких языков программирования. Вот запросы [Halo 3] и [7 привычек высокоэффективных людей]. А вот кто-то спрашивает у нас про [Мальдивы] и про [полёт на Луну].

Но я уже свыкся с образом бабушки, и расставаться с ним не хотелось. И тут мне вспомнилось, как лет десять назад я стоял на автобусной остановке в одном подмосковном наукограде. Рядом одна старушка жаловалась другой на молодёжь и объясняла, как вздорожали огурцы. Подошёл наш автобус, и, уже забираясь в него, я услышал, как на прощание старушка сказала соседке: «Ильинишна, ну так ты мне это, завтра файлы мылом скинь, значит, не забудь».

Может быть, я ничего не знаю о современных российских бабушках. Может быть, теперь бабушки уже не те, какими были в ХХ веке.

Может быть, наступило будущее.

.

Автор:

Поделиться

* - обязательные к заполнению поля