Рубрика «поисковые технологии» - 10

Инфраструктура А-Б-экспериментов в большом Поиске. Доклад Яндекса

2019-09-03 в 8:06, admin, рубрики: yql, YT, аналитика, Блог компании Яндекс, БЭМ, интерфейсы, логи, метрики а/б-тестирование, поиск яндекса, поисковые технологии, Тестирование веб-сервисов, фронтенд, эксперименты

А/Б-тестирование — мощный способ проверки интерфейсов перед публикацией на всю аудиторию. Я решил рассказать, из чего этот инструмент состоит, какие у него особенности логирования, как составляются метрики и в чем суть экспериментов во фронтенде. Поговорим об их устройстве и сервисах для решения ежедневных аналитических задач. Обсудим несколько путей развития для разработчика, который вроде бы всё уже умеет, но хочет больше.

— Меня зовут Лёша, я работаю в Поиске и разрабатываю самый главный, наверное, продукт Яндекса — поисковую выдачу.

Читать полностью »

Как работают поисковые системы

2019-08-27 в 7:00, admin, рубрики: Блог компании Яндекс, математика, поисковые системы, поисковые технологии

Мы разбирали старые письма и наткнулись на статью, которую писал Илья Сегалович iseg для журнала «Мир Internet» в далёком 2002 году. В ней он сравнивает интернет и поисковые системы с чудесами света, размышляет о поисковых технологиях и вспоминает их историю. Несмотря на загруженность по работе, Илья написал статью в рекордные сроки и даже снабдил достаточно подробным словарём терминов, который особенно интересно читать в наши дни. Нам не удалось найти электронную версию журнала со статьей, поэтому сегодня мы публикуем её в нашем блоге, основателем и первым автором которого, к слову, был Илья.

Как работают поисковые системы - 1

Читать полностью »

«Яндекс» показал, какими словами ищут забытые фильмы

2019-08-21 в 16:22, admin, рубрики: поисковые технологии, фильмы, яндекс

«Яндекс» показал, какими словами ищут забытые фильмы - 1

Свиньи… родители… девочка…
Влюбляться… операционная система… мужчина…
Спасать… конец света… космонавты...

Это ключевые слова, по которым пользователи «Яндекса» пытаются найти фильм, название которого они забыли. Поисковик опубликовал интересное исследование на эту тему. Оно включает слова и фразы, которые наиболее часто используются для поиска конкретных фильмов (нецензурная лексика удалена).

Три фильма вверху: «Унесённые призраками» (2001), «Она» (2013), «Армагеддон» (1998).
Читать полностью »

Фильм, в котором был грунт. Исследование Яндекса и краткая история поиска по смыслу

2019-08-21 в 7:02, admin, рубрики: Блог компании Яндекс, исследование, Исследования и прогнозы в IT, королев, машинное обучение, палех, поиск, поисковые технологии, фильмы, яндекс

Иногда люди обращаются к Яндексу, чтобы найти фильм, название которого вылетело из головы. Описывают сюжет, запомнившиеся сцены, яркие детали: например, [как называется фильм там где мужик выбирает красная или синяя таблетка]. Мы решили изучить описания забытых фильмов и выяснить, что сильнее всего запоминается людям в кино.

Сегодня мы не только поделимся ссылкой на наше исследование, но и вкратце расскажем о том, как развивался семантический поиск Яндекса. Вы узнаете, какие технологии помогают поиску находить ответ даже тогда, когда точно сформулировать запрос просто не получается.

А ещё мы добавили слайдеры-загадки с примерами реальных запросов людей — почувствуйте себя поисковой системой и попробуйте угадать ответ.

Читать полностью »

Как попасть в топ Google в ЕС-США в нише разработки и найти клиентов с большими бюджетами

2019-08-16 в 6:10, admin, рубрики: Google, seo, seo оптимизация, аутсорс, аутсорсинг, аутсорсинг разработки, интернет-маркетинг, как продать, контент, контент-маркетинг, поисковая оптимизация, поисковые технологии, продвижение на запад, управление проектами, чеклист, чеклисты

Пост лучше всего подойдет разработчикам «one-man-company» или командам. Я расскажу, как достаточно легко и просто (при отсутствии или минимальном бюджете) попасть в топ поисковой выдачи в развитых странах в нише разработки и перестать бороться за клиентов в СНГ, которые хотят круто, классно, без ТЗ ~~(ну ты понял, бро, хотим, чтобы все было красиво)~~ и так, чтобы за $4/час и вообще оплата по факту. В конце попробую свести все в чеклист. Кто попробует ему следовать и отпишется о результатах в комментариях, обязательно дам фидбек с советами.

Как попасть в топ Google в ЕС-США в нише разработки и найти клиентов с большими бюджетами - 1
Читать полностью »

Обзор открытых решений для исправления опечаток

2019-08-15 в 11:06, admin, рубрики: natural language processing, nlp, spellchecker, typo, автокорректор, Алгоритмы, Блог компании Naumen, опечатка, поисковые технологии

У каждого пользователя когда-либо были опечатки при написании поисковых запросов. Отсутствие механизмов, которые исправляют опечатки, приводит к выдаче нерелевантных результатов, а то и вовсе к их отсутствию. Поэтому, чтобы поисковая система была более ориентированной на пользователей, в неё встраивают механизмы исправления ошибок.

Задача исправления опечаток, на первый взгляд, кажется довольно несложной. Но если отталкиваться от разнообразия ошибок, реализация решения может оказаться трудной. В целом, исправление опечаток разделяется на контекстно-независимое и контекстно-зависимое (где учитывается словарное окружение). В первом случае ошибки исправляются для каждого слова в отдельности, во втором – с учетом контекста (например, для фразы «она пошле домой» в контекстно-независимом случае исправление происходит для каждого слова в отдельности, где мы можем получить «она пошел домой», а во втором случае правильное исправление выдаст «она пошла домой»).
Читать полностью »

Поиск в Google стал поиском внутри Google: менее половины поисковых запросов приводят к переходам на сайты

2019-08-14 в 17:47, admin, рубрики: Google, Законодательство в IT, методология, нулевые клики, органический трафик, поиск, поисковая оптимизация, поисковые технологии

Поисковый сервис компании Google перестал быть просто инструментом для поиска нужных сайтов и ссылок, теперь это полноценный сервис, способный сам ответить на большинство интересующих пользователей запросов, почти не давая им причин переходить на сайты, которые поисковый запрос выдает после “карточек Google”.
Читать полностью »

Лес не сдается технологиям поиска, но инженеры наносят ответный удар

2019-08-14 в 13:21, admin, рубрики: билайн, будущее здесь, Геоинформационные сервисы, искусственный интеллект, машинное обучение, поиск людей, поисковые технологии

Лес не сдается технологиям поиска, но инженеры наносят ответный удар - 1
Фото: «Лиза Алерт».

Если в лесу пропал человек, лучший способ его найти — оправить тренированных поисковиков на прочесывание. Ни одна технология поиска пока не может заменить людей. В начале лета мы писали про несколько команд, которые в рамках конкурса «Одиссея» разрабатывали решения для дикой природы. Многие инженеры полагались на беспилотники с камерами и компьютерное зрение, но столкнулись с не очевидными проблемами — плохая связь, низкая скорость обработки и передачи огромных данных, плотные кроны деревьев и многое другое.

В итоге ни одно решение с компьютерным зрением не прошло в финал конкурса. Но технические эксперты говорили — если бы команды объединили усилия, вместе собрали датасет и обучили на нем алгоритмы, у компьютерного зрения мог быть шанс.

На прошлой неделе, 9 августа поисковый отряд «Лиза Алерт» вместе с «Билайном» объявили о запуске инструмента, который будет искать людей на фотографиях с беспилотников. Мы сходили на пресс-конференцию, приуроченную к запуску, и узнали, как он работает.
Читать полностью »

Шесть демонов неэффективной и назойливой онлайн-рекламы

2019-08-07 в 5:54, admin, рубрики: контекстная реклама, медийная реклама, мысли вслух, онлайн-реклама, поисковые технологии, рекламный рынок

Реклама надоела — и надоела настолько, что даже говорить об этом уже надоело. Когда в Россию пришло коммерческое телевидение, вместе с ним в наши дома вошла и реклама, к которой неподготовленному постсоветскому зрителю пришлось привыкать с нуля. Вскоре интерес сменился раздражением, нашедшим отражение, в том числе, в многочисленных шутках и анекдотах про рекламу. Сейчас эффекта новизны уже нет, рекламу стали меньше обсуждать — но раздражение никуда не делось. И переезд значительной части аудитории, а вслед за ней и самой рекламы, в интернет ситуацию не улучшил, а в чём-то и усугубил. Американское исследование за сентябрь 2017 года зафиксировало недовольство избытком рекламы YouTube и других соцсетей среди подростков. Меняются вкусы, мода, товары, которые выбирает новое поколение, но остаётся непреходящая неприязнь его к рекламе.

Шесть демонов неэффективной и назойливой онлайн-рекламы - 1
John Wanamaker, автор знаменитого выражения “Half the money I spend on advertising is wasted; the trouble is I don't know which half”

От обилия рекламы страдают люди, но при этом есть и другая проблематика — для самих рекламодателей.
Читать полностью »

Активное обучение ранжированию

2019-07-30 в 15:25, admin, рубрики: big data, mail.ru, Алгоритмы, Блог компании Mail.Ru Group, машинное обучение, поиск, поисковые технологии, ранжирование

Этим постом я открываю серию, где мы с коллегами расскажем, как используется ML у нас в Поиске Mail.ru. Сегодня я объясню, как устроено ранжирование и как мы используем информацию о взаимодействии пользователей с нашей поисковой системой, чтобы сделать поисковик лучше.

Задача ранжирования

Что подразумевается под задачей ранжирования? Представим, что в обучающей выборке есть какое-то множество запросов, для которых известен порядок документов по релевантности. Например, вы знаете, какой документ самый релевантный, какой второй по релевантности и т.д. И вам нужно восстановить такой порядок для всей генеральной совокупности. То есть для всех запросов из генеральной совокупности на первое место поставить самый релевантный документ, а на последнее — самый нерелевантный.

Давайте посмотрим, как такие задачи решаются в больших поисковых системах.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «поисковые технологии» - 10

Инфраструктура А-Б-экспериментов в большом Поиске. Доклад Яндекса

Как работают поисковые системы

«Яндекс» показал, какими словами ищут забытые фильмы

Фильм, в котором был грунт. Исследование Яндекса и краткая история поиска по смыслу

Как попасть в топ Google в ЕС-США в нише разработки и найти клиентов с большими бюджетами

Обзор открытых решений для исправления опечаток

Поиск в Google стал поиском внутри Google: менее половины поисковых запросов приводят к переходам на сайты

Лес не сдается технологиям поиска, но инженеры наносят ответный удар

Шесть демонов неэффективной и назойливой онлайн-рекламы

Активное обучение ранжированию

Задача ранжирования