Рубрика «поисковые системы» - 2

imageФото: www.bleepingcomputer.com

Корпорация Microsoft изменила планы насчет обязательного внедрения поисковой системы Bing в браузер Chrome для тех, кто использует Office 365 ProPlus. Об этом было объявлено в январе. Однако после протестов клиентов Microsoft заявила, что расширение Microsoft Search в Bing не будет автоматически развернуто с Office 365 ProPlus в конце февраля. Читать полностью »

image

Google сообщила турецким компаниям, что отказывается от поддержки новых смартфонов на ОС Android. Данное решение принято после того, как турецкий совет по конкуренции расценил изменения, внесенные Google в контракты, неприемлемыми.

Совет по конкуренции оштрафовал Google на $17,4 млн в сентябре 2018 года. Компанию обвинили в нарушении закона о конкуренции в связи с продажами мобильного ПО. Google дали полгода на внесение изменений в свои контракты, чтобы потребители могли выбирать варианты поисковиков в Android. Данное требование ранее выдвинул российский поисковик «Яндекс». Читать полностью »

Индексируем миллиарды текстовых векторов - 1

При извлечении информации часто возникает задача поиска подобных фрагментов текста. В контексте поиска запрос может быть сгенерирован пользователем (например, текст, который пользователь вводит в поисковом движке) или самой системой. Часто нам нужно сопоставлять входящий запрос с уже проиндексированными запросами. В этой статье мы рассмотрим, как можно построить систему, решающую эту задачу применительно к миллиардам запросов без траты целого состояния на серверную инфраструктуру.
Читать полностью »

Дальняя кривая меня привела к написанию этого поста. Перечитываю шедевральный труд про историю зарождения интернета, начиная с лейденской банки, в большей степени шедевральный конечно — с точки зрения усилий автора, но не умоляя и труда переводчика (тот же М. Лозинский с его Божественной комедией — яркий пример того, что переводчик внес не меньший вклад чем сам автор, вечная ему память и слава). Но не об этом речь.

В комментариях к статье вижу годные комментарии, ну дай думаю поглажу по спинке человека, пытаюсь поставить плюс в карму — и вижу достаточно весомый минус по карме. Заинтересовался. Смотрю историю — «прокололся» человек на том, что решил похвалить поисковик Спутник.
И вот стал размышлять, конформизм это или глупость. Тут дисклеймер — прошу не путать личность и поступки личности. Личность может быть гениальной, и совершать глупые поступки, а может быть и наоборот. Но опять же, не в этом суть.

И я решил сравнить эффективность различных поисков — а именно Google, Яндекс и Спутник.
Как это сделать — тут уж кто на что горазд. Можно об этом написать целую диссертацию, про эффективность поисковых механизмов и ключевых показателях для их сравнения, но я выбрал такой, немножко «программистский подход», с изрядной долей упрощения.
Читать полностью »

Применение сиамских нейросетей в поиске - 1

Всем привет! В этом посте я расскажу, какие подходы мы в Поиске Mail.ru используем для сравнения текстов. Для чего это нужно? Как только мы научимся хорошо сравнивать разные тексты друг с другом, поисковая система сможет лучше понимать запросы пользователя.

Что нам для этого нужно? Для начала строго поставить задачу. Нужно определить для себя, какие тексты мы считаем похожими, а какие не считаем и затем сформулировать стратегию автоматического определения схожести. В нашем случае будут сравниваться тексты пользовательских запросов с текстами документов.
Читать полностью »

Мы разбирали старые письма и наткнулись на статью, которую писал Илья Сегалович iseg для журнала «Мир Internet» в далёком 2002 году. В ней он сравнивает интернет и поисковые системы с чудесами света, размышляет о поисковых технологиях и вспоминает их историю. Несмотря на загруженность по работе, Илья написал статью в рекордные сроки и даже снабдил достаточно подробным словарём терминов, который особенно интересно читать в наши дни. Нам не удалось найти электронную версию журнала со статьей, поэтому сегодня мы публикуем её в нашем блоге, основателем и первым автором которого, к слову, был Илья.

Как работают поисковые системы - 1

Читать полностью »

image

В 1998 году Лоуренс Пейдж, Сергей Брин, Раджив Мотвани и Терри Виноград опубликовали статью «The PageRank Citation Ranking: Bringing Order to the Web», в которой описали знаменитый теперь алгоритм PageRank, ставший фундаментом Google. Спустя чуть менее два десятка лет Google стал гигантом, и даже несмотря на то, что его алгоритм сильно эволюционировал, PageRank по-прежнему является «символом» алгоритмов ранжирования Google (хотя только немногие люди могут действительно сказать, какой вес он сегодня занимает в алгоритме).

С теоретической точки зрения интересно заметить, что одна из стандартных интерпретаций алгоритма PageRank основывается на простом, но фундаментальном понятии цепей Маркова. Из статьи мы увидим, что цепи Маркова — это мощные инструменты стохастического моделирования, которые могут быть полезны любому эксперту по аналитическим данным (data scientist). В частности, мы ответим на такие базовые вопросы: что такое цепи Маркова, какими хорошими свойствами они обладают, и что с их помощью можно делать?
Читать полностью »

Триллион маленьких шинглов - 1

Источник изображения:www.nikonsmallworld.com

Антиплагиат – это специализированный поисковик, о чем уже писали ранее. А любому поисковику, как ни крути, чтобы работать быстро, нужен свой индекс, который учитывает все особенности области поиска. В своей первой статье на Хабре я расскажу о текущей реализации нашего поискового индекса, истории его развития и причинах выбора того или иного решения. Эффективные алгоритмы на .NET — это не миф, а жесткая и продуктивная реальность. Мы погрузимся в мир хеширования, побитового сжатия и многоуровневых кешей с приоритетами. Что делать, если нужен поиск быстрее, чем за O(1)?

Если кто-то еще не знает, где на этой картинке шинглы, добро пожаловать…

Читать полностью »

В нескольких недавних постах обсуждался многообещающий и достаточно простой способ оценки качества поиска по продуктам с использованием намерений. Спешим представить открытый автоматизированный инструмент для такого рода тестирования — Intent-based Search Quality. Идея сводится к использованию заранее подготовленных «фокусированных» запросов, ценность которых заключается в их прямолинейности и однозначной интерпретации.

Первый релиз открытого инструмента для тестирования поиска по продуктам - 1

Если вас заинтересовал подход, обязательно обратите внимание на пост “Я намереваюсь купить” или самый простой способ оценить качество продуктового поиска. Переход от стандартного A/B тестирования к тестированию с использованием намерений может показаться не совсем очевидным.
Читать полностью »

Как маркетологи, работающие с Google, монетизируют наш дискомфорт - 1

Первая часть статьи

Сегодня три из четверых владельцев смартфона, когда у них возникает какая-нибудь потребность, требующая немедленного удовлетворения, первым делом обращаются к Google. Соответственно, работающие с Google маркетологи (в том числе и я) выживают за счет своего умения играть на вашем нетерпении и импульсивности, которые проявляются при использовании мобильного устройства. Мы должны быть тут как тут и подсунуть вам рекламное объявление точно в «микромомент» — то есть в ту секунду, когда вы решили прибегнуть к смартфону, чтобы устранить дискомфорт от невозможности что-то получить. Этим чем-то может быть что угодно — горящая распродажа, маршрут до магазина, который вот-вот закроется, информация о курсах, где количество места быстро расхватывают.

Как в простых выражениях объясняют представители Google: «Микромоменты — это мгновения, насыщенные намерением, когда принимаются решения и формируются предпочтения». Но такая формулировка не стыкуется с тем фактом, который они открыто высказать не могут: настрой «хочу прямо сейчас!» обычно порождает в нас неприятные чувства страха и тревоги. Когда вы что-нибудь присматриваете в подобном расположении духа (тут речь необязательно идет о товарах), эти эмоции подтачивают ваше самообладание. Ваша острая потребность — в информации, навигации, транзакции, неважно — начинает смешиваться с желанием как-то избавиться от тяжелого чувства.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js