Рубрика «поиск» - 2

Сайты, годами занимавшие первые строки поисковой выдачи, теряют посетителей: это явление уже окрестили «нейросетевым сайтокалипсисом». Виновники «торжества» — нейросети, как сами по себе, так и в виде модулей поисковых систем. Давайте разбираться, что происходит, как ИИ-модели влияют на сайты и можно ли с этим что-то сделать.

Читать полностью »

От проблемы до технической реализации — опыт создания ИИ‑ассистента для Росатома за 48 часов хакатона АтомикХак 2.0

Часть 1: Бизнес‑кейс. Зачем это нужно?

Проблема, которая съедает миллионы

Представьте: новый сотрудник крупной корпорации ищет ответ на рабочий вопрос. Он открывает внутренний портал, видит сотни PDF‑инструкций, тысячи записей в базе знаний службы поддержки. Час поиска, звонки коллегам, еще час изучения документов. В итоге — либо неточный ответ, либо решение отложить задачу.

Читать полностью »
Простой механизм поиска с нуля - 1

Мы с Крисом недавно «с нуля» буквально за пару часов создали механизм поиска для моего блога. Основную часть проделал именно Крис, так как до этого с word2vec я был знаком лишь отдалённо.

Читать полностью »

Более быстрые хеш-таблицы: претенденты на место SwissTable - 1


24 ноября 2021 года на сайте ArXiv.org была опубликована научная статья «Крошечные указатели» (Tiny Pointers) с описанием новой структуры данных — «крошечных» указателей, которые указывают путь к фрагменту хранимых данных и занимают меньше памяти, чем традиционные указатели.

Осенью 2021 года эту статью заметил Андрей Крапивин (Andrew Krapivin), студент Ратгерского университета в Нью-Джерси, и не придал ей особого значения, пишет Quanta Magazine, журнал о последних достижениях в математике (перевод статьи на Хабре). Только через два года он нашёл время, чтобы внимательно ознакомиться с материалом. И понял, насколько это прорывное изобретение, если применить его для оптимизации хеш-таблиц.

Данная тема уже упоминалась на Хабре, но заслуживает более подробного обсуждения.
Читать полностью »

  • Введение

  • Видение

  • Подготовка (ака тоже лайфхак)

  • Лайфхак (без кода пока что)

  • Метрики

Введение

Из-за санкций, Elasticsearch многие стали отвергать. Единственное, что его спасает, это RAG'и шмаги. Я первую работу выбрала в поисковом отделе, для меня это было завлекательнее, чем datascience, с которым я была уже знакома. 8 лет назад начала изучать эластик. Наработалась "интуиция" на его функционал, так как с нуля я делала поиск для других компаний несколько раз. Поиск текстовый, GEO поиск, подсказки для поиска (suggester) и с МЛ'ем которым майнились синонимы или кластеризовались запросы.

Читать полностью »

Привет! Публикую специально в чулан, дабы не задеть ничьи чувства. Для подготовки следующей статьи о моддинге и программировании для необычных девайсов (можете посмотреть примеры у меня в профиле), я ищу китайские ARM-нетбуки конца нулевых-начала десятых годов. Стоили такие девайсы очень дешево (около 50 баксов за новый нетбук), имели 7 или 9 дюймовый дисплей и работали на базе процессоров WonderMedia WM8650/WM8505, а также Ingenic JZ4720. Готов приобрести такой девайс для подготовки крутого контента с ним! Также ищу Ben NanoNote - миниатюрный ARM-нетбук с OpenWRT на борту из 2010 года.

Читать полностью »
Вместо тысячи слов: как картинки помогают в текстовом Поиске? - 1

Всем привет! Меня зовут Дима. Я работаю в Поиске Okko и в этой статье хочу рассказать, насколько картиночные модели полезны для задачи Поиска и для чего мы используем их в наших пайплайнах.

Читать полностью »

Вам точно нужен топ-10? Сколько кликов достаются 1 месту в поиске? Как было 10 лет назад и как влияют на кликабельность сниппеты? Исследование показателей кликабельности в Google на основе данных аналитической компании Advanced Web Ranking.

Война за клики: Как позиции в Google влияют на CTR? - 1

Интро

Читать полностью »

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js