
Когда цифры перестают быть просто цифрами
Я давно работаю с компаниями, у которых есть ассортимент из сотен или тысяч Читать полностью »

Я давно работаю с компаниями, у которых есть ассортимент из сотен или тысяч Читать полностью »
Трафик дорожает, конкуренция растет, AI-продукты выходят быстрее, чем я успеваю их тестировать, — и единственный способ выжить в этой гонке: удерживать пользователей, а не просто радоваться скачкам трафика по праздникам.
Но есть проблема: большинство команд все еще думают, что retention — это «график, на который мы будем смотреть, пока CFO грустит».
если вы тоже сейчас грустите, глядя на свой retention, — вы не один
Давайте разберём, как всё работает в реальности.
Привет, коллеги ML инженеры, Data scientist'ы и все, кто интересуется искусственным интеллектом, созданием нейросетей, машинным обучением и анализом данных! Принёс вам пачку вебинаров с интенсива трека Наука о данных курсов повышения квалификации Летней цифровой школы Сбера.
Привет! Меня зовут Влад Божьев, я старший разработчик юнита АБ-тестирования Авито. В нашей команде мы ежедневно работаем с по-настоящему большими объёмами данных – это не просто фигура речи, это наша реальность. Мы помогаем создавать метрики, которые помогают бизнесу не «гадать на кофейной гуще», а принимать взвешенные решения, основанные на данных.
Привет! Это моя первая статья на Хабре, так что тапки прошу кидать мягкие (или хотя бы плюшевые).
Поговорим о том, почему сегодня быть full-stack дата-сайентистом — не просто модно, а жизненно необходимо.
Представьте: вы запилили нейросеть, которая определяет котиков на фото с точностью 99.9% (оставшиеся 0.1% — это когда хомяк притворяется котом). Воодушевлённый результатом, бежите к руководству — и тут начинается шоу:
Инфраструктурные проблемы:
Бэкенд-разработчик в отпуске (а его API недоступно)
Фронтенд-интерфейс рисует пиксель-арт вместо функционального дашборда
Ориентируются ли собаки по компасу, когда делают свои грязные дела? Оказывается — да! Если вам интересно, как можно это подтвердить в домашних условиях, используя компас, Байесовскую статистику и собаку (собака не включена), то добро пожаловать под кат.
Я очень люблю заниматься нестандартными исследованиями данных и периодически пишу о них статьи и заметки (вроде этой). Если вам такое тоже нравится — приглашаю подписаться на мой телеграм-канал: Data Wondering.
Привет!
В этом туториале разобран метод для анализа внутренних представлений "логит-линза" (Logit Lens).
В результате практики по туториалу, вы:
Изучите подход и концепцию Logit Lens;
Реализуете Logit Lens для Visual Transformer;
Познакомитесь с анализом результатов применения логит-линзы.
Приступим! Как всегда, весь код будет на гитхаб — step by step.
Метод Logit Lens был предложен на Lessworng в 2020 году на примере модели GPT-2.
Времена когда горящий куст мог принести озарение давно прошли. Примитивный опыт уже не может стать источником открытий. А всё потому, что он обобщён и впитан в культуру человечества. И чтобы подключиться к мудрости предков нужно опереться на философию. В Читать полностью »
Привет! Меня зовут Женя и я работаю аналитиком данных. В этой статье я бы хотел рассказать начинающим аналитикам о том, как правильно настроить окружение для работы с Python. Когда я только начинал заниматься анализом данных, концепция питоновского виртуального окружения вводила меня в ступор, и здесь я постараюсь показать, что в ней нет ничего сложного.
Для этого мы:
Установим Python
Создадим и активируем виртуальное окружение при помощи базовых инструментов pip и venv
В качестве примера установим библиотеки notebook и pandas