Рубрика «Блог компании HeadHunter» - 3

Считаем статистику по экспериментам на hh.ru

2018-10-10 в 9:38, admin, рубрики: Hadoop, Hive, presto, Zeppelin, аналитика, Блог компании HeadHunter, веб-аналитика, Статистика в IT, Управление продуктом

Всем привет!

Сегодня я расскажу вам, как мы в hh.ru считаем ручную статистику по экспериментам. Мы посмотрим откуда появляются данные, как мы их обрабатываем и на какие подводные камни натыкаемся. В статье я поделюсь общими архитектурой и подходом, реальных скриптов и кода будет по минимуму. Основная аудитория — начинающие аналитики, которым интересно, как устроена инфраструктура анализа данных в hh.ru. Если данная тема будет интересна — пишите в комментариях, можем углубиться в код в следующих статьях.

О том, как считаются автоматические метрики по АБ-экспериментам, можно почитать в нашей другой статье.

Читать полностью »

Равномерно распределяем точки по сфере в pytorch и tensorflow

2018-09-24 в 12:11, admin, рубрики: backpropagation, function minimization, ml, povray, pytorch, TensorFlow, vapory, Блог компании HeadHunter, глубокое обучение, искусственный интеллект, математика, машинное обучение, оптимизация

Этот текст написан для тех, кто интересуется глубоким обучением, кто хочет использовать разные методы библиотек pytorch и tensorflow для минимизации функции многих переменных, кому интересно научиться превращать последовательно выполняющуюся программу в выполняемые с помощью numpy векторизованные матричные вычисления. А ещё можно научиться делать мультфильм из данных, визуализированных с помощью PovRay и vapory.

Равномерно распределяем точки по сфере в pytorch и tensorflow - 1

Читать полностью »

Контроль над ресурсами. Настраиваем SwiftGen

2018-09-16 в 17:42, admin, рубрики: iOS, swift, swiftgen, Блог компании HeadHunter, Программирование, разработка мобильных приложений, разработка под iOS

Наверное, в каждом большом iOS-проекте — долгожителе можно наткнуться на иконки, которые нигде не используются, или обращения к ключам локализации, которые уже давно не существуют. Чаще всего такие ситуации возникают из-за невнимательности, а лучшее лекарство от невнимательности — автоматизация.

В iOS-команде HeadHunter мы большое внимание уделяем автоматизации рутинных задач, с которыми может столкнуться разработчик. Этой статьей мы хотим начать цикл рассказов о тех инструментах и подходах, которые упрощают нашу повседневную работу.

Какое-то время назад нам удалось взять ресурсы приложения под контроль с помощью утилиты SwiftGen. О том, как ее настроить, как с ней жить и как эта утилита помогает переложить проверку актуальности ресурсов на плечи компилятора, и пойдет речь под катом.

Контроль над ресурсами. Настраиваем SwiftGen - 1

Читать полностью »

Процесс ревью кода в HH.RU

2018-09-06 в 8:29, admin, рубрики: code review, Git, github, HH, hh.ru, Блог компании HeadHunter, Программирование, разработка, ревью, ревью кода, Совершенный код, хедхантер

Мне на глаза попался документ с правилами и рекомендациями по процессу ревью кода внутри компании. Я решил, что такой полезной информацией надо поделиться с внешним миром. С благословения автора я публикую работу
Процесс ревью кода в HH.RU - 1
Читать полностью »

Школа программистов HeadHunter: новый набор — 2018-19

2018-09-05 в 6:15, admin, рубрики: Блог компании HeadHunter, Карьера в IT-индустрии, обучение, обучение программированию, Учебный процесс в IT

Наверное, вы уже слышали про Школу программистов: из начинающих разработчиков мы растим специалистов с опытом запуска проекта и участия во всех бизнес-процессах. Потому что именно так происходит работа в крупной ИТ-компании.
Школа программистов HeadHunter: новый набор — 2018-19 - 1
С сегодняшнего дня мы открываем девятый набор в Школу. Что ждет тех, кто начнет обучение в ноябре этого года?
Читать полностью »

Java REST в Школе Программистов HeadHunter

2018-08-22 в 7:07, admin, рубрики: java, RESTful, web-разработка, Блог компании HeadHunter

Привет Хабр, мы хотим рассказать об одном из проектов школы программистов HeadHunter 2018. Ниже статья нашего выпускника, в которой он расскажет об опыте, полученном во время обучения.

Java REST в Школе Программистов HeadHunter - 1

Читать полностью »

Наиболее востребованные языки программирования – 2018

2018-08-01 в 6:32, admin, рубрики: javascript, php, Блог компании HeadHunter, зарплата, Исследования и прогнозы в IT, Карьера в IT-индустрии, Статистика в IT, теги никто не читает

Очередная статистика от hh.ru под катом. Вкратце — очень хотелось посчитать, на каких языках чаще всего пишут отечественные разработчики и какие языки чаще других ищут работодатели. Итого — посчитал, что указывали в вакансиях и в резюме в первом полугодии 2018 и 2017 годов. Получилось что получилось.

Читать полностью »

Массовый стекинг моделей ML в production: реально или нет?

2018-07-26 в 11:30, admin, рубрики: als, data science, feature, feature selection, ml, production, stacking, Алгоритмы, Блог компании HeadHunter, логистическая регрессия, машинное обучение, нейросети, поисковые технологии, признаки, продакшн, стекинг, факторизационные машины

Довольно часто нас спрашивают, почему мы не устраиваем соревнований дата-сайентистов. Дело в том, что по опыту мы знаем: решения в них совсем не применимы к prod. Да и нанимать тех, кто окажется на ведущих местах, не всегда имеет смысл.

Массовый стекинг моделей ML в production: реально или нет? - 1

Такие соревнования часто выигрывают с помощью так называемого китайского стекинга, когда комбинаторным способом берут все возможные алгоритмы и значения гиперпараметров, и полученные модели в несколько уровней используют сигнал друг от друга. Обычные спутники этих решений — сложность, нестабильность, трудность при отладке и поддержке, очень большая ресурсоёмкость при обучении и прогнозировании, необходимость внимательного надзора человека в каждом цикле повторного обучения моделей. Смысл делать это есть только на соревнованиях — ради десятитысячных в локальных метриках и позиций в турнирной таблице.

Читать полностью »

Анонс мобильного митапа: Что делать, когда приложение стало большим?

2018-07-19 в 10:19, admin, рубрики: android, continuous delivery, iOS, Блог компании HeadHunter, конференция, процессы разработки, Разработка под android, разработка под iOS

Анонс мобильного митапа: Что делать, когда приложение стало большим? - 1
Формат

Мероприятие будет проходить в формате круглого стола

О чем будем говорить

Чем отличается большое приложение от маленького?
Как меняется кодовая база и процессы?
Как поймать тот момент, когда надо что-то менять?

Читать полностью »

Как докатить ML в прод: шесть граблей, на которые мы наступили

2018-06-28 в 8:03, admin, рубрики: headhunter, ml, production, TensorFlow, Алгоритмы, Блог компании HeadHunter, грабли, машинное обучение, нейросеть, отладка, поисковые технологии, умный поиск

Совсем недавно мы искали дата-сайентиста в команду (и нашли — привет, nik_son и Арсений!). Пока общались с кандидатами, поняли, что многие хотят сменить место работы, потому что делают что-то «в стол».

Например, берутся за сложное прогнозирование, которое предложил начальник, но проект останавливается — потому что в компании нет понимания, что и как включить в продакшен, как получить прибыль, как «отбить» потраченные на новую модель ресурсы.

Как докатить ML в прод: шесть граблей, на которые мы наступили - 1

У HeadHunter нет больших вычислительных мощностей, как у «Яндекса» или Google. Мы понимаем, как нелегко катить в продакшен сложный ML. Поэтому многие компании останавливаются на том, что катят в прод простейшие линейные модели.

В процессе очередного внедрения ML в рекомендательную систему и в поиск по вакансиям мы столкнулись с некоторым количеством классических «граблей». Обратите на них внимание, если собираетесь внедрять ML у себя: возможно, этот список поможет по ним не ходить и найти уже свои, персональные грабли.
Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «Блог компании HeadHunter» - 3

Считаем статистику по экспериментам на hh.ru

Равномерно распределяем точки по сфере в pytorch и tensorflow

Контроль над ресурсами. Настраиваем SwiftGen

Процесс ревью кода в HH.RU

Школа программистов HeadHunter: новый набор — 2018-19

Java REST в Школе Программистов HeadHunter

Наиболее востребованные языки программирования – 2018

Массовый стекинг моделей ML в production: реально или нет?

Анонс мобильного митапа: Что делать, когда приложение стало большим?

Как докатить ML в прод: шесть граблей, на которые мы наступили

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «Блог компании HeadHunter» - 3

Новости

Актуальные темы

Архив