Привет! Меня зовут Миша Мартьянов, я инженер по исследованиям и разработке в red_mad_robot. Моя работа — искать новые идеи, проверять гипотезы и улучшать продукты. На этом пути иногда приходится изобретать уникальные решения. Например, мы создали собственный фильтр, чтобы отсеивать нежелательный контент с помощью LLM. Рассказываю, как мы к этому пришли и с какими сложностями столкнулись.
Рубрика «false positive»
Собственный контент-фильтр на базе LLM: от эксперимента до стабильной системы
2025-06-27 в 15:23, admin, рубрики: AI, false positive, Few-shot, filter, llm, фильтр контентаКак мы искали компромисс между точностью и полнотой в конкретной задаче ML
2016-09-13 в 6:48, admin, рубрики: big data, data mining, false positive, Блог компании HeadHunter, машинное обучение, обработка данных, управление требованиями
Я расскажу о практическом примере того, как мы формулировали требования к задаче машинного обучения и выбирали точку на кривой точность/полнота. Разрабатывая систему автоматической модерации контента, мы столкнулись с проблемой выбора компромисса между точностью и полнотой, и решили ее с помощью несложного, но крайне полезного эксперимента по сбору асессорских оценок и вычисления их согласованности.
Читать полностью »
Сбой в работе Google malware detection(?)
2015-11-03 в 8:44, admin, рубрики: false positive, Google, google webmasters, MalwareЗнакомый многим экран «опасносте — malware»

штука неприятная, несомненно — аудитория вашего сайта может и подсократиться после таких «фокусов». Но что вы будете делать, если ещё и обвинения в том, что на вашем сайте зловредное ПО — результат сбоя систем Google? Как видно из screenshot'ов, каких либо фактов у Google нет:
Читать полностью »
