Привет. Меня зовут Нафиса Валиева. Я младший разработчик в MWS AI и Пситехлабе, студентка 3го курса ПМ-ПУ СПбГУ. Этот пост — текстовый вариант моего выступления на Дата Фесте. Я расскажу вам, как мы в команде Пситехлаб переводили интересный датасет с английского на русский с помощью больших языковых моделей (далее - БЯМ). Сам подход основан на ранней работе [1] нашего руководителя. Отличие в том, что здесь мы детально анализируем поведение различных БЯМ.
Рубрика «machine learning» - 2
Перевод датасета для оценки эмпатии на русский язык: подход, проблемы, результаты
2025-09-12 в 7:12, admin, рубрики: artificial intelligence, llm, machine learning, natural language processing, перевод с английского, пситехлабМетоды интерпретации на основе вмешательства в CV: RISE implementation
2025-09-05 в 18:40, admin, рубрики: cnn, machine learning, интерпретируемый ии, карты активации, машинное обучениеПривет, друзья! Добро пожаловать в новый туториал из серии практических материалов по explanable AI (интерпретируемости моделей). Он посвящен методу интерпретации на основе вмешательства — RISE. В этом материале разобрана теоретическая постановка метода, подчеркнуты красивые математические идеи и переходы, и, конечно, реализован код для практики. Приглашаю к чтению! Ноутбук к туториалу доступен на гитхаб.
Введение
Методы интерпретации на основе вмешательства основаны на идее ответа на вопрос: на вопрос:
Ученые научились «расшифровывать» внутренний голос человека. Приватности конец?
2025-08-30 в 7:00, admin, рубрики: machine learning, будущее здесь, искусственный интеллект, машинное обучение, мозг, Научно-популярноеПредставьте, что ваши мысли, которые вы проговариваете про себя, переводятся в текст на экране. Без единого слова и движений губ — просто сигналы мозга, пойманные и расшифрованные. Как-то не по себе, не так ли? Между тем это не сюжет фантастического фильма, а реальность, созданная учеными из Стэнфордского университета: они разработали нейроинтерфейс, способный услышать «внутренний голос».
Google снизил энергопотребление AI-запросов в 33 раза: что это значит для будущего ИИ
2025-08-29 в 12:43, admin, рубрики: Google, machine learning, высокая производительность, искусственный интеллект, машинное обучениеИскусственный интеллект давно вышел за рамки научной фантастики и стал частью нашей жизни — от поисковых систем до чат-ботов и голосовых помощников. Но у этого удобства есть немалая цена: для генерации ответа ИИ расходует значительные вычислительные ресурсы и энергию.
Как внедрить автоматическое ревью кода с помощью ИИ: опыт Microsoft, Google и ByteDance + практическое руководство
2025-08-25 в 11:51, admin, рубрики: artificial intelligence, automation, CICD, code review, devops, github, machine learning, software development, software engineeringSemantic Retrieval-Augmented Contrastive Learning (SRA-CL) для sequential рекомендательных систем: обзор
2025-08-18 в 15:38, admin, рубрики: data science, machine learning, recsys, Transformers👋 Привет!
Меня зовут Никита Горячев, я Research Engineer в WB, последние несколько лет работаю на стыке RecSys, LLM и мультимодальных моделей. Каждый день мы обрабатываем миллиарды событий, а модели, которые мы внедряем, напрямую влияют на CTR, удержание и конверсию, принося немало дополнительной выручки.
До этого я успел поработать в AI-стартапе в Palo Alto, где занимался голосовыми агентами (ASR/TTS), и в МТС, где мы строили AI-экосистему. Ранее в Сбере я занимался созданием единого RecSys SDK для всей экосистемы (от SberMegaMarket до Okko и Zvuk), а ещё раньше — развивал персонализацию и ML в ритейле.
Koda: AI-помощник разработчика – бесплатно, без VPN, с поддержкой русского языка
2025-08-14 в 9:19, admin, рубрики: AI, AI-инструменты, copilot, data science, llm, machine learning, vibecoding, Агент, вайб-кодингИндустрия ИИ переживает рекордный бум: каждую неделю появляются новые модели, а заголовки пестрят новостями о многомиллионных контрактах и громких переходах звёздных исследователей. Прорывы происходят на всех уровнях: от чипов и инфраструктуры (NVIDIA и др.) до моделей и инструментов вроде Cursor или Windsurf.
Но у российских разработчиков выбор заметно ýже: ограничения, VPN, трудности с оплатой. Мы решили это изменить и создали KodaЧитать полностью »
Как мы обучали модели для кода GigaCode
2025-08-08 в 15:05, admin, рубрики: code assistant, code generation, llm, machine learning
Привет, Хабр Меня зовут Дмитрий Бабаев, я руководитель R&D GigaCode в Сбере. Сегодня расскажу о том, как мы создавали ИИ‑помощника для программистов задолго до того, как это стало мейнстримом.
Semantic Error Correction Loop (SECL): самоисправляющиеся LLM-пайплайны с понятием доверия к контексту
2025-08-03 в 20:00, admin, рубрики: GigaChat, llm, llm-модели, machine learning, OpenAI, алгоритмы машинного обучения, искусственный интеллект, исследование, обучениеВ последние годы большие языковые модели кардинально изменили ландшафт искусственного интеллекта, открывая невероятные возможности для автоматизации текстовых задач. Однако, несмотря на впечатляющие успехи, одна из ключевых проблем остаётся нерешённой — модели часто допускают логические ошибки, создают неясные или избыточные формулировки, а также генерируют тексты с низкой степенью доверия к собственным ответам.
В своей практике я столкнулся с необходимостью повышения качества генерации без постоянного ручного контроля и затратных этапов дообучения. Это подтолкнуло меня к идее нового подхода — Читать полностью »


