Привет и с Новым годом! Меня зовут Екатерина, я практикующий юрист, исследую эффективное применение нейросетей в юридических задачах. В декабре ушедшего года я провела необычный для себя и российского LegalTech-рынка эксперимент: с помощью одиннадцати коллег-оценщиков организовала небольшоенезависимое слепое сравнение пяти нейросетевых сервисов. В этой публикации хочу рассказать о вызовах human-eval бенчмарка в домене, где зачастую нет единственно правильных ответов, интересных выводах исследования, полученной мной обратной связи и дальнейших планах.
Рубрика «open-source llm»
Делай Bench: мой опыт слепого human-eval бенчмарка нейросетей для юристов
2026-01-08 в 15:01, admin, рубрики: llm, open-source llm, rag, сезон ии в разработкеОт промптов к дообучению: четыре уровня адаптации open-source моделей
2024-08-22 в 13:26, admin, рубрики: Fine-tuning, genai, open-source llm, rag, искусственный интеллект, машинное обучение, промпт-инжиниринг
Привет! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Ко мне часто приходят задачи, где нужно использовать open-source LLM. Сразу же встает вопрос: а как адаптировать имеющуюся модель под конкретный кейс?
