Привет и с Новым годом! Меня зовут Екатерина, я практикующий юрист, исследую эффективное применение нейросетей в юридических задачах. В декабре ушедшего года я провела необычный для себя и российского LegalTech-рынка эксперимент: с помощью одиннадцати коллег-оценщиков организовала небольшоенезависимое слепое сравнение пяти нейросетевых сервисов. В этой публикации хочу рассказать о вызовах human-eval бенчмарка в домене, где зачастую нет единственно правильных ответов, интересных выводах исследования, полученной мной обратной связи и дальнейших планах.
Архив за 08 января 2026 - 3
Делай Bench: мой опыт слепого human-eval бенчмарка нейросетей для юристов
2026-01-08 в 15:01, admin, рубрики: llm, open-source llm, rag, сезон ии в разработкеЛоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее
2026-01-08 в 14:55, admin, рубрики: large language models, llm, оптимизация нейросетейЭксперимент по хирургическому удалению слоёв из языковой модели
TL;DR
Я взял TinyLlama (1.1B параметров, 22 слоя) и начал удалять из неё слои, чтобы проверить гипотезу: современные LLM переобучены, и многие слои делают одно и то же.
Результаты:
-
Удалил 1 средний слой → +10% скорость, -4% качество
-
Удалил 7 слоёв (безопасных) → +30% скорость, -2.5% качество
-
Удалил первый слой → модель сломалась
-
Неожиданно: Layer 2 важнее Layer 0! (+6.67 vs +3.92 perplexity)
Протестировал все 22 слоя по отдельности. Вот что нашёл.
Зачем это нужно?
Zeekr 8X с ДВС полностью рассекречен: опубликованы живые фото
2026-01-08 в 14:54, admin, рубрики: НовостиКитайский Минпром опубликовал живые фото Zeekr 8X — впервые машину засняли без камуфляжа.
«Длительность жизни» у мифов
2026-01-08 в 14:51, admin, рубрики: антропогенез, антропология, возраст мифов, история, мифологияУ людей главный признак, наряду с орудиями труда ( особенно состоящими из 2-3-4 частей ) это умение обучать друг друга через мифологию, присказки, легенды. Какова древность известных мифов? Ответ науки, основанный на массовом изучении всех мифов мира и прогоне их через компьютерные программы и географические карты - больше 40 000 лет некоторые мифы-сюжеты живут.
60-ваттная зарядка Samsung Galaxy S26 Ultra творит чудеса: зарядка от 0 до 75% — всего за полчаса
2026-01-08 в 14:34, admin, рубрики: НовостиИнсайдер Ice Universe привел новые данные о Samsung Galaxy S26 Ultra. Согласно внутренним тестам, будущий флагман будет заряжаться с 0 до 75% всего за полчаса.
Для тех, кому ездить много и дешево. Представлен BYD Qin L DM-i 2026: просторный салон, 2110 км на баке бензина и расход всего 2,79 л/100 км — от 92 800 юаней (1 млн рублей)
2026-01-08 в 14:21, admin, рубрики: НовостиКомпания BYD официально представила седан Qin L DM-i 2026 модельного года в версии с увеличенным запасом хода. Новинка предлагается в четырех исполнениях по цене от 92 800 до 122 800 юаней (1,0-1,4 млн рублей).
LMArena привлекла $150 млн и стала «единорогом» на рынке оценки ИИ-моделей
2026-01-08 в 14:14, admin, рубрики: НовостиСтартап LMArena, выросший из исследовательского проекта UC Berkeley, объявил о привлечении $150 млн в рамках серии A при оценке в $1,7 млрд. Примечательно, что всего семь месяцев назад компания привлекла $100 млн на посевной стадии при оценке в $600 млн. Таким образом, общий объём привлечённых средств за короткий период составил $250 млн.
Caterpillar внедряет ИИ от Nvidia для автономной техники и «умных» заводов
2026-01-08 в 14:07, admin, рубрики: НовостиCaterpillar представила на выставке CES 2026 масштабную стратегию по внедрению искусственного интеллекта Cat AI в свои машины, программное обеспечение и производственные процессы. Компания делает ставку на ИИ-системы, работающие непосредственно на оборудовании и в промышленных условиях, а не полагающиеся на постоянное подключение к облаку.
В рамках инициативы Caterpillar расширила сотрудничество с Nvidia, которая предоставит вычислительные платформы и программное обеспечение.
Новейшую Lada Vesta Sport 2026 с пакетом Black показали перед началом продаж
2026-01-08 в 14:00, admin, рубрики: НовостиАвтоВАЗ готовится к началу продаж новой Lada Vesta Sport 2026 модельного года. В Тольятти заметили автовоз с одним экземпляром долгожданной модели в модном оттенке «Тайфун» и с пакетом Black.
Под капотом Lada Vesta Sport установлен форсированный атмосферный двигатель 1.8 EVO мощностью 145 л.с. с 184 Нм крутящего момента и 6-ступенчатая механическая коробка переключения передач.
Токамак MAST Upgrade в Великобритании запускает пятую научную кампанию из более чем 950 плазменных импульсов
2026-01-08 в 13:57, admin, рубрики: НовостиФлагманская термоядерная установка Великобритании, Mega Amp Spherical Tokamak (MAST) Upgrade, официально начала свою пятую научную кампанию, о чём сообщило Управление по атомной энергии Великобритании (UKAEA). В течение шести месяцев более 200 учёных будут проводить эксперименты, направленные на разработку первой британской термоядерной электростанции.
Новая кампания включает более 950 плазменных «импульсов», что позволит учёным лучше понять процессы, необходимые для термоядерного синтеза в токамаке — реакторе в форме тора.

