
Рубрика «nlp»
GigaChat расправляет плечи. Новая версия нейросетевой модели от Сбера
2023-10-19 в 8:01, admin, рубрики: GigaChat, large language model, linguistics, machine learning, nlp, большие языковые модели, искусственный интеллект, Компьютерная лингвистика
От полиглота к эксперту: модели mGPT для малых языков России и стран СНГ
2023-08-22 в 9:43, admin, рубрики: llm, low resource languages, mgpt, multilingual language models, nlp, малые языки россии, языковые модели
Не так давно мы рассказывали про то, как обучили модель-полиглот mGPT, которая говорит на 61 языке. Этим летом мы выложили большую мультиязычную модель (претрейн) mGPT-13B под открытой лицензией MIT.
Сбер открывает доступ к нейросетевой модели ruGPT-3.5
2023-07-20 в 8:02, admin, рубрики: large language model, llm, natural language processing, nlp, open source, rugpt, ruGPT-3.5, sberdevices, Блог компании SberDevices, Блог компании Сбер, искусственный интеллект, Компьютерная лингвистика, языковые модели
Друзья, свершилось. Сегодня мы рады сообщить вам о релизе в открытый доступ нейросетевой модели, которая лежит в основе сервиса GigaChat.
Про то, что такое GigaChat и как мы его обучаем, вы можете прочитать в нашей предыдущей статьеЧитать полностью »
RuGPT3. Исследование вариантов циклическим перебором
2023-07-02 в 5:32, admin, рубрики: deep learning, gpt, machine learning, natural language processing, nlp, rugpt3, генеративные модели, искусственные нейронные сети, искусственный интеллект, машинное обучение, обработка естественного языка, языковые моделиRuGPT3 - коллекция генеративных моделей от Сбер
Проводим автоматическое тестирование циклическим перебором вариантов

Работаем в Colab, тестируем Small, Mediub, Large.
Параметры генерации совершенно неоптимизированы - это первый заход, чтобы посмотреть исходную ситуацию и сравнивать по мере улучшения.
Читать полностью »
О «раздутом пузыре» нейросетей
2023-02-26 в 12:59, admin, рубрики: gpt, machine learning, natural language processing, nlp, python, искусственный интеллект, машинное обучение, Программирование, статьиНа днях я наткнулся на одно любопытное видео:
Моей первой реакцией было Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще? отрицание и усталость, потому что всё это я уже слышу с разной интенсивностью на протяжении лет пяти, в зависимости от текущих объектов хайпа. В этом посте я попытаюсь разобраться, что из сказанного в видео является правдой.
Утверждения:
Юмор ChatGPT
2023-02-07 в 15:17, admin, рубрики: chatgpt, machine learning, nlp, искусственный интеллект, исследование, машинное обучение, юмор
Как машинное обучение помогает проекту «ЗабастКом» освещать трудовые конфликты
2023-01-16 в 9:14, admin, рубрики: diy или сделай сам, IT в НКО, nlp, nlp (natural language processing), Алгоритмы, Блог компании Open Data Science, искусственный интеллект, классификация текстов, НКО, Новости, новостной агрегатор, общество, общество и IT, текстовая аналитикаВ посте расскажу о моем успешном взаимодействии с некоммерческим проектом ЗабастКом, который поддерживает наемных работников в отстаивании своих трудовых прав и интересов. Моя цель была реализовать что-то похожее на ML4SG проект, где волонтеры-специалисты по анализу данных направляют свою энергию на пользу обществу. Например, применяют алгоритмы искусственного интеллекта для спасения потерявшихся людей, для мониторинга качества воздуха или для анализа новостного потока.
Для Забасткома получилось улучшить систему автоматической обработки новостей с помощью алгоритмов машинного обучения. Это привело к увеличению охвата важных событий и уменьшению ручного труда редакторов. Добавлю, что работа с ребятами была похожа на мечту любого DS специалиста: "заказчик" легко шел на контакт; присутствовала заинтересованность и неплохое понимание ML алгоритмов; некоторая продакшн-система уже функционировала; данные для обучения алгоритмов легко собирались. А под катом — поделюсь подробностями и кодом.
Умные субтитры
2022-11-06 в 13:27, admin, рубрики: BERT, LaBSE, moviepy, natural language processing, nlp, python, английский, аудирование, видео, изучение языков, машинное обучение, Работа с видео, субтитры, языки
Сегодня я вам расскажу о своем методе для изучения иностранных языков.
С чего начать изучение нового языка? Чаще всего люди на раннем этапе используют стандартный лексико-грамматический метод с доминированием письменного языка, который показал себя медленным и весьма скучным — вам чаще всего нужна зашкаливающая мотивация, чтобы не бросить где-то посередине.
Я предлагаю начать сразу с видео:
Первый нейросетевой переводчик для эрзянского языка
2022-10-09 в 10:00, admin, рубрики: cезон data mining, data mining, lower-resource language, machine learning, machine translation, ml, natural language processing, nlp, искусственный интеллект, малоресурсный язык, машинное обучение, машинный перевод, переводчик, СемантикаЭрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей. Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения.
Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно.
Как я собирал для этого тексты и обучал модели – под катом.