Рубрика «обработка естественного языка»

Ловим «взрослые» сцены на видео: как ИИ помогает редакторам

2025-10-28 в 13:10, admin, рубрики: streamlit, Whisper, yolo, аудиоанализ, возрастной рейтинг, гибридная модерация, Компьютерное зрение, машинное обучение, модерация контента, обработка естественного языка

Поводом для написания этой заметки стало обсуждение на недавнем отраслевом мероприятии задач Читать полностью »

Что именно ИИ-чатботы делают «под капотом»

2025-10-21 в 17:09, admin, рубрики: llm-модели, нейросети, обработка естественного языка, токены, чат-бот

Среди друзей я пользуюсь репутацией «ты ж программист», поэтому у меня нередко интересуются, как именно работают «под капотом» такие известные инструменты как ChatGPT, Claude, Grok или DeepSeek. Со временем я отточил ответ на этот вопрос — и потому, что нашёл способы лучше на него отвечать, и потому, что научился сам создавать большую языковую модель с нуля. Поэтому и сам понимать большие языковые модели я стал гораздо лучше.

Читать полностью »

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

2025-10-08 в 9:08, admin, рубрики: ML-репозитории, где искать датасет, датасеты, Компьютерное зрение, машинное обучение, наборы данных, обработка естественного языка, обучение моделей, подборка датасетов для ML, распознавание речи

Читать полностью »

ИИ — просто мешок слов. Как перестать видеть интеллект там, где его нет

2025-09-04 в 10:00, admin, рубрики: llm, антропоморфизм, генерация текста, искусственный интеллект, машинное обучение, обработка естественного языка, языковые модели

Или: Claude, пойдёшь со мной на выпускной?

Слушайте, я не знаю, уничтожит ли нас когда-нибудь искусственный интеллект, сделает ли он нас всех богатыми или что-то ещё, но одно я знаю точно: мы всё ещё используем неправильную метафору.

Мы пытаемся понимать эти модели как людей. Когда вы задаете вопрос ChatGPT, а он отвечает полноценными предложениями, кажется, будто внутри сидит крошечный человечек и печатает ответы. Возникает яркое ощущение «он живой!!», и мы включаем весь арсенал ментальных механизмов, который эволюционировал для взаимодействия с другими людьми: Читать полностью »

От хаоса к порядку: как ML помогает искать и защищать конфиденциальную информацию

2025-06-11 в 9:04, admin, рубрики: Data security, machine learning, named entity recognition, ner, nlp, защита данных, информационная безопасность, машинное обучение, обработка естественного языка, персональные данные

Читать полностью »

Введение

Почти все проекты начинаются с одного важного этапа — активных исследований. Инвестировать в то, что уже было сделано другими, в развитие их работы — это один из путей к повышению ценности вашего проекта. Важно не только извлечь уроки из опыта других, но и понять, чего не стоит делать в своем проекте, чтобы повысить его шансы на успех.

Читать полностью »

NLP: когда машины начинают понимать нас (Часть 3)

2024-12-09 в 6:00, admin, рубрики: keras, machine learning, natural language processing, nlp, python, pytorch, TensorFlow, искусственный интеллект, машинное обучение, обработка естественного языка

1. Введение

В предыдущих статьях мы рассмотрели теоретические основы NLP, включая базовые понятия, такие как токенизация, стемминг, лемматизация и другие. Мы также поработали с библиотеками NLTK и spaCy и выполнили простые задания по обработке текста.

В этой статье мы продолжим изучение NLP и перейдем к более продвинутым темам, которые являются главными для построения современных приложений и моделей в области обработки естественного языка. А также создадим и обучим модели самостоятельно, используя TensorFlow/Keras и PyTorch.

Читать полностью »

NLP: когда машины начинают понимать нас (Часть 2)

2024-12-08 в 6:30, admin, рубрики: machine learning, natural language processing, nlp, NLTK, python, spacy, искусственный интеллект, машинное обучение, обработка естественного языка, пайтон

1. Введение

В прошлой статье мы с вами изучили теоретические основы обработки естественного языка (NLP) и теперь готовы перейти к практике. В мире NLP выбор подходящего языка программирования и инструментов играет ключевую роль в успешной реализации проектов. Одним из наиболее популярных языков для решения задач в этой области является Python. Его простота, читаемость и поддержка мощных библиотек делают его идеальным выбором для разработчиков.

Читать полностью »

NLP: когда машины начинают понимать нас (Часть 1)

2024-12-07 в 7:00, admin, рубрики: machinelearning, ml, natural language processing, nlp, машинное обучение, обработка естественного языка

Введение в NLP

Представьте, что вы можете разговаривать с компьютером так же естественно, как с обычным человеком. Вы задаёте вопросы, получаете ответы, даёте команды - и это всё на вашем родном языке. Именно этим и занимается обработка естественного языка (Natural Language Proccessing, или NLP) - область искусственного интеллекта, которая фокусируется на взаимодействии между компьютерами и людьми с помощью естественного языка.

Читать полностью »

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

2024-12-06 в 11:15, admin, рубрики: nlp, TTS, обработка естественного языка, синтез речи

Введение

VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shotЧитать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «обработка естественного языка»

Ловим «взрослые» сцены на видео: как ИИ помогает редакторам

Что именно ИИ-чатботы делают «под капотом»

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

ИИ — просто мешок слов. Как перестать видеть интеллект там, где его нет

От хаоса к порядку: как ML помогает искать и защищать конфиденциальную информацию

Рекомендательная система для вашего каталога научных работ (и не только!)

Введение

NLP: когда машины начинают понимать нас (Часть 3)

1. Введение

NLP: когда машины начинают понимать нас (Часть 2)

1. Введение

NLP: когда машины начинают понимать нас (Часть 1)

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

Введение