Главная

Рубрика «наборы данных»

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

2025-10-08 в 9:08, admin, рубрики: ML-репозитории, где искать датасет, датасеты, Компьютерное зрение, машинное обучение, наборы данных, обработка естественного языка, обучение моделей, подборка датасетов для ML, распознавание речи

Читать полностью »

Картель влиятельных датасетов в обучении ИИ

2025-03-25 в 9:01, admin, рубрики: llm, OpenAI, ruvds_статьи, sota, YouTube, датасеты, ИИ, наборы данных, обучение ИИ, переобучение, языковая модель

В последнее время такие компании, как OpenAI и Google, заключают эксклюзивные соглашения об обмене данными с издателями, крупными форумами вроде Reddit и социальными медиаплатформами, что становится для них ещё одним способом сконцентрировать власть.

Такая тенденция выгодна крупнейшим игрокам на рынке ИИ, которые могут позволить себе такие сделки, в отличие от исследователей, некоммерческих организаций и небольших компаний. Крупнейшие корпорации располагают лучшими ресурсами для сбора датасетов. В результате эталонные датасеты для бенчмарков (и для обучения) моделей ИИ всё больше концентрируются в руках малого количества корпораций и академических учреждений.

По мнению некоторых исследователей, это «новая волна асимметричного доступа», которой ещё не было в истории открытого интернета в таком масштабе.Читать полностью »

Откуда берут фотографии для тестирования систем распознавания лиц

2019-03-23 в 15:41, admin, рубрики: FRVT, Multiple Encounter Dataset, NIST, машинное обучение, наборы данных, обработка изображений, обучение нейросети, распознавание лиц

Откуда берут фотографии для тестирования систем распознавания лиц - 1
Аннотированная фотография из набора данных Diversity in Faces от IBM

Недавно компания IBM подверглась критике за то, что для обучения нейросетей без разрешения взяла общедоступные фотографии с фотохостинга Flickr и других сайтов, куда пользователи выкладывают свои снимки. Формально всё по закону — все фотографии опубликованы под лицензией Creative Commons — но люди чувствуют дискомфорт из-за того, что ИИ обучается на их лицах. Некоторые даже не знали, что их сфотографировали. Как известно, для съёмки человека в общественном месте не нужно спрашивать у него разрешения.
Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «наборы данных»

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

Картель влиятельных датасетов в обучении ИИ

Откуда берут фотографии для тестирования систем распознавания лиц