Рубрика «разметка»

Тыкай и кидай голосовухи: как ускорить сбор данных для мультимодальности

2024-10-03 в 9:03, admin, рубрики: CV, GigaChat, labeling, labeling tool, markup, Компьютерное зрение, разметка, разметка данных, разметка датасета, сбор данных

Привет! Мы собираем много разных данных и часто перед заказчиком стоит большая описательная задача в области задач компьютерного зрения: детально и максимально подробно описывать всё, что присутствует на изображении или видео.

В деталях описывать картинку с помощью текста — трудоемкая задача для человека. На днях исследователи из института Аллена предложили интересный способ оптимизации такой задачи. А так как мы, в хорошем смысле, поехавшие на качестве данных, то пройти мимо было невозможно.

Читать полностью »

Sapiens: фундаментальная CV-модель для задач с людьми

2024-09-05 в 9:28, admin, рубрики: AI, computer vision, CV, data mining, open source, ИИ, Компьютерное зрение, разметка, разметка данных, разметка изображений

Почти две недели назад из недр одной из самых прорывных AI лабораторий мира вышла новая классная модель (а точнее — семейство моделей) компьютерного зрения, но данная новость в русскоязычном интернете прошла будто бы без энтузиазма. А зря — штука довольно хороша.

Итак, у нас есть семейство моделей, которое из коробки поможет решить «четыре фундаментальные задачи человека в CV» (цитата авторов) и давайте посмотрим, что же там есть есть и как это работает.

Читать полностью »

Атрибуты HTML, которыми вы никогда не пользовались

2022-04-12 в 13:22, admin, рубрики: css, html, markup, атрибуты, разметка, теги, Формы ввода

В январе этого года Мэдисон Канна спросила у своих подписчиков в Twitter:

Какие языки/технологии вам бы хотелось изучить или узнать глубже в этом году?

Мой выбор: typescript, next.js, react, graphql, solidity, node — Мэдисон Канна (@Madisonkanna) January 3, 2022

Мой ответ был очень простым: HTML. И я ни в коей мере не был саркастичным или насмешливым. Разумеется, я неплохо знаю, какие теги использовать в каких случаях и как обеспечивать семантику и доступность моего HTML.

Однако существует целая куча малоиспользуемых атрибутов, о которых я забыл, и, вероятно, целая куча атрибутов, о существовании которых я и не знал. Этот пост стал результатом моих исследований, и я надеюсь, что он окажется для вас полезным при создании страниц на HTML.
Читать полностью »

Искусство парсинга 2 или транслитерация собственной разметки

2019-03-23 в 17:36, admin, рубрики: c++, html, Алгоритмы, верстка, парсинг, разметка, транслитерация

+БОНУС: как включать классы друг в друга в C++

Привет! Эта статья — прямое продолжение статьи Искусство парсинга или DOM собственными руками, где мы разобрали HTML-документ и построили на его основе абстрактное синтаксическое дерево (AST) с доступом к любому элементу через индексацию при помощи лишь стандартной библиотеки C++, проще говоря, научились самостоятельно парсить XML-подобные штуки. Напомню, что процесс парсинга, или синтаксического анализа/разбора состоит из двух этапов: лексического разбора (разбора текста на токены) и построения AST. Если первый мы рассмотрели очень подробно, с примерами и исходниками, то описание второго похоже на пустую куколку бабочки, у которой есть только оболочка, а прекрасное содержимое автор извлёк перед публикацией. На то была причина, для HTML построить дерево действительно просто, нужно всего 4 класса: пустой тег, блок, текстовый узел и корень документа, наследуемый от блока. Сегодня мы оставим такую простоту позади и построим дерево, где свойства элементов, и пустых, и блочных, будут содержаться не в атрибутах тегов, а непосредственно в классах, а для этого классов придётся создать много. Действительно много. Строить будем не из простых известных языков разметки, а создадим свой, с правилами, показанными на изображении под катом. Плюс в конце ещё переведём, или, говоря правильнее, транслитируем документ с предыдущей статьёй, размеченной нашим языком, в HTML, а в качестве бонуса я отвечу начинающим программистам C++ на тривиальный, но труднонаходимый вопрос: как включать классы «друг в друга»?
Читать полностью »

Специалист по разметке данных

2018-04-01 в 11:40, admin, рубрики: 1 апреля, big data, deep learning, Блог компании New Professions Lab, Карьера в IT-индустрии, машинное обучение, обработка изображений, разметка, семантическая разметка

Сегодня замечательный день (if you know what I mean), чтобы анонсировать нашу новую программу — Специалист по разметке данных.

На текущий момент в сфере искусственного интеллекта сложилась такая ситуация, при которой для обучения сильной нейронной сети нужны несколько компонентов: железо, софт и, непосредственно, данные. Много данных.

Железо, в общем-то, доступно каждому через облака. Да, оно может быть недешевым, но GPU-инстансы на EC2 вполне по карману большинству исследователей. Софт опенсорсный, большинство фреймворков можно скачать себе куда-то и работать с ними. Некоторые сложнее, некоторые проще. Но порог для входа вполне приемлемый. Остается только последний компонент — это данные. И вот здесь и возникает загвоздка.

Deep learning требует действительно больших данных: сотни тысяч–миллионы объектов. Если вы хотите заниматься, например, задачей классификации изображений, то вам, помимо самих данных, нужно передать нейронке информацию, к какому классу относится тот или иной объект. Если у вас задача связана еще и с сегментацией изображения, то получение хорошего датасета — это уже фантастически сложно. Представьте, что вам нужно на каждом изображении выделить границы каждого объекта.

В этом посте хочется сделать обзор тех инструментов (коммерческих и бесплатных), которые пытаются облегчить жизнь этих прекрасных людей — разметчиков данных.
Читать полностью »

Зачем нужны заголовки

2017-09-29 в 16:00, admin, рубрики: html, html-разметка, html5, Блог компании HTML Academy, верстка, для начинающих, для новичков, разметка, Разработка веб-сайтов, семантическая верстка, семантическая разметка

Зачем нужны заголовки - 1

Зачем нужны заголовки и какие теги для них использовать?

Этот вопрос нам задают чаще всего.

Читать полностью »

Памятка по базовой верстке статьи для Хабра без использования Markdown-разметки

2016-02-19 в 14:00, admin, рубрики: верстка статей, как сверстать статью, мелочи, никто не читает теги, пара хитростей, разметка, хабр, хабрахабр, метки: верстка статей, разметка

На Хабре, по меркам старожилов, я совсем недавно, всего два года, но пишу активно, по возможности каждый день. Так вот, читая статьи, да и просто прокручивая ленту свежих публикаций как на Хабре, так и на GT, я понял, что многие просто не могут совладать с версткой текста и, как следствие, достаточно часто годные публикации хоронятся их же авторами из-за нечитабельности текста. Или отпугивает кривая КДПВ, или еще что произойдет.

Возможно, для опытных авторов пост покажется капитанским, мелочным, или еще каким, ведь главное содержание, но тем, кто хочет пройти песочницу и влиться в Хабра-сообщество, я уверен, он поможет не только написать что-то полезное, но и красиво свой труд преподнести.

Картинка Для Привлечения Внимания и выравнивание по левому краю

Так уж сложилось, что вся лента Хабрахабра выровнена по левому краю. По этой причине опытные авторы небольшие изображения оставляют слева или используют картинки шириной в 800-1000 px. Отдельно хочется заметить, что чуть ли не лучшим является соотношение КДПВ 2 к 1, т.е. изображения 800х400 px. Подобная пропорция позволяет SMM-щику соц. сетей не изгаляться с вашей картинкой (а то и вовсе искать что-то другое, более подходящее по размерам), а использовать оригинал, не нарушая задумки автора.
Читать полностью »

Новый инструмент проверки структурированных данных, документация и не только

2015-02-13 в 12:19, admin, рубрики: Google, JSON-LD, Блог компании Google, веб-дизайн, Веб-разработка, документация, инструменты тестирования, правила, проверка, разметка, Семантика, синтаксис, структурированные данные, метки: структурированные данные

Разметка структурированных данных позволяет показывать дополнительную информацию с вашего сайта в результатах поиска и сервисах Google. Мы рады представить несколько обновлений, которые помогут создавать разметку на сайте:

Новый Инструмент проверки структурированных данных, который показывает, как Google интерпретирует ваш контент.
Дополненная документация и правила использования возможностей Google, основанных на технологии структурированных данных.
Расширенная поддержка синтаксиса разметки JSON-LD.

Инструмент проверки структурированных данных

Новый Инструмент проверки структурированных данных лучше показывает то, как Google интерпретирует разметку структурированных данных на странице сайта.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «разметка»

Тыкай и кидай голосовухи: как ускорить сбор данных для мультимодальности

Sapiens: фундаментальная CV-модель для задач с людьми

Атрибуты HTML, которыми вы никогда не пользовались

Искусство парсинга 2 или транслитерация собственной разметки

+БОНУС: как включать классы друг в друга в C++

Специалист по разметке данных

Зачем нужны заголовки

Памятка по базовой верстке статьи для Хабра без использования Markdown-разметки

Картинка Для Привлечения Внимания и выравнивание по левому краю

Новый инструмент проверки структурированных данных, документация и не только

Инструмент проверки структурированных данных