- PVSM.RU - https://www.pvsm.ru -
Вот видишь ты на улице пёсика. Ты всегда видишь на улице пёсиков. Вот кто-то вообще их не замечает и не имеет хлопот, вот нет этих душевных терзаний, и вообще можно считать, что им на улице норм. Но ты же! И заметил, и глаза у тебя на мокром месте, такой думаешь: «пёсик. уаа, такой миленький, взял бы но не могу. Но вот прям точно, но никак». И пошёл такой дальше. Но пофотал его, погладил.

Вот таким добрым малым нужно кидать нам в систему геопозицию животинки на данный момент и пару фото.
Есть и те, кто очень хочет найти своего убежавшего спариться или ещё чего пёсечка. Вот этим прям точно сильно хочется найти питомца. Они сами размещают объявления, ходят по подворотням, подвалам и по разным сайтам.
2019 год располагает к более технологичным решениям. И наш проект с рабочим названием PetSI (PetSearchInstrument) именно такой.
В рамках направления Machine Learning for Social Good [1] сообщества Open Data Science мы вместе с 9851754 [2] и нашей командой делаем сервис для поиска пропавших животных, в котором владелец может указать фото животного, адрес пропажи и другие характеристики, а в ответ получить наиболее релевантные с точки зрения нашего алгоритма сообщения о найденных или увиденных животных.
Краткий алгоритм работы нашего сервиса: мы агрегируем данные(фото, место находки, порода итд) с нескольких сайтов, преобразуем изображения нейронной сетью в вектор, обучаем knn и показываем ближайших соседей введённой фотографии. Ты находишь потерянное животное, животное возвращается домой. Все довольны)

Кроме поиска пропавших домашних питомцев мы развиваем рекомендательную систему для ускорения пристройства приютских животных новым хозяевам. Пока у нас нет статистики поведения пользователей на сайте, поэтому мы используем content-based рекомендации основанные на визуальной схожести.

Разработка ведется на python. Мы используем следующий технологический стек:
Для синхронизации всех стадий нашего рабочего процесса мы используем Airflow:

Сбор данных многоступенчатый. Сначала пауки собирают информацию и в необработанном виде отправляют ее в очередь. С другой стороны очереди специальные обработчики преобразовывают данные в нужный вид(например, преобразуют текст в адрес) и складывают в СУБД.

Собранные данные валидируются и отправляются на обучение моделям. Для сайта написан специальный сервис, который загружает новые данные и модели, а также инициирует пересчет поисковой выдачи для каждого пользователя. Весь цикл занимает примерно 8 часов.
Как мы используем машинное обучение и анализ данных:

Для дальнейшего развития нам нужны:
Зачем это может быть нужно тебе:
Есть план. Нужны люди в команду.
Пиши в личку или заполни форму [5] и присоединяйся!
Напоследок мы подготовили подборку собак-мемов и похожих на них собак из приютов, которых мы нашли с помощью наших алгоритмов
Автор: Gavroshe
Источник [10]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/324127
Ссылки в тексте:
[1] Machine Learning for Social Good: https://opendatascience.slack.com/messages/CJ6UPQ3FZ
[2] 9851754: https://habr.com/ru/users/9851754/
[3] http://petsiai.ru: http://petsiai.ru/
[4] хостинга: https://www.reg.ru/?rlink=reflink-717
[5] форму: https://drive.google.com/open?id=1NH_uG2FGDwg6R15GkvcO4W9uXOuiLvv4IDfhgUKXLmw
[6] podberi-sobaku.ru/sobaki-v-dobrie-ruki/15400-yamajka: https://podberi-sobaku.ru/sobaki-v-dobrie-ruki/15400-yamajka
[7] podberi-sobaku.ru/sobaki-v-dobrie-ruki/20471-khati: https://podberi-sobaku.ru/sobaki-v-dobrie-ruki/20471-khati
[8] podberi-sobaku.ru/sobaki-v-dobrie-ruki/21766-rudik: https://podberi-sobaku.ru/sobaki-v-dobrie-ruki/21766-rudik
[9] podberi-sobaku.ru/sobaki-v-dobrie-ruki/12017-belyash: https://podberi-sobaku.ru/sobaki-v-dobrie-ruki/12017-belyash
[10] Источник: https://habr.com/ru/post/459988/?utm_source=habrahabr&utm_medium=rss&utm_campaign=459988
Нажмите здесь для печати.