Тестирование фотохостингов на цифровой износ (21 шт)

в 1:44, , рубрики: Исследования и прогнозы в IT, сохранение информации

Тестирование фотохостингов на цифровой износ (21 шт) - 1

В прошлый раз я описал явление и ввёл термин "цифровой износ", а на следующее, после публикации, утро обнаружил что в тот же день на mobile-review вышел обзор с упоминанием подобной темы. В обзоре рассказывалась история про человека который несколько лет загружал свои фотографии в Google Photo и в итоге лишился исходников.

«Это знак», — подумал я и решил провести анализ популярных фотохостингов на предмет цифрового износа фотографий.

Для этого, я выбрал критерии износа и смоделировал реальную ситуация из жизненного цикла цифровых фотографий.

Условия эксперимента: пользователь поехал на публичное мероприятие (в моём случае — всероссийский чемпионат «Лесоруб-2017»), по возвращении домой закинул фотографии в интернет (с помощью браузера) и потом пробабал исходники. Пробабал самым обычным образом — диск покрашился, случайно стёр папку, сознательно чистил диск будучи уверенным что у него в интернете всё сохранено и т.п. И потом, время спустя, пользователь понял что оригинала у него нет и пошёл скачивать то что у него «в интернете».

Но он забыл, что любые сервисы в любой момент могут пропустить ваши фотографии через мясорубку или вообще закрыться.

Посмотрим, что было в начале, что осталось в конце и насколько велик износ.

Поехали!

1. Выбор фотохостингов

В качестве базы фотохостингов я использовал коллективное бессознательное — нашёл статью и взял те сайты которые входят в первые 10 тысяч по Alexa. (Потом оказалось что данные в Википедии были устаревшими, но список был удачным. ) К полученному списку я добавил сервисы из аналогичных русскоязычных статей Википедии и парочку из головы.

В итоге, получились сайты отвечающие критерию «куда среднестатистический пользователь, скорее всего, загрузит свои фотографии».

Сперва получилось 20 сайтов, но потом я добавил Тамблер и получилось красивое ровное число.

2. Что не учитывалось

  • Не проверялся общий объём и макисмальный размер загружаемого файла.
  • Игнорировалась лицензия под которой загружается фотография (да, я сделал это сознательно и не буду отзывать фотографию с Википедии — можете вставить её в статью про Илону Броневицкую).
  • Срок хранения и стоимость так же не рассматривались.

Ни то, ни другое, ни третье не важны в рамках данного эксперимента.

И вообще, наш тестовый пользователь раздолбай, он загрузил картинку не для того что бы сделать бэкап, а для того что бы… в общем для чего сейчас в интернет фотки загружают, для того и загрузил.

Как порядочный раздолбай, он предпочитал не регистрироваться, а если где и регистрировался, то пароль благополучно забыл.

Короче, классический чайник.

3. Что учитывалось

Проверялось то, сколько исходной информации было утеряно.
Результаты сведены в таблицу:

ИМЯ ФАЙЛА — зная исходное имя файла, можно попытаться поискать его на диске — вдруг он где-то завалялся. Меняя число в имене файла можно попробовать найти диске другие фотографии с того же события.

MD5-ХЭШ ФАЙЛА — совпадает ли содержимое файла со всем барахлом

РАЗМЕР ФАЙЛА — какой-никакой, а критерий качества картинок у которых совпадает размер в пикселях

EXIF (очищ.) — полезная техническая информация. Из массива который выдала php-функция exif_read_data были удалены элементы 'FileName', FileDateTime', 'SectionsFound' ,'COMPUTED', 'FileSize'. Результат сериализован и хэширован. «no» означает, что нет ПОЛНОГО совпадения, но часть данных может быть сохранена (дата, модель камеры и пр.)

ДАТА СЪЁМКИ — так как съёмка у нас репортажная, то очень важно знать когда она происходила. Данная информация извлекалась из данных exif

ШИРИНА КАРТИНКИ — если отресайзили, то насколько всё плохо

ALEXA RANK — насколько популярен сервис

4. Результаты

В результате получилось три группы сайтов:
ОТЛИЧНО — нулевой или практически нулевой цифровой износ фотографии. Учитывая полное сохранение содержимого, на сохранение имени исходного файла я решил не настаивать.
ХОРОШО — фотография получили минимальный цифровой износ. Сохранилось исходное разрешение, но файл был подвергнут пересжатию. Кое-где сохранился exif.
ОСТАЛЬНОЕ — не то что бы фотография превратилась в фарш, который невозможно провернуть назад, но есть значительные потери. Удивительно, но треть из этих сервисов сохранила исходный exif, и больше половины — дату съёмки.

Ссылки на конкретные страницы на фотхостингах будут после таблицы. Можете проверять сами.

Тестирование фотохостингов на цифровой износ (21 шт) - 2

Дополнительные замечания по разным фотохостингам:

https://pinterest.com/ — удивительно бережное обращение с материалами, учитывая что это ещё и социальная сеть. Требует регистрации. Скачивал картинку со страницы просмотра.

https://www.flickr.com/ — Фликр он и есть Фликр. Требует регистрации. Скачивание со страницы просмотра. Есть настройки по скачиванию файлов и сохранению exif.

http://www.photobucket.com/ — некогда был популярен, но сейчас стал жёстко монетизироваться, требовать денег за возможность встраивания картинок на других сайтах и очень грубо обвешан рекламой. Фу таким быть.

http://www.fotolog.com/ — Требует регистрации. Скачивание из публичной части. Качество хуже чему photobucket.com. Что он вообще делает в этом обзоре?!

imgur.com — не требует регистрации. Скачал со страницы просмотра и потом удалил файл. Раньше мог хранить без сжатия, но потом изменил правила.

https://photos.google.com/ — Требует регистрации. Скачивание со страницы просмотра. Нужно выбрать правильную опцию хранения файлов.

https://fotki.yandex.ru/ — Требует регистрации. Скачивание со страницы просмотра. Можно запретить скачивание оригинала

https://my.mail.ru/ — Требует регистрации. Скачивание со страницы просмотра. Раньше назывался Фото@Mail.Ru, но потом был передан в «Мой мир» и, как пишут в Википедии, "Оригиналы фото были удалены без предупреждения пользователей. Пересжатые копии фото перенесены в Мой Мир.".

https://500px.com/ — Требует регистрации. Скачать можно только отреверсив страницу, и неважно что ты владелец.

http://www.fotki.com/ — Требует регистрации (заявлен какой-то 30-ти дневный триал). Вариант файла, который учтён в таблице, скачан из эккаунта владельца. В публичной части доступна картинка шириной 1400 пикселей.

radikal.ru — Старичок удивил. Реально удивил! Регистрации не требуется. Заливал с выбранной опцией заливки без пересжатия. Потом удалил.

https://www.smugmug.com/ — Требует регистрации (какой то 14 дневный триал). Оригинал был скачан из админки. В публичной части качество хуже.

https://unsplash.com/ — Требует регистрации. Скачивание из публичной части.

http://tinypic.com/ — Не требует регистрации (она есть, но регисрироваться не стал). Скачивание из публичной части. Обвешан рекламой.

http://photo.qip.ru/ — Требует регистрации. Скачивание из публичной части. На уровне фотографий есть какая то опция «Защита оригиналов фотографий» при которой нельзя скачать даже залогиненым авторо. Стоит отметить, что «оригинал» это очень странное название для файла в котором пикселей в 4 раза меньше чем у оригинале, а байт — в 14(!) раз.

https://pixabay.com/ — Требует регистрации. Скачивал залогиненым из публичной части. Забавно, но в итоге файл не прошёл какую-то их модерацю. Ещё и эта хрень с датой, когда из трёх полей у них сохранено только DateTimeOriginal ( DateTime и DateTimeDigitized — нет ). Не смотря на не самоё жёсткое пережёвывание фотографии — ФУ ТАКИМИ БЫТЬ!

https://www.shutterfly.com/ — Требует регистрации. И вообще это не фотохостинг, а сервис печати. Скачивание из админки. Очень бережное отношение!

https://www.snapfish.com/ — Требует регистрации. Ещё один сервис печати. При регистрации нельзя вставлять данные из буфера. Скачивание из админки. Из публичной части с меньшим разрешением. Вообще, очень странный сервис — сохранили имя файла, но пересжали. В exif сохранено много данных, потом гляну почему не совпало с оригиналом.

https://www.deviantart.com/ — Требует регистрации. Неожиданно хороший результат. Скачивание из публичной части. Из админской части скачать нельзя. Есть запрет на скачивание оригинала. То есть, нельзя скачать самому, не разрешив другим.

https://www.tumblr.com/ — Требует регистрации. Скачивание из публичной части. Из админской части — нет. Ожидаемый результат для соцсети.

https://commons.wikimedia.org — Требует регистрации. Было бы странно если бы они не сохраняли оригинал, но странно что переименовали файл.

5. Выводы

Этим анализом популярных фотохостинов я хотел показать, как цифровой износ происходит в реальности, когда человек теряет возможность получить оригинал фотографии и остаётся с тем что он когда-то залил в интернет.

На практике получается так же как с бумажными фотографиями — когда-то у вас был негатив, да и фотографии печатали на весь класс, но спустя годы осталась лишь парочка фоток из которых одна помятая, а другая порезанная.

То что получилось в меня в эксперименте — износ в чистом виде, пусть и цифровой.

6. Ещё одни выводы

В данном тексте не только было продемонстрировано как теоретически бессмертные цифровые фотографии превращаются в труху, но и то как и по каким критериям выбирать себе фотохостинг.

Так что, если Вам жалко выпускать в мир фотографии в хорошем качестве — пользуйтесь сервисами из группы «ПРОЧЕЕ».

Во всех остальных случаях — выбирайте сервисы из группы «ОТЛИЧНО», но помните, что не только Вы сможете скачать оригиналы.

И, в любом случае, учитывайте, что любые сервисы в любой момент могут пропустить ваши фотографии через мясорубку или вообще закрыться.

* * *

Народ, а накидайте в комментариях информации по закрывшимся фотохостингам которые раньше были крутыми.

Пикаса
Панорамио
… кто ещё?

Автор: Михаил Елисейкин

Источник

Поделиться

* - обязательные к заполнению поля