- PVSM.RU - https://www.pvsm.ru -
Перед вами перевод статьи из блога Seattle Data Guy [1]. В ней авторы выделили 5 наиболее популярных ресурсов для обработки Big Data на текущий момент.
Сегодня любая компания, независимо от ее размера и местоположения, так или иначе имеет дело с данными. Использование информации в качестве ценного ресурса, в свою очередь, подразумевает применение специальных инструментов для анализа ключевых показателей деятельности компании. Спрос на аналитику растет пропорционально ее значимости, и уже сейчас можно определить мировые тенденции и перспективы в этом секторе. Согласно мнению International Data Corporation [2], в 2019 году рынок Big Data и аналитики готов перешагнуть порог в 189,1 миллиарда долларов [3].
Инструменты для анализа данных — это ресурсы, которые поддерживают функцию оперативного сбора, анализа и визуализации данных. Они полезны для любой компании, которая уделяет внимание потребительским предпочтениям, данным, рыночным трендам и т. д. Сегодня набирают популярность многие эффективные и общедоступные открытые ресурсы, что усложняет выбор самой успешной платформы. Возможностей для анализа данных сейчас очень много, но хочется найти оптимальный вариант.
В мире информационной аналитики автоматическим сбором, обработкой и анализом данных занимаются как крупные компании, так и небольшие. Чтобы помочь вам выбрать подходящую платформу, мы составили список из 5 топовых аналитических инструментов. Это лучшие продукты, которые существуют на сегодняшний день в этой сфере. Оценивались они по следующим критериям:
С этой подборкой вам будет проще подобрать оптимальный аналитический инструмент для вашей деятельности. Итак, вот 5 наиболее популярных ресурсов для обработки Big Data на текущий момент:
Платформа Apache Cassandra [4], разработанная в 2008 году Apache Software Foundation, представляет собой бесплатный и доступный любому пользователю инструмент для управления базой данных. Apache Cassandra распространяется и работает на основе NoSQL. Управление данными осуществляется через кластерные формы, соединяющие несколько узлов в центрах обработки многокомпонентных данных. В терминологии NoSQL инструмент Apache Cassandra также обозначен как «столбцовая база данных».
В первую очередь, эта система востребована в приложениях для Big Data, которые работают с актуальными данными, например, в сенсорных устройствах и социальных сетях. Кроме того, Cassandra использует децентрализованную архитектуру, которая подразумевает, что функциональные модули, такие как сегментирование данных, устранение отказов, репликация и масштабирование, доступны по отдельности и работают в цикле. Более подробную информацию можно узнать в документации Apache Cassandra [5].
Ключевые характеристики Apache Cassandra:
Скачать: http://cassandra.apache.org/download/ [6]
Apache Hadoop [7] представляет собой общедоступный аналитический инструмент для распределенного хранения и обработки больших пакетов данных. Кроме того, Apache Hadoop предоставляет услуги для доступа к данным с помощью набора утилит, которые позволяют выстроить сеть из нескольких компьютеров. Внутренняя структура Apache Hadoop лояльна к поддержке крупных компьютерных кластеров. Более подробную информацию можно узнать в документации Apache Hadoop [8].
Ключевые характеристики Apache Hadoop:
Скачать: https://hadoop.apache.org/releases.html [9]
Elasticsearch [10] — это инструмент на основе JSON для поиска и анализа Big Data. Elasticsearch предоставляет децентрализованную библиотеку аналитики и поиск на основе архитектуры REST по решенным вариантам использования. Также платформа Elasticsearch проста в управлении, в высокой степени надежна и поддерживает горизонтальную масштабируемость. Более подробную информацию можно узнать в документации Elasticsearch [11].
Ключевые характеристики Elasticsearch:
Скачать: https://www.elastic.co/downloads/elasticsearch [12]
Продукт Facebook Presto [13] выделяется за счет стабильной скорости обработки коммерческих данных. Presto функционирует в качестве децентрализованной библиотеки запросов на основе SQL, которая может отлично взаимодействовать с Hadoop [7], MySQL и другими ресурсами. Для работы с совместными аналитическими запросами по отношению к различным источникам информации Presto использует децентрализованную открытую схему. Система Presto также предоставляет качественную интерактивную аналитику, недаром ее считают одним из лучших общедоступных инструментов для анализа Big Data. Более подробную информацию можно узнать в документации Presto [14].
Ключевые характеристики Presto:
Скачать: https://prestodb.github.io/download.html [15]
Talend [16] считается одним из представителей нового поколения инструментов в сфере Big Data и облачной интеграции. Talend остается открытой платформой, которая предлагает свой способ автоматической и упрощенной интеграции Big Data. Среди дополнительных решений от Talend стоит отметить проверку качества данных, управление данными и генерацию собственного кода с помощью графического мастера. Более подробную информацию можно узнать в документации Talend [17].
Ключевые характеристики Talend:
Скачать: https://www.talend.com/download/ [18]
Миром правит информация. Чтобы стать лидером, компании необходимо отслеживать данные и уметь правильно с ними работать. Если вы планируете укрепить свои позиции, выявляя потребительские предпочтения, рыночные тренды, эффективные бизнес-модели и будущие перспективы, то следует пристально рассмотреть передовые инструменты для анализа данных.
Не стоит упускать из внимания статистические данные вашей деятельности и недооценивать их значение. Также важно понимать трафик ваших коммерческих данных. Воспользовавшись одним из представленных выше аналитических инструментов (или же любым другим), вы получите много новой информации и сможете значительно увеличить свои шансы на успех. Поэтому, чтобы двигаться в верном направлении, не забывайте о ваших данных, анализируйте их, работайте с ними и берите на вооружение полученный результат.
Автор: Plarium
Источник [19]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/analiz-danny-h/340584
Ссылки в тексте:
[1] Seattle Data Guy: https://www.theseattledataguy.com/
[2] International Data Corporation: https://www.idc.com/
[3] 189,1 миллиарда долларов: https://www.idc.com/getdoc.jsp?containerId=prUS44998419
[4] Apache Cassandra: http://cassandra.apache.org/
[5] документации Apache Cassandra: http://cassandra.apache.org/doc/latest/
[6] http://cassandra.apache.org/download/: http://cassandra.apache.org/download/
[7] Apache Hadoop: https://hadoop.apache.org/
[8] документации Apache Hadoop: https://hadoop.apache.org/docs/stable/
[9] https://hadoop.apache.org/releases.html: https://hadoop.apache.org/releases.html
[10] Elasticsearch: https://www.elastic.co/
[11] документации Elasticsearch: https://www.elastic.co/guide/index.html
[12] https://www.elastic.co/downloads/elasticsearch: https://www.elastic.co/downloads/elasticsearch
[13] Presto: https://prestodb.io/
[14] документации Presto: https://prestodb.io/docs/current/
[15] https://prestodb.github.io/download.html: https://prestodb.io/download.html
[16] Talend: https://www.talend.com/
[17] документации Talend: https://help.talend.com/reader/MW~bv2NtBd_sCQPsRNN2pA/lCqoKBO1L5I3HJrhQ49C8g
[18] https://www.talend.com/download/: https://www.talend.com/download/
[19] Источник: https://habr.com/ru/post/481168/?utm_campaign=481168&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.