Рубрика «BigData» - 5

Переход с Redshift на ClickHouse

2018-12-19 в 8:06, admin, рубрики: Amazon Web Services, AWS, big data, BigData, clickhouse, devops, funcorp, redshift, Блог компании FunCorp, системное администрирование

Переход с Redshift на ClickHouse - 1

Долгое время в iFunny использовался Redshift в качестве базы данных для событий, которые происходят в сервисах бэкенда и мобильных приложениях. Его выбрали потому, что на момент внедрения, по большому счёту, не было альтернатив, сравнимых по стоимости и удобству.

Однако всё изменилось после публичного релиза ClickHouse. Мы долго его изучали, сравнивали стоимость, прикидывали примерную архитектуру и вот, наконец, этим летом решились посмотреть, насколько он нам полезен. Из этой статьи вы узнаете о том, какую проблему нам помогал решить Redshift, и как мы перенесли это решение на ClickHouse.
Читать полностью »

«Мне кажется, идеи команды – самое важное при разработке продукта»

2018-12-03 в 11:10, admin, рубрики: big data, BigData, data analysis, data mining, data science, data scientist, IT-образование, Блог компании New Professions Lab, управление разработкой

Мы продолжаем серию интервью с выпускниками Newprolab, в которой они рассказывают о своей истории перехода в data science. Истории разные и будут интересны тем, кто задумывается о смене карьерной траектории или о том, как новые знания могут помочь решать в том числе текущие задачи. Недавно встретились с Яной Чаруйской, Product Owner в МТС. Яна рассказала, как она пришла в большие данные, как профессионально росла, вспомнила о своем любимом проекте, подарившем ей помимо знаний и опыта, еще и друзей. Рассказала о рабочей атмосфере в МТС, о проектах, которые делает ее команда, о своей мечте, планах на будущее и пр.

— Яна, расскажи немного о себе и своем бэкграунде.

— Меня зовут Яна Чаруйская, я Product Owner в МТС. Интересуюсь областью Big Data и занимаюсь ею уже порядка двух лет. Если вкратце про мою историю: я закончила ВШЭ по направлению «Бизнес-информатика», училась 6 лет, затем год училась на психолога. Четыре года я проработала в IT-консалтинге, три из них занималась хранилищами данных, витринами данных, построением управленческой отчетности в основном для крупных банков. Последний год в консалтинге занималась машинным обучением и предиктивной аналитикой. Сейчас я работаю в МТС менеджером по продукту, у меня команда из 6 человек, и она растет, в ближайшее время нанимаю еще 7. В целом, компания тоже расширяется, сейчас в МТС более 150 Big Data специалистов и еще открыто множество вакансий (планируем увеличить штат практически в 2 раза!). Мы с командой разрабатываем несколько продуктов одновременно, в настоящий момент они на разных стадиях реализации: есть продукты, которые находятся в стадии R&D, какие-то — в стадии продуктивизации.
Читать полностью »

«Data Science, как математика и физика, — еще один способ познавать мир вокруг себя»

2018-11-26 в 12:21, admin, рубрики: big data, BigData, data mining, data science, data scientist, new professions lab, Блог компании New Professions Lab, машинное обучение

Мы продолжаем серию интервью с выпускниками Newprolab, в которой они рассказывают о своей истории перехода в область работы с большими данными. Истории разные и будут интересны тем, кто задумывается о смене карьерной траектории или о том, как новые знания могут помочь решать в том числе текущие задачи. Знакомьтесь — Олег Хомюк, Head of R&D в Lamoda.

Олег рассказал про свой карьерный путь, ценности, почему выбрал Lamoda, а не компанию в Долине, про текущие проекты, свою команду, про самый успешный и самый неудачный проекты, про отношение к data science и многое другое.

Читать полностью »

Геологическое 3D-моделирование, каротаж и технатон от Aramco Innovations

2018-10-24 в 10:38, admin, рубрики: Aramco Innovations, BigData, IT в нефтедобыче, Saudi Aramco, геология, ИИ, машинное обучение, нефтедобыча, технатон, я пиарюсь

Признайтесь, когда речь заходит о добыче нефти, перед глазами встают техасские пейзажи и механические «качалки» на фоне закатного неба. Кто-то увидит еще трубы-факелы, сжигающие попутные газы, а может еще и буровую платформу где-то на морском шельфе. Само собой, добыча нефти — бизнес тяжелый и сопряженный с определенными рисками. Огромные машины, буровые станки, опасность взрыва и пожара. Нефтедобыча в сознании масс — дело, несомненно, брутальное, для крепких рабочих и почти таких же крепких инженеров.

Геологическое 3D-моделирование, каротаж и технатон от Aramco Innovations - 1

Все вы одновременно и правы, и ошибаетесь. Да, нефть добывали и добывают с помощью «качелей», но весь этот образ, который мы получили из кино и сериалов, уже не соответствует полной картине; прогрессивные компании все активнее начинают внедрять последние достижения из области IT. Современные нефтяники одновременно используют последние наработки в обработке BigData, ИИ, машинного обучения и многих других. Ниже, опираясь на опыт компании Aramco Innovations, будет несколько примеров того, насколько глубоко IT-технологии проникли в такой, казалось бы, классический и инертный бизнес, как нефтедобыча.

Стоит начать с того, о чьих кейсах пойдет речь. Aramco Innovations — российское представительство исследовательской организации, которая входит в структуру национальной нефтедобывающей компании Саудовской Аравии Saudi Aramco. Последняя является крупнейшим нефтедобытчиком на планете и целиком принадлежит Королевству Саудовская Аравия. Конкретно Aramco Innovations занимается для материнской организации исследованиями в области искусственного интеллекта (ИИ), высокопроизводительных вычислительных систем и наноматериалов. Компания недавно открыла офис в Москве, как в одном из наиболее перспективных мест для организации научной работы в сферах ИИ, BigData и машинного обучения.
Читать полностью »

Bigdata, машинное обучение и нейросети – для руководителей

2018-05-25 в 17:27, admin, рубрики: big data, BigData, Блог компании 1С-Битрикс, машинное обучение, электронная коммерция

Если менеджеру попытаться разобраться в этой области и получить конкретные бизнес-ответы, то, скорее всего, страшно заболит голова и екнет сердце от ощущения ежеминутно упускаемой выгоды.

"AlphaGo обыграл чемпиона по Go" впервые за всю историю человечества, скоро наши улицы заполонят беспилотные автомобили, распознавание лиц и голоса теперь в порядке вещей, а в квартиру к нам завтра постучатся AI-секс-куклы с грудью наивысшего размера с шампанским под мышкой и настраиваемым уровнем интенсивности и продолжительности оргазма.

Все оно так, но что делать-то прямо сейчас. Как на этом заработать в краткосрочной перспективе? Как заложить прочный фундамент на будущее?

Постараюсь дать исчерпывающие ответы на все мучающие вас вопросы, «вскрыть» подводные камни и, главное — здраво оценить риски в AI и научиться ими правильно управлять. Ведь то, что не понимаем, то и не “танцуем”.

Читать полностью »

Метод фрактального многообразия в задачах Data Science

2018-05-04 в 11:46, admin, рубрики: big data, BigData, анализ данных, Большие данные, математика, топология, фрактал, фракталы

1. Постановка задачи

Наборы числовых упорядоченных данных можно разделить на две группы: гауссовы и странные (негауссовы). Если к гауссовым данным можно применять количественное сравнение, то к странным данным такой подход неприменим ввиду их относительности и отсутствия стандарта, что оставляет возможным лишь качественный анализ, который во многих случаях является неоднозначным и трудоемким. При этом такие данные широко распространены, а задача их анализа является актуальной для многих областей науки.

Далее будет представлен вычислительный метод, преобразующий исходные негауссовы данные в гауссовы, что позволяет в дальнейшем сравнивать количественно структурные характеристики больших наборов данных.

Читать полностью »

Ищем спикеров на Java MeetUp

2018-04-28 в 9:47, admin, рубрики: architecture, BigData, java, kotlin, meetups, qa, Raiffeisen, raiffeisenIT, scala, Блог компании Райффайзенбанк, конференции, Райффайзенбанк, Учебный процесс в IT

Ищем спикеров на Java MeetUp - 1

Мы активно развиваем внутренние профессиональные сообщества в Райффайзенбанке. По каждому из направлений мы регулярно проводим встречи и делимся новостями о том, что происходит у кого на проекте, кто что узнал интересного и чему может научить.

Мы знаем, как важно общаться с людьми из других команд и проектов, иметь возможность спросить совета, обсуждать только что появившиеся технологии и поделиться опытом. Поэтому 16 мая, в московском офисе Райффайзенбанка, мы организуем наш первый открытый Java MeetUp.
Подробности под катом.
Читать полностью »

Анализируй это — Lenta.ru

2017-12-04 в 12:31, admin, рубрики: big data, BigData, data engineering, data mining, data science, R, открытые данные

Анализируй это — Lenta.ru - 1

Анализируй это. Lenta.ru (часть 1)

What, How, Why

What — анализ статей новостного ресурса Lenta.ru за последние 18 лет (с 1 сентября 1999 года). How — средствами языка R (с привлечением программы MySterm от Yandex на отдельном участке). Why… В моем случае, коротким ответом на вопрос "почему" будет "получение опыта" в Big Data. Более развернутым же объяснением будет "выполнение какого-либо реального задания, в рамках которого я смогу применить навыки, полученные во время обучения, а так же получить результат, который я бы смог показывать в качестве подтверждения своих умений".

Читать полностью »

Используем Apache Ignite в быту

2017-10-20 в 6:45, admin, рубрики: .net, Apache, big data, BigData, C#, gridgain, Ignite, java, MapReduce, nosql, sql, Блог компании GridGain

В продолжение темы «доступным языком про Ignite / GridGain», начатой в предыдущем посте (Для чего нужен Apache Ignite), давайте рассмотрим примеры использования продукта «для простых смертных».

Терабайты данных, кластеры на сотни машин, big data, high load, machine learning, микросервисы и прочие страшные слова — всё это доступно Ignite. Но это не значит, что он не годится для менее масштабных целей.

Сегодня мы рассмотрим, как Ignite может легко хранить любые ваши объекты, обмениваться ими по сети и обеспечивать взаимодействие .NET и Java.

Apache Ignite.NET

Читать полностью »

Открытая трансляция из главного зала SmartData 2017: речь не про решения — речь про эволюцию

2017-10-20 в 6:09, admin, рубрики: AI, big data, BigData, catboost, cgi, data science, deep learning, Hadoop, machine learning, Блог компании JUG.ru Group, машинное обучение, свёрточная нейросеть, сверточные нейронные сети, свёрточные сети

Открытая трансляция из главного зала SmartData 2017: речь не про решения — речь про эволюцию - 1

Как мы уже неоднократно сообщали ранее, в этом году компания JUG.ru Group решила заглянуть в будущее и ~~разобраться, какая необходимость двум серым ящикам взаимодействовать друг с другом~~ впустить в наш мир дозу сакральных знаний по Big Data и машинному обучению — мы сделали конференцию SmartData 2017, которая пройдёт в Питере 21 октября.

Зачем мы собираем конференцию по Big Data и машинному обучению? Потому что не можем не собрать. И чтобы обратить в наше братство как можно большее количество разработчиков, мы традиционно открываем бесплатную онлайн-трансляцию из первого зала конференции.

Итак, бесплатная онлайн-трансляция из главного зала SmartData 2017 начнётся 21 октября 2017 года в 9:30 утра по московскому времени. Только вы, мы и будущее. В этот раз трансляция будет доступна в 2k — доставайте ваши 4k мониторы!

Открытая трансляция из главного зала SmartData 2017: речь не про решения — речь про эволюцию - 2

Ссылка на онлайн-трансляцию первого трека конференции SmartData 2017 и краткое описание докладов — под катом.
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «BigData» - 5

Переход с Redshift на ClickHouse

«Мне кажется, идеи команды – самое важное при разработке продукта»

«Data Science, как математика и физика, — еще один способ познавать мир вокруг себя»

Геологическое 3D-моделирование, каротаж и технатон от Aramco Innovations

Bigdata, машинное обучение и нейросети – для руководителей

Метод фрактального многообразия в задачах Data Science

1. Постановка задачи

Ищем спикеров на Java MeetUp

Анализируй это — Lenta.ru

Анализируй это. Lenta.ru (часть 1)

What, How, Why

Используем Apache Ignite в быту

Открытая трансляция из главного зала SmartData 2017: речь не про решения — речь про эволюцию