Рубрика «Большие данные» - 9

Правительство США запретило Intel продавать процессоры в Китай: Америка боится ядерной программы КНР

2015-04-13 в 18:33, admin, рубрики: intel, Большие данные, Железо, Процессоры, суперкомпьютеры, Тяньхэ-2, ядерная программа, метки: Intel, Тяньхэ-2

Intel подала заявку на экспорт десятков тысяч чипов для обновления Тяньхэ-2, который последние полтора года возглавляет ТОП-500 суперкомпьютеров. Власти США запретили компании помогать обновлять китайский суперкомпьютер из-за страха перед ядерной программной КНР.

Зато в США Intel построит самый мощный суперкомпьютер в мире.

Читать полностью »

Немного о лаборатории Data Science в Билайне

2015-03-31 в 7:49, admin, рубрики: big data, data mining, data science, анализ данных, Анализ и проектирование систем, билайн, Блог компании ВымпелКом (Билайн), Большие данные, математика, машинное обучение, рекомендательные системы, метки: Big Data, Data Mining, Data Science, большие данные

Немного о лаборатории Data Science в Билайне - 1

Привет! Меня зовут Александр Крот, я отвечаю за разработку алгоритмов машинного обучения и интеллектуального анализа данных в компании Билайн, а также за подготовку и отбор специалистов по работе с данными под руководством Сергея Марина, который ранее знакомил Вас с работой нашего подразделения Big Data. Я уже писал про отдельные аспекты Big Data и Machine Learning, но сегодня я расскажу, как это устроено на практике, а именно — как мы в Билайн решаем задачи, связанные с анализом больших данных, как отбираем специалистов, какие инструменты и методы применяем на практике.
Читать полностью »

Big Data в Билайне: реальный опыт

Big Data в Билайне: реальный опыт - 1

Ваш персональный курс по Big Data

2015-03-16 в 13:13, admin, рубрики: big data, data mining, machine learning, python, анализ социальных сетей, Большие данные, математика, машинное обучение, Поисковые машины и технологии, социальные сети, метки: Big Data, Data Mining

Ваш персональный курс по Big Data - 1 Привет!

После публикации нескольких статей по Big Data и Машинному обучению, ко мне пришло немало писем от читателей с вопросами. За последние несколько месяцев мне удалось помочь многим людям сделать быстрый старт, некоторые из них — уже решают прикладные задачи и делают успехи. А кто-то уже устроился на работу и занимается решением реальных задач. Моя цель — чтобы вокруг меня были умные люди, с которыми в том числе и я смогу работать в дальнейшем. Поэтому я хочу помочь тем, кто действительно хочет научиться решать настоящие задачи на практике. В сети присутствует большое количество мануалов о том, как стать ученым по данным (Data Scientist). В свое время я прошел все, что там есть. Однако, на практике порой нужны совсем другие знания. О том, какие именно навыки нужны — я расскажу в сегодняшней статье и постараюсь ответить на все Ваши вопросы.
Читать полностью »

EBay выпустила инструмент с открытым программным кодом Pulsar для укрощения больших данных

2015-03-03 в 19:27, admin, рубрики: ebay, анализ больших данных, аналитика, Аналитика мобильных приложений, Большие данные, инструменты анализа, контекстная реклама, контент-маркетинг, опенсорс, Повышение конверсии, Управление e-commerce, электронная коммерция, метки: большие данные

Огромное количество неструктурированной информации — это проблема для eBay, грамотное решение которой позволит персонализировать контент, найти мошенников и повысить прибыль. Поэтому инженеры компании создали новый инструмент для обработки больших данных Pulsar.

Инструмент доступен для всех по опенсорсной лицензии, прямо сейчас он есть на GitHub.

Читать полностью »

Обучение на больших данных: Spark MLlib

2015-02-26 в 13:53, admin, рубрики: Apache, big data, data mining, Hadoop, python, spark, анализ данных, Большие данные, машинное обучение, разработка

Привет!

В прошлый раз мы познакомились с инструментом Apache Spark, который в последнее время становится чуть ли не самым популярным средством для обработки больших данных и в частности, Large Scale Machine Learning. Сегодня мы рассмотрим подробнее библиотеку MlLib, а именно — покажем, как решать задачи машинного обучения — классификации, регресии, кластеризации, а также коллаборативной фильтрации. Кроме этого покажем, как можно исследовать признаки с целью отбора и выделения новых (т.н. Feature Engineering, о котором мы говорили ранее, причем не один раз).
Читать полностью »

Обзор рынка информационных технологий от IDC

2015-02-12 в 6:54, admin, рубрики: alibaba, apple, idc, ipo, Lenovo, LenovoIN, rusventure, Большие данные, венчурные инвестиции, Законодательство и IT-бизнес, Исследования и прогнозы в IT, Карьера в IT-индустрии, Московская Биржа, рвк, рынок ИТ, социальные технологии, финансы в IT, метки: IDC, rusventure, РВК

Объем мирового рынка ИТ превышает два триллиона долларов США. Самый динамичный сегмент — программное обеспечение, он растет на 6% ежегодно. Быстро развивается категория приложений для совместной работы.

Развитие отрасли ИТ аналитики IDC представили в виде трех платформ. На первой работали тысячи пользователей, она построена на базе мейнфреймов и терминалов. Затем появились традиционные персональные компьютеры и интернет, технологии стали доступны сотням тысяч пользователей. Сегодня миллиарды пользователей для доступа к информации и работы используют мобильные устройства, облачные сервисы и социальные технологии.

Читать полностью »

«Специалист по большим данным»: учебная программа от «Лаборатории новых профессий»

2015-02-02 в 14:41, admin, рубрики: big data, Блог компании New Professions Lab, Большие данные

Сегодня я рад презентовать на Хабре образовательную программу «Специалист по большим данным» — интенсивный трехмесячный курс «Лаборатории новых профессий» для разработчиков и экспертов по IT-инфраструктуре, которые хотят войти в быстро в растущую индустрию Big Data.

«Специалист по большим данным»: учебная программа от «Лаборатории новых профессий» - 1 Читать полностью »

Визуализация многомерных данных с помощью диаграмм Эндрюса

2015-01-23 в 6:35, admin, рубрики: big data, python, Большие данные, визуализация данных

В эпоху Big Data графическое представление многомерных данных является весьма актуальной задачей. Однако результат визуализации не всегда соответствует ожиданиям. Вот пример не самого наглядного графика для изображения многомерных данных «Ирисы Фишера»:
Визуализация многомерных данных с помощью диаграмм Эндрюса - 1
Читать полностью »

Google помогает в поиске генетического кода аутизма

2014-12-26 в 11:22, admin, рубрики: big data, Google, аутизм, Биотехнологии, Большие данные, Медгаджеты, медицина, суперкомпьютеры

Прошлые 15 лет Google работал над распознаванием паттернов в хаосе информации в сети, а теперь свои умения приложит к поиску генетических причин аутизма. Для этого будут обработаны геномы 10 000 человек с аутизмом и членов их семей.

Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «Большие данные» - 9

Правительство США запретило Intel продавать процессоры в Китай: Америка боится ядерной программы КНР

Немного о лаборатории Data Science в Билайне

Big Data в Билайне: реальный опыт

Ваш персональный курс по Big Data

EBay выпустила инструмент с открытым программным кодом Pulsar для укрощения больших данных

Обучение на больших данных: Spark MLlib

Обзор рынка информационных технологий от IDC

«Специалист по большим данным»: учебная программа от «Лаборатории новых профессий»

Визуализация многомерных данных с помощью диаграмм Эндрюса

Google помогает в поиске генетического кода аутизма

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «Большие данные» - 9

Новости

Актуальные темы

Архив