Новости информационных технологий - 59

Лёха — единственный биолог среди моих друзей. Мы сидим в баре, он тычет телефоном мне в лицо. На экране — чашка Петри. В колонию бактерий вливают бактериофаги. Бактерии лопаются. Колония редеет. Тает. Исчезает.

Перематывает на сутки.

Колония на месте. Как ни в чём не бывало.

«Выжившие передали устойчивость потомкам. Они не понимают вирус. Перебирают мутации, пока что-то не сработает. А потом это наследуется».

Я смотрю на экран и думаю совсем про другое. Вчера Карпати выложил microGPT — минимальную архитектуру GPTЧитать полностью »

Привет! Сегодня разберём простую на первый взгляд, но очень показательную задачку: найти максимальное произведение двух чисел в массиве целых чисел.

На собеседованиях, в олимпиадах или даже в реальных задачах часто возникают простые на вид задачи, за которыми скрывается важный урок: правильный выбор алгоритма решает всё.

Казалось бы — что сложного скрывает поставленная задача о нахождении максимального произведения двух чисел? Но в зависимости от подхода решение может работать за O(n^2), O(n log n) или O(n).

Компания Lenovo готовит планшет ThinkPad X13 Detachable. Обычно производители называют такие устройства ноутбуками-трансформерами, потому что к такому планшету можно подключить чехол-клавиатуру и получится ноутбук. Но технически это именно планшет. 

Привет! Сегодня хочу поделиться интересным проектом, который мы сделали для конкурса. Задача — превратить сырые GPX-треки (треки с GPS-устройств) в структурированные данные с визуализацией, метеорологической и географической аналитикой. Всё это — на Python, с использованием открытых API и библиотек для работы с геоданными.

Что делает проект?

Код представляет собой пайплайн обработки GPS-треков, который:

  1. Скачивает GPX-файлы по ссылкам

  2. Визуализирует треки на карте

  3. Извлекает данные о каждой точке (координаты, время, высота)

  4. ДобавляетЧитать полностью »

Введение

Добрый день. Сегодня я расскажу о том, как я за 2 месяца с полного нуля создал доменную RAG систему с корпусом в 20+ книг. В статье затрону проблемы парсинга данных (особенно PDF документов, с которыми приходилось иметь дело), чанкинга, создания и индексации эмбеддингов, а также самого интересного – ретривера. Расскажу о latency, трейд-оффах, и сложностях реализации подобных систем локально на ноутбуке (хоть и «игровом») без использования API LLM.

Вся система делалась мной самостоятельно без использования LangChain Читать полностью »

Привет! Меня зовут Алексей, и я занимаюсь беспроводными технологиями.

На новогодних каникулах, лениво перелистывая каналы в телевизоре, я наткнулся на современную интерпретацию «Графа Монте‑Кристо». Как раз на тот момент, когда главный герой управлял оптическим телеграфом. Об этом удивительном устройстве я слышал на курсе сетевых технологий ещё в университете, но тогда на меня это не произвело никакого впечатления. Ну телеграф и телеграф, только оптический: что‑то там маячило и показывало. Но живая картинка в фильме меня заинтересовала, и я решил твёрдо разобраться с этой темой. И, конечно… забыл.

Читать полностью »

Привет! Меня зовут Черняховский Денис, и я Data Engineer. Я достаточно продолжительное время работаю с данными и увлекаюсь математической статистикой. Совсем недавно решил поискать в интернете, как другие опытные дата-инженеры исследуют качество данных при помощи статистики, и обнаружил, что никак… пум-пум-пум. А далее обнаружил, что проблема уходит корнями гораздо глубже, чем может показаться.

В этой статье я постараюсь рассказать:

  • почему дата-инженерам необходимо использовать статистику и почему её не используют

  • проведём тесты на реальных примерах данных

  • Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js