Деанонимизация программиста возможна не только через исходный код, но и через скомпилированный бинарный файл

в 5:21, , рубрики: De-Anonymizing, open source, информационная безопасность, Программирование, метки:

Не секрет, что многие разработчики программного обеспечения с открытым исходным кодом и не только, по разным причинам желают сохранить свою анонимность. Совсем недавно группа исследователей опубликовала работу, в которой описываются методы деанонимизации программиста по его стилю кодирования через анализ исходных кодов. Авторы утверждают, что им удалось достигнуть средней точности идентификации в 94%.

С помощью построения абстрактных синтаксических деревьев на основе разбора исходного текста, им удалось выделить устойчивые отличительные признаки при написании кода, которые трудно скрыть даже целенаправленно. Используя машинное обучение и набор эвристик, удалось добиться впечатляющей точности определения авторства среди выборки из 1600 программистов Google Code Jam.

Деанонимизация программиста возможна не только через исходный код, но и через скомпилированный бинарный файл - 1

В своей новой работе, исследователи продемонстрировали, что деанонимизация возможна и через анализ уже скомпилированных бинарных файлов в отсутствии исходных кодов (видео презентации доклада). В этот раз для исследования использовались исходные коды 600 участников Google Code Jam, которые были скомпилированы в исполняемые файлы, а потом подвергались разбору. Благодаря тому, что задания на соревнованиях были одинаковы для всех, разница файлов заключалась в значительной степени именно в стиле программирования, а не в алгоритме. Изначально, при сборке бинарных файлов отключались оптимизации копилятора и не применялась обфускация исходных кодов. Но, как утверждают авторы работы, некоторые отличительные признаки сохраняются и при применении этих способов сокрытия авторства, снижая точность деанонимизации до 65%.

Деанонимизация программиста возможна не только через исходный код, но и через скомпилированный бинарный файл - 2

С помощью дизассемблирования и декопиляции, применяя все те же нечеткие синтаксические деревья, проводится анализ управляющего графа и выделяются отличительные признаки кодирования и производится обучение классификатора на основе векторов признаков.

Деанонимизация программиста возможна не только через исходный код, но и через скомпилированный бинарный файл - 3
Деанонимизация программиста возможна не только через исходный код, но и через скомпилированный бинарный файл - 4

Что интересно, было обнаружено, что боле профессиональные программисты гораздо легче могут быть деанонимизированы по сравнении с менее опытными коллегами, т.к. имеют более выраженный и индивидуальный стиль программирования.

Авторы уверены, что с помощью подобных методов когда-нибудь будут выявлены настоящие авторы таких разработок как Bitcoin, TrueCrypt и известных вредоносных программ.

Автор: Akr0n

Источник

Поделиться новостью

* - обязательные к заполнению поля