Зачем анализировали 1 500 000 историй болезней? Что это дало?

в 19:27, , рубрики: алгоритмы поиска, анализ данных, аутизм, массивы, Песочница, метки: , , ,

Существует ли связь между астмой и шизофренией?
Диабет и биполярное расстройство личности — могут ли они иметь что-то общее?
Сможет ли выявить столь нетривиальные связи анализ базы данных по почти всем пациентам США?
Зачем анализировали 1 500 000 историй болезней? Что это дало?

Статья написана по материалам доклада «Аутизм и меделевские заболевания» Ржецкого Андрея Юрьевича на Первой международной конференции «Аутизм. Вызовы и решения». Дальше о нем и о анализе данных

Андрей Юрьевич Ржецкий

Андрей Ржецкий — профессор медицины и генетики человека в Институте геномики и системной биологии Университета Чикаго. Он также является директором КОНТЕ Центра геномной биоинформатики в области нейропсихиатрических заболеваний. А. Ржецкий закончил Новосибирский государственный университет, защитил кандидатскую диссертацию в Институте цитологии и генетики в Новосибирске. В 1991 году в качестве постдока уехал в США.
Научные интересы:
1) биоинформатика и филогенетика в применении к анализу генов, белков, молекулярных метаболических путей;
2) применение статистики к анализу последовательностей и анализ молекулярных сетей;
3) разработка алгоритмов и программ для анализа и сравнения метаболических путей и последовательностей, филогенетической реконструкции.
Как математик и биолог-теоретик, Андрей Ржецкий является ведущим экспертом в области разработки новых биоинформационных подходов к анализу биологических комплексов и болезней. Ученый является пионером в разработке стратегий биоинформационного картирования заболеваний посредством комплексного анализа генетических данных.
Андрей Юрьевич настолько известен в США, что в гугле есть даже несколько подсказок поиска с его фамилией:
Зачем анализировали 1 500 000 историй болезней? Что это дало?

Аутизм

Аутизм представляет собой нарушение развития нервной системы, которое выражается затруднениями социального взаимодействия и общения, а также ограниченным и повторяющимся поведением. В согласии с критериями диагностики, симптомы аутизма должны быть очевидны у детей уже до трех лет. Аутизм влияет на процесс обработки информации в мозге, изменяя порядок организации и подключения синапсов нервных клеток. Как это происходит пока не совсем понятно.
Примерный перевод из анго-Вики

Менделевские заболевания

Менделевские заболевания, признаки (Mendels diseases, traits): заболевания или признаки, являющиеся результатом экспрессии единичного гена, который оказывает большое влияние на фенотип. Наследуются согласно законам Менделя. Примеры менделевских болезней: муковисцидоз, болезнь серповидных эритроцитов, болезнь Хантингтона (Гентингтона) и гемофилия
из просторов интернета

Abstract

В биологии накопились огромные данные, которые можно обработать только с помощью компьютера. Группа Андрея Ржецкого взялась обработать данные о психоневрологических расстройствах. При этом они обрабатывают не отдельный массив данных, будь то генетические причины, факторы окружающей среды или клинические результаты, а все данные вместе, и это дает более полную картину причин возникновения расстройств.
В 2004 году группа А. Ржецкого получила грант от организации Autism Speaks на двусторонний анализ аутизма (как биологического процесса и как нарушения развития), используя богатую информацию, накопленную в нескольких связанных между собой областях. Группа собирала информацию о молекулярных взаимодействиях в человеческих нейронах и с помощью своей уникальной программы (система GeneWays) рассмотрела широкий спектр нарушений, с которыми аутизм показывает неслучайные ассоциации (неврологические, аутоиммунные, метаболические и многие другие группы расстройств, которые имеют сильный наследственный компонент).
В 2007 году группа уже проанализировала 1,5 миллиона историй болезней. Суть работы заключается в исследовании области пересечения на уровне определенных генов различных заболеваний. Исследователи пришли к выводу, что определенные группы генов могут предрасполагать человека к нескольким заболеваниям, в то время как другие могут предрасполагать человека лишь к одной болезни, защищая против другой. Одна и та же мутация в гене может как коррелировать с другим заболеванием, так и защищать от него, делая невозможным сочетание двух разных болезней. В моделях по оценке данных из области аутизма выявилась возможность предрасположенности так же и к биполярному расстройству. При этом общая группа генов обнаружилась и при сравнении мигрени с аутизмом, а также связь инфекций со многими психоневрологическими расстройствами, в том числе, и с аутизмом. Группа А. Ржецкого впервые измерила эти корреляции.

На графике (ниже) показана корреляция некоторых часто встречающихся заболеваний. Красные линии — положительная корреляция, синие — отрицательная. Толщина линии — величина корреляции. Размер окружности соответствует выборке пациентов (от 20 до 136 тыс).

Аутизм и меделевские заболевания

Свою презентацию доктор Ржецкий открыл слайдом с хорошо знакомым кадром из российского фильма о Шерлоке Холмсе. И это не случайно: именно феномен Холмса, преуспевшего в сыскном деле благодаря вниманию к деталям, незначительным для большинства обычных наблюдателей, вдохновляет Ржецкого, так же уверенного в том, что именно мелочи могут определять многие биологические загадки и помогать подбирать к ним ключи.
Болезнь — преступление, данные — улики. Цель: построение моделей дающей результат.

Еж и Лис — Лис знает много, Еж- один надежный трюк.

(мнение психолога: Толстой был Лис, который думал, что он Еж, Достоевский был Еж, который думал что он Лис)

Научные предсказания: в книге “Сигнал и шум” (Мед Сильвер) — анализирует массу предсказаний. И если посмотреть какие предсказания работают, какие проваливаются, то “Лисы” предсказывают лутше чем “ежи”.

Статистика — два подхода, сранимых с религиозными.

Баесовский подход позволяет объяснить насколько сильно мы можем верить результатам и дать предположения колличественно. Кроме того, модели очень простые.
Проблема: надо сложить фенотип+геном+среда = (чтоб получить)мат. модель с полезными предсказаниями. Например, предрасположеность к болезни

Зачем анализировали 1 500 000 историй болезней? Что это дало?
Зачем анализировали 1 500 000 историй болезней? Что это дало?
Зачем анализировали 1 500 000 историй болезней? Что это дало?
Зачем анализировали 1 500 000 историй болезней? Что это дало?

Избранные публикации А. Ржецкого:

  • Iossifov I, Zheng T, Baron M, Gilliam TC, Rzhetsky A. (2008) Genetic-linkage mapping of complex hereditary disorders to a whole-genome molecular-interaction network. Genome Res. June 3.
  • Feldman I, Rzhetsky A, Vitkup D. (2008) Network properties of genes harboring inherited disease mutations. Proc Natl Acad Sci U S A. 105, 4323-4328.
  • Rodriguez-Esteban R,Rzhetsky A. (2008) Six senses in the literature. The bleak sensory landscape of biomedical texts. EMBO Rep. 9, 212-215.
  • Yao L &Rzhetsky A.(2008) Quantitative systems-level determinants of human genes targeted by successful drugs. Genome Res. 18:206-213.
  • Rzhetsky, A., Wajngurt, D., Park, N. & Zheng, T. (2007) Probing genetic overlap among complex human phenotypes. Proc. Natl. Acad. Sci. U S A. 104, 11694-11699.
  • Cokol, M., Rodriguez-Esteban, R. & Rzhetsky, A. (2007) A recipe for high impact. Genome Biol, 8, 406.
  • Cokol, M., Iossifov, I., Rodriguez-Esteban, R. & Rzhetsky, A. (2007) How many scientific papers should be retracted? EMBO Rep, 8. 422-423.
Ссылки:

Одна из книг написанных Ржецким А.Ю. в соавторстве с Жарких А.А. во времена СССР: «Новый подход к реконструкции филогений на основе анализа многих семейств генов»: books.google.com.ua/books/about/%D0%9D%D0%BE%D0%B2%D1%8B%D0%B9_%D0%BF%D0%BE%D0%B4%D1%85%D0%BE%D0%B4_%D0%BA_%D1%80%D0%B5%D0%BA%D0%BE%D0%BD%D1%81.html?id=RTPGHAAACAAJ&redir_esc=y
Сайт Андрея Юрьевича: www.ci.uchicago.edu/research/rzhetsky/
Статьи по результатам исследований:
Network properties of genes harboring inherited disease mutations www.pnas.org/content/105/11/4323.full
Probing genetic overlap among complex human phenotypes www.pnas.org/content/104/28/11694.full

Автор: AlexPancho

Источник

Поделиться

* - обязательные к заполнению поля