- PVSM.RU - https://www.pvsm.ru -

Применение машинного обучения и Data Science в промышленности

Хабр, привет. Написал пост, который идёт строго (!) в закладки и передаётся коллегам. Он со списком блокнотов и библиотек ML и Data Science для разных отраслей промышленности. Все коды на Python, и размещены на GitHub. Они будут полезны как для расширения кругозора, так и для запуска своего интересного стартапа.

image

Отмечу, что если среди читателей есть желающие помочь, и добавить в любую из подотраслей подходящий проект, пожалуйста, свяжитесь со мной. Я их добавлю в список. Итак, давайте начнём изучение списка.

1. Недвижимость и питание

1.1. Питание

  • RobotChef [1] — совершенствование рецептов еды на основе отзывов пользователей;
  • Food Amenities [2] — прогнозирование спроса на пищевые продукты с использованием нейронных сетей;
  • Recipe Cuisine and Rating [3] — предсказание названия кухни любого блюда на основе списка его ингредиентов;
  • Food Classification [4] — пищевая классификация еды с использованием библиотеки Keras;
  • Image to Recipe [5] — перевод изображения еды в рецепт его приготовления;
  • Calorie Estimation [6] — оценка калорийности по фотографиям еды;
  • Fine Food Reviews [7] — сегментационный анализ еды на основе отзывов с Amazon Fine Food.

1.2. Рестораны

  • Restaurant Violation [8] — прогнозирование нарушения правил проверки продуктов питания;
  • Restaurant Success [9] — предсказание, будет ли ресторан успешным;
  • Predict Michelin [10] — предсказание того, что ресторану дадут звезду Мишлен;
  • Restaurant Inspection [11] — анализ уровня лояльности к ресторану и популярностью на основе оценок по Yelp;
  • Sales [11] — прогнозирование продаж у ресторанов с LTSM;
  • Visitor Forecasting [12] — бронирование и прогнозирование количества посещений;
  • Restaurant Profit [13] — ресторанный регрессионный анализ;
  • Competition [14] — анализ конкурентоспособности ресторана;
  • Business Analysis [15] — проект по анализу ресторанного бизнеса;
  • Location Recommendation [16]— рекомендация о будущем местонахождении ресторана;
  • Closure, Rating and Recommendation [17] — три задачи прогнозирования с использованием данных Yelp;
  • Anti-recommender [18] — рекомендация ресторанов, которые вы (на основе ваших предпочтений) не захотите посещать;
  • Menu Analysis [19] — анализ ресторана на основе его меню;
  • Menu Recommendation [20] — рекомендация новых ресторанов на основе вашего любимого меню;
  • Food Price [21] — прогнозирование стоимости продуктов питания;
  • Automated Restaurant Report [22] — автоматический, ресторанный отчет на основе машинного обучения.

1.3. Недвижимость

  • Peer-to-Peer Housing [23] — влияние одноразовой аренды жилья на её состояние;
  • Roommate Recommendation [24] — рекомендация соседа по комнате;
  • Room Allocation [25] — распределение помещений;
  • Dynamic Pricing [26] — расчеты динамического ценообразования в отеле;
  • Hotel Similarity [27] — сравнение конкурирующих отелей друг с другом;
  • Hotel Reviews [28] — отзывы об отелях;
  • Predict Prices [29] — предсказание цен на номера в отелях;
  • Hotels vs Airbnb [30] — сравнение отелей с Airbnb;
  • Hotel Improvement [31] — анализ отзывов для отеля;
  • Orders [32] — прогноз отмены заказов для отелей;
  • Fake Reviews [33] — распознавание, являются ли отзывы поддельными или спамом;
  • Reverse Image Lodging [34] — нахождение нужного вам жилья по изображению.

2. Бухгалтерский учёт

2.1. Machine Learning

  • Chart of Account Prediction [35] — использование промеченных данных для имени учетной записи каждой транзакции;
  • Accounting Anomalies [36] — выявление аномалий в бухгалтерском учёте;
  • Financial Statement Anomalies [37] — обнаружение аномалий (используя R) перед подачей документов в налоговую;
  • Useful Life Prediction (FirmAI) [38] — прогнозирование срока полезного использования активов с помощью сенсорных наблюдений и разработки функций;
  • AI Applied to XBRL [39] — стандартизированное представление XBRL в AI и ML.

2.2. Аналитика

  • Forensic Accounting [40] — сборник тематических исследований по криминалистическому учету с использованием анализа данных;
  • General Ledger (FirmAI) [41] — обработка данных в FirmAI;
  • Bullet Graph (FirmAI) [42] — визуализация Bullet Graph помогает отслеживать продажи, комиссионные и другие показатели;
  • Aged Debtors (FirmAI) [38] — пример анализа для выявления должников;
  • Automated FS XBRL [43] — набор файлов PDF, содержащих более 700 страниц информации о XBRL.

2.3. Текстовый анализ

  • Financial Sentiment Analysis [44] — анализ рычагов оптимизации в торговле;
  • Extensive NLP [45] — комплексные НЛП методы для бухгалтерского учета.

2.4. Данные, парсинг и API

  • EDGAR [46] — пошаговое руководство по получению данных EDGAR;
  • PyEDGAR [47] — библиотека для загрузки, кэширования и доступа к файлам EDGAR;
  • IRS [48] — доступ и анализ файлов IRS;
  • Financial Corporate [49] — наборы корпоративных финансовых данных Rutgers;
  • Non-financial Corporate [50] — нефинансовый корпоративный набор данных Rutgers;
  • PDF Parsing [51] — извлечение полезных данных из документов PDF;
  • PDF Tabel to Excel [52]— создание файла Excel из данных в PDF.

2.5. Исследования и статьи

  • Understanding Accounting Analytics [53] — статья, посвященная важности бухгалтерской аналитики.
  • VLFeat [54] — открытая и портативная библиотека алгоритмов компьютерного зрения, имеющая набор инструментов Matlab.

2.6. Веб-сайты

  • Rutgers Raw [55] — исследования в области цифрового бухгалтерского учета от Rutgers.

2.7. Курсы

  • Computer Augmented Accounting [56]— видеоролик из Университета Rutgers, посвященный использованию вычислений для улучшения бухгалтерского учета;
  • Accounting in a Digital Era [57] — еще одна серия статей Университета Rutgers, посвященная влиянию цифрового века на бухгалтерский учет.

3. Сельское хозяйство

3.1. Экономика

  • Prices [58] — прогноз цен на сельскохозяйственную продукцию 1;
  • Prices 2 [59] — прогноз цен на сельскохозяйственную продукцию 2;
  • Yield [60] — сельскохозяйственный анализ урожайности в Украине;
  • Recovery [61] — стратегическое использование земель в сельском хозяйстве с учетом восстановления экосистем;
  • MPR [62] — данные отчетности по ценам на сельхоз. продукцию от Министерства сельского хозяйства США.

3.2. Разработка

  • Segmentation [63] — сегментация сельскохозяйственных полей с использованием спутниковых снимков;
  • Water Table [64] — прогнозирование глубины грунтовых вод в сельскохозяйственных районах;
  • Assistant [65] — ноутбуки от виртуального Ассистента по сельскому хозяйству;
  • Eco-evolutionary [66] — эко-эволюционная динамика;
  • Diseases [67] — идентификация болезней сельскохозяйственных культур и вредителей с использованием фреймворка Deep Learning по изображениям;
  • Irrigation and Pest Prediction [68] — анализ орошения и прогноз вероятности появления вредителей.

4. Банковское дело и страхование

4.1. Потребительское финансирование

  • Loan Acceptance [69] — принятия решений о ссуде на основе классификации и анализа временных рядов;
  • Predict Loan Repayment [70] — прогнозирование погашения кредита с помощью функции автоматизированного проектирования;
  • Loan Eligibility Ranking [71] — система, которая помогает банкам проверять, может ли клиент получить данный (определенный) кредит;
  • Home Credit Default (FirmAI) [72] — прогнозирование дефолта по кредиту;
  • Mortgage Analytics [73] — обширная аналитика ипотечных кредитов;
  • Credit Approval [74] — система для одобрения кредитной карты;
  • Loan Risk [75] — прогнозная модель, помогающая уменьшить списания и потери %-ов с кредитов;
  • Amortisation Schedule (FirmAI) [76] — простой график амортизации в Python.

4.2. Управление и операции

  • Credit Card [77] — оценка CLV клиентов кредитной карты;
  • Survival Analysis [78] — анализ LTV клиентов;
  • Next Transaction [79] — модель глубокого обучения для прогнозирования суммы транзакции и дней до следующей транзакции;
  • Credit Card Churn [79] — предсказание оттока клиентов с кредитными картами;
  • Bank of England Minutes [80] — основные идеи предварительной обработки текста с использованием протоколов заседаний Комитета по денежно-кредитной политике Банка Англии;
  • CEO [81] — анализ корреляции между вознаграждениями генерального директора мужчины и генерального директора женщины.

4.3. Оценка

  • Zillow Prediction [82] — прогноз оценки Zillow, выполненный на Kaggle;
  • Real Estate [83] — прогнозирование цен на городскую недвижимость;
  • Used Car [84] — прогноз цен на подержанный автомобиль.

4.4. Мошеничество

  • XGBoost [85] — обнаружение мошенничества путем настройки гиперпараметров XGBoost;
  • Fraud Detection Loan in R [86] — обнаружение мошенничества в банковских кредитах;
  • AML Finance Due Diligence [87] — поиск новостных статей для финансирования AML DD;
  • Credit Card Fraud [88] — обнаружение мошенничества с кредитными картами.

4.5. Страхование и риски

  • Car Damage Detective [89] — оценка повреждений автомобиля с помощью свёрточных нейронных сетей;
  • Medical Insurance Claims [90] — прогнозирование претензий по медицинскому страхованию;
  • Claim Denial [91] — прогнозирование отказа от страхового возмещения;
  • Claim Fraud [92] — прогнозные модели, позволяющие определить, какие претензии в отношении автомобилей являются мошенническими;
  • Claims Anomalies [93] — система обнаружения аномалий для данных страховых претензий;
  • Actuarial Sciences [94] — ряд актуарных инструментов в R;
  • Bank Failure [95] — предсказание банкротства;
  • Risk Management [96] — финансирование курсов по управлению рисками;
  • VaR GaN [97] — оценка стоимости управления рыночным риском с использованием Keras и TensorFlow;
  • Compliance [98] — управление соответствиями с требованиями банка;
  • Stress Testing [99] — ECB стресс-тестирование;
  • Stress Testing Techniques [100] — notebook с различными упражнениями на стресс-тестирование;
  • BoE stress test [101] — результаты стресс-теста и составление графика;
  • Recovery [102] — возмещение причитающихся денег;
  • Quality Control [103] — контроль качества банков с использованием LDA.

4.6. Полезное

  • Bank Note Fraud Detection [104] — аутентификация с использованием DNN Tensorflow Classifier и RandomForest;
  • ATM Surveillance [105] — наблюдение за банкоматами в банках.

image

5. Биотехнологии и наука

5.1. Общие

  • Programming [106] — программирование для биологов на Python;
  • Introduction DL [107] — учебник по углубленному изучению геномики;
  • Pose [108] — оценка позы животных с использованием DL;
  • Privacy [109] — обмен клиническими данными, с сохранением конфиденциальности;
  • Population Genetics [110] — популяционный генетический вывод;
  • Bioinformatics Course [111] — материалы курса по вычислительной биологии и биоинформатике;
  • Applied Stats [112] — прикладная статистика для высокопроизводительной биологии;
  • Scripts [113] — скрипты Python для биологов;
  • Molecular NN [114] — мини-фреймворк для построения и обучения нейронных сетей для молекулярной биологии;
  • Systems Biology Simulations [115] — практическая системная биология при написании симуляторов с F # и Z3;
  • Cell Movement [116] — LSTM для прогнозирования биологического движения клеток;
  • Deepchem [117] — глубокое обучение для открытия новых лекарств, квантовой химии, материаловедения и биологии.

5.2. Последовательность

  • DNA, RNA and Protein Sequencing [118] — новое представление для биологических последовательностей;
  • CNN Sequencing [119] — набор инструментов для изучения последовательности ДНК/РНК с использованием сверточных нейронных сетей;
  • NLP Sequencing [120] — модель обучения языковой передаче для геномики.

5.3. Хемоинформатика и открытие лекарств

  • Novel Molecules [121] — сверточная сеть, которая может изучать функции;
  • Automating Chemical Design [122] — создание новых молекул для эффективного исследования;
  • GAN drug Discovery [123] — метод, который сочетает в себе генеративные модели с обучением и подкреплением;
  • RL [124] — генерирующие соединения, предсказанные как активные;
  • One-shot learning [117] — использование машинного обучения в области поиска лекарств простым и удобным способами.

5.4. Геномные

  • Jupyter Genomics [125] — сборник ноутбуков по вычислительной биологии и биоинформатике;
  • Variant calling [126] — определение отклонений от эталонного генома в ДНК человека;
  • Gene Expression Graphs [127] — использование сверток на изображениях;
  • Autoencoding Expression [128] — извлечение соответствующих шаблонов из больших наборов данных экспрессии генов;
  • Gene Expression Inference [129] — прогнозирование экспрессии указанных генов-мишеней из панели из примерно 1000 предварительно выбранных «ориентировочных генов»;
  • Plant Genomics [130] — материал для презентаций и примеров для геномики растений и патогенов.

5.5. Наука

  • Plants Disease [131] — приложение, которое выявляет болезни у растений с помощью модели глубокого обучения;
  • Leaf Identification [132] — идентификация растений через листья на основе их формы, цвета и текстуры;
  • Crop Analysis [133] — библиотека изображений для обнаружения и отслеживания будущего положения колосьев на растениях кукурузы;
  • Seedlings [134] — растительная рассада, классификация от Kaggle;
  • Plant Stress [135] — онтология, содержащая растительные стрессы;
  • Animal Hierarchy [136] — пакет для расчета иерархий доминирования животных;
  • Animal Identification [137] — глубокое обучение идентификации животных;
  • Species [138] — анализ больших данных различных видов животных;
  • Animal Vocalisations [139] — генеративная сеть для вокализации животных;
  • Evolutionary [140] — инструмент стратегий эволюции;
  • Glaciers [141] — учебный материал о ледниках.

6. Строительная техника

6.1. Строительство

  • DL Architecture [142] — генератор изображений для построения архитектуры;
  • Construction Materials [143] — курс по строительным материалам;
  • Bad Actor Risk Model [144] — модель риска для повышения безопасности строительства;
  • Inspectors [145] — определение назначенных инспекций;
  • Corrupt Social Interactions [146] — выявение потенциальных коррумпированных взаимодействий между сотрудниками отрасли и сотрудниками DOB;
  • Risk Construction [147] — определение высокорискованного строительства;
  • Facade Risk [148] — модель риска для прогнозирования небезопасных фасадов;
  • Staff Levels [149] — прогнозирование уровня персонала для передовых работников;
  • Injuries [150] — моделирование количества травм, связанных со строительством;
  • Productivity [151] — анализ и проверка производительности.

6.2. Инженерия

  • Structural Analysis [152] — 2D Структурный анализ в Python;
  • Structural Engineering [153] — структурные инженерные модули;
  • Nusa [154] — структурный анализ с использованием метода конечных элементов;
  • StructPy [155] — библиотека структурного анализа для Python на основе метода прямой жесткости;
  • Aileron [156] — структурный анализ элеронов Боинга 737;
  • Vibration [157] — образовательные вибрационные программы;
  • Civil [158] — сборник инструментов гражданского строительства в FreeCAD;
  • GEstimator [159] — подготовки сметы расходов на строительные и электромонтажные работы с подробным анализом тарифов;
  • Fatpack [160] — функции и классы для анализа усталости ряда данных;
  • Pysteel [161] — автоматизированное проектирование стальной конструкции;
  • Structural Uncertainty [162] — количественная оценка структурной неопределенности на основе глубокого обучения;
  • Pymech [163] — модуль Python для инженеров-механиков;
  • Aerospace Engineering [164] — астродинамика и статистика;
  • Interactive Quantum Chemistry [165] — объединение Psi4 и Numpy для образования и развития;
  • Chemical and Process Engineering [166] — различные ресурсы химической и технологической инженирии;
  • PyTherm [167] — прикладная термодинамика;
  • Aerogami [168] — аэродинамика с использованием самолетов;
  • Electro geophysics [169] — интерактивные приложения для электромагнетизма в геофизике;
  • Graph Signal [170] — учебник по обработке сигналов на графике;
  • Mechanical Vibrations [171] — механические вибрации в Университете Луизианы;
  • Process Dynamics [172] — динамика процесса и управления;
  • Battery Life Cycle [173] — прогнозирование срока службы батареи на основе данных;
  • Wind Energy [174] — Python для энергии ветра;
  • Energy Use [175] — стандартные методы расчета нормированного потребления энергии;
  • Nuclear Radiation [176] — как люди подвержены воздействию радиации, излучаемой атомными электростанциями.

6.3. Материаловедение

  • Python Materials Genomics [177] — код анализа материалов, используемый в устоявшемся проекте;
  • Materials Mining [178] — скрипты для моделирования и анализа материалов;
  • Emmet [179] — создание баз данных свойств материалов;
  • Megnet [180] — графовые сети как каркас ML для молекул и кристаллов;
  • Atomate [181] — рабочие процессы для вычислительного материаловедения;
  • Bylaws Compliance [182] — предсказание штрафов на собственность;
  • Asphalt Binder [183] — строительные материалы, свободная энергия и химический состав вяжущего асфальтового покрытия;
  • Awesome Materials Informatics [184] — кураторский список известных работ в области материаловедения.

7. Экономика

7.1. Общее

  • Trading Economics API [185] — Торговая экономика API, информация для 196 стран;
  • Development Economics [186] — микроэкономика развития;
  • Applied Econ & Fin [187] — прикладная вычислительная экономика и финансы;
  • Macroeconomics [188] — темы по макроэкономике с примерами из notebook.

7.2. Машинное обучение

  • EconML [189] — автоматизированное обучение и анализ причинно-следственных связей;
  • Auctions [190] — оптимальные аукционы с использованием глубокого обучения.

7.3. Вычисления

  • Quant Econ [191] — курс количественной экономики от NYU;
  • Computational [192] — вычислительные методы в экономике;
  • Computational 2 [193] — малый курс по вычислительной экономике;
  • Econometric Theory [194] — notebook'и по эконометрической теории для начинающих.

8. Образование и исследования

8.1. Студенты

  • Student Performance [195] — успеваемость студентов расчитанная на основе машинного обучения;
  • Student Performance 2 [196] — студенческий экзамен;
  • Student Performance 3 [197] — успеваемость учащихся в учреждениях среднего образования;
  • Student Performance 4 [198] — оценка успеваемости учеников с использованием Feature Engineering;
  • Student Enrolment [199] — регистрация студентов и анализ результатов;
  • Academic Performance [196] — изучение демографических и семейных особенностей, которые влияют на успеваемость учащегося;
  • Grade Analysis [200] — анализ достижений учащихся.

8.2. Школа

  • School Choice [201] — анализ данных для выбора школы;
  • School Performance [202] — практика анализа данных с использованием данных из data.utah.gov о школьной успеваемости;
  • School Performance 2 [203] -использование Pandas для анализа школьной и ученической успеваемости в округе;
  • School Performance 3 [204] — Филадельфия Школа Performance;
  • School Performance 4 [205] — NJ Школа Performance;
  • School Closure [206] — определение школ, подверженных риску закрытия, по показателям успеваемости и другим характеристикам;
  • School Budgets [207] — инструменты и методы для школьного бюджетирования;
  • School Budgets [208] — инструменты и методы для школьного бюджетирования part 2;
  • PyCity [209] — анализ школ;
  • PyCity 2 [210] — сопоставление школьного бюджета и школьных результатов;
  • Budget NLP [211] — классификация НЛП для бюджетных ресурсов;
  • Budget NLP 2 [212] — дальнейшая классификация упражнений;
  • Budget NLP 3 [213] — Бюджетная классификация;
  • Survey Analysis [214] — анализ опроса в сфере образования.

9. Чрезвычайные ситуации

9.1. Профилактика

  • Emergency Mapping [215] — обнаружение разрушенных домов в Калифорнии;
  • Emergency Room [216] — поддержка принятия срочных решений;
  • Emergency Readmission [217] — скорректированный риск аварийной реадмиссии;
  • Forest Fire [218] — обнаружение лесного пожара с помощью изображений БПЛА с использованием CNN;
  • Emergency Response [219] — анализ аварийного реагирования;
  • Emergency Transportation [220] — транспортная подсказка на аварийные службы;
  • Emergency Dispatch [221] — сокращение времени отклика благодаря интеллектуальному моделированию, оптимизации и автоматизации;
  • Emergency Calls [222] — проект анализа экстренных вызовов;
  • Calls Data Analysis [223] — анализ данных звонков 911;
  • Emergency Response [224] — химический завод РЛ.

9.2. Преступления

  • Crime Classification [225] — анализ времени серьезных нападений, неправильно классифицированных LAPD;
  • Article Tagging [226] — обработка естественного языка в новостной статье в Чикаго;
  • Crime Analysis [227] — нахождения правил ассоциации из пространственных данных для анализа преступности;
  • Chicago Crimes [228] — Изучение публичных данных о преступлениях в Чикаго в Python;
  • Graph Analytics [229] — Гаагские преступления;
  • Crime Prediction [230] — классификация, анализ и предсказание Преступности в городе Индор;
  • Crime Prediction [231] — разработаные прогностические модели уровня преступности;
  • Crime Review [232] — анализ данных обзора преступности.
  • Crime Trends [233] — анализ тенденций преступности и проблемных условий, побуждающих к этому;
  • Crime Analytics [234] — анализ данных о преступности в Сиэтле и Сан-Франциско.

9.3. Скорая помощь

  • Ambulance Analysis [235] — исследование изменения времени приезда скорой помощи в штате Виктория;
  • Site Location [236] — места расположения скорой помощи;
  • Dispatching [237] — применение теории игр и симуляции дискретных событий, для нахождения оптимального решения диспетчеризации скорой помощи;
  • Ambulance Allocation [238] — анализ временных рядов отправлений скорой помощи в городе Сан-Диего;
  • Response Time [239] — анализ улучшения времени отклика машины скорой помощи;
  • Optimal Routing [240] — проект по поиску оптимальной маршрутизации машин скорой помощи;
  • Crash Analysis [241] — прогнозирование вероятности аварий на данном сегменте в данный момент времени.

9.4. Управление стихийными бедствиями

  • Conflict Prediction [242] — Notebooks по прогнозированию конфликтов;
  • Burglary Prediction [242] — пространственно-временное моделирование для предсказания взломов;
  • Predicting Disease Outbreak [243] — прогнозирование вспышек заболевания;
  • Road accident prediction [244] — прогноз по типу жертв федеральных ДТП в Бразилии;
  • Text Mining [245] — управление стихийными бедствиями с использованием Text mining;
  • Twitter and disasters [246] — предсказание, твитов о бедствиях;
  • Flood Risk [247] — влияние катастрофических наводнений;
  • Fire Prediction [248] — 4 алгоритма расчета вероятности будущих пожаров.

image

10. Финансы

10.1. Торговля и инвестиции

  • Deep Portfolio [249] — предсказание объёма облигаций на основе глубокого обучения;
  • AI Trading [250] — современные методы торговли AI;
  • Corporate Bonds [251] — прогнозирование объема покупки и продажи корпоративных облигаций;
  • Simulation [252] — исследование симуляции, как части вычислительного финансирования;
  • Industry Clustering [253] — проект кластеризации отраслей по финансовым признакам;
  • Financial Modeling [254] — HFT-трейдинг и моделирование волатильности;
  • Trend Following [255] — фьючерсная тенденция после стратегии портфельных инвестиций;
  • Financial Statement Sentiment [256] — извлечение прогнозов из финансовой отчетности с использованием нейронных сетей;
  • Applied Corporate Finance [257] — изучения эмпирического поведения на фондовом рынке;
  • Market Crash Prediction [258] — прогнозирование рынка с использованием модели LPPL;
  • NLP Finance Papers [259] — составление количественных финансовых документов с использованием машинного обучения;
  • ARIMA-LTSM Hybrid [260] — гибридная модель для прогнозирования будущих коэффициентов ценовой корреляции двух активов;
  • Basic Investments [261] — основные инвестиционные инструменты в Python;
  • Basic Derivatives [262] — основные форвардные контракты и хеджирование;
  • Basic Finance [263] — исходные коды ноутбуков базовых финансовых приложений;
  • Advanced Pricing ML [264] — дополнительная реализация достижений в области финансового машинного обучения;
  • Options and Regression [265] — проект финансового инжиниринга для методов оценки опционов;
  • Quant Notebooks [266] — Обучающие ноутбуки по квантовым финансам, алгоритмической торговле и инвестиционной стратегии;
  • Forecasting Challenge [267] — задача финансового прогнозирования от G-Research;
  • XGboost [268] — торговый алгоритм, использующий XgBoost;
  • Research Paper Trading [269] — реализация стратегии на основе бумаги с использованием Alpaca Markets;
  • Various [270] — опции, распределение, моделирование;
  • ML & RL NYU [271] — машинное обучение и обучение в сфере финансов.

10.2. Данные

  • Datastream [272] — Datastrem от Thomson Reuters, доступный через Python;
  • AlphaVantage [273] — API-обертка для упрощения процесса получения бесплатных финансовых данных;
  • FSA [274] — Проект по переводу финансовых данных SEC Edgar Filings в пользовательские модели анализа финансовой отчетности;
  • TradeConnector [275] — связи с поставщиками рыночных данных;
  • Employee Count SEC Filings [276] — точные значения количества сотрудников для компаний из заявок SEC;
  • SEC Parsing [277] — НЛП для поиска и извлечения конкретной информации из длинных неструктурированных документов;
  • Open Edgar [278] — OpenEDGAR;
  • Rating Industries [279] — истории от нескольких агентств, конвертированные в формат CSV.

11. Здравоохранение

11.1. Общее

  • zEpid [280] — пакет эпидемиологического анализа;
  • Python For Epidemiologists [281] — учебное пособие по введению эпидемиологического анализа в Python;
  • Prescription Compliance [282] — анализ предписания и медицинского соответствия;
  • Respiratory Disease [283] — отслеживание респираторных заболеваний у спортсменов-олимпийцев;
  • Bubonic Plague [284] — Бубонная чума и модель SIR.

12. Юстиция, закон и регламент

12.1. Инструменты

  • LexPredict [285] — контроль над своими контрактами;
  • AI Para-legal [286] — первый в мире помощник адвоката AI;
  • Legal Entity Detection [287] — обнаружение юридического лица;
  • Legal Case Summarisation [288] — внедрение различных алгоритмов суммирования применительно к судебным решениям;
  • Legal Documents Google Scholar [289] — использование Google scholar для программного извлечения дел;
  • Chat Bot [290] — чат-бот и уведомления по электронной почте;
  • Data Generator GDPR [291] — генератор фиктивных данных для соответствия GDPR.

12.2. Политика и регулирование

  • GDPR scores [292] — прогнозирование показателей GDPR для юридических документов;
  • Driving Factors FINRA [293] — определение факторов, влияющие на решения арбитража FINRA;
  • Securities Bias [294] Correction — оценка влияния цены на судебные процессы по ценным бумагам;
  • Public Firm to Legal Decision [295] — публичная фирма для юридических решений;
  • Night Life Regulation [296] — ночная жизнь Австралии, ее регулирование и полицейская деятельность;
  • Comments [297] — общественные комментарии по государственному регулированию;
  • Clustering [298] — кластеризация канадских правил;
  • Environment [299] — регулирование энергетики и окружающей среды;
  • Risk [300] — риск различных финансовых положений;
  • FINRA Compliance [301] — лучшее моделирование на соответствие.

12.3. Судебная практика

  • Supreme Court Prediction [302] — предсказание идеологического направления решений Верховного Суда;
  • Supreme Court Topic Modeling [303] — тематическое моделирование в Верховном суде;
  • Judge Opinion [304] — использование анализа текста и машинного обучения для анализа мнений судей по конкретным вопросам;
  • ML Law Matching [305] — производитель матчей по машинному обучению;
  • Bert Multi-label Classification [306] — мультибликовая классификация Берта.

13. Производство

13.1. Общее

  • Green Manufacturing [307] — Mercedes-Benz Greener соревнование на Kaggle;
  • Semiconductor Manufacturing [308] — анализ данных производственной линии Semiondutor;
  • Smart Manufacturing [309] — совместная работа по методологии моделирования;
  • Bosch Manufacturing [310] — производственный проект Bosch, Kaggle.

13.2. Техническое обслуживание

  • Predictive Maintenance 1 [311] — прогнозирование оставшегося срока использования авиационных двигателей;
  • Predictive Maintenance 2 [312] — время до отказа (TTF) или оставшийся срок полезного использования двигателя (RUL);
  • Manufacturing Maintenance [313] — моделирование обслуживания в производственных систем.

13.3. Ошибки

  • Predictive Analytics [314] — метод прогнозирования сбоев в оборудовании;
  • Detecting Defects [315] — обнаружение аномалий для дефектных полупроводников;
  • Defect Detection [316] — интеллектуальное обнаружение дефектов для производства таблеток;
  • Manufacturing Failures [317] — сокращение производственных сбоев;
  • Manufacturing Anomalies [318] — интеллектуальное обнаружение аномалий для производственной линии.

13.4. Качество

  • Quality Control [319] — обнаружение провалов в контроле качества;
  • Manufacturing Quality [320] — интеллектуальный прогноз качества производства;
  • Auto Manufacturing [321] — данные о продаже автомобилей на аукционе.

14. СМИ и издательство

14.1. Маркетинг

  • Video Popularity [322] — HIP модель для прогнозирования популярности видео;
  • YouTube transcriber [323] — автоматически транскрибирует видео в YouTube;
  • Marketing Analytics [324] — маркетинговая аналитика, тематические исследования;
  • Algorithmic Marketing [325] — модели от введения до книги «Алгоритмический маркетинг»;
  • Marketing Scripts [326] — приложения для маркетинга данных;
  • Social Mining [327] — майнинг социальных сетей.

15. Физика

15.1. Общее

  • Gamma-hadron Reconstruction [328] — инструменты, используемые в наземной астрономии гамма-излучений;
  • Curriculum [329] — ньютоновские notebook'и;
  • Interaction Networks [330] — сети взаимодействия для изучения объектов, отношений и физики;
  • Particle Physics [331] — генерационный и аналитический код для изучения физики частиц;
  • Computational Physics [332] — хранилище вычислительной физики;
  • Medical Physics [333] — полезный Python для медицинской физики;
  • Medical Physics 2 [334] — общий, основной пакет Python для медицинской физики;
  • Flow Physics [335] — физика и аэроакустика с Python.

15.2. Машинное обучение

  • Physics ML and Stats [336] — машинное обучение и статистика для физиков;
  • High Energy [337] — машинное обучение для физики высоких энергий;
  • High Energy GAN [338] — генеративные состязательные сети для физики высоких энергий;
  • Neural Networks [339] — физика встречает нейронные сети.

16. Правительство

16.1. Социальная политика

  • Triage [340] — универсальный инструментарий по моделированию рисков и прогнозированию политических решений и социальных проблем;
  • World Bank Poverty I [341] — сравнительная оценка алгоритмов классификации машинного обучения, применяемых для прогнозирования бедности;
  • World Bank Poverty II [342] — сравнительная оценка алгоритмов классификации машинного обучения, применяемых для прогнозирования бедности II;
  • Overseas Company Land Ownership [343] — определение иностранной собственности в Великобритании;
  • CFPB [344] — анализ жалоб Бюро по защите прав потребителей;
  • Cannabis Legalisation Effect [345] — Влияние легализации каннабиса на преступность;
  • Public Credit Card [346] — идентификация потенциального мошенничества с кредитными картами;
  • Recidivism Prediction [347] — прозрачность и учёт оценки риска рецидивизма;
  • Household Poverty [348] — предсказание бедности домохозяйств в Коста-Рике;
  • NLP Public Policy [349] — пример варианта использования НЛП в публичной политике;
  • World Food Production [350] — сравнение ведущих производителей продуктов питания и кормов по всему миру;
  • Tax Inequality [351] — проект данных о налогообложении и неравенстве в Базеле;
  • Sheriff Compliance [352] — соответствие требованиям ICE;
  • Apps Detection [353] — обнаружение подозрительных приложений для детей;
  • Social Assistance [354] — актуальная информация о социальной помощи;
  • Computational Social Science [355] — курс летних школьных наук по социальным данным;
  • Liquor and Crime [356] — влияние спиртных напитков на уровень преступности;
  • Animal Placement Kennels [357] — оптимизация размещения животных в приютах;
  • Staffing Wall [358] — независимый исследовательский проект на мексиканской границе США;
  • Worker Fatalities [359] — карта несчастных случаев на производстве по данным OSHA.

16.2. Благотворительность

  • Census Data API [360] — извлечение переменных из 5-летнего опроса американского сообщества;
  • Donor Identification [361] — проект машинного обучения, в котором нужно найти доноров для благотворительности;
  • Charity Effectiveness [362] — сбор онлайн-данных о благотворительных организациях, чтобы понять их эффективность.

16.3. Анализ выборов

  • Election Analysis [363] — анализ выборов и модели прогнозирования;
  • American Election Causal [364] — использование данных ANES с моделями причинно-следственных связей;
  • Campaign Finance and Election Results [365] — изучение связи между финансированием кампании и результатами последующих выборов;
  • Voting System [366] — методы голосования пропорционального представительства;
  • President Vote [367] — голосование по анализу уровня доходов.

16.4. Политика

  • Congressional politics [368] — палата представителей конгресса США;
  • Politico [369] — платформа для профилирования общественных деятелей в бразильской политике;
  • Bots [370] — инструменты и алгоритмы для анализа парагвайских твитов во время выборов;
  • Gerrymander tests [371] — множество метрик для количественной оценки Gerrymandering;
  • Sentiment [372] — анализ газет на предмет их политической убежденности с использованием субъективных настроений представителей партии;
  • DL Politics [373] — сравнение социалистической партия против народной в Бразилии;
  • PAC Money [374] — влияние денег PAC на политику США;
  • Power Networks [375] — создание сторожевого пса для индийских корпоративных и политических сетей;
  • Elite [376] — политическая элита в США;
  • Debate Analysis [377] — программа для анализа политических дебатов;
  • Political Affiliation [378] — прогноз политической принадлежности с использованием метаданных Twitter;
  • Political Ads [379] — расследование в Facebook политических объявлений и таргетинга;
  • Political Identity [380] — многоосная политическая модель политической идентичности;
  • YT Politics [381] — отображение политики на YouTube;
  • Political Ideology [382] — неконтролируемое изучение политической идеологии с помощью словесных векторных проекций.

17. Недвижимость, аренда и лизинг

17.1. Недвижимость

  • Finding Donuts [383] — прогнозировании окрестностей;
  • Neighbourhood [83] — прогнозирование цен на недвижимость в городе;
  • Real Estate Classification [384] — классификация типа имущества с учетом недвижимости, спутниковой связи и просмотра улиц;
  • Recommender [385] — рекомендательная система топ-5 объектов недвижимости, которые соответствуют поиску пользователя;
  • House Price [386] — предсказание цены дома с использованием линейной регрессии и GBR;
  • House Price Portland [387] — предсказание цены на жилье в Портленде;
  • Zillow Prediction [82] — прогноз оценки Zillow, выполненный на Kaggle.

17.2. Аренда и лизинг

  • Analyzing Rentals [388] — анализ и визуализация данных списков аренды;
  • Interest Prediction [389] — предсказание интереса людей к аренде конкретных квартир в Нью-Йорке;
  • Predict Household Poverty [348] — прогнозирование бедности домохозяйств в Коста-Рике;
  • Airbnb public analytics competition [390] — конкурс публичной аналитики Airbnb.

18. Коммунальные услуги

18.1. Электроэнергия

  • Electricity Price [391] — сравнение цен на электроэнергию в Сингапуре;
  • Electricity-Coal Correlation [392] — определение корреляции между государственными тарифами на электроэнергию и выработкой угля за последнее десятилетие;
  • Electricity Capacity [393] — анализ Los Angeles Times анализа дорогостоющей электроэнергии в Калифорнии;
  • Electricity Systems [394] — оптимальная система электроэнергии для европейских стран;
  • Load Disaggregation [395] — интеллектуальная разметка нагрузки по скрытым марковским моделям;
  • Price Forecasting [396] — прогнозирование цен на электроэнергию на сутки вперед в немецкой зоне торгов с глубокими нейронными сетями;
  • Carbon Index [397] — расчет интенсивности CO₂ и электричества в регионах страны, НКРЭ с 2001 года;
  • Demand Forecasting [398] — прогнозирование спроса на электроэнергию в Остине;
  • Electricity Consumption [399] — оценка потребления электроэнергии из обследований домашних хозяйств;
  • Electricity French Distribution [400] — анализ данных по электроэнергии, предоставленных французской распределительной сетью (RTE);
  • Renewable Power Plants [401] — временные ряды совокупной установленной мощности;
  • Wind Farm Flow [402] — хранилище моделей потоков ветровой электростанции, подключенных к FUSED-Wind;
  • Power Plant [403] — набор данных содержит 9568 точек данных, собранных электростанцией с комбинированным циклом за 6 лет (2006-2011 гг.).

18.2. Уголь, нефть и газ

  • Coal Prediction [404] — прогнозирование добычи угля;
  • Oil & Gas [405] — прогноз цены на нефть и природный газ с использованием ARIMA и нейронных сетей;
  • Gas Formula [406] — расчет потенциального экономического эффекта формулы индексации цен;
  • Demand Prediction [407] — прогноз спроса на природный газ;
  • Consumption Forecasting [408] — прогнозирование потребления природного газа;
  • Gas Trade [409] — мировая модель торговли природным газом.

18.3. Загрязнение воды

  • Safe Water [410] — предсказание нарушения качества питьевой воды, основанные на здоровье людей в США;
  • Hydrology Data [411] — набор удобных функций для изучения данных о воде в Python;
  • Water Observatory [412] — мониторинг уровня воды в озерах и водохранилищах с использованием спутниковых изображений;
  • Water Pipelines [413] — использование машинного обучения для поиска водопроводов на аэрофотоснимках;
  • Water Modelling [414] — австралийская система моделирования сообществ по оценке водных ресурсов;
  • Drought Restrictions [415] — анализ использования воды в Los Angeles;
  • Flood Prediction [416] — применение LSTM к данным об уровне воды в реке;
  • Sewage Overflow [417] — анализ санитарных переливов (SSO);
  • Air Quality Prediction [418] — прогноз качества воздуха (aq) в Пекине и Лондоне в течение следующих 48 часов.

18.4. Логистика

  • Transdim [419] — создание точных и эффективных решений для задач расчета и прогнозирования пространственно-временных данных потоков трафика машин;
  • Transport Recommendation [420] — контекстно-зависимая рекомендация по мультимодальной транспортировке;
  • Transport Data [421] — данные и ноутбуки для транспорта Торонто;
  • Transport Demand [422] — прогнозирование спроса на общественный транспорт в Найроби;
  • Demand Estimation [423] — внедрение динамической оценки спроса отправителя-получателя;
  • Congestion Analysis [424] — анализ транспортных систем;
  • TS Analysis [425] — анализ временных рядов по транспортным данным;
  • Network Graph Subway [426] — анализ уязвимости для транспортных сетей;
  • Transportation Inefficiencies [427] — количественная оценка неэффективности транспортных сетей;
  • Train Optimisation [428] — оптимизация расписания поездов;
  • Traffic Prediction [429] — прогнозирование городского трафика;
  • Predict Crashes [430] — прогнозирования сбоев, использующее несколько источников данных;
  • AI Supply chain [431] — система оптимизации цепочки поставок;
  • Transfer Learning Flight Delay [432] — использование вариационных кодеров в Keras для прогнозирования задержки полета;
  • Replenishment [433] — код для управления цепочкой поставок.

19. Оптовая и розничная торговля

19.1. Оптовая торговля

  • Customer Analysis [434] — анализ оптовых клиентов;
  • Distribution [435] — JB оптовый анализ распределения;
  • Clustering [436] — кластеризация данных о затратах на продукт, собираемым для клиентов;
  • Market Basket Analysis [437] — публичный набор данных Instacart, с информацией о том, какие продукты часто покупаются вместе.

19.2. Розничная торговля

  • Retail Analysis [438] — онлайн набор данных о розничной торговле;
  • Online Insights [439] — анализ онлайн-транзакций в Великобритании;
  • Retail Cohort [440] — когортный анализ.

На этом наш пост о применение ML и DS в промышленности подошел к концу. Надеюсь вы узнали для себя что-нибудь новое.

Если у вас есть то, чем вы можете поделиться сами — пишите в комментариях. Больше информации о машинном обучении и Data Science на Хабре [441] и в телеграм-канале Нейрон [442] (@neurondata).

Всем знаний!

Автор: Rushan

Источник [443]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/python/327154

Ссылки в тексте:

[1] RobotChef: https://github.com/bschreck/robo-chef

[2] Food Amenities: https://github.com/Ankushr785/Food-amenities-demand-prediction

[3] Recipe Cuisine and Rating: https://github.com/catherhuang/FP3-recipe

[4] Food Classification: https://github.com/stratospark/food-101-keras

[5] Image to Recipe: https://github.com/Murgio/Food-Recipe-CNN

[6] Calorie Estimation: https://github.com/jubins/DeepLearning-Food-Image-Recognition-And-Calorie-Estimation

[7] Fine Food Reviews: https://github.com/Architectshwet/Amazon-Fine-Food-Reviews

[8] Restaurant Violation: https://github.com/nd1/DC_RestaurantViolationForecasting

[9] Restaurant Success: https://github.com/alifier/Restaurant_success_model

[10] Predict Michelin: https://github.com/josephofiowa/dc-michelin-challenge/tree/master/submissions

[11] Restaurant Inspection: https://github.com/gzsuyu/Data-Analysis-NYC-Restaurant-Inspection-Data

[12] Visitor Forecasting: https://github.com/anki1909/Recruit-Restaurant-Visitor-Forecasting

[13] Restaurant Profit: https://github.com/everAspiring/RegressionAnalysis

[14] Competition: https://github.com/klin90/missinglink

[15] Business Analysis: https://github.com/nvodoor/RBA

[16] Location Recommendation : https://github.com/sanatasy/Restaurant_Risk

[17] Closure, Rating and Recommendation: https://github.com/Lolonon/Restaurant-Analytical-Solution

[18] Anti-recommender: https://github.com/Myau5x/anti-recommender

[19] Menu Analysis: https://github.com/bzjin/menus

[20] Menu Recommendation: https://github.com/rphaneendra/Menu-Similarity

[21] Food Price: https://gist.github.com/analyticsindiamagazine/f9b2ba171a0eef9ad396ce6f1b83bbbc

[22] Automated Restaurant Report: https://github.com/firmai/interactive-corporate-report

[23] Peer-to-Peer Housing: https://github.com/rochiecuevas/shared_accommodations

[24] Roommate Recommendation: https://github.com/SiddheshAcharekar/Liveright

[25] Room Allocation: https://github.com/nus-usp/room-allocation

[26] Dynamic Pricing: https://github.com/marcotav/hotels

[27] Hotel Similarity: https://github.com/Montclair-State-University-Info368/Assignment-6

[28] Hotel Reviews : https://github.com/EliadProject/Hotels-Data-Science

[29] Predict Prices: https://github.com/morenobcn/capstone_hotels_arcpy

[30] Hotels vs Airbnb: https://github.com/morenobcn/hotels_vs_airbnb_proof_of_concept

[31] Hotel Improvement: https://github.com/argha48/smarthotels

[32] Orders: https://github.com/Hasan330/Order-Cancellation-Prediction-Model

[33] Fake Reviews: https://github.com/danielmachinelearning/HotelSpamDetection

[34] Reverse Image Lodging: https://github.com/starfoe/Eye-bnb

[35] Chart of Account Prediction : https://github.com/agdgovsg/ml-coa-charging

[36] Accounting Anomalies: https://github.com/GitiHubi/deepAI/blob/master/GTC_2018_CoLab.ipynb

[37] Financial Statement Anomalies: https://github.com/rameshcalamur/fin-stmt-anom

[38] Useful Life Prediction (FirmAI): http://www.firmai.org/documents/Aged%20Debtors/

[39] AI Applied to XBRL: https://github.com/Niels-Peter/XBRL-AI

[40] Forensic Accounting: https://github.com/mschermann/forensic_accounting

[41] General Ledger (FirmAI): http://www.firmai.org/documents/General%20Ledger/

[42] Bullet Graph (FirmAI): http://www.firmai.org/documents/Bullet-Graph-Article/

[43] Automated FS XBRL: https://github.com/CharlesHoffmanCPA/charleshoffmanCPA.github.io

[44] Financial Sentiment Analysis: https://github.com/EricHe98/Financial-Statements-Text-Analysis

[45] Extensive NLP: https://github.com/TiesdeKok/Python_NLP_Tutorial/blob/master/NLP_Notebook.ipynb

[46] EDGAR: https://github.com/TiesdeKok/UW_Python_Camp/blob/master/Materials/Session_5/EDGAR_walkthrough.ipynb

[47] PyEDGAR: https://github.com/gaulinmp/pyedgar

[48] IRS: http://social-metrics.org/sox/

[49] Financial Corporate: http://raw.rutgers.edu/Corporate%20Financial%20Data.html

[50] Non-financial Corporate: http://raw.rutgers.edu/Non-Financial%20Corporate%20Data.html

[51] PDF Parsing: https://github.com/danshorstein/python4cpas/blob/master/03_parsing_pdf_files/AR%20Aging%20-%20working.ipynb

[52] PDF Tabel to Excel : https://github.com/danshorstein/ficpa_article

[53] Understanding Accounting Analytics: http://social-metrics.org/accountinganalytics/

[54] VLFeat: http://www.vlfeat.org/

[55] Rutgers Raw: http://raw.rutgers.edu/

[56] Computer Augmented Accounting : https://www.youtube.com/playlist?list=PLauepKFT6DK8TaNaq_SqZW4LIDJhCkZe2

[57] Accounting in a Digital Era: https://www.youtube.com/playlist?list=PLauepKFT6DK8_Xun584UQPPsg1grYkWw0

[58] Prices: https://github.com/deadskull7/Agricultural-Price-Prediction-and-Visualization-on-Android-App

[59] Prices 2: https://github.com/Vipul115/Statistical-Time-Series-Analysis-on-Agricultural-Commodity-Prices

[60] Yield: https://github.com/DFS-UCU/UkrainianAgriculture

[61] Recovery: https://github.com/vicelab/slaer

[62] MPR: https://github.com/gumballhead/mpr

[63] Segmentation: https://github.com/chrieke/InstanceSegmentation_Sentinel2

[64] Water Table: https://github.com/jfzhang95/LSTM-water-table-depth-prediction

[65] Assistant: https://github.com/surajmall/Agriculture-Assistant/tree/master/models

[66] Eco-evolutionary: https://github.com/tecoevo/agriculture

[67] Diseases: https://github.com/gauravmunjal13/Agriculture

[68] Irrigation and Pest Prediction: https://github.com/divyam3897/agriculture

[69] Loan Acceptance: https://github.com/Paresh3189/Bankruptcy-Prediction-Growth-Modelling

[70] Predict Loan Repayment: https://github.com/Featuretools/predict-loan-repayment

[71] Loan Eligibility Ranking: https://github.com/RealRadOne/Gyani-The-Loan-Eligibility-Predictor

[72] Home Credit Default (FirmAI): http://www.firmai.org/documents/Aggregator/#each-time-step-takes-30-seconds

[73] Mortgage Analytics: https://github.com/abuchowdhury/Mortgage_Bank_Loan_Analtsics/blob/master/Mortgage%20Bank%20Loan%20Analytics.ipynb

[74] Credit Approval: https://github.com/IBM-Cloud-DevFest-2018/Data-Science-for-Banking/blob/master/02-CreditCardApprovalModel/CreditCardApprovalModel.ipynb

[75] Loan Risk: https://github.com/Brett777/Predict-Risk

[76] Amortisation Schedule (FirmAI): http://www.firmai.org/documents/Amortization%20Schedule/

[77] Credit Card: https://github.com/am-aditya/Artificial-Intelligence-for-Banking/blob/master/03_ipy_notebooks/clv_prediction.ipynb

[78] Survival Analysis: https://github.com/am-aditya/Artificial-Intelligence-for-Banking/blob/master/01_code/01_02_clv_survival/Survival_Analysis.py

[79] Next Transaction: https://github.com/am-aditya/Artificial-Intelligence-for-Banking/blob/master/01_code/01_02_clv_survival/Customer_NextTransaction_Prediction.py

[80] Bank of England Minutes: https://github.com/sekhansen/mpc_minutes_demo/blob/master/information_retrieval.ipynb

[81] CEO: https://github.com/kaumaron/Data_Science/tree/master/CEO_Compensation

[82] Zillow Prediction: https://github.com/eswar3/Zillow-prediction-models

[83] Real Estate: https://github.com/denadai2/real-estate-neighborhood-prediction

[84] Used Car: https://nbviewer.jupyter.org/github/albahnsen/PracticalMachineLearningClass/blob/master/exercises/P1-UsedVehiclePricePrediction.ipynb

[85] XGBoost: https://github.com/KSpiliop/Fraud_Detection

[86] Fraud Detection Loan in R: https://github.com/longtng/frauddetectionproject/blob/master/A%20Consideration%20Point%20of%20%20Fraud%20Detection%20in%20Bank%20Loans%20Project%20Code.ipynb

[87] AML Finance Due Diligence: https://github.com/Michaels72/AML-Due-Diligence/blob/master/AML_Finance_DD.ipynb

[88] Credit Card Fraud: https://github.com/am-aditya/Artificial-Intelligence-for-Banking/blob/master/03_ipy_notebooks/fraud_detection.ipynb

[89] Car Damage Detective: https://github.com/neokt/car-damage-detective

[90] Medical Insurance Claims: https://github.com/roshank1605A04/Insurance-Claim-Prediction/blob/master/InsuranceClaim.ipynb

[91] Claim Denial: https://github.com/slegroux/claimdenial/blob/master/Claim%20Denial.ipynb

[92] Claim Fraud: https://github.com/rshea3/alpha-insurance

[93] Claims Anomalies: https://github.com/dchannah/fraudhacker

[94] Actuarial Sciences: https://github.com/JSchelldorfer/ActuarialDataScience

[95] Bank Failure: https://github.com/Shomona/Bank-Failure-Prediction/blob/master/Bank.ipynb

[96] Risk Management: https://github.com/andrey-lukyanov/Risk-Management

[97] VaR GaN: https://github.com/hamaadshah/market_risk_gan_keras

[98] Compliance: https://github.com/SaiBiswas/Bank-Grievance-Compliance-Management/blob/master/The%20Main%20File.ipynb

[99] Stress Testing: https://github.com/apbecker/Systemic_Risk/blob/master/Generalized.ipynb

[100] Stress Testing Techniques: https://github.com/kaitai/stress-testing-with-jupyter/blob/master/Playing%20with%20financial%20data%20and%20Python%203.ipynb

[101] BoE stress test: https://github.com/VankatPetr/BoE_stress_test/blob/master/BoE_stress_test_5Y_cummulative_imparment_charge.ipynb

[102] Recovery: https://github.com/hkacmaz/Bankin_Recovery/blob/master/Banking_Recovery.ipynb

[103] Quality Control: https://github.com/mick-zhang/Quality-Control-for-Banking-using-LDA-and-LDA-Mallet

[104] Bank Note Fraud Detection: https://github.com/apoorv-goel/Bank-Note-Authentication-Using-DNN-Tensorflow-Classifier-and-RandomForest

[105] ATM Surveillance: https://github.com/ShreyaGupta08/InfosysHack

[106] Programming: https://github.com/burkesquires/python_biologist

[107] Introduction DL: https://colab.research.google.com/drive/17E4h5aAOioh5DiTo7MZg4hpL6Z_0FyWr

[108] Pose: https://github.com/talmo/leap

[109] Privacy: https://github.com/greenelab/SPRINT_gan

[110] Population Genetics: http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1004845

[111] Bioinformatics Course : https://github.com/ricket-sjtu/bioinformatics

[112] Applied Stats: https://github.com/waldronlab/AppStatBio

[113] Scripts: https://github.com/mingzhangyang/Mybiotools

[114] Molecular NN: https://github.com/mitmedialab/Evolutron

[115] Systems Biology Simulations: https://github.com/hallba/WritingSimulators

[116] Cell Movement : https://github.com/jrieke/lstm-biology

[117] Deepchem: https://github.com/deepchem/deepchem

[118] DNA, RNA and Protein Sequencing: https://github.com/ehsanasgari/Deep-Proteomics

[119] CNN Sequencing: https://github.com/budach/pysster

[120] NLP Sequencing: https://github.com/hussius/deeplearning-biology

[121] Novel Molecules: https://github.com/HIPS/neural-fingerprint

[122] Automating Chemical Design: https://github.com/aspuru-guzik-group/chemical_vae

[123] GAN drug Discovery: https://github.com/gablg1/ORGAN

[124] RL: https://github.com/MarcusOlivecrona/REINVENT

[125] Jupyter Genomics: https://github.com/ucsd-ccbb/jupyter-genomics

[126] Variant calling: https://github.com/google/deepvariant

[127] Gene Expression Graphs: https://github.com/mila-iqia/gene-graph-conv

[128] Autoencoding Expression: https://github.com/greenelab/adage

[129] Gene Expression Inference: https://github.com/uci-cbcl/D-GEX

[130] Plant Genomics : https://github.com/widdowquinn/Teaching-EMBL-Plant-Path-Genomics

[131] Plants Disease: https://github.com/viritaromero/Plant-diseases-classifier

[132] Leaf Identification: https://github.com/AayushG159/Plant-Leaf-Identification

[133] Crop Analysis: https://github.com/openalea/eartrack

[134] Seedlings: https://github.com/mfsatya/PlantSeedlings-Classification

[135] Plant Stress: https://github.com/Planteome/ontology-of-plant-stress

[136] Animal Hierarchy: https://github.com/sacul-git/hierarpy

[137] Animal Identification: https://github.com/A7med01/Deep-learning-for-Animal-Identification

[138] Species: https://github.com/NomaanAhmed/BigData_AnimalSpeciesAnalysis

[139] Animal Vocalisations: https://github.com/timsainb/AVGN

[140] Evolutionary: https://github.com/hardmaru/estool

[141] Glaciers: https://github.com/OGGM/oggm-edu

[142] DL Architecture: https://github.com/carolineh101/deep-learning-architecture

[143] Construction Materials: https://github.com/damontallen/Construction-materials

[144] Bad Actor Risk Model : https://github.com/dariusmehri/Social-Network-Bad-Actor-Risk-Tool

[145] Inspectors: https://github.com/dariusmehri/Tracking-Inspectors-with-Euclidean-Distance-Algorithm

[146] Corrupt Social Interactions: https://github.com/dariusmehri/Social-Network-Analysis-to-Expose-Corruption

[147] Risk Construction: https://github.com/dariusmehri/Risk-Screening-Tool-to-Predict-Accidents-at-Construction-Sites

[148] Facade Risk: https://github.com/dariusmehri/Algorithm-for-Finding-Buildings-with-Facade-Risk

[149] Staff Levels: https://github.com/dariusmehri/Predicting-Staff-Levels-for-Front-line-Workers

[150] Injuries: https://github.com/dariusmehri/Topic-Modeling-and-Analysis-of-Building-Related-Injuries

[151] Productivity: https://github.com/dariusmehri/Inspection-Productivity-Analysis-and-Visualization-with-Tableau

[152] Structural Analysis: https://github.com/ritchie46/anaStruct

[153] Structural Engineering: https://github.com/buddyd16/Structural-Engineering

[154] Nusa: https://github.com/JorgeDeLosSantos/nusa

[155] StructPy: https://github.com/BrianChevalier/StructPy

[156] Aileron: https://github.com/albiboni/AileronSimulation

[157] Vibration: https://github.com/vibrationtoolbox/vibration_toolbox

[158] Civil: https://github.com/ebrahimraeyat/Civil

[159] GEstimator: https://github.com/manuvarkey/GEstimator

[160] Fatpack: https://github.com/Gunnstein/fatpack

[161] Pysteel : https://github.com/yajnab/pySteel

[162] Structural Uncertainty: https://github.com/davidsteinar/structural-uncertainty

[163] Pymech: https://github.com/jellespijker/pymech

[164] Aerospace Engineering: https://github.com/AlvaroMenduina/Jupyter_Notebooks/tree/master/Introduction_Aerospace_Engineering

[165] Interactive Quantum Chemistry: https://github.com/psi4/psi4numpy

[166] Chemical and Process Engineering: https://github.com/CAChemE/learn

[167] PyTherm: https://github.com/iurisegtovich/PyTherm-applied-thermodynamics

[168] Aerogami: https://github.com/kshitizkhanal7/Aerogami

[169] Electro geophysics: https://github.com/geoscixyz/em-apps

[170] Graph Signal: https://github.com/mdeff/pygsp_tutorial_graphsip

[171] Mechanical Vibrations: https://github.com/DocVaughan/MCHE485---Mechanical-Vibrations

[172] Process Dynamics: https://github.com/OpenChemE/CHBE356

[173] Battery Life Cycle: https://github.com/rdbraatz/data-driven-prediction-of-battery-cycle-life-before-capacity-degradation

[174] Wind Energy: https://github.com/DTUWindEnergy/Python4WindEnergy

[175] Energy Use: https://github.com/openeemeter/eemeter/blob/master/scripts/tutorial.ipynb

[176] Nuclear Radiation: https://github.com/HitarthiShah/Radiation-Data-Analysis

[177] Python Materials Genomics: https://github.com/materialsproject/pymatgen/

[178] Materials Mining: https://github.com/dchannah/materials_mining

[179] Emmet: https://github.com/materialsproject/emmet

[180] Megnet: https://github.com/materialsvirtuallab/megnet

[181] Atomate: https://github.com/hackingmaterials/atomate

[182] Bylaws Compliance: https://github.com/Mehranov/UnderstandingAndPredictingPropertyMaintenanceFines/blob/master/Assignment4_complete.ipynb

[183] Asphalt Binder: https://github.com/sierraporta/asphalt_binder

[184] Awesome Materials Informatics: https://github.com/tilde-lab/awesome-materials-informatics

[185] Trading Economics API: https://github.com/tradingeconomics/tradingeconomics

[186] Development Economics: https://github.com/jhconning/Dev-II/tree/master/notebooks

[187] Applied Econ & Fin: https://github.com/lnsongxf/Applied_Computational_Economics_and_Finance/blob/master/Chapter05.ipynb

[188] Macroeconomics: https://github.com/jlperla/ECON407_2018

[189] EconML: https://github.com/microsoft/EconML

[190] Auctions: https://github.com/saisrivatsan/deep-opt-auctions

[191] Quant Econ: https://github.com/jstac/quantecon_nyu_2016

[192] Computational: https://github.com/zhentaoshi/econ5170

[193] Computational 2: https://github.com/QuantEcon/columbia_mini_course

[194] Econometric Theory: https://github.com/jstac/econometrics/tree/master/notebooks

[195] Student Performance : https://github.com/roshank1605A04/Education-Process-Mining

[196] Student Performance 2: https://github.com/janzaib-masood/Educational-Data-Mining

[197] Student Performance 3: https://github.com/RohithYogi/Student-Performance-Prediction

[198] Student Performance 4 : https://github.com/roshank1605A04/Students-Performance-Analytics

[199] Student Enrolment : https://github.com/arrahman17/Learning-Analytics-Project-

[200] Grade Analysis: https://github.com/kaumaron/Data_Science/tree/master/Grade_Analysis

[201] School Choice: https://github.com/nprapps/school-choice

[202] School Performance: https://github.com/bradleyrobinson/School-Performance

[203] School Performance 2: https://github.com/vtyeh/pandas-challenge

[204] School Performance 3: https://github.com/benattix/philly-schools

[205] School Performance 4: https://github.com/adrianakopf/NJPublicSchools

[206] School Closure: https://github.com/whugue/school-closure

[207] School Budgets: https://github.com/datacamp/course-resources-ml-with-experts-budgets/blob/master/notebooks/1.0-full-model.ipynb

[208] School Budgets: https://github.com/nymarya/school-budgets-for-education/tree/master/notebooks

[209] PyCity: https://github.com/JonathanREB/Budget_SchoolsAnalysis/blob/master/PyCitySchools_starter.ipynb

[210] PyCity 2: https://github.com/1davegalloway/SchoolDistrictAnalysis

[211] Budget NLP: https://github.com/jinsonfernandez/NLP_School-Budget-Project

[212] Budget NLP 2: https://github.com/DivyaMadhu/School-Budget-Prediction

[213] Budget NLP 3: https://github.com/sushant2811/SchoolBudgetData/blob/master/SchoolBudgetData.ipynb

[214] Survey Analysis: https://github.com/kaumaron/Data_Science/tree/master/Education

[215] Emergency Mapping: https://github.com/aeronetlab/emergency-mapping

[216] Emergency Room: https://github.com/roshetty/Supporting-Emergency-Room-Decision-Making-with-Relevant-Scientific-Literature

[217] Emergency Readmission: https://github.com/mesgarpour/T-CARER

[218] Forest Fire: https://github.com/LeadingIndiaAI/Forest-Fire-Detection-through-UAV-imagery-using-CNNs

[219] Emergency Response: https://github.com/sky-t/hack-or-emergency-response

[220] Emergency Transportation: https://github.com/bayesimpact/bayeshack-transportation-ems

[221] Emergency Dispatch: https://github.com/jamesypeng/Smarter-Emergency-Dispatch

[222] Emergency Calls: https://github.com/analystiu/LICT-Project-Emergency-911-Calls

[223] Calls Data Analysis : https://github.com/tanoybhattacharya/911-Data-Analysis

[224] Emergency Response: https://github.com/amunategui/Leak-At-Chemical-Factory-RL

[225] Crime Classification: https://github.com/datadesk/lapd-crime-classification-analysis

[226] Article Tagging: https://github.com/chicago-justice-project/article-tagging

[227] Crime Analysis: https://github.com/chrisPiemonte/crime-analysis

[228] Chicago Crimes: https://github.com/search?o=desc&q=crime+language%3A%22Jupyter+Notebook%22+NOT+%22taxi%22+NOT+%22baseline%22&s=stars&type=Repositories

[229] Graph Analytics : https://github.com/pedrohserrano/graph-analytics-nederlands

[230] Crime Prediction: https://github.com/vikram-bhati/PAASBAAN-crime-prediction

[231] Crime Prediction: https://github.com/tina31726/Crime-Prediction

[232] Crime Review: https://github.com/felzek/Crime-Review-Data-Analysis

[233] Crime Trends: https://github.com/benjaminsingleton/crime-trends

[234] Crime Analytics: https://github.com/cmenguy/crime-analytics

[235] Ambulance Analysis: https://github.com/kaiareyes/ambulance

[236] Site Location: https://github.com/ankitkariryaa/ambulanceSiteLocation

[237] Dispatching: https://github.com/DimaStoyanov/Ambulance-Dispatching

[238] Ambulance Allocation: https://github.com/scngo/SD-ambulance-allocation

[239] Response Time: https://github.com/nonsignificantp/ambulance-response-time

[240] Optimal Routing: https://github.com/aditink/EMSRouting

[241] Crash Analysis: https://github.com/ArpitVora/Maryland_Crash

[242] Conflict Prediction: https://github.com/Polichinel/Master_Thesis

[243] Predicting Disease Outbreak: https://github.com/ab-bh/Disease-Outbreak-Prediction/blob/master/Disease%20Outbreak%20Prediction.ipynb

[244] Road accident prediction: https://github.com/leportella/federal-road-accidents

[245] Text Mining: https://github.com/rajaswa/Disaster-Management-

[246] Twitter and disasters: https://github.com/paultopia/concrete_NLP_tutorial/blob/master/NLP_notebook.ipynb

[247] Flood Risk: https://github.com/arijitsaha/FloodRisk

[248] Fire Prediction: https://github.com/Senkichi/The_Catastrophe_Coefficient

[249] Deep Portfolio: https://github.com/DLColumbia/DL_forFinance

[250] AI Trading: https://github.com/borisbanushev/stockpredictionai/blob/master/readme2.md

[251] Corporate Bonds: https://github.com/ishank011/gs-quantify-bond-prediction

[252] Simulation: https://github.com/chenbowen184/Computational_Finance

[253] Industry Clustering: https://github.com/SeanMcOwen/FinanceAndPython.com-ClusteringIndustries

[254] Financial Modeling: https://github.com/MiyainNYC/Financial-Modeling/tree/master/codes

[255] Trend Following: http://inseaddataanalytics.github.io/INSEADAnalytics/ExerciseSet2.html

[256] Financial Statement Sentiment: https://github.com/MAydogdu/TextualAnalysis

[257] Applied Corporate Finance: https://github.com/chenbowen184/Data_Science_in_Applied_Corporate_Finance

[258] Market Crash Prediction: https://github.com/sarachmax/MarketCrashes_Prediction/blob/master/LPPL_Comparasion.ipynb

[259] NLP Finance Papers: https://github.com/chenbowen184/Research_Documents_Curation_with_NLP

[260] ARIMA-LTSM Hybrid: https://github.com/imhgchoi/Corr_Prediction_ARIMA_LSTM_Hybrid

[261] Basic Investments: https://github.com/SeanMcOwen/FinanceAndPython.com-Investments

[262] Basic Derivatives: https://github.com/SeanMcOwen/FinanceAndPython.com-Derivatives

[263] Basic Finance: https://github.com/SeanMcOwen/FinanceAndPython.com-BasicFinance

[264] Advanced Pricing ML: https://github.com/jjakimoto/finance_ml

[265] Options and Regression: https://github.com/aluo417/Financial-Engineering-Projects

[266] Quant Notebooks: https://github.com/LongOnly/Quantitative-Notebooks

[267] Forecasting Challenge: https://github.com/bukosabino/financial-forecasting-challenge-gresearch

[268] XGboost : https://github.com/firmai?after=Y3Vyc29yOnYyOpK5MjAxOS0wNS0wMlQwNToyMzoyMSswMTowMM4KBjIV&tab=stars

[269] Research Paper Trading: https://github.com/rawillis98/alpaca

[270] Various: https://github.com/arcadynovosyolov/finance

[271] ML & RL NYU: https://github.com/joelowj/Machine-Learning-and-Reinforcement-Learning-in-Finance

[272] Datastream: https://github.com/mbravidor/PyDSout

[273] AlphaVantage: http://twopirllc/

[274] FSA: https://github.com/duncangh/FSA

[275] TradeConnector: https://github.com/tradeasystems/tradeasystems_connector

[276] Employee Count SEC Filings: https://github.com/healthgradient/sec_employee_information_extraction

[277] SEC Parsing: https://github.com/healthgradient/sec-doc-info-extraction/blob/master/classify_sections_containing_relevant_information.ipynb

[278] Open Edgar: https://github.com/LexPredict/openedgar

[279] Rating Industries: http://www.ratingshistory.info/

[280] zEpid : https://github.com/pzivich/zEpid

[281] Python For Epidemiologists: https://github.com/pzivich/Python-for-Epidemiologists

[282] Prescription Compliance: https://github.com/rjhere/Prescription-compliance-prediction

[283] Respiratory Disease: https://github.com/alistairwallace97/olympian-biotech

[284] Bubonic Plague: https://github.com/callysto/curriculum-notebooks/blob/master/Humanities/BubonicPlague/bubonic-plague-and-SIR-model.ipynb

[285] LexPredict: https://github.com/LexPredict/lexpredict-contraxsuite

[286] AI Para-legal : https://github.com/davidawad/lobe

[287] Legal Entity Detection: https://github.com/hockeyjudson/Legal-Entity-Detection/blob/master/Dataset_conv.ipynb

[288] Legal Case Summarisation: https://github.com/Law-AI/summarization

[289] Legal Documents Google Scholar: https://github.com/GirrajMaheshwari/Web-scrapping-/blob/master/Google_scholar%2BExtract%2Bcase%2Bdocument.ipynb

[290] Chat Bot: https://github.com/akarazeev/LegalTech

[291] Data Generator GDPR: https://github.com/toningega/Data_Generator

[292] GDPR scores: https://github.com/erickjtorres/AI_LegalDoc_Hackathon

[293] Driving Factors FINRA: https://github.com/siddhantmaharana/text-analysis-on-FINRA-docs

[294] Securities Bias: https://github.com/davidsontheath/bias_corrected_estimators/blob/master/bias_corrected_estimators.ipynb

[295] Public Firm to Legal Decision: https://github.com/anshu3769/FirmEmbeddings

[296] Night Life Regulation: https://github.com/Kevin-McIsaac/Nightlife

[297] Comments: https://github.com/ProximaDas/nlp-govt-regulations

[298] Clustering: https://github.com/philxchen/Clustering-Canadian-regulations

[299] Environment: https://github.com/ds-modules/EEP-147

[300] Risk: https://github.com/vsub21/systemic-risk-dashboard

[301] FINRA Compliance: https://github.com/raymond180/FINRA_TRACE

[302] Supreme Court Prediction: https://github.com/davidmasse/US-supreme-court-prediction

[303] Supreme Court Topic Modeling: https://github.com/AccelAI/AI-Law-Minicourse/tree/master/Supreme_Court_Topic_Modeling

[304] Judge Opinion: https://github.com/GirrajMaheshwari/Legal-Analytics-project---Court-misclassification

[305] ML Law Matching: https://github.com/whs2k/GPO-AI

[306] Bert Multi-label Classification: https://github.com/brightmart/sentiment_analysis_fine_grain

[307] Green Manufacturing: https://github.com/Danila89/kaggle_mercedes

[308] Semiconductor Manufacturing: https://github.com/Meena-Mani/SECOM_class_imbalance

[309] Smart Manufacturing: https://github.com/usnistgov/modelmeth

[310] Bosch Manufacturing: https://github.com/han-yan-ds/Kaggle-Bosch

[311] Predictive Maintenance 1: https://github.com/Azure/lstms_for_predictive_maintenance

[312] Predictive Maintenance 2: https://github.com/Samimust/predictive-maintenance

[313] Manufacturing Maintenance: https://github.com/m-hoff/maintsim

[314] Predictive Analytics: https://github.com/IBM/iot-predictive-analytics

[315] Detecting Defects : https://github.com/roshank1605A04/SECOM-Detecting-Defected-Items

[316] Defect Detection: https://github.com/jorgehas/smart-defect-inspection

[317] Manufacturing Failures : https://github.com/aayushmudgal/Reducing-Manufacturing-Failures

[318] Manufacturing Anomalies: https://github.com/mohan-mj/Manufacturing-Line-I4.0

[319] Quality Control: https://github.com/buzz11/productionFailures

[320] Manufacturing Quality: https://github.com/limberc/tianchi-IMQF

[321] Auto Manufacturing: https://github.com/trentwoodbury/ManufacturingAuctionRegression

[322] Video Popularity: https://github.com/andrei-rizoiu/hip-popularity

[323] YouTube transcriber: https://github.com/hathix/youtube-transcriber

[324] Marketing Analytics: https://github.com/byukan/Marketing-Data-Science

[325] Algorithmic Marketing: https://github.com/ikatsov/algorithmic-examples

[326] Marketing Scripts: https://github.com/HowardNTUST/Marketing-Data-Science-Application

[327] Social Mining: https://github.com/mikhailklassen/Mining-the-Social-Web-3rd-Edition/tree/master/notebooks

[328] Gamma-hadron Reconstruction: https://github.com/fvisconti/gammas_machine_learning

[329] Curriculum: https://github.com/callysto/curriculum-notebooks/tree/master/Physics

[330] Interaction Networks: https://github.com/higgsfield/interaction_network_pytorch

[331] Particle Physics: https://github.com/hep-lbdl/adversarial-jets

[332] Computational Physics: https://github.com/ernestyalumni/CompPhys

[333] Medical Physics: https://github.com/robmarkcole/Useful-python-for-medical-physics

[334] Medical Physics 2: https://github.com/pymedphys/pymedphys

[335] Flow Physics: https://github.com/FPAL-Stanford-University/FloATPy

[336] Physics ML and Stats: https://github.com/dkirkby/MachineLearningStatistics

[337] High Energy: https://github.com/arogozhnikov/hep_ml

[338] High Energy GAN: https://github.com/hep-lbdl/CaloGAN

[339] Neural Networks: https://github.com/GiggleLiu/marburg

[340] Triage: https://github.com/dssg/triage

[341] World Bank Poverty I: https://github.com/worldbank/ML-classification-algorithms-poverty/tree/master/notebooks

[342] World Bank Poverty II : https://github.com/avsolatorio/world-bank-pover-t-tests-solution

[343] Overseas Company Land Ownership: https://github.com/Global-Witness/overseas-companies-land-ownership/blob/master/overseas_companies_land_ownership_analysis.ipynb

[344] CFPB: https://github.com/MAydogdu/ConsumerFinancialProtectionBureau/blob/master/CFPB_Complaints_2017September.ipynb

[345] Cannabis Legalisation Effect: https://github.com/tslindner/Effects-of-Cannabis-Legalization

[346] Public Credit Card: https://github.com/dmodjeska/barnet_transactions/blob/master/Barnet_Transactions_Analysis.ipynb

[347] Recidivism Prediction: https://github.com/shayanray/GlassBox/tree/master/mlPredictor

[348] Household Poverty: https://github.com/Featuretools/predict-household-poverty

[349] NLP Public Policy: https://github.com/ancilcrayton/nlp_public_policy

[350] World Food Production: https://github.com/roshank1605A04/World-Food-Production

[351] Tax Inequality: https://github.com/DataScienceForGood/TaxationInequality

[352] Sheriff Compliance: https://github.com/austinbrian/sheriffs

[353] Apps Detection: https://github.com/MengchuanFu/Suspecious-Apps-Detection

[354] Social Assistance: https://github.com/farkhondehm/Social-Assistance

[355] Computational Social Science: https://github.com/abjer/sds/tree/master/material

[356] Liquor and Crime: https://github.com/bhaveshgoyal/safeLiquor

[357] Animal Placement Kennels: https://github.com/austinpetsalive/distemper-outbreak

[358] Staffing Wall: https://github.com/ryanschaub/The-U.S.-Mexican-Border-Wall-and-Staffing-A-Statistical-Approach-

[359] Worker Fatalities: https://github.com/zischwartz/workerfatalities

[360] Census Data API: https://github.com/johnfwhitesell/CensusPull/blob/master/Census_ACS5_Pull.ipynb

[361] Donor Identification: https://github.com/gouravaich/finding-donors-for-charity

[362] Charity Effectiveness: https://github.com/LauraChen/02-Metis-Web-Scraping

[363] Election Analysis: https://github.com/1jinwoo/DeepWave/blob/master/DR_Random_Forest.ipynb

[364] American Election Causal : https://github.com/Akesari12/LS123_Data_Prediction_Law_Spring-2019/blob/master/labs/OLS%20for%20Causal%20Inference/OLS_Causal_Inference_solution.ipynb

[365] Campaign Finance and Election Results: https://github.com/sfbrigade/datasci-campaign-finance/blob/master/notebooks/ML%20Campaign%20Finance%20and%20Election%20Results%20Example.ipynb

[366] Voting System: https://github.com/nealmcb/pr_voting_methods

[367] President Vote: https://github.com/austinbrian/portfolio/blob/master/tax_votes/president_counties.ipynb

[368] Congressional politics: https://github.com/kaumaron/Data_Science/tree/master/Congressional_Partisanship

[369] Politico: https://github.com/okfn-brasil/perfil-politico

[370] Bots: https://github.com/ParticipaPY/politic-bots

[371] Gerrymander tests: https://github.com/PrincetonUniversity/gerrymandertests

[372] Sentiment: https://github.com/JulianMar11/SentimentPoliticalCompass

[373] DL Politics: https://github.com/muntisa/Deep-Politics

[374] PAC Money: https://github.com/edmundooo/more-money-more-problems

[375] Power Networks: https://github.com/abhiagar90/power_networks

[376] Elite: https://github.com/philippschmalen/Project_tsds

[377] Debate Analysis: https://github.com/kkirchhoff01/DebateAnalysis

[378] Political Affiliation: https://github.com/davidjwiner/political_affiliation_prediction

[379] Political Ads: https://github.com/philiplbean/facebook_political_ads

[380] Political Identity: https://github.com/pgromano/Political-Identity-Analysis

[381] YT Politics: https://github.com/kmunger/YT_descriptive

[382] Political Ideology: https://github.com/albertwebson/Political-Vector-Projector

[383] Finding Donuts: https://github.com/GretelDePaepe/FindingDonuts

[384] Real Estate Classification: https://github.com/Sardhendu/PropertyClassification

[385] Recommender: https://github.com/hyattsaleh15/RealStateRecommender

[386] House Price: https://github.com/Shreyas3108/house-price-prediction

[387] House Price Portland: https://github.com/girishkuniyal/Predict-housing-prices-in-Portland

[388] Analyzing Rentals: https://github.com/ual/rental-listings

[389] Interest Prediction: https://github.com/mratsim/Apartment-Interest-Prediction

[390] Airbnb public analytics competition: http://inseaddataanalytics.github.io/INSEADAnalytics/groupprojects/AirbnbReport2016Jan.html

[391] Electricity Price: https://github.com/luqmanhakim/research-on-sp-wholesale/blob/master/research-on-sp-wholesale-plan.ipynb

[392] Electricity-Coal Correlation: https://github.com/richardddli/state_electricity_rates

[393] Electricity Capacity: https://github.com/datadesk/california-electricity-capacity-analysis

[394] Electricity Systems : https://github.com/PyPSA/WHOBS

[395] Load Disaggregation: https://github.com/pipette/Electricity-load-disaggregation

[396] Price Forecasting: https://github.com/farwacheema/DA-electricity-price-forecasting

[397] Carbon Index: https://github.com/gschivley/carbon-index

[398] Demand Forecasting: https://github.com/hvantil/ElectricityDemandForecasting

[399] Electricity Consumption: https://github.com/un-modelling/Electricity_Consumption_Surveys

[400] Electricity French Distribution: https://github.com/amirrezaeian/Individual-household-electric-power-consumption-Data-Set-

[401] Renewable Power Plants: http://inseaddataanalytics.github.io/INSEADAnalytics/groupprojects/group_energy.html

[402] Wind Farm Flow: https://github.com/Open-Power-System-Data/renewable_power_plants

[403] Power Plant: https://github.com/YungChunLu/UCI-Power-Plant

[404] Coal Prediction: https://github.com/Jean-njoroge/coal-exploratory/tree/master/notebooks

[405] Oil & Gas: https://github.com/sdasadia/Oil-Natural-Gas-Price-Prediction

[406] Gas Formula: https://github.com/cep-kse/natural_gas_formula

[407] Demand Prediction: https://github.com/victorpena1/Natural-Gas-Demand-Prediction

[408] Consumption Forecasting: https://github.com/williamadams1/natural-gas-consumption-forecasting

[409] Gas Trade: https://github.com/bahuisman/NatGasModel

[410] Safe Water: https://github.com/codeforboston/safe-water

[411] Hydrology Data: https://github.com/mroberge/hydrofunctions

[412] Water Observatory: https://github.com/sentinel-hub/water-observatory-backend

[413] Water Pipelines: https://github.com/wassname/pipe-segmentation

[414] Water Modelling: https://github.com/awracms/awra_cms_older

[415] Drought Restrictions: https://github.com/datadesk/california-ccscore-analysis

[416] Flood Prediction: https://github.com/cadrev/lstm-flood-prediction

[417] Sewage Overflow: https://github.com/jesseanddd/sewer-overflow

[418] Air Quality Prediction: https://github.com/txytju/air-quality-prediction

[419] Transdim: https://github.com/xinychen/transdim

[420] Transport Recommendation: https://github.com/AlanConstantine/KDD-Cup-2019-CAMMTR

[421] Transport Data: https://github.com/CityofToronto/bdit_data-sources

[422] Transport Demand: https://github.com/pawelmorawiecki/traffic_jam_Nairobi

[423] Demand Estimation: https://github.com/Lemma1/DPFE

[424] Congestion Analysis: https://github.com/hackoregon/transportation-congestion-analysis

[425] TS Analysis: https://github.com/nishanthgampa/Time-Series-Analysis-on-Transportation-Data

[426] Network Graph Subway: https://github.com/fangshulin/Vulnerability-Analysis-for-Transportation-Networks

[427] Transportation Inefficiencies: https://github.com/akpen/Stockholm-0.1

[428] Train Optimisation: https://github.com/crowdAI/train-schedule-optimisation-challenge-starter-kit

[429] Traffic Prediction: https://github.com/mratsim/McKinsey-SmartCities-Traffic-Prediction

[430] Predict Crashes: https://github.com/Data4Democracy/crash-model

[431] AI Supply chain: https://github.com/llSourcell/AI_Supply_Chain

[432] Transfer Learning Flight Delay: https://github.com/cavaunpeu/flight-delays

[433] Replenishment: https://github.com/pratishthakapoor/RetailReplenishement/tree/master/Code

[434] Customer Analysis: https://github.com/kralmachine/WholesaleCustomerAnalysis

[435] Distribution: https://github.com/Semionn/JB-wholesale-distribution-analysis

[436] Clustering: https://github.com/prakhardogra921/Clustering-Analysis-on-customers-of-a-wholesale-distributor

[437] Market Basket Analysis : https://github.com/tstreamDOTh/Instacart-Market-Basket-Analysis

[438] Retail Analysis: https://github.com/SarahMestiri/online-retail-case

[439] Online Insights: https://github.com/roshank1605A04/Online-Retail-Transactions-of-UK

[440] Retail Cohort: https://github.com/finnqiao/cohort_online_retail

[441] Хабре: https://habr.com/en/users/syurmakov/

[442] Нейрон: https://t.me/neurondata

[443] Источник: https://habr.com/ru/post/462769/?utm_source=habrahabr&utm_medium=rss&utm_campaign=462769