ML и Data Science для фармацевтической отрасли
Индустрия: Фармацевтика
География: Россия
Задача: создать прогностическую модель потребления по некоторым видам препаратов (в том числе по антигистаминным) в разрезе ряда регионов России
В значительной части Российского фармацевтического рынка машинное обучение, к сожалению, не получило широкого распространения. Однако в рамках пилотного проекта нами была разработана для клиента прогностическая модель потребления по некоторым видам препаратов (в том числе по антигистаминным) в разрезе ряда регионов России.
Данные, полученные от заказчика: данные о продажах препаратов помесячно в разрезе территориальных образований, типов препаратов, назначены ли они медицинскими работниками.
Зачем машинное обучение нужно фармацевтической компании?
Алгоритмы искусственного интеллекта и модели машинного обучения оказывают значительное влияние на биотехнологическую отрасль. От открытия, разработки и производства жизненно важных лекарств до клинических испытаний, коммуникации и определения целей лекарств - ИИ в фармацевтике является несомненным игровым фактором. Уже сейчас в ряде направлений активно внедряется машинное обучение, направленное на прогнозирование спроса на медицинские препараты, улучшение диагностики и сокращение сроков разработки и вывода на рынок новых препаратов. Ниже приведены основные сценарии использования искусственного интеллекта и машинного обучение в фармацевтике:
- Улучшение диагностики: благодаря огромному количеству данных, доступных врачам, от информации, касающейся новых лекарств до симптомов заболеваний, взаимодействия лекарств и того, как разные пациенты, получающие одинаковое лечение, могут иметь уникальные результаты, ловкость в получении доступа к этой информации и ее переваривании быстро становится все более важной. А машинное обучение позволяет им учиться на этих данных и применять их на практике.
- Прогнозирование следующей эпидемий и сезонных заболеваний: заболевания вызываются многочисленными факторами, такими как изменение экологии, внедрение нового патогена в популяцию или генетические изменения в резервуаре патогена. Эпидемия распространяется со скоростью света, заражая большое количество людей за короткое время, обычно за две недели или даже меньше. В некоторых случаях оно может распространиться на другие страны и затронуть значительное число людей. Ученые из Калифорнийского университета, Университета Джорджии и Университета Мэсси создали модель искусственного интеллекта, которая может определить потенциальные очаги филовирусной инфекции с точностью 87%. Филовирусы обычно заражают летучих мышей, но могут передаваться человеку и могут вызвать разрушительные последствия — например, Эболу.
- Оценка эффективности лекарств: Успех персонализированных лекарств во многом зависит от способности идентифицировать подгруппы пациентов, чему можно способствовать с помощью точных диагностических тестов, основанных на биомаркерах. Benevolent AI, ведущая британская компания в области искусственного интеллекта, является одним из лидеров, использующих машинное обучение для открытия лекарств и диагностики заболеваний. Их система недавно успешно идентифицировала биомаркеры бокового амиотрофического склероза (БАС), также известного как болезнь двигательных нейронов (БДН). Эта технология использовалась для просмотра миллиардов предложений из бесчисленных научных статей и рефератов.
- Содействие процессу клинических испытаний: Процесс клинических испытаний — самая опасная и трудоемкая часть открытия лекарств. Дело в том, что в клинических испытаниях нет ничего предсказуемого или определенного. При проведении клинических исследований клиницисты сталкиваются с многочисленными проблемами, такими как набор и удержание пациентов, растущие расходы, сложность исследований и множество правил. Бостонская биофармацевтическая компания Berg Health начала использовать свою уникальную платформу на основе искусственного интеллекта Interrogative Biology, которая позволяет им идентифицировать биомаркеры для открытия новых лекарств и отслеживать реакцию пациентов во время клинических испытаний. Они строят модели, используя платформу с учетом собственной биологии пациента, и контролируют реакцию пациента на биологическом уровне. Еще одним примером машинного обучения в клинических исследованиях является приложение ATACH-II, которое помогает оценить пригодность пациентов, предварительный скрининг и рандомизацию.
- Набор участников клинических исследований: Удержание участников клинических испытаний и обеспечение лучшего тестирования с помощью машинного обучения. Анализ EMR, чтобы найти наиболее подходящих кандидатов для участия в исследовании, и используйте их данные для прогнозирования оттока участников и результатов, чтобы избежать потенциальных осложнений.
- Анализ фармацевтического рынка: Улучшение маркетинга с помощью передовой информации о тенденциях рынка. Использование глубокого обучения и машинного обучения, чтобы лучше понимать поведение потребителей и точно позиционировать лекарства для нужной аудитории.
- Оптимизация производства: Проведение статистического анализа данных, чтобы оптимизировать процессы и повысить качество. Снижение риска за счет повышения безопасности потребителей. Оптимизация режимов работы производственного оборудования.
- Оптимизация и мониторинг цепочек поставок, повышение их устойчивости.
- Маркетинг и рекламные компании: Искусственный интеллект в фармацевтической отрасли может сравнивать результаты прошлых маркетинговых кампаний, чтобы определить наиболее прибыльные из них. Это помогает проанализировать любую маркетинговую деятельность и то, как она влияет на аудиторию, чтобы создать наиболее эффективную стратегию для вашего последующего взаимодействия с клиентами. Основываясь на различных результатах лечения пациентов и данных, он может предсказать успех или неудачу различных методов взаимодействия в рамках конкретной кампании.
Результат:
-
Анализ данных заказчика и оценка их качества:
- Качество данных оставляло желать лучшего, наблюдалась кратные перепады в потреблении препаратов по ряду регионов год к году, выбросы в отдельные (нехарактерные месяцы) месяцы причиной этого в большинстве случаев стали проблемы учета реализации препаратов в предыдущие года.
- На основании исторического анализа выявлено что потребление препаратов по маркам связано в значительно степени не с поведенческими привычками потребителей, а с доступностью того или иного препарата в определённый момент времени, вызванной сложно прогнозируемыми факторами (сбоями в цепочках поставок, экономическими проблемами производителей сырья итд.)
-
Выявление проблем и /или аномалий в данных:
- Существенные аномалии были выявлены методами статистического анализа
- Причины аномалий и фильтрация значений, где она возможна, была произведена совместно с отраслевыми специалистами на основании исторических данных и учета различных факторов
-
Формирование возможного списка факторов, влияющих на потребление препаратов (помимо сезонности):
- Выявлены зависимости от погодных условий (температура воздуха, ветер, осадки)
- Периодов цветения аллергенных растений
- Моделирование с использованием различных моделей: Группы авторегрессионных моделей(ARIMA/SARIMA итд), Нейронных сетей, Регрессионных моделей (Lasso, RigeCV), Случайного леса, Градиентного бустинга.
- Произведена оценка результатов моделирования по параметрам точности прогноза другим
- Определена наилучшая модель. Показатели точности прогнозирования данной модели составили от 71% до 89% c учетом неточностей в данные и шума.
Выводы: Продажи антигистаминных препаратов в большей степенью связаны с сезонностью и основаны в большей степени на ожиданиях потребителей нежели чем на фактических погодных условиях. Негативным образом на качестве прогноза сказывается как низкое качество данных о продажах препаратов, так и не слишком высокое качество метеопрогнозов, в связи с чем многие аллергики при формировании запасов препаратов ориентируются на месяцы и сезоны чем на прогнозы о цветении растений.
Развитие проекта продолжается основным направлением необходимым для улучшения качества прогноза является улучшение качества входных данных. Проект показал кроме всего прочего, необходимость плотного сотрудничества Дата сайентистов и отраслевых специалистов для получения качественного результата.
Data Science, ML
- Прогнозная аналитика: предотвращение мошенничества, прогнозирование поведения клиентов, выявление неисправностей и отклонений от норм, прогнозирование времени доставки, объема спроса и др.
- Управление опытом клиента, системы персонализированных рекомендаций, повышение точности таргетирования маркетинговых кампаний
- Распознавание объектов, анализ видеопотока, автоматизированный визуальный контроль с использованием технологий компьютерного зрения
- Поиск информации в каталогах и хранилищах данных
- Автоматизированная классификация и обработка документов
- Анализ эмоциональной окраски сообщений в соцсетях, на форумах, в СМИ
- Обработка речи, речевое управление, применение чат-ботов