Ученые научили искусственный интеллект помогать в прогнозировании опасных заболеваний
Ученые лаборатории гибридных методов моделирования и оптимизации сложных систем подведомственного Минобрнауки России Сибирского федерального университета (СФУ) вместе с коллегами разработали алгоритм концептуальной кластеризации, который поможет решать ряд сложных задач в области машинного обучения. Используя этот алгоритм, машина может самостоятельно за доли секунды выделять подгруппы схожих объектов и анализировать их. Исследование обнародовано в журнале Algorithms.
Разработка может применяться в медицине для диагностики и прогнозирования социально значимых заболеваний, например, для прогнозирования рисков осложнений инфаркта миокарда и диагностики онкологических заболеваний у пациентов. По словам ученых, универсальность метода позволяет использовать его на производстве, например, для сортировки деталей, и даже для решения вопросов налогообложения – словом, везде, где требуется быстрый и обоснованный анализ большого объёма данных.
Одной из базовых проблем современного машинного обучения является создание объяснимого искусственного интеллекта, решения которого будут носить рекомендательный характер – так называемой системы поддержки принятия решений. Его отличие от уже существующих разновидностей ИИ – в полной прозрачности работы алгоритма.
«Современные алгоритмы машинного обучения, те же нейросети, чаще всего представляют из себя «чёрный ящик» – в соответствии с вводными они формируют некий результат, которому мы можем доверять или не доверять. Однако в медицине или в системе налогообложения пользователю требуется объяснение, почему машина пришла к тому или иному выводу, ведь последствия негативного решения ИИ могут быть разрушительны. Особенно это касается области диагностики заболеваний или моделирования возможных осложнений для здоровья пациентов», – сообщил руководитель исследования, профессор кафедры информационных систем Института космических и информационных технологий СФУ Игорь Масич.
Если искусственный интеллект обучается с помощью «учителя», то есть ему даются примеры с метками, то можно на основе этих исходных данных найти логические закономерности и построить классификатор, состоящий из логических правил, так что каждый новый случай, требующий рассмотрения, ИИ может соотнести с этими правилами.
Ученые уже выяснили, как поведет себя новый алгоритм в области прогнозирования осложнений у пациентов, перенесших инфаркт миокарда. Задача состояла в том, чтобы составить прогноз состояния таких пациентов и скорректировать индивидуальную траекторию их лечения.
«Можно взять результаты первичных анализов и обследований – анализы крови, результаты УЗИ сердца и коронарографии, электрокардиограмму и т.д. и загрузить их в систему, которая по заданным правилам все проверит, соотнесет, найдет значимое и сделает выводы. Эти выводы лечащий врач может интерпретировать и использовать для назначения индивидуальной терапии», – продолжил учёный.
Таким образом машина поможет предсказать не только основные осложнения в постинфарктный период, но и предупредить пациента о возможности повторного кризиса, или даже сработать на опережение в группах риска и предсказать вероятность инфаркта у человека.
Ещё одна медицинская задача, с которой уже учится справляться новый алгоритм – диагностика раковых заболеваний. Учёные СФУ поручили ИИ решение задачи из области генетики – изучить экспрессию генов с целью прогнозирования развития онкологических болезней. Сложность состоит в гигантском объёме данных, которые предстояло изучить машинному помощнику. Студентке Института космических и информационных технологий СФУ Марии Бартош удалось выделить с помощью нового алгоритма несколько генов, которые, по всей видимости, отвечают за развитие рака в организме человека. Машина указала на них, проанализировав индивидуальные данные пациентов и соотнеся их с пороговыми значениями.
Дальнейшим развитием этого направления стало применение логического анализа данных к задачам кластеризации – задачам более сложным и неформализованным. Разработан инструмент, который позволяет получать совершенно прозрачную группировку объектов по кластерам, используя близкий человеческому мышлению аппарат понятий или концептов. Этот инструмент также полезен для более детальной классификации и выявления новых классов объектов, например, обнаружение новых видов заболеваний.
Учёные предусмотрели ещё одно практическое применение разработанной системы: она поможет работникам налоговых органов проверить сведения о налогоплательщиках, проверить достоверность налоговых деклараций и т.п. Пригодятся такие способности искусственного интеллекта и на производстве – например, чтобы выделять однородные партии продукции с повышенными требованиями к качеству, например, изделий электронной компонентной базы космического применения. Так можно быстро и эффективно сортировать микрочипы или транзисторы в соответствии с их качествами.
Проект реализуется в рамках программы Минобрнауки России «Приоритет 2030», которая является одной из мер государственной поддержки университетов нацпроекта «Наука и университеты».