НМИЦ кардиологии им. Е. И. Чазова Минздрава России совместно с Центром технологий для общества Yandex Cloud запустил цифровой регистр пациентов, перенёсших острый коронарный синдром. Пилот охватывает Тульскую область, где за 2021–2025 годы накоплено более 13 тысяч документов из сосудистых центров. О технических деталях проекта рассказал руководитель медицинского направления Yandex Cloud Евгений Попов на habr.com.
Контекст
Острый коронарный синдром — наиболее опасная форма ишемической болезни сердца: смертность в группе перенёсших его пациентов достигает 20% в течение четырёх лет. Ключевая информация о течении болезни хранится в выписных эпикризах — неструктурированных текстах объёмом 3–6 страниц, где смешаны анамнез, результаты обследований и схемы лечения. До запуска цифрового регистра врачи и аналитики переносили эти данные в региональный нозологический регистр вручную, тратя несколько часов в неделю на одного специалиста. При этом около 70% пациентов не приходят на повторный осмотр, и отследить их можно только перебирая медицинские системы.
Как устроено решение
Команда разбила задачу на три этапа:
- обезличивание персональных данных перед машинной обработкой;
- извлечение именованных сущностей из эпикризов большими языковыми моделями;
- сборка регистра с разграниченным доступом — закрытый контур с персональными данными для региональных кардиологов и обезличенный срез для исследователей НМИЦ.
Тульская область выбрана пилотным регионом из-за зрелой кардиологической службы и накопленного массива документов. Региональные специалисты получают инструмент мониторинга диспансерного наблюдения и «красные флаги» по пропускам приёма препаратов, а федеральный центр — материал для сравнения регионов и корректировки стратегии помощи при сердечно-сосудистых заболеваниях.
Что это значит для отрасли
Проект показывает, что языковые модели способны закрыть давнюю болевую точку российской медицинской аналитики — разрыв между неструктурированными первичными документами и регистрами, на которых строится статистика и регуляторные решения. Если подход масштабируется на другие нозологии и регионы, это снизит нагрузку на врачей-кураторов регистров и ускорит обратную связь между первичным звеном и федеральными НМИЦ. Отдельный сигнал для рынка — акцент на обезличивании как обязательном шаге конвейера: без этого крупные медицинские датасеты остаются юридически непригодными для исследовательских и коммерческих ИИ-задач.