РАСЧЕТ КОНЦЕНТРАЦИИ ХОЛЕСТЕРИНА ЛИПОПРОТЕИНОВ НИЗКОЙ ПЛОТНОСТИ НА ОСНОВЕ ДАННЫХ ЛИПИДНОГО ПРОФИЛЯ С ПРИМЕНЕНИЕМ МАШИННОГО ОБУЧЕНИЯ
Doi: 10.51620/0869-2084-2026-71-2-133-138 EDN: HHMFEB ISSN: 0869-2084 (Print) ISSN: 2412-1320 (Online)
Аннотация
В условиях реализации стратегии РФ по развитию цифровых технологий в медицине актуально изучение возможностей искусственного интеллекта (ИИ) и машинного обучения (МО) в клинической лабораторной диагностике.
Цель исследования – создать модель МО для расчета концентрации холестерина липопротеинов низкой плотности на основе показателей липидного профиля и оценить ее точность относительно традиционных прямого и расчётных методов.
Материал и методы. Обучение и тестирование модели проведено на выборке из 631 267 пациентов с использованием обезличенного набора данных, включающего демографические характеристики и результаты показателей липидограммы: концентрации общего холестерина, холестерина липопротеинов высокой плотности, триглицеридов и холестерина липопротеинов низкой плотности.
Результаты. Модель регрессии показала высокую точность в прогнозе уровня холестерина липопротеинов низкой плотности с R² = 0,952, превосходя традиционные формулы для пациентов при уровнях триглицеридов более 4,5 ммоль/л и холестерина липопротеинов низкой плотности более 3,0 ммоль/л: средняя абсолютная ошибка между предсказанным и известным значением холестерина липопротеинов низкой плотности составила 0,476 и 0,168 против 1,173, 0,562, 0,796 и 0,187, 0,173, 0,200 ммоль/л, рассчитанным по формулам Фридвальда, Мартина и Сэмпсона, соответственно.
Заключение. Разработанная модель, обученная и протестированная на крупной российской выборке пациентов, по точности расчета концентрации холестерина липопротеинов низкой плотности превосходит традиционные формулы при высоких уровнях триглицеридов и холестерина липопротеинов низкой плотности, и не уступает при иных диапазонах, что подтверждает надежность регрессионной модели для клинического использования в условиях отсутствия прямого измерения концентрации холестерина липопротеинов низкой плотности.
Annotation
In the context of implementing the Russian Federation’s strategy for the development of digital technologies in medicine, studying the possibilities of artificial intelligence and machine learning in clinical laboratory diagnostics is highly relevant.
Objective. To develop a machine learning model for calculating low-density lipoprotein cholesterol concentration based on lipid profile parameters and evaluate its accuracy compared to traditional direct and calculated methods.
Material and methods. Model training and testing were performed on a sample of 631,267 patients using an anonymized dataset that included demographic characteristics and lipid profile results: concentrations of total cholesterol, high-density lipoprotein cholesterol, triglycerides, and low-density lipoprotein cholesterol.
Results. The regression model demonstrated high accuracy in predicting low-density lipoprotein cholesterol levels with R² = 0.952, outperforming traditional formulas for patients with triglyceride levels above 4.5 mmol/L and low-density lipoprotein cholesterol levels above 3.0 mmol/L: the mean absolute error between predicted and known low-density lipoprotein cholesterol values was 0.476 and 0.168 versus 1.173, 0.562, 0.796 and 0.187, 0.173, 0.200 mmol/L calculated using the Friedewald, Martin, and Sampson formulas, respectively.
Conclusion. The developed model, trained and tested on a large Russian patient cohort, outperforms traditional formulas at high triglyceride and low-density lipoprotein cholesterol levels, and performs comparably at other ranges in terms of accuracy for calculating low-density lipoprotein cholesterol concentration, confirming the reliability of the regression model for clinical use when direct measurement of low-density lipoprotein cholesterol concentration is unavailable.
Key words: machine learning; artificial intelligence; low-density lipoprotein cholesterol; Friedwald equation; Martin equation; Sampson equation
Для цитирования:
Вареха Л.А., Кокорин В.А., Святов И.С. Тяжельников А.А., Дорожкова В.С., Гимадиев Р.Р., Стуклов Н.И., Кочетов А.Г., Гордиенко К.В., Губина Е.В., Вареха Н.В., Чаусова С.В., Щеголев О.Б., Силкина Т.А. Расчет концентрации холестерина липопротеинов низкой плотности на основе данных липидного профиля с применением машинного обучения. Клиническая лабораторная диагностика. 2026; 71 (2): 133-138
DOI: https://doi.org/10.51620/0869-2084-2026-71-2-133-138
EDN: HHMFEB
For citation:
Varekha L.A., Kokorin V.A., Sviatov I.S., Tyazhelnikov A.A., Dorozhkova V.S., Gimadiev R.R., Stuklov N.I., Kochetov A.G., Gordienko K.V., Gubina E.V., Varekha N.V., Chausova S.V., Shchegolev O.B., Silkina T.A. Calculation of low-density lipoprotein cholesterol concentration from lipid profile data using machine learning. Klinicheskaya Laboratornaya Diagnostika (Russian Clinical Laboratory Diagnostics). 2026; 71 (2): 133-138 (in Russ.).
DOI: https://doi.org/10.51620/0869-2084-2026-71-2-133-138
EDN: HHMFEB