MATHEMATICAL MODELING OF THE DEGREE OF THE DEPENDENCE OF THE PECULIARITIES OF THE CLINICAL PERFORMANCE OF THE ACUTE CORONARY SYNDROME ON THE MARKERS OF THE VIRAL AND BACTERIAL INFECTIONS
Abstract and keywords
Abstract (English):
The assessment of the relationship between a disease and viral-bacterial markers can be the basis as both in making diagnostic decisions and choosing the treatments. The procedure of assessment is implemented on the basis of the methods using mathematical statistics with regard to the influence of viral-bacterial markers on the features that characterize the clinical performance of chronic diffuse acute coronary syndromes (ACS). The results of the studies based on the examination of 136 patients with the existence of the guidance ACS diagnosis confirmed by a set of laboratory and instrumental methods, are presented. To solve this problem the authors used the previously modified in relation to the multidimensional case, classical Mann - Whitney method to test for homogeneity of two samples (multidimensional generalization). On the basis of the proposed method, a table of estimations of the importance of modifying actions of 22 viral and bacterial markers in ACS was formed. The analysis of the data in the table showed that 4 markers have a high level of dependence with ACS and can be successfully used for diagnostic and therapeutic measures. 14 markers have medium level of significance to ACS and their use in the treatment process requires additional diagnostic procedures.

Keywords:
hypothesis testing for homogeneity, multidimensional data, making of diagnostic decisions, Mann - Whitney method, viral and bacterial markers, acute coronary syndrome
Text
Введение Проблема взаимосвязи различных заболеваний с составом и количеством различных вирусов и бактерий (как патогенных, так и нейтральных и полезных), а также антител к вирусно-бактериальным антигенам в организме пациента представляет большой интерес, поскольку понимание характера этой взаимосвязи позволит выбрать более эффективные методы лечения, способствующие нейтрализации опасных и негативно влияющих микроорганизмов и активизации микроорганизмов, поддерживающих процесс вылечивания. Кроме того, наличие или отсутствие этой зависимости может быть использовано при диагностировании заболеваний. Нами проводится анализ применительно к сердечно-сосудистым заболеваниям (ССЗ), относящимся к наиболее распространенным и опасным. Ранее подобный анализ проводился применительно к хроническим диффузным заболеваниям печени [1]. В настоящем исследовании методы и подходы, разработанные в [1], распространены на случай ССЗ. Как и при проведении исследований, выполненных в [1], имеется достаточно представительный набор результатов обследования пациентов по ССЗ, и в качестве основного метода анализа выбраны методы математической статистики. Построение регрессионных моделей для установления диагноза по заболеваниям печени рассматривалось в [2], и полученные результаты используются ниже. Работ по анализу влияния различных микроорганизмов на процесс течения определенных заболеваний достаточно много, укажем прежде всего [3-5]. Однако методы анализа в этих работах отличаются от методов многомерного статистического анализа, которые предлагаются нами. Целью исследований являлось формирование формализованной процедуры оценки влияния вирусно-бактериальных маркеров на клиническую картину острого коронарного синдрома (ОКС) с точки зрения концепции «модификации» болезни. Исходные данные обследования пациентов В исследование были включены пациенты, которые находились на обследовании и лечении в отделении кардиологии (блоке интенсивной терапии) городской клинической больницы № 3 г. Астрахани в период 2004-2010 гг. Они составили группу из 136 лиц с ОКС в возрасте от 35 до 84 лет (в среднем 58,47 ± 0,93 года). Критериями включения в исследование было наличие направительного диагноза ОКС, подтвержденного с помощью комплекса лабораторно-инструментальных методов исследования; отсутствие предшествующих нарушений ритма и клинически значимой сердечной недостаточности, не связанных с ишемической болезнью сердца, пороков сердца, кардиомиопатий, тяжелых конкурирующих и (или) сопутствующих заболеваний со стороны других органов и систем в фазе обострения или декомпенсации, а также отсутствие летальных исходов при нахождении в стационаре. Больных отбирали в случайном порядке. Все пациенты были обследованы согласно российским национальным стандартам в кардиологии. Кроме того, определяли сывороточные маркеры вирусных и бактериальных инфекций (Chlamidophyla pneumoniae, Mycoplasma pneumoniae, Helicobacter pylori, вирус простого герпеса (HSV-1), вирус Эпштейна - Барр (ВЭБ), цитомегаловирус (ЦМВ), вирус гепатита А (HAV) и антитела к патогенной и условно-патогенной микрофлоре (Escerichia coli, Proteus mirabilis, Candida albicans, Streptococcus spp., Bacteroides, Klebsiella pneumoniae) классов IgG, IgM, IgA или суммарные антитела методом иммунофлюоресцентного анализа (качественным, полуколичественным или количественным). Была составлена база данных из 106 используемых параметров, включая результаты исследований, формализованные по «бинарному» принципу «0 или 1», т. е. «нет признака - есть признак» (жалобы пациентов, результаты физикального исследования, некоторые инструментальные и лабораторные показатели), а также количественные показатели - результаты определения биохимических параметров, данные инструментальных методов исследования (ультразвуковое, ЭКГ-исследование) и иные факторы (год рождения, возраст). В ряде случаев использовалась шкала признаков. Целью исследования была разработка алгоритма для оценки «вклада» в болезнь сывороточных маркеров вирусных и бактериальных инфекций, антител к патогенной и условно-патогенной микрофлоре. Построение процедуры статистического анализа данных Задача выявления зависимости между клиническими признаками заболевания и вирусно-бактериальными маркерами с точки зрения математической статистики, по аналогии с [1], может быть сведена к задаче проверки гипотезы на однородность двух многомерных выборок - для конкретного вирусно-бактериального маркера, данные по которому имеются в результатах обследования пациентов. Формируются две выборки. Первая - наборы результатов обследований по всем показателям больных, у которых зафиксировано либо наличие данного маркера (бинарный принцип - «есть - нет»), либо - при количественном определении (концентрация, превышающая таковую у здоровых лиц, т. е. норму). Вторая - аналогичные наборы у больных, у которых маркера либо не было, либо его концентрация не превышала пороговое значение (норму). В ряде случаев было возможно выделение дополнительной, третьей группы со сниженной, относительно «донорской», концентрацией антител, определяемых количественно. Рассматривается гипотеза H0: можно ли считать, что обе выборки подчиняются одному и тому же вероятностному распределению, т. е. неразличимы с точки зрения их вероятностных свойств? Справедливость данной гипотезы будет означать, что наличие изучаемого конкретного вирусно-бактериального маркера не влияет на особенности протекания ОКС. Альтернативной является гипотеза H1 - гипотеза о несовпадении распределений, которым подчиняются выборочные значения для пациентов по следующим двум выборкам: пациентов с высоким содержанием данного маркера и пациентов, у которых данный маркер практически отсутствует. В исходных данных имеется ряд особенностей, которые также повлияли на выбор методов решения проблемы. Прежде всего, в исходных данных, которые формировались на протяжении многих лет, имелись большие пропуски, причем эти пропуски разбросаны по данным достаточно нерегулярно. Это связано с тем, что данные по ряду показателей стали собираться и фиксироваться относительно недавно, поэтому в материалах более ранних наблюдений информация по этим показателям отсутствует. Кроме того, анализ ряда показателей требует значимых усилий и финансовых затрат, что ограничило круг пациентов, для которых эти анализы были проведены. Наконец, по отдельным показателям данные отсутствуют по различным текущим причинам, связанным с конкретным пациентом, конкретными условиями работы медицинского учреждения. Существуют методы восстановления пропущенных данных (см., например, [5-7]). Однако эти методы эффективны для случаев, когда пропуски имеют негрупповой, разбросанный характер и их количество не очень велико, что не выполняется для использованных в нашем исследовании данных. Далее, многие из исходных показателей имеют субъективное содержание - эти параметры были получены в основном при опросе и физикальном обследовании пациентов. Перечисленные особенности наложили определенные ограничения на выбор методов проверки гипотез. Один из возможных подходов мог бы опираться на проверку одномерных гипотез об однородности по каждому показателю, и если хотя бы по одному из показателей гипотеза об однородности не выполнялась, то можно было бы считать, что и исходные наборы не являются однородными. Имеется достаточно много методов проверки гипотезы об однородности для одномерных выборок: для нормально распределенных наборов - критерии Стьюдента, F-критерий, критерий Крамера - Уэлча, непараметрические критерии Смирнова, типа ω-квадрат (Лемана - Розенблатта), Вилкоксона (Манна - Уитни), Ван-дер-Вардена, Сэвиджа, χ-квадрат и др. [5, 8]. Однако при таком подходе (на основе анализа одномерных выборок) игнорируется возможная взаимосвязь между признаками, т. е. они рассматриваются как независимые, что, вообще говоря, некорректно. Кроме того, поскольку в задаче, рассматриваемой нами, общее число признаков, или учтенных параметров болезни, равно 135, то практическое воплощение описанного подхода в рамках настоящей работы реализовать сложно ввиду ее трудоемкости. В связи с этим целесообразно рассмотреть многомерные методы анализа однородности. Воспользуемся предложенным в [1] вариантом многомерного обобщения метода Манна - Уитни, модифицированным с учетом особенностей имеющихся данных. Анализ степени зависимости между признаками и маркерами Описанная выше процедура была использована для оценки степени связи маркеров и признаков - как с отдельными, так и со всей их совокупностью. В качестве весового коэффициента для каждого признака была выбрана величина, пропорциональная коэффициенту корреляции по Спирмену между ним и рассматриваемым маркером. В данной задаче коэффициент корреляции по Спирмену следует предпочесть классическому коэффициенту корреляции по Пирсону по двум причинам. Во-первых, данные, приведенные в исходных таблицах наблюдений (прежде всего, данные субъективного характера), имеют по ряду признаков значительные погрешности, что, безусловно, отражается и на величине классического коэффициента корреляции. Но в отличие от классического, коэффициент корреляции по Спирмену вычисляется только на основе порядкового расположения оценок, без непосредственного учета их абсолютных значений - при искажении оценок их порядок обычно не изменяется. Во-вторых, в отличие от классического коэффициента, коэффициент корреляции по Спирмену при линейном преобразовании признака может изменять свои значения. Указанное свойство в контексте нашего исследования важно при учете пола пациента (0 соответствует женскому полу, 1 - мужскому): классический коэффициент корреляции выдает одинаковые значения как для признака «пол мужской», так и для признака «пол женский», поскольку они линейно связаны - их сумма равна 1. В то же время значения коэффициента корреляции по Спирмену для мужского и женского пола различны, что, по-видимому, точнее передает содержательное понимание вопроса о взаимосвязи маркера с полом пациента. Отметим, однако, следующее: при больших объемах выборок значения классического коэффициента корреляции и коэффициента корреляции по Спирмену отличаются в среднем на 5 % , что укладывается в рамки погрешности исходных данных. Это означает, что различия между значениями коэффициентов по Пирсону и Спирмену могут быть объяснены только погрешностями в исходных данных, и поэтому эти коэффициенты могут считаться равными (с точностью до погрешностей в исходных данных). Результаты оценок рассмотренных выше коэффициентов корреляции по Спирмену приведены в таблице. В первом столбце таблицы оставлены только те маркеры, для которых выполняется предположение о связи их со всей совокупностью признаков ОКС при 5 %-м уровне значимости. Отметим, что каждый из этих маркеров оказался существенно взаимосвязанным с большим (135) числом признаков, т. е. имел большое абсолютное значение коэффициента связи признака с маркером. Оценки значимости модифицирующего действия вирусно-бактериальных маркеров при ОКС № Маркер Коэффициент связи набора признаков с маркером Оценка модифицирующего действия маркера 1 Chlamidophyla pneumoniae IgM 1,197 Слабый модификатор 2 Chlamidophyla pneumoniae IgA 1,563 Средней силы модификатор* 3 Chlamidophyla pneumoniae IgG 1,435 Средней силы модификатор 4 Mycoplasma pneumoniae IgM NS** 5 Mycoplasma pneumoniae IgA 1,367 Средней силы модификатор 6 Mycoplasma pneumoniae IgG 1,471 Средней силы модификатор 7 Helicobacter pylori (суммарные антитела) 1,419 Средней силы модификатор 8 Вирус простого герпеса (HSV-1) IgM 1,642 Средней силы модификатор* 9 Вирус простого герпеса (HSV-1) IgG NS** 10 Вирус Эпштейна - Барр (ВЭБ) IgM 1,290 Средней силы модификатор 11 Вирус Эпштейна - Барр (ВЭБ) IgG 1,362 Средней силы модификатор 12 Цитомегаловирус (ЦМВ) IgM 1,634 Средней силы модификатор* 13 Цитомегаловирус (ЦМВ) IgG NS** 14 Вирус гепатита А (HAV) - суммарные антитела (КП - коэффициент позитивности) 1,62 Средней силы модификатор* 15 Escherichia coli 1,62 Средней силы модификатор* 16 Candida albicans 1,071 Слабый модификатор 17 Streptococcus spp. NS** 18 Klebsiella pneumoniae 2,094 Сильный модификатор 19 Staphylococcus 2,911 Сильный модификатор 20 Pseudomonas aeruginosa 3,274 Сильный модификатор 21 Гликолипин (эндотоксин) NS** 22 Proteus mirabilis 3,274 Сильный модификатор * p = 0,055-0,08, т. е. близко к статистической достоверности. ** Значение вероятности p не вычислено ввиду недостаточного объема необходимых данных. Отметим, что 1,645 - табличный квантиль для 95 %-й статистической достоверности, 1,282 - для 90 %-й статистической достоверности; > 95 % - сильный модификатор, 90-95 % - средней силы модификатор, < 90 % - слабый модификатор Как видно из значений коэффициентов связи набора признаков с маркером, при уровне значимости 0,95 значимыми являются маркеры-модификаторы под номерами 18, 19, 20, 22 (всего 4 из 22), указывающие на сильную связь с ОКС. При уровне значимости 0,9, что можно рассматривать как средний уровень связи, значимыми оказались 14 маркеров из 22 рассматриваемых, в том числе с номерами 2-8, 10-12, 14, 15. Два маркера под номерами 1 и 16 слабо влияли на показатели ОКС - коэффициенты соответствуют уровню значимости меньше 0,9. Наконец, по пяти маркерам с номерами 4, 9, 13, 17, 21 не удалось сделать конкретного вывода ввиду отсутствия требуемого объема данных одновременно по всей совокупности диагностических признаков. Заключение Таким образом, нами получены следующие результаты. 1. Исходная задача оценки влияния вирусно-бактериальных маркеров на клиническую картину ОКС сведена к задаче в области математической статистики - к задаче проверки гипотезы на однородность двух многомерных выборок. 2. Предложена алгоритмическая процедура проверки гипотезы на однородность двух многомерных выборок, обобщающая метод Манна - Уитни, предназначенный для проверки однородности одномерных выборок. 3. Описанная процедура проверки гипотезы об однородности использована для анализа указанных в исследовании данных по ОКС. Проведен анализ полученных результатов, сформулированы выводы и рекомендации. Предложена классификация вирусно-бактериальных маркеров по степени их влияния на многомерный массив данных по ОКС, а именно сильные, умеренные и слабые модификаторы болезни.
References

1. Dedov A. V. Opredelenie diagnoza po serdechno-sosudistym zabolevaniyam na osnove ispol'zovaniya nabora formalizovannyh modeley / A. V. Dedov, G. A. Popov // Izv. Volgograd. gos. tehn. un-ta. Ser.: Aktual'nye problemy upravleniya, vychislitel'noy tehniki i informatiki v tehnicheskih sistemah. 2014. Vyp. 22, № 3. S. 124-135.

2. Dedov A. V. Postroenie matematicheskih modeley predvaritel'nogo diagnoza zabolevaniy pecheni na osnove metodov regressionnogo analiza / A. V. Dedov, G. A. Popov // Vestn. Astrahan. gos. tehn. un-ta. Ser.: Upravlenie, vychislitel'naya tehnika i informatika. 2014. № 4. S. 124-136.

3. Medik V. A. Rukovodstvo po statistike v medicine i biologii / pod red. Yu. M. Komarova. T. 2. Prikladnaya statistika zdorov'ya / V. A. Medik, B. B. Fishman, M. S. Tokmachev. M.: Medicina, 2001. 352 s.

4. Leonov V. P. Statistika v kardiologii. 15 let spustya / V. P. Leonov // Medicinskie tehnologii. Ocenka i vybor. 2014. № 1. S. 17-28.

5. Rebrova O. Yu. Statisticheskiy analiz medicinskih dannyh. Primenenie paketa prikladnyh programm STATISTIKA / O. Yu. Rebrova. M.: MediaSfera, 2002. 312 s.

6. Bruijne M. H. J. de. On the use of Cox regression in the presence of an irregularly observed time-dependent covariate / M. H. J. de Bruijne, S. le Cessie, H. C. Kluine-Nelemas, H. C. van Houwelingen // Statistic in medicine. 2001. Vol. 20, no. 24, pp. 3817-3829.

7. Marshall G. Prospective prediction in the presence of missing data / G. Marshall, B. Warner, S. MaWhinney, K. Hammermeister // Statistics in Medicine. 2002. Vol. 21, no. 4. P. 561-570.

8. Hollender M. Metody neparametricheskoy statistiki / M. Hollender, D. A. Vulf. M.: Finansy i statistika, 1983. 518 s.


Login or Create
* Forgot password?