» » Методы анализа данных в социально-гигиенических исследованиях

Канал Натальи Прокопенко - доктора биологических наук, г. Киев

 

Н.А. Прокопенко

Институт геронтологии АМН Украины


 

Применение системного подхода в социально-гигиенических исследованиях позволяет всесторонне и глубоко изучить поставленную проблему, что связано с извлечением необходимой информации из большого массива собранных данных. Поэтому с точки зрения научной значимости результатов работы важно правильно определить способы и методы обработки статистического материала.

Анализ сложного многофакторного комплекса проводится в определенной последовательности, по этапам. Первый этап включает оценку частоты значений каждого признака в изучаемой совокупности. При этом следует учитывать, что чем ближе значение частоты к 50 % (в случае номинальных признаков), тем вероятнее полагаться на достоверные результаты при дальнейшем анализе, т.е. более устойчивые признаки менее значимы.

Важной ступенью исследования является изучения характера взаимодействия признаков с целью выделения среди них факторных и результативных признаков. Поскольку признаки могут принадлежать к тому или иному типу классификации (например, количественные, порядковые, классификационные), то для их обработки необходимо использовать различный математический аппарат. Для оценки силы связи и ее направленности могут быть применены несколько показателей, такие, как коэффициенты контингенции, коллигации, ассоциации, риска, ранговый коэффициент корреляции. Достоинство коэффициента риска (Relative Risk RR), ассоциации (называемого иначе тетрахорическим показателем связи) и рангового коэффициента корреляции Спирмена заключается в том, что они позволяют измерять степень сопряженности между варьирующими признаками независимо от закона их распределения и вида связи. Причем коэффициенты ассоциации и Спирмена являются более строгими по сранению с коэффициентом риска. Коэффициент ассоциации и ранговый коэффициент корреляции Спирмена выражаются в долях единицы, как и пирсоновский коэффициент корреляции; его величина изменяется в пределах от 0 до 1. Коэффициент риска показывает, во сколько раз доля главного признака выше (или ниже) при наличии фактора риска по сравнению с такой при его отсутствии. Достоверность коэффициентов оценивается по критериям c2 Пирсона и Стьюдента. Для расчета коэффициентов риска и ассоциации статистический материал группируется в четырехпольные таблицы сопряженности, с предварительным преобразованием порядковой и классификационной шкал в номинальную.

Следующим этапом проводится качественный и количественный анализ факторных признаков, т.е. отбрасываются менее информативные признаки, а также те, которые статистически выглядят взаимозависимыми, исключаются причинно-следственные связи, и таким образом формируется комплекс факторных признаков для дальнейшей оценки их совместного влияния на результативный признак. Для определения влияния можно использовать различные методы многомерного статистического анализа, к которым в первую очередь следует отнести факторный, дисперсионный, дискриминантный, регрессионный, канонический. В основе факторного анализа лежит способ описания сложного комплекса взаимосвязанных переменных несколькими латентными (гипотетическими или ненаблюдаемыми) факторами. Исходя из этого, применение факторного анализа имеет большое значение для решения сложных проблем с большим числом взаимопереплетающихся признаков, когда трудно понять, где причина, а где следствие. Дисперсионный анализ позволяет выявить долю, вносимую каждым из включенных в исследование факторов в общую дисперсию комплекса, и рассчитать их совокупное влияние. Преимущества этого метода наиболее ощутимы при изучении одновременного действия двух факторов на какую-либо структуру, однако они уменьшаются с увеличением числа факторов. Каноническая корреляция позволяет одновременно учесть комплекс взаимосвязанных факторов с несколькими результативными признаками. Данный метод целесообразно применять в случаях, когда приходится иметь дело не только с большим числом факторов, но и с комплексом результативных признаков. Дискриминантный анализ применяется для классификации объектов на группы по нескольким переменным одновременно. При проведении регрессионного анализа удается оценить влияние каждого из факторов в отдельности и их совместное влияние на результативный признак, рассчитать ряд коэффициентов, имеющих большое значение для анализа статистических данных (например, коэффициент множественной детерминации, дисперсии признаков, показатель интенсивности мультиколинеарности), представить взаимодействие структур изучаемой системы.

Таким образом, правильный выбор показателей связи и методов многомерного статистического анализа позволит выделить цепочки взаимосвязанных факторов, характер их взаимодействия и, в конечном итоге, оценить возможность и силу воздействия на более существенные факторы.

Похожие публикации:


Эта запись была опубликована Nataliia 28-10-2016, 06:31, Если Вы впервые на данном блоге и он Вам понравился, предлагаю подписаться на RSS чтобы не пропустить новых публикаций.

 

Сайт про социальные медицинские и биологические научные проблемы, г. Киев, Украина
Социальная медицина, биология и психология - Прокопенко Н.А. Google :)