Первый этап статистического исследования включает в себя. Статистическое наблюдение является первой стадией статистического исследования, представляющий собой научно организованный сбор данных об изучаемых явлениях и процессах общественной жизни

Чтобы получить представление о том или ином явлении, сделать выводы, необходимо провести статистическое исследование. Предме­том статистического исследования в здравоохранении и медицине мо­гут быть здоровье населения, организация медицинской помощи, раз­личные разделы деятельности лечебно-профилактических учреждений, факторы внешней среды, оказывающие влияние на состояние здоровья.

Методическая последовательность выполнения статистического исследования складывается из определенных этапов.

1 этап. Составление плана и программы исследования.

2 этап. Сбор материала (статистическое наблюдение).

3 этап. Разработка материала, статистическая группировка и сводка

4 этап. Статистический анализ изучаемого явления, формулировка выводов.

5 этап. Литературная обработка и оформление полученных результатов.

По завершении статистического исследования разрабатываются ре­комендации и управленческие решения, проводится внедрение ре­зультатов исследования в практику, оценивается эффективность.

В проведении статистического исследования важнейшим элементом является соблюдение строгой последовательности в осуществлении названных этапов.

Первый этап статистического исследования - составление плана и программы - является подготовительным, на котором определяется цель и задачи исследования, составляется план и программа иссле­дования, разрабатывается программа сводки статистического мате­риала и решаются организационные вопросы.

Приступая ж статистическому исследованию, следует точно и чет­ко сформулировать цель и задачи исследования, изучить по данной теме литературу.

Цель определяет основное направление исследования и носит, как правило, не только теоретический, но и практический характер. Цель формулируется ясно, четко, недвусмысленно.

Для раскрытия поставленной цели определяются задачи исследова­ния.

Важным моментом подготовительного этапа является разработка организационного плана. Организационный план исследования предус­матривает определение места (административно-территориальных границ наблюдения), время (конкретных сроков осуществления наблю­дения, проведения разработки и анализа материала) и субъекта ис­следования (организаторов, исполнителей, методического и органи­зационного руководства, источников финансирования исследования).

Пл ан иссле дов ания включает:

Определение объекта исследования (статистической совокупнос­ти);

Объема исследования (сплошное, несплошное);

Видов (текущее, единовременное);

Способов сбора статистической информации. Программа исследования включает:

Определение единицы наблюдения;

Перечень вопросов (учетных признаков), подлежащих регистра­ции в отношении каждой единицы наблюдения*



Разработку индивидуального учетного (регистрационного) блан­ка с перечнем вопросов и признаков, подлежащих учету;

Разработку макетов таблиц, в которые затем вносятся результа­ты исследования.

На каждую единицу наблюдения заполняется отдельный бланк, он содержит паспортную часть, четко сформулированные, поставленные в определенной последовательности вопросы программы и дату заполне­ния документа.

В качестве учетных бланков могут быть использованы применяе­мые в практике лечебно-профилактических учреждений учетные меди­цинские Формы.

Источниками получения информации могут служить другие медицин­ские документы (истории болезни, и индивидуальные карты амбула­торного больного, истории развития ребенка, истории родов), от­четные формы лечебно-профилактических учреждений и др.

Для обеспечения возможности статистической разработки данных из этих документов производят выкопировку сведений на специально разработанные учетные бланки, содержание которых определяется в каждом отдельном случае в соответствии с задачами исследования.

В настоящее время в связи с машинной обработкой результатов наблюдения с использованием ЭВМ вопросы программы могут быть формализованы, когда вопросы в учетном документе ставятся в виде альтернативы (да, нет), или предлагаются уже готовые ответы, из которых следует выбрать определенный ответ.

На первом этапе статистического исследования наряду с програм­мой наблюдения составляется программ* сводки полученных данных, которая включает установление принципов группировки, выделение группировочных признаков, определение комбинаций этих признаков, составление макетов статистических таблиц.

Второй этап - сбор статистического материала (статистическое наблюдение) - заключается в регистрации отдельных случаев изу­чаемого явления и характеризующих их учетных признаков в регис­трационные бланки. Перед и в ходе выполнения этой работы прово­дится инструктаж (устный или письменный) исполнителей наблюде­ния, обеспечение их формами регистрации.

По времени статистическое наблюдение может быть текущим и еди­новременным.

При текущем набл юдении явление изучается за какой-то от­дельный период времени (неделю, квартал, год и т.д.) путем пов­седневной регистрации явления по мере возникновения каждого слу­чая. Примером текущего наблюдения является учет числа родившихся, умерших, заболевших, выписанных из стационара и т. п. Так учиты­ваются быстро меняющиеся явления.

При единовременном набл юдении статистические данные собирают­ся на определенный (критический) момент времени. Единовремен­ным наблюдением являются: перепись населения, изучение физического развития детей, учет больничных коек на коней года, паспорти­зация лечебно-профилактических учреждений и т. д. К этому же виду относятся профилактические осмотры населения. Единовременная ре­гистрация отражает состояние явления на момент изучения. Этот вид наблюдения используется для изучения медленно меняющихся явлений.

Выбор вид наблюдения по времени определяется целью и задачами исследования. Например, характеристику госпитализированных больных можно получить в результате текущей регистрации выбывших из стационара (текущее наблюдение) или путем однодневной перепи­си больных, находящихся в стационаре (единовременное наблюдение).

В зависимости от полноты охвата изучаемого явления различают сплошное и несплошное исследование.

При сплошном исследовании изучаются все входящие в состав со­вокупности единицы наблюдения, т.е. генеральная совокупность. Сплошное исследование проводят с целью установления абсолютных размеров явления, например, общей численности населения, общего количества родившихся или умерших, общего числа заболевших тем или иным заболеванием и др. Сплошной метод применяется и в тех случаях, когда сведения необходимы для оперативной работы (учет инфекционной заболеваемости, нагрузка врачей и др.)

При несплошном исследовании изучается лишь часть генеральной совокупности. Оно подразделяется на несколько видов: анкетное, монографическое, основного массива, выборочное. Самым распростра­ненным в медицинских исследованиях является выборочный метод.

Монографический метод - дает детальное описание отдельных ха­рактерных в каком-либо отношении единиц совокупности и глубокое, всестороннее описание объектов.

Метод основного массива - предполагает изучение тех объектов, в которых сосредоточено значительное большинство единиц наблюде­ния. Недостатком этого метода является то, что остается неохва­ченной исследованием часть совокупности, хотя и небольшая по размерам, но которая может значительно отличаться от основного мас­сива.

Анкетный метод - это сбор статистических данных с помощью спе­циально разработанных анкет, адресованных определенному кругу лиц. Это исследование основано на принципе добровольности, поэто­му возврат анкет зачастую бывает неполным. Нередко ответы на пос­тавленные вопросы носят отпечаток субъективности и случайности. Этот метод применяется для получения приблизительной характеристики изучаемого явления.

Выборочный метод - сводится к исследованию некоторой спе­циально отобранной части единиц наблюдения для характеристики всей генеральной совокупности. Преимуществом этого метода являет­ся получение результатов высокой степени надежности, а также зна­чительно более низкая стоимость. В исследовании занято меньшее число исполнителей, кроме того он требует меньших затрат времени.

В медицинской статистике роль и место выборочного метода осо­бенно велики, поскольку медицинские работники имеют дело обычно только с частью изучаемого явления: изучают группу больных с тем или иным заболеванием, анализируют работу отдельных подразделе­ний и медицинских учреждений, оценивают качество определенных ме­роприятий и т. д.

По способу получения сведений в ходе проведения статистическо­го наблюдения и характеру его осуществления выделяют несколько видов:

1) непосредственное наблюдение (клинический осмотр больных, проведение лабораторных, инструментальных исследований, антропо­метрические измерения и т. п.)

2) социологические методы : метод интервью (очный опрос), анке­тирование (заочный опрос - анонимный или неанонимный) и др.;

3) документальное исследов ание (выкопировка сведений из учет­но-отчетных медицинских документов, сведения официальной статис­тики учреждений и организаций.)

Третий этап - группировка и сводка материала - начинается с проверки и уточнения числа наблюдений, полноты и правильности по­лученных сведений, выявлении и устранении ошибок, дубликатов за­писей и т. д.

Для правильной разработки материала применяется шифровка пер­вичных учетных документов, т.е. обозначение каждого признака и его группы знаком - буквенным или цифровым. Шифровка - это техни­ческий прием, облегчающий и ускоряющий разработку материала, по­вышающий качество, точность разработки. Шифры - условные обозна­чения - вырабатываются произвольно. При шифровке диагнозов реко­мендуется пользоваться международной номенклатурой и классифика­цией болезней; при шифровке профессий - словарем профессий.

Преимуществом шифровки является то, что при необходимости пос­ле окончания основной разработки можно вернуться к материалу для разработки с целью выяснения новых связей и зависимостей. Зашиф­рованный учетный материал позволяет сделать это легче и быстрее, чем незашифрованный. После проверки проводится группировка призна­ков.

Группировка - расчленение совокупности изучаемых данных на од­нородные, типичные группы по наиболее существенным признакам. Группировка может проводиться по качественным и количественным признакам. Выбор группировочного признака зависит от характера изучаемой совокупности и задач исследования.

Типологическая группировка производится по качественным (опи­сательным, атрибутивным) признакам, например, по полу, профессии, группам болезни, тяжести течения болезни, послеоперационным ос­ложнениям и т. д.

Группировка по количественным (вариационным) признакам прово­дится на основании числовых размеров признака, например, по воз­расту, длительности заболевания, продолжительности лечения и т.д. Количественная группировка требует решения вопроса о величине группировочного интервала: интервал может быть равным, а в ряде случаев - неравный, даже включать так называемые открытые группы.

Например, при группировке по возрасту могут быть определены открытые группы: до 1 года. 50 лет и старше.

При определении числа групп исходят из цели и задач исследова­ния. Необходимо, чтобы группировки могли вскрыть закономерности изучаемого явления. Большое число групп может привести к чрезмер­ному дроблению материала, ненужной детализации. Малое число групп приводит к затушевыванию характерных черт.

Закончив группировку материала, приступают к сводке.

Сводка - обобщение единичных случаев, полученных в результате статистического исследования, в определенные группы, их подсчет и внесение в макеты таблиц.

Сводку статистического материала проводят при помощи статисти­ческих таблиц. Таблица, не заполненная цифрами, называется макетом.

Статистические таблицы бывают перечневые, хронологические, тер­риториальные.

Таблица имеет подлежащее и сказуемое. Статистическое подлежа­щее обычно размещается по горизонтальным строкам в левой части таблицы и отражает главный, основной признак. Статистическое ска­зуемое размещается слева направо по вертикальным графам и отра­жает дополнительные учетные признаки.

Статистические таблицы делятся на простые, групповые и комби­национные.

В простых таблицах представлено числовое распределение мате­риала по одному признаку, составных частей его (табл.1). Простая таблица содержит обычно простой перечень или итог по всей сово­купности изучаемого явления.

Таблица 1

Распределение умерших в больнице Н. по возрасту

В групповых таблицах представлено сочетание двух признаков в связи друг с другом (табл.2).

Таблица 2

Распределение умерших в больнице Н. по полу и возрасту

В комбин аци онных таблицах дается распределение материала по трем и более взаимосвязанным признакам (Таблица 3).

Таблица 3

Распределение умерших в больнице Н. при разных заболеваниях по возрасту и полу

Диагноз основного заболевания Возраст
0-14 15-19 20-39 40-59 60 и > Всего
м ж м ж м ж м ж м ж м ж м+ж
Болезни сис­темы кровооб. - - - -
Травмы и отравления - - -
Злокачеств. новообразов. - - - - - -
Другие заб. - - - -
Все заболев. - -

При составлении таблиц должны соблюдаться определенные требо­вания:

Каждая таблица должна иметь заголовок, отражающий ее содержание;

Внутри таблицы все графы также должны иметь четкие краткие наз­вания;

При заполнении таблицы все клетки таблицы должны содержать соответствующие числовые данные. Оставшиеся незаполненными из-за отсутствия данной комбинации клетки таблицы прочеркивают­ся ("-"), а при отсутствии сведений в клетке проставляется "н.с." или "...";

После заполнения таблицы в нижней горизонтальном ряду и в пос­леднем справа вертикальном столбце подводятся итоги верти­кальных граф и горизонтальных строк.

Таблицы должны иметь единую последовательную нумерацию.

В исследованиях, имеющих небольшой объем наблюдений, сводка проводится вручную. Все учетные документы раскладываются на груп­пы в соответствии с шифром признака. Далее проводится подсчет и запись данных в соответствующую клетку таблицы.

В настоящее время в проведении сортировки и сводки материала широко используются ЭВМ. которые позволяют не только отсортиро­вать материал по изучаемым признакам, но выполнить расчеты пока­зателей.

Четвертый этап - статистический анализ - является ответствен­ным этапом исследования. На этом этапе проводится вычисление ста­тистических показателей (частоты, структуры, средних размеров изучаемого явления),дается их графическое изображение, изучает­ся динамика, тенденции, устанавливаются связи между явлениями. даются прогнозы и т.д. Анализ предполагает интерпретацию получен­ных данных, оценку достоверности результатов исследования. В зак­лючение делаются выводы.

Пятый этап - литературная обработка является заключительным. Он предполагает окончательное оформление результатов статистичес­кого исследования. Результаты могут быть оформлены в виде статьи, отчета, доклада, диссертации и др. Для каждого вида оформления существуют определенные требования, которые должны соблюдаться при литературной обработке результатов статистического исследования.

Результаты медико-статистического исследования внедряются в практику здравоохранения. Возможны различные варианты использова­ния результатов исследования: ознакомление с результатами широ­кой аудитории медицинских и научных работников; подготовка ин­структивно-методических документов; оформление рационализаторско­го предложения и другие.

Статистическая методология – система приемов, способов и методов, направленных на изучение количественных закономерностей, которые проявляются в структуре, динамике и взаимосвязях социально-экономических явлений. Методология является основой статистического исследования .

Этапы статистического исследования :

1. статистическое наблюдение, или сбор информации;

2. сводка и группировка результатов статистического наблюдения, или обработка информации;

3. анализ полученной информации.

Статистическое наблюдение – это массовое, планомерное, научно-организованное наблюдение за явлениями социальной и экономической жизни, которое заключается в регистрации отобранных признаков у каждой единицы совокупности.

Процесс проведения статистического наблюдения включает следующие этапы:

1) подготовка наблюдения;

2) проведение массового сбора данных;

3) подготовка данных к автоматизированной обработке;

4) разработка предложений по совершенствованию статистического наблюдения.

Сводка – комплекс последовательных операций по обобщению данных статистического наблюдения для характеристики статистической совокупности в целом и отдельных ее частей (подсчет промежуточных и общих итогов). Группировка – разграничение общей статистической совокупности на группы качественно однородных единиц. Результаты статистической сводки и группировки излагаются в виде статистических таблиц.

Анализ или исследование сущности изучаемых явлений, исследует структуру, динамику и взаимосвязи общественных явлений и процессов.

Имеет следующие этапы:

1) констатация фактов и их оценка;

2) установление характерных черт и причин каждого явления;

3) сопоставление одного явления с другими (в том числе с эталоном);

4) формулирование гипотез, выводов и предложений.

5) Статистическая проверка выдвинутых гипотез с помощью специальных статистических показателей

38.Статистические методы прогнозирования на основе показателей ряда динамики. Процесс прогнозирования, опирающийся на статистические методы, распадается на два этапа. Первый, индуктивный , заключается в обобщении данных, наблюдаемых за более или менее продолжительный период времени, и в представлении соответствующих статистических закономерностей в виде модели. Статистическую модель получают или в виде аналитически выраженной тенденции развития, или же в виде уравнения зависимости от одного или нескольких факторов-аргументов. В ряде случаев – при изучении сложных комплексов экономических показателей – прибегают к разработке так называемых взаимозависимых систем уравнений, состоящих в основном опять-таки из уравнений, характеризующих статистические зависимости. Процесс построения и применения статистической модели для прогнозирования, какой бы вид последняя не имела, обязательно включает выбор формы уравнения, описывающего динамику или взаимосвязь явлений, и оценивание его параметров с помощью того или иного метода. Второй этап, собственно прогноз, является дедуктивным . На этом этапе на основе найденных статистических закономерностей определяют ожидаемое значение прогнозируемого признака.

Следует подчеркнуть, что полученные результаты не могут рассматриваться как нечто окончательное. При их оценке и использовании должны приниматься во внимание факторы, условия или ограничения, которые не были учтены при разработке статистической модели, должна осуществляться корректировка обнаруженных статистических характеристик в соответствии с ожидаемым изменением обстоятельств их формирования. Короче говоря, найденные с помощью статистических методов прогностические оценки являются важным материалом, который, однако, должен быть критически осмыслен. При этом главным является учет возможных изменений в самих тенденциях развития экономических явлений и объектов

39.Статистические таблицы, их виды, составные элементы и правила построения таблиц. Статистическая таблица - форма наиболее рационального изложения полученных в результате статистической сводки и группировки числовых (цифровых) данных. По внешнему виду она представляет собой комбинацию вертикальных и горизонтальных строк, содержащую боковые и верхние заголовки. Статистическая таблица содержит подлежащее и сказуемое.

Подлежащее таблицы представляет ту статистическую совокупность, о которой идет речь в таблице, т. е. перечень отдельных или всех единиц совокупности либо их групп. Чаще всего подлежащее помещается в левой части таблицы и содержит перечень строк.

41.СТРУКТУРНАЯ СРЕДНЯЯ МОДА И ЕЕ ОПРЕДЕЛЕНИЕ. Величина средней определяется всеми значениями признака, встречающимися в данном ряду распределения. Различают такие структурные средние, как: (1) мода (2) медиана (3) квартиль (4) дециль (5) перцентиль Мода - это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем - значение модальной величины признака по формуле: где:

Сказуемое таблицы - показатели, с помощью которых дается характеристика явления, отображаемого в таблице.

Если в подлежащем таблицы содержится простой перечень каких-либо объектов, таблица называется простой. В подлежащем простой таблицы нет каких-либо группировок статистических данных. Если подлежащее простой таблицы содержит перечень территорий, то такая таблица называется территориальной.

Простая таблица содержит только описательные сведения, ее аналитические возможности ограничены. Глубокий анализ исследуемой совокупности, взаимосвязей признаков предполагает построение более сложных таблиц - групповых и комбинационных.

Групповые таблицы содержат в подлежащем группировку единиц объекта наблюдения по одному существенному признаку. Простейшим видом групповой таблицы являются таблицы, в которых представлены ряды распределения. Групповая таблица может быть более сложной, если в сказуемом приводится не только число единиц в каждой группе, но и ряд других важных показателей, количественно и качественно характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам, что позволяет сделать определенные практические выводы.

Комбинационными называются статистические таблицы, е подлежащей которых группы единиц, образованные по одному признаку, подразделяются на подгруппы по одному или нескольким признакам. В отличие от простых и групповых таблиц, комбинационные позволяют проследить зависимость показателей сказуемого от нескольких признаков, которые легли в основу комбинационной группировки в подлежащем.

Основные правила построения статистических таблиц:

1) в заголовке должны быть отражены объект, признак, время и место совершения события;

2) графы и строки следует нумеровать;

3) графы и строки должны содержать единицы измерения;

4) сопоставляемую в ходе анализа информацию располагают в соседних графах (либо одну под другой);

5) числа в таблице проставляют в середине граф, строго одно под другим; числа целесообразно округлять с одинаковой степенью точности;

6) отсутствие данных обозначается знаком умножения ( ), если данная позиция не подлежит заполнению, отсутствие сведений обозначается многоточием (...), либо н.д., либо н. св., при отсутствии явления ставится знак тире (-);

7) для отображения очень малых чисел используют обозначение 0.0 или 0.00; если число получено на основании условных расчетов, то его берут в скобки, сомнительные числа сопровождают вопросительным знаком, а предварительные - знаком (*).

40.Структурная средняя медиана и ее определение. Медиана - это численное значение признака у той единицы совокупности, которая находится в середине ранжированного ряда (построенного в порядке возрастания, либо убывания значений изучаемого признака). Медиану иногда называют серединной вариантой , т.к. она делит совокупность на две равные части таким образом, чтобы по обе ее стороны находилось одинаковое число единиц совокупности. Если всем единицам ряда присвоить порядковые номера, то порядковый номер медианы будет определяться по формуле (n+1):2 для рядов, где n – нечетное . Если же ряд с четным числом единиц, то медианой будет являться среднее значение между двумя соседними вариантами, определенными по формуле: n:2, (n+1):2, (n:2)+1.

В дискретных вариационных рядах с нечетным числом единиц совокупности – это конкретное численное значение в середине ряда.

Нахождение медианы в интервальных вариационных рядах требует предварительного определения интервала, в котором находится медиана, т.е. медианногоинтервала – этот интервал характеризуется тем, что его кумулятивная (накопленная) частота равна полусумме или превышает полусумму всех частот ряда.

X Me -нижняя граница медианного интервала

h Me -величина медианного интервала;

S Me-1 -сумма накопленных частот интервала, предшествующего медианному интервалу;

  • f Me -локальная частота медианного интервала.

Частота интервала, следующего за модальным

42.Сущность и значение графиков, их основные элементы. В статистике графиком называют наглядное изобр ажение статистических величин и их соотношений при помощи геометрических точек, линий, фигур или географических картосхем.

Графики придают изложению статистических данных большую наглядность , чем таблицы, выразительность, облегчают их восприятие и анализ . Позволяет зрительно оценить характер изучаемого явления, присущие ему закономерности, тенденции развития, взаимосвязи с другими показателями, географическое разрешение изучаемых явлений. Еще в древности китайцы говорили, что одно изображение заменяет тысячу слов.При любой возможности анализ статистических данных рекомендуется всегда начинать с их графического изображения. График позволяет сразу получить общее представление обо всей совокупности статистических показателей. Графический метод анализа выступает как логическое продолжение табличного метода и служит целям получения обобщающих статистических характеристик процессов, свойственных массовым явлениям.
При помощи графического изображения стат.данных решаютсязадачи стат.исследования:

1) наглядное представление величины показателей (явлений) в сравнении друг с другом;

2) характеристика структуры какого-либо явления;

3) изменение явления во времени;

4) ход выполнения плана;

5) зависимость изменения одного явления от изменения другого;

6) распространенность или размещение каких-либо величин по территории

В каждом графике выделяют (различают) следующие основные элементы :

  • 1) пространственные ориентиры (систему координат);
  • 2) графический образ;
  • 3) поле графика;
  • 4) масштабные ориентиры;
  • 5) экспликация графика;
  • 6) наименование графика

43.Сущность и значение средних величин. Средняя величина – обобщенная характеристика уровня значений признака, полученная в расчете на единицу совокупности. Средняя величина вычисляется для признаков качественно однородных и различных только количественно, которые присущи всем явлениям в данной совокупности.

Средние величины бывают общими (отражают совокупность в целом) и групповыми (отражают особенность по группам). Делятся на 2 категории – степенные и структурные .

К степенным относятся – средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадратическая. Самая распространенная – ср.арифметическая . Ср.гармоническую используют как обратную ср.арифметической. Ср.квадратическая используется при расчете показателей вариации, ср.геометрическая – при анализе динамики.

К структурным относятся – мода и медиана. Мода – значение изучаемого признака с наибольшей частотой. Медиана – значение признака, приходящее на середину ранжированного ряда. Мода применяется в коммерческой практике для изучения покупательского спроса и регистрации цен. В дискретном ряду мода - это варианта с наибольшей частотой. В интервальном вариационном ряду модой считают центральный вариант интервала, который имеет наибольшую частоту. Применение медианы позволяет получить более точные результаты, чем при использовании других форм средних. Свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.Порядок нахождения медианы в интервальном вариационном ряду следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал.

2.1 Схема проведения статистического исследования

Системы статистического анализа данных – это современный эффективный инструмент статистического исследования. Широкие возможности для обработки статистических данных имеют специальные системы статистического анализа, а также универсальные средства – Excel, Matlab, Mathcad и др..

Но даже самый совершенный инструмент не может заменить исследователя, который должен сформулировать цель исследования, провести сбор данных, выбрать методы, подходы, модели и средства проведения обработки и анализа данных, а также интерпретировать полученные результаты.

На рисунке 2.1 представлена схема проведения статистического исследования.

Рис.2.1 - Принципиальная схема статистического исследования

Исходным пунктом статистического исследования является формулировка проблемы. При ее определении учитывается цель исследования, определяется, какая информация необходима и как она будет использоваться при принятии решения.

Само статистическое исследование начинается с подготовительного этапа. В ходе подготовительного этапа аналитики изучают техническое задание – документ, составляемый заказчиком исследования. В техническом задании должны быть четко сформулированы цели исследования:

    определен объект исследования;

    перечислены предположения и гипотезы, которые в ходе исследования должны быть подтверждены или опровергнуты;

    описано то, как будут использоваться результаты исследования;

    сроки, в которые исследование должно быть проведено и бюджет исследования.

На основе технического задания разрабатывается структура аналитического отчета - то, в каком виде должны быть представлены результаты исследования, а также программа статистического наблюдения . Программа представляет собой перечень признаков, подлежащих регистрации в процессе наблюдения (или вопросов на которые должны быть получены достоверные ответы по каждой обследуемой единице наблюдения). Содержание программы определяется как особенностями наблюдаемого объекта и целями исследования, так и методами, выбранными аналитиками для дальнейшей обработки собранной информации.

Основной этап статистического исследования включает сбор необходимых данных и их анализ.

Финальным этапом исследования является составление аналитического отчета и предоставление его заказчику.

На рис. 2.2 представлена схема статистического анализа данных.

Рис.2.2 – Основные этапы статистического анализа

2.2 Сбор статистической информации

Сбор материалов подразумевает анализ технического задания исследования, определение источников необходимой информации и (при необходимости) разработку анкет. При исследовании источников информации все требуемые данные разделяют на первичные (данные, которых нет в наличии и которые должны быть собраны непосредственно для данного исследования), и вторичные (собранные ранее для иных целей).

Сбор вторичных данных часто называют "кабинетным" или "библиотечным" исследованием.

Примеры сбора первичных данных: наблюдения за посетителями магазина, анкетирование пациентов больницы, обсуждение проблемы на совещании.

Вторичные данные делят на внутренние и внешние.

Примеры источников внутренних вторичных данных:

    информационная система организации (включающая в себя бухгалтерскую подсистему, подсистему управления продажами, CRM (CRM-система, сокращение от англ. Customer Relationship Management) - прикладное программное обеспечение для организаций, предназначенное для автоматизации стратегий взаимодействия с заказчиками) и другие);

    ранее проведенные исследования;

    письменные отчеты сотрудников.

Примеры источников внешних вторичных данных:

    отчеты органов статистики и других государственных учреждений;

    отчеты маркетинговых агентств, профессиональных ассоциаций и т.п.;

    электронные базы данных (адресные справочники, ГИС и т.п.);

    библиотеки;

    средства массовой информации.

Основными выходными данными на этапе сбора данных являются:

    планируемый объем выборки;

    структура выборки (наличие и размер квот);

    вид статистического наблюдения (сбор данных опрос, анкетирование, измерение, эксперимент, экспертиза, др.);

    информация о параметрах опроса (например, возможность факта фальсификации анкет);

    схема кодировки переменных в базе данных программы, выбранной для обработки;

    план-схема преобразования данных;

    план-схема используемых статистических процедур.

Этот же этап включает непосредственно процедуру анкетирования. Разумеется, анкеты разрабатываются только для получения первичной информации.

Полученные данные должны быть соответствующим образом отредактированы и подготовлены. Каждая анкета или форма наблюдения проверяется и, если нужно, корректируется. Каждому ответу присваиваются числовые или буквенные коды – производится кодировка информации. Подготовка данных включает в себя редактирование, расшифровку и проверку данных, их кодирование и необходимые преобразования.

2.3 Определение характеристик выборки

Как правило, данные, собранные в результате статистического наблюдения для проведения статистического анализа являются выборочной совокупностью. Последовательность преобразования данных в процесс статистического исследования можно схематично представить следующим образом (рис. 2.3)

Рис 2.3 Схема преобразования статистических данных

Анализируя выборку, можно делать выводы о генеральной совокупности, представленной выборкой.

Окончательное определение общих параметров выборки производят, когда все анкеты собраны. Оно включает:

    определение реального количества респондентов,

    определение структуры выборки,

    распределение по месту опроса,

    установление доверительного уровня статистической надежности выборки,

    расчет статистической ошибки и определение репрезентативности выборки.

Реальное количество респондентов может оказаться большим либо меньшим запланированного. Первый вариант лучше для анализа, но невыгоден заказчику исследования. Второй может отрицательно сказаться на качестве исследования, а, следовательно, невыгоден ни аналитикам, ни заказчикам.

Структура выборки может быть случайной или неслучайной (респонденты отбирались на основе заранее известного критерия, например методом квотирования). Случайные выборки априори являются репрезентативными. Неслучайные выборки могут быть намерено нерепрезентативными относительно генеральной совокупности, но давать важную информацию для исследований. В этом случае также следует внимательно отнестись к фильтрационным вопросам анкеты, которые предназначены специально для отсеивания неподходящих под требования респондентов.

Для определения точности оценивания , прежде всего, необходимо установить уровень доверительной вероятности (95% или 99%). Тогда максимальная статистическая ошибка выборки рассчитывается как

или
,

где - объем выборки,- вероятность наступления исследуемого события (попадание респондента в выборку),- вероятность обратного события (непопадания респондента в выборку),- коэффициент доверительной вероятности,
- дисперсия признака.

В таблице 2.4 приведены наиболее употребляемые значения доверительной вероятности и коэффициентов доверительной вероятности.

Таблица 2.4

2.5 Обработка данных на компьютере

Анализ данных с применением компьютера включает выполнение ряда необходимых шагов.

1. Определение структуры исходных данных.

2. Ввод данных в компьютер в соответствии с их структурой и требованиями программы. Редактирование и преобразование данных.

3. Задание метода обработки данных в соответствии с задачами исследования.

4. Получение результата обработки данных. Его редактирование и сохранение в нужном формате.

5. Интерпретация результата обработки.

Шаги 1 (подготовительный) и 5 (заключительный) не способна выполнить ни одна компьютерная программа - их исследователь делает сам. Шаги 2-4 выполняются исследователем с использованием программы, но именно исследователь определяет необходимые процедуры редактирования и преобразования данных, методы обработки данных, а также формат представления результатов обработки. Помощь компьютера (шаги 2–4) заключается, в конечном итоге, в переходе от длинной последовательности чисел к более компактной. На «вход» компьютера исследователь подает массив исходных данных, который недоступен осмыслению, но пригоден для компьютерной обработки (шаг 2). Затем исследователь дает программе команду на обработку данных в соответствии с поставленной задачей и структурой данных (шаг 3). На «выходе» он получает результат обработки (шаг 4) - тоже массив данных, только уже меньший, доступный осмыслению и содержательной интерпретации. При этом исчерпывающий анализ данных обычно требует многократной их обработки с применением разных методов.

2.6 Выбор стратегии анализа данных

Выбор стратегии анализа собранных данных основывается на знании теоретических и практических аспектов исследуемой предметной области, специфики и известных характеристик информации, свойств конкретных статистических методов, а также на опыте и взглядах исследователя.

Необходимо помнить, что анализ данных - это вовсе не конечная цель исследования. Его цель - получить информацию, которая поможет решить определенную проблему и принять адекватные управленческие решения. Выбор стратегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: определение проблемы и разработка плана исследования. В качестве "черновика" используется предварительный план анализа данных, разработанный как один из элементов плана исследования. Затем, в ходе поступления на последующих стадиях процесса исследования дополнительной информации, может понадобиться внесение определенных изменений.

Статистические методы делятся на одно- и многомерные. Одномерные методы(univariatetechniques) используются тогда, когда все элементы выборки оцениваются одним показателем, либо если этих показателей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

Многомерные методы (multivariate techniques) прекрасно подходят для анализа данных, если для оценки каждого элемента выборки используется два или больше показателей и эти переменные анализируются одновременно. Такие методы применяются для определения зависимостей между явлениями.

Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические (рис. 3). Метрические данные (metric data) измеряются по интервальной шкале или относительной шкале. Неметрические данные (nonmetric data) оцениваются по номинальной или порядковой шкале

Кроме того, эти методы делят на классы на основе того, сколько выборок - одна, две или более - анализируется в ходе исследований.

Классификация одномерных статистических методов представлена на рис.2.4.

Рис. 2.4 Классификация одномерных статистических методов в зависимости от анализируемых данных

Число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные. Например, данные по лицам мужского и женского пола можно получить в пределах одной выборки, но если их анализ нацелен на выявление разницы в восприятии, основанной на разнице полов, исследователю придется оперировать двумя разными выборками. Выборки считаются независимыми, если они экспериментально не связаны между собой. Измерения, проведенные в одной выборке, не оказывают влияния на значения переменных в другой. Для анализа данные, относящиеся к разным группам респондентов, например собранные от лиц женского и мужского пола, обычно обрабатываются как независимые выборки.

С другой стороны, если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары - зависимыми.

Если существует только одна выборка метрических данных, может использоваться z- и t-критерий. Если же независимых выборок две или больше, в первом случае можно воспользоваться z- и t-критерием для двух выборок, в во втором - методом однофакторного дисперсионного анализа. Для двух связанных выборок используется парный t-критерий. Если речь идет о неметрических данных по одной выборке, исследователь может воспользоваться критериями частотного распределения, хи-квадратом, критерием Колмогорова-Смирнова (K~S), критерием серий и биномиальным критерием. Для двух независимых выборок с неметрическими данными можно прибегнуть к следующим методам анализа: хи-квадрат, Манна-Уитни, медианы, К-С, однофакторным дисперсионным анализом Крускала-Уоллиса (ДА К-У). В отличие от этого, если существует две или больше взаимосвязанных выборок, следует воспользоваться критериями знаков, Мак-Немара и Уилкоксона.

Многомерные статистические методы нацелены на выявление существующих закономерностей: взаимозависимости переменных, взаимосвязи или последовательности событий, межобъектного сходства.

Достаточно условно можно выделить пять стандартных типов закономерностей, исследование которых представляет существенный интерес: ассоциация, последовательность, классификация, кластеризация и прогнозирование

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в виде временных рядов. Если удается построить найти закономерности, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

Многомерные статистические методы можно разделить на методы анализа взаимосвязи и классификационный анализ (рис. 2.5).

Рис.2.5 – Классификация многомерных статистических методов

Любое статистическое исследование массовых общественных явлений включает в себя 3 основных этапа:

    Статистическое наблюдение - формируются первичные статистические данные, или исходная статистическая информация, которая является основой статисти­ческого исследования. Если при сборе первичных статистических данных допущена ошибка или материал оказался недоброкачественным, это повлияет на правильность и достоверность как теоретических, так и практических выводов;

    Сводка и группировка данных - на этой стадии совокупность делится по признакам различия и объединяется по признакам сходства, подсчитываются суммарные показатели по группам и в целом. С помощью метода группировок изучаемые явления в зависимости от существенных признаков подразделяются на типы, группы и подгруппы. Метод группировок позволяет ограничивать качественно однородные в существенном отношении совокупности, что служит предпосылкой для определения и применения обобщающих показателей;

    Обработка и анализ полученных данных, выявление закономерностей. На этом этапе с помощью обобщающих показателей рассчитываются относительные и средние величины, дается сводная оценка вариации признаков, характеризуется динамика явлений, применяются индексы, балансовые построения, рассчитываются показатели, характеризующие тесноту связей в изменении признаков. С целью наиболее рационального и наглядного изложения цифрового материала он представляется в виде таблиц и графиков.

Лекция №2. Статистическое наблюдение

1. Понятие и формы статистического наблюдения

Статистическое наблюдение - это первая стадия всякого статистического исследования.

Статистическое наблюдение представляет собой научно организованную работу по сбору массовых первичных данных о явлениях и процессах общественной жизни.

Однако не всякий сбор сведений является статистическим наблюдением. О статистическом наблюдении можно говорить лишь тогда, когда изучаются статистические закономерности, т.е. такие, которые проявляются только в массовом процессе, в большом числе единиц какой-то совокупности.

Следовательно, статистическое наблюдение должно быть:

    планомерным - готовиться и проводиться по разработанному плану, который включает вопросы методологии, организации, техники сбора информации, контроля за качеством собранного материала, его достоверности, оформления итоговых результатов;

    массовым - охватывать большое число случаев проявления данного процесса, достаточное для того, чтобы получить правдивые статистические данные, характеризующие не только отдельные единицы, но и всю совокупность в целом;

    система­тическим – изучение тенденций и закономерностей социально-экономических процессов, характеризующихся количественными и качественными измене­ниями, возможно лишь на основе систематичности.

К статистическому наблюдению предъявляются следующие основные требования:

    полнота статистических данных (полнота охвата единиц изучаемой совокупности, сторон того или иного явления, а также полнота охвата во времени);

    достоверность и точность данных;

    единообразие и сопоставимость данных.

В статистической практике используются две организационные формы наблюдения:

1) отчетность - это такая организационная форма, при которой единицы наблюдения представляют сведения о своей деятельности в виде формуляров регламентированного образца. Особенность отчетности состоит в том, что она обязательна, документально обоснована и юридически подтверждена подписью руководителя;

2) специальное статистическое обследование, примером чего являются проведение переписей населения, социологические исследования, переписи остатков материала и др. наблюдения, которые проводятся, если возникают задачи, для решения которых нет достаточной информации. Они дают дополнительный материал к отчетным данным или с их помощью проверяют отчетные данные.

ВОПРОСЫ К ЭКЗАМЕНУ

По дисциплине «Статистика»

Раздел 1. Общая статистика

Предмет статистической науки и задачи статистики на современном этапе.

Полная и достоверная статистическая информация является тем необходимым основанием, на котором базируется процесс управления экономикой. Принятие управленческих решений на всех уровнях - от общегосударственного или регионального и до уровня отдельной корпорации или частной фирмы - невозможно без должного статистического обеспечения. Именно статистические данные позволяют определить объемы валового внутреннего продукта и национального дохода, выявить основные тенденции развития отраслей экономики, оценить уровень инфляции, проанализировать состояние финансовых и товарных рынков, исследовать уровень жизни населения и другие социально-экономические явления и процессы.

Статистика - это наука, изучающая количественную сторону массовых явлений и процессов в неразрывной связи с их качественной стороной, количественное выражение закономерностей общественного развития в конкретных условиях места и времени.

Используемые на всех стадиях исследования приемы и методы сбора, обработки и анализа данных являются предметом изучения общей теории статистики, которая является базовой отраслью статистической науки. Разработанная ею методология применяется в макроэкономической статистике, отраслевых статистиках (промышленности, сельского хозяйства, торговли и прочих), статистике населения, социальной статистике и в других статистических отраслях.

Статистическая совокупность, ее виды. Единицы совокупности и классификация их признаков.

Статистическая совокупность – это природные ресурсы народов, населения и природные явления, взятые вместе в определенных границах места и времени влияют на экономическую жизнь общества. Она представляет собой единое целое состоит из отдельных ее единиц. Каждая из которых может быть описана рядом свойств и особенностей которыми они обладают. Каждая из особенностей свойств единиц статистической совокупности отражает конкретный признак характеризующий данную единицу совокупности.

Признак – особенность ед. совокупности. Выбор ед. совокупности, перечень признаков которые характеризуют зависят от цели и задачи данного статистического исследования.

Ед. стат. совокупности образуют вместе единое целое по ряду свойств и особенностей отличающихся друг от друга. Эти отличия называют вариацией признаков. Вариация возможна под воздействием внешних причин.

Классификация признаков:

Качественные (атрибутные) определяются наличием или отсутствием какого-либо качества

Количественные выражаются числами

Дискретные принимают целочисленное значение - непрерывные принимают любое вещественное значение.

Метод статистики и основные этапы статистического исследования.

Статистика имеет собственную систему приемов способов и методов исследования направленные на методы коммерческих закономерностей, проявление в структуре, динамике (развитие) и взаимосвязи социальных явлений.

Основной прием статистических исследований. 3 стадии:

1) стат. наблюдение

2) сводка и группировка результатов

3) анализ полученных данных

Метод массового наблюдения (закон больших чисел) осуществляется научно-организационным сбором сведений, изучением социально-экономическим процессами или явлениями (перепись населения).

Метод группировки распределяет всю массу на одноразовые группы и подгруппы. Осуществляется подсчет итогов по каждой группе и подгруппе с оформлением результатов в виде таблиц. Осуществляется обработка статистических показателей и анализ результатов для получения обоснованных выводов о состоянии изучения явлений и закономерности экономического развития. Выводы оформляются в текстовой форме и сопровождаются графиками и таблицами.

Министерство статистики включает: областное, городское управление статистики, районный отдел статистики. В состав Мин. стат. входят: аналитические, информационно-ресурсные и регистрационные стандарты и классификации организации стат. наблюдений и балансов, стат. финансов платежного баланса, стат. цен, товаров, рынков, услуг.

Для получения статистической информации органы государственной и ведомственной статистики, а также коммерческие структуры проводят различного рода статистические исследования. Процесс статистического исследования включает три основные стадии: сбор данных, их сводка и группировка, анализ и расчет обобщающих показателей.

От того, как собран первичный статистический материал, как он обработан и сгруппирован в значительной степени зависят результаты и качество всей последующей работы. Недостаточная проработка программно-методологических и организационных аспектов статистического наблюдения, отсутствие логического и арифметического контроля собранных данных, несоблюдение принципов формирования групп в конечном итоге могут привести к абсолютно ошибочным выводам.

Не менее сложной, трудоемкой и ответственной является и заключительная, аналитическая стадия исследования. На этой стадии рассчитываются средние показатели и показатели распределения, анализируется структура совокупности, исследуется динамика и взаимосвязи между изучаемыми явлениями и процессами.

gastroguru © 2017