Содержание
СТАТИСТИКА — НАУКА И ОТРАСЛЬ ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ
В результате освоения данной темы студент должен: знать
- • предмет статистики в экономике и социальной сфере;
- • особенности организации и задачи Федеральной службы государственной статистики и ее территориальных органов;
- • основные этапы становления и развития официальной статистики в России; уметь
- • формулировать основные этапы проведения статистического исследования и требования к системе статистических показателей;
- • рассчитывать абсолютные и относительные показатели; владеть
- • методами построения относительных показателей в пространстве и во времени;
- • спецификой статистического изучения социально-экономических явлений;
- • приемами получения статистических данных из различных источников.
Определение и основные понятия статистики
Статистика — одна из древнейших отраслей знаний, возникших на базе хозяйственного учета. Статистика возникла с появлением государственности в связи с необходимостью решения практически государственных и хозяйственных проблем. Для этого потребовались сбор и обработка данных о населении, ремеслах (промышленности и сельском хозяйстве).
Первоначально статистика означала сбор данных о государстве. Слово «статистика» имеет один корень со словом «государство» (state), и первоначально оно означало искусство и науку управления. Первые преподаватели статистики университетов Германии XVIII в. сегодня назывались бы специалистами по общественным (политическим) наукам.
Сегодня статистика — это искусство и наука сбора, обработки и анализа данных, а поскольку данными называют любой вид зарегистрированной информации, то статистика играет важную роль во всех сферах деятельности человека. В процессе управления статистические методы позволяют выработать обоснованные решения, сочетающие интуицию специалиста с тщательным анализом имеющейся информации.
В современном мире статистика призвана обеспечить количественные оценки и прогноз основных макроэкономических показателей, а также таких микроэкономических показателей, как объемы продаж, степень риска в банковском деле, страховании и производстве, характеристики потребительского поведения населения, социально-демографической ситуации и т.д. Так что же такое статистика?
Статистика — это область знаний, изучающая количественную сторону массовых явлений и объединяющая принципы и методы работы с числовыми данными, характеризующими эти явления.
Явления и процессы, изучаемые статистикой, многообразны. Статистический инструментарий позволяет не только собрать и обработать статистические данные, но и дать содержательную интерпретацию полученных результатов. Статистические методы и приемы исследования во многом универсальны и применяются практически во всех сферах человеческой деятельности: экономике, социологии, психологии, медицине, биологии, маркетинге, логистике, бизнесе и т.д.
Статистика изучает все, что связано с экономической деятельностью общества, включая производство и реализацию промышленной и сельскохозяйственной продукции, строительство, работу транспорта и связи, формирование и движение финансовых потоков, инновационную и инвестиционную деятельность, рынки товаров и услуг.
Статистические методы также широко используются при анализе социальных процессов и явлений — занятости и безработицы, уровня и качества жизни населения, изучении общественного мнения и т.д. Большую роль играет статистика в технике и производственной деятельности, например статистический анализ технологических процессов и контроль качества продукции.
Термин «статистика» имеет и ряд других значений. Под статистикой также понимают отрасль практической деятельности по сбору, обработке, анализу и публикации статистической информации о жизни общества как в целом ио стране, так и по отдельным ее регионам. В большинстве стран эту работу выполняют специальные государственные учреждения. В России это Федеральная служба государственной статистики (Росстат).
Статистику часто рассматривают как синоним слова «данные». Именно в этом смысле говорят: «статистика рождаемости и смертности», «статистика преступлений» или «имеется хорошая статистика». В связи с этим статистика входит в разделы самых разных естественных и технических наук, так как они связаны со сбором и обработкой больших массивов наблюдений, опытов и экспериментов. Нас окружают количественные данные о погоде, курсе валют, уровне инфляции, спортивных мероприятиях, результатах рейтингов и т.д.
Знание статистики позволяет более компетентно работать с данными, которые часто содержат много информации, не являющейся очевидной. Статистика дает возможность извлечь и понять эту информацию, получить новые знания. При этом статистика все больше становится одним из значимых компонентов процесса принятия решений, позволяющих выработать обоснованные стратегические решения, сочетающие интуицию специалиста с тщательным анализом имеющейся информации. Использование статистики становится важным преимуществом в конкуренции.
Предметом исследования экономической статистики служат количественные закономерности происходящих в экономике явлений и процессов, выявление основных пропорции и тенденции экономического развития. Экономическая статистика изучает как сам процесс воспроизводства материальных благ и услуг, так и его результаты, а также их воздействие на уровень жизни населения. Различают макроэкономическую статистику, объект исследования которой — экономика в целом как совокупность ее отраслей, секторов и регионов, и микроэкономическую статистику, изучающую группу предприятий, отдельное предприятие или производство, домашние хозяйства.
Отдельная отрасль статистики — статистика населения — изучает численный состав, размещение, структуру и воспроизводство населения страны в целом или его отдельных групп.
Происходящие в обществе социальные процессы и явления выступают объектом исследования социальной статистики.
Для того чтобы получить общее представление о статистической методологии, необходимо рассмотреть сам процесс статистического исследования, который включает пять основных этапов.
I. Определение цели и задачи исследования.
II. Сбор статистического материала.
III. Предварительная обработка данных.
IV. Расчет и интерпретация обобщающих статистических показателей.
V. Моделирование и прогнозирование.
На первом, начальном, этапе формулируются цель и задачи исследования, строится система показателей, характеризующих каждый элемент анализируемой совокупности.
На втором этапе осуществляется сбор первичного статистического материала, проверяются его достоверность и полнота. С этой целью применяются методы сплошного и несплошного статистического наблюдения. От качества полученных исходных статистических данных во многом зависят окончательные результаты всего статистического исследования.
На третьем этапе осуществляется предварительная обработка данных, подсчет групповых и общих итогов, расчет некоторых относительных показателей. Основной метод, используемый на данном этапе, — метод группировок. В результате его реализации происходит переход от больших массивов статистических данных к компактным и удобным для анализа статистическим группам.
На четвертом этапе рассчитываются средние величины, показатели вариации, структуры, взаимосвязи и динамики. Полученные результаты подвергаются анализу.
В процессе реализации пятого этапа выполняется моделирование, учитывающее взаимосвязи между социально-экономическими показателями, проводится многомерная классификация наблюдений, строятся модели, отражающие основные тенденции динамики изучаемых показателей.
Используемые в процессе реализации всех этапов статистические приемы и методы в целом составляют статистическую методологию исследования, куда входят методы: дескриптивной (описательной) статистики, теории вероятностей, математической статистики, многомерного статистического анализа и эконометрики.
Рассмотрим ключевые понятия и терминологию, положенные в основу описания статистических приемов и методов исследования.
Признак — это объективная характеристика единицы статистической совокупности, ее характерная черта или свойство. Это свойство может быть измерено и отражено показателем, причем признак входит в качественное содержание показателя. Показатель, характеризующий конкретные свойства изучаемого объекта, часто в статистических исследованиях рассматривается как синоним признака.
Значения различных признаков наблюдаются и регистрируются на стадии статистического наблюдения.
К признакам, характеризующим промышленное предприятие, относятся: выручка от реализации продукции, прибыль, стоимость основных фондов, численность персонала и др. Признаками, характеризующими человека, считаются: возраст, пол, место жительства, профессия, среднемесячный доход и проч. Для любых окружающих нас объектов и явлений можно выделить достаточно большое число признаков, которые наблюдаются или потенциально могут наблюдаться в процессе статистического исследования.
Расчетным, или вторичным, называют признак, непосредственно не измеряемый, а рассчитываемый как некая функция от исходных, непосредственно измеряемых признаков данного объекта. Например, разделив объем выпущенной продукции на численность работников, получим производительность труда.
В результате измерения свойства, признака объекта наблюдения получаем одно из вероятных значений, называемых вариантом, или значением признака.
Например, во время экзамена преподаватель измеряет (оценивает) знание студента по изучаемой дисциплине, которое характеризуется показателем «экзаменационная оценка», и ставит одно из пяти возможных значений признака: 1, 2, 3, 4 или 5.
Введем еще одно важное статистическое понятие.
Статистической совокупностью называют множество объектов или наблюдений, обладающих общими признаками, из которых один или несколько признаков не варьируют.
Статистика имеет дело с совокупностями промышленных, сельскохозяйственных, строительных и торговых предприятий, коммерческих банков, населения страны или отдельного региона. Например, всех жителей Москвы можно рассматривать как статистическую совокупность, так как один признак — город проживания — будет не варьирующий. По остальным же признакам — полу, возрасту, социальному положению — элементы совокупности могут различаться.
Единицей совокупности называют индивидуальный составной элемент статистической совокупности, выполняющий роль носителя изучаемых признаков.
Для отрасли единицей совокупности будет служить отдельное предприятие, для банковской системы — отдельный банк, при изучении половозрастной структуры населения за единицу принимается отдельный человек, а при изучении доходов, обеспеченности жильем, предметами длительного пользования (стиральной машиной, холодильником и т.н.) единицей является домохозяйство.
Объемом совокупности называют общее число единиц, образующих статистическую совокупность.
Одна из важнейших характеристик статистической совокупности — ее однородность. Однородной признается совокупность, элементы которой близки по значениям признаков, или же они относятся к одному и тому же типу. Многие методы и приемы статистического исследования применимы лишь к однородным совокупностям.
Статистическое исследование независимо от его масштабов и целей всегда завершается расчетом и анализом различных по виду и форме выражения статистических показателей.
Показатель (индикатор) определяется па основе признаков и представляет собой количественную характеристику социально-экономического явления или процесса, непосредственно связанную с его сущностью.
Его построение зависит от задачи исследования. Средний возраст работников предприятия и одного из его подразделений — это показатели, представляющие собой возрастную характеристику групп работников.
К показателям конкретных свойств изучаемого объекта относятся, например, объем реализованной продукции предприятия, валовой внутренний продукт (ВВП) государства, показатели рождаемости региона, среднедушевой доход жителя города и т.д. Особенность этих показателей в том, что их качественное содержание определяется такими областями знаний, как экономика и демография. Статистика отвечает здесь за методику учета и расчета количественной стороны этих показателей.
В то же время для показателей статистических свойств, таких как средние величины, показатели вариации, структуры, характер распределения и др., статистика разрабатывает методы их расчета и анализа.
Статистические показатели подразделяют на абсолютные и относительные.
Абсолютные показатели отражают либо суммарное число единиц совокупности, либо суммарное свойство объекта. Например, число машиностроительных предприятий в федеральном округе, посевная площадь гречихи в стране, основные фонды предприятия. Абсолютные показатели выражаются в натуральных единицах измерения: тыс. га, млн руб. и т.д.
Относительные показатели получают путем сравнения, сопоставления показателей в пространстве (между объектами), во времени (по одному и тому же объекту) или сравнения показателей разных свойств анализируемого объекта.
Рассматривают следующие виды относительных показателей, характеризующих:
• структуру объекта анализа. Это удельный вес (доля), представляющий собой отношение части к целому. Например, отношение стоимости реализованной магазином молочной продукции к общей стоимости реализованных продуктов питания, отношение числа работников с высшим образованием к общему числу работников на фирме. Нередко доли выражают в процентах;
- • динамику процесса. Это отношение показателей, характеризующих объект в текущий, более поздний период к аналогичным показателям того же объекта в более ранний период времени. Такие показатели именуют темпами роста и темпами прироста;
- • соотношение разных признаков одного объекта. Эти показатели часто называют показателями интенсивности, они идентичны расчетным признакам. Например, показатель производительности труда есть отношение объема произведенной продукции к затратам труда на се производство, или соотношение между ростом и весом человека, характеризующий пропорциональность его тела;
- • отношение наблюдаемых значений признака к его нормативному, максимальному или оптимальному значениям. Это распространенные на производстве показатели выработки, расхода материальных и других ресурсов. Отношение наблюдаемых значений признака к его максимально возможному значению часто характеризует качество процесса, машины. Например, степень интенсивности работы сборочного цеха;
- • отношение одинаковых признаков разных объектов. Используется, например, при сравнении урожайности одной и той же культуры в разных регионах, сравнении показателей производства или уровня жизни населения разных стран.
Как правило, изучаемые статистикой экономические и социальные явления достаточно сложны, и их сущность может быть отражена посредством не одного, а совокупности показателей. В таких случаях используется система статистических показателей.
Система статистических показателей — совокупность взаимосвязанных показателей у характеризующих анализируемый объект или явление у которая имеет одноуровневую или многоуровневую структуру и строится в зависимости от цели исследования и решаемых задач.
Стандартизация показателей системы позволяет решать задачи сравнения состояния одного и того же объекта в разные моменты времени или разных, но качественно близких объектов в конкретный момент времени.
Например, сущность промышленного предприятия заключается в производстве продукции на базе взаимодействия средств производства и трудовых ресурсов, поэтому для характеристики эффективности его функционирования необходимо использовать систему, включающую такие показатели, как прибыль, рентабельность, численность промышленно-производственного персонала, производительность труда, фондовооруженность и др.
Современные технологии позволяют собирать и анализировать множество самых разнообразных данных – сколько людей в день пользуются метро, какое количество абонентов подключены к тому или иному оператору мобильной связи, кандидатам от каких партий отдают предпочтение в каждом отдельном регионе страны и т.д. Собрать всю полученную информацию воедино и сделать правильные выводы – задача статистика.
Обязанности и требования
Работа статистика состоит из двух основных направлений. Первое – это сбор данных. Его методика будет зависеть от тех целей, которые стоят перед статистиком в данный момент. Зачастую требуется разработать собственную методику сбора данных, учитывающую специфику ситуации, в которой он проводится. От статистика требуется быть крайне внимательным и аккуратным, чтобы избежать погрешности и ошибок в процессе работы. Он также должен в совершенстве владеть соответствующим программным обеспечением. Затем ему необходимо обобщить полученные данные, корректно их интерпретировать и представить выводы. Это требует развитых аналитических способностей. Анализ и сбор данных может быть как проектным, так и плановым, например, написание ежеквартальных отчетов. Для того чтобы выполнять работу надлежащим образом, статистик должен знать правила оформления подобных документов.
Трудоустройство
Статистики работают в аналитических агентствах, осуществляющих исследования по заказам государства или частных предприятий. Их труд также востребован в любой относительно крупной организации, сталкивающейся с большим количеством отчетности. Статистики нередко выступают в качестве аудиторов.
Образование
Статистик должен получить высшее образование в области экономики или математики. Знание социологии также пригодится. Наиболее популярные вузы, в которых представлена данная специальность, – НИУ «Высшая школа экономики», Российский экономический университет им. Г.В. Плеханова и Санкт-Петербургский государственный экономический университет.
Современным руководителям разного уровня требуется обладать большим корпусом текущей информации по отраслям, экономическим данным конкретных регионов и России в целом, социальной структуры страны, медицинским показателям, потребительскому спросу, уровню криминогенной обстановки и другим важным вопросам стратегического планирования. Как правило это текущие данные статистики, которыми теперь может воспользоваться каждый пользователь с помощью системы ЕМИСС.
Что это
ЕМИСС – это общероссийская платформа, на которой собрана вся межведомственная статистика. Она была специально разработана для госпрограммы «Развитие государственной статистики России в 2007-2011 годах». С ее помощью упрощается доступ через Интернет представителей государственной власти на местах, муниципалитетов, представителей местного самоуправления, предпринимателей и физлиц к собранным федеральной службой статистики данным различного типа:
- Денежных доходов и расходов населения в разных социальных группах.
- Индексу инфляции на товары и услуги массового спроса.
- Средним потребительским ценам на товары и услуги.
- Экспорту определенных товаров.
- Доходам населения, и другим важным данным, сбором которых занимается федеральная статистическая служба РФ.
Управленцы разного уровня, работающие в региональных, муниципальных и частных организациях, получают возможность через официальный сайт GKS (Федеральной службы статистики) получить актуальные данные отчетности за 2019 год, необходимые для принятия правильного управленческого решения, составления прогноза на ближайшее время, а также для составления ежегодного отчета в государственные системы, занимающиеся сбором текущих данных по районам.
Для получения бесплатного доступа к актуальной информации необходимо зарегистрироваться на сайте fedstat.ru. После этого у пользователя появляется свой личный кабинет, через который он может получить доступ ко всей собранной государственными органам информации. Используя предоставленные в личном кабинете инструменты, можно не только получить доступ к реестру текущей статистики по разным ведомствам, но и объединять нужные базы данных для удобства использования предоставленной информации в процессе работы.
Как пользоваться
После регистрации пользователи смогут получить доступ ко всему корпусу информации, собранной на сервисе ЕМИСС. Для этого можно использовать поисковую строку, в которую вводится тематический запрос.
Без регистрации на главной странице официального сайта ЕМИСС показаны актуальные запросы на самые востребованные данные и индексы на сегодняшний день. Кликнув на любой из этих показателей, можно получить актуальную статистическую информацию, а также скачать ее для работы. Также на основе этих данных можно построить графики и гистограммы.
В личном кабинете есть панель инструментов, позволяющая использовать фильтры, настраивать поисковую систему под личные нужды сайта, строить графики и гистограммы. Инструменты упрощают работы с найденной статистической информацией, позволяя выделять нужные данные, закреплять найденные результаты в таблицах, разделяя их на определенные показатели.
Также можно воспользоваться тематическими рубрикаторами, размещенными на сайте. С помощью предлагаемых инструментов поиска статистической информации каждый пользователь, зарегистрировавшийся на официальном сайте, получает так называемый паспорт искомого статистического показателя, в который будет включена информация следующего типа:
- По длине отчетного периода.
- Товарной группе.
- Ведомству Росстата, отвечающему за искомый статистический показатель.
- По степени обновления информации.
- Форме ведения статистического наблюдения.
- Отражению искомых данных по всем российским регионам в отдельности.
С помощью выставления специальных фильтров, зарегистрированный пользователь ЕМИСС сможет быстро найти нужную статистику по конкретным параметрам.
Получить ответ на свой запрос по конкретной информации можно на электронную почту или при посещении одного из офисов Росстат. Информация на электронный ящик может быть отправленная в разных форматах:
- Excel;
- Word;
- XML-формате ЕМИСС.
Отправляемый в цифровом варианте ответ оформляется в форме таблицы с помощью специальных средств визуализации ЕМИСС. Описание конкретного показателя оформляется в форме паспорта, в котором содержатся все атрибуты конкретной статистики и метаданные.
Извлечь описание искомого показателя из базы метаданных ЕМИСС можно с помощью экранных форумов, представленных на портале Госуслуг.
В ЕМИСС на сегодняшний день добавлено свыше 1800 различных показателей, отражающих показатели за длительный период времени по всем регионам РФ. Каждый показатель имеет свой индивидуальный паспорт, что существенно упрощает поисковую работу и обработку искомых метаданных.
Личный кабинет ЕМИСС
Зарегистрированный пользователь в своем личном кабинете получает удобный функционал, с помощью которого существенно упрощается поиск нужной статистической информации и предоставляется возможность обработки полученных статистических данных.
Пользователь имеет возможность выделить те показатели, которые нужны ему для работы, отправив их в раздел избранное. Все полученные данные будут сохраняться в личном кабинете, поэтому не придется каждый раз искать их заново.
В личном кабинете можно подписаться на регулярное обновление информации по нужному разделу данных, а также встроить виджеты в интерфейс программы, которые упростят доступ к нужному инструменту для обработки статистики Росстата. Здесь можно узнать, как расшифровывается предоставленная информация.
Регистрация
Регистрация проводится после нажатия на кнопку с соответствующим названием, расположенную на главной странице официального сайта в верхнем правом углу. Для регистрации личного кабинета проводится простая процедура, не занимающая много времени. Пользователю нужно указать:
- Свой адрес электронной почты, который будет логином.
- Придумать пароль.
- Подтвердить созданный пароль, введя его еще раз.
- Написать в отдельных графах имя, отчество и фамилию.
- Назвать сектор, в котором осуществляется экономическая деятельность пользователя.
- Пройти тест, подтверждающий, что регистрируется не робот, а человек.
Процедура занимает не более 5 минут. При создании пароля требуется указать не менее 6 знаков, используя символы английского алфавита. Для этого нужно переключить регистр клавиатуры для введения определенного набора знаков. Для создания пароля можно использовать комбинации из строчных и прописных букв, а также цифр от 0 до 9.
После регистрации потребуется подтвердить свой электронный адрес. Для этого нужно будет зайти в свой электронный ящик, открыть письмо, пришедшее с официального сайта ЕМИСС и перейти по ссылке. Потом войти в личный кабинет с помощью логина и пароля.
Вход в личный кабинет
Чтобы попасть на созданную страницу, нужно будет нажать на кнопку «Вход» и в открывшейся форме написать свой логин, которым является адрес электронной почты, указанный при регистрации, и созданный пароль.
Реестр показателей
Реестр данных Федстата, размещенный на ЕМИСС, включает в себя данные, которые вносятся по определенной форме. Каждая запись имеет свой код, название документа, форму отчетности, указание на ведомство, ее предоставившее, единицы, в которых ведется измерение данных. Расшифровка данных упрощается при работе с ними в личном кабинете.
Популярные записи реестра отражаются на его главной странице. Среди самых востребованных документов реестра являются:
- Cредняя заработная плата по стране или в конкретной отрасли.
- Cреднедушевые доходы и расходы населения РФ в 2019 году по регионам.
- Размер цен на товары и услуги в том или ином секторе экономики страны.
- Уровень бедности.
- Текущие индексы цен на потребительские товары и услуги.
- Экспорт отдельных товаров.
- Средние по стране цены на потребительские товары и услуги.
- Численность населения по районам.
Используя реестр базы данных ЕМИСС, можно узнать популярную у пользователей статистику здравоохранения по регионам:
- Сколько людей обратилось к врачу в прошлом году в том или ином субъекте федерации и с какими проблемами они сталкиваются.
- Насколько хорошо обеспечены регионы медицинскими специалистами.
- Статистика записи к врачу.
- Обеспеченность врачами населения отдельных регионов РФ и другие важные данные.
Реестр содержит отчетность всех ведомств российского государства, доступ к которой сможет получить каждый пользователь, зарегистрировавшийся на официальном сайте.
Ведомства
На официальном сайте Росстат ЕМИСС представлены все федеральные ведомства ФР, предоставляющие данные статистики по своей отрасли. Всего представлено 65 ведомств, по которым собирается информация от отчетности:
- Федстат.
- Здравоохранение.
- Правоохранительные органы.
- Службы труда и занятости.
- Судебная система.
- Сельское хозяйство.
- Различные отрасли промышленности.
- Образование.
- Коммунальные услуги.
- Центробанк.
- Транспортные структуры.
- Федеральные службы различного типа.
- Финансовый сектор экономики и т.д.
Все действующие министерства, ведомства и службы регулярно предоставляют в Росстат статистическую отчетность, получить доступ к которой можно будет после регистрации.
Контакты
Пользователи могут оперативно связаться со службой технической поддержки сайта в случае возникновения проблем в работе ресурса, используя электронную почту emiss@digital.gov.ru
Также можно позвонить по телефонам горячей линии +7 (495) 320-10-19; 8 (800) 100-60-42 в рабочее время.
Введение. Нечисловая статистика — основа статистических методов
В.1. О развитии статистических методов
Четыре столетия статистики. Впервые термин «статистика» появился в «Гамлете» Шекспира ( 1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира – знать, придворные. По-видимому, оно происходит от латинского слова status, что в оригинале означает «состояние» или «политическое состояние».
В течение следующих 400 лет термин «статистика» понимали и понимают по-разному. В работе собрано более 200 определений этого термина, некоторые из них обсуждаются ниже.
Вначале под статистикой понимали описание экономического и политического состояния государства или его части. Например, к 1792 г. относится определение: «Статистика описывает состояние государства в настоящее время или в некоторый известный момент в прошлом». И в настоящее время деятельность государственных статистических служб (в нашей стране – Государственного комитета РФ по статистике) вполне укладывается в это определение.
Однако постепенно термин «статистика» стал использоваться более широко. По Наполеону Бонапарту «Статистика – это бюджет вещей». Тем самым статистические методы были признаны полезными не только для административного управления, но и на уровне отдельного предприятия. Согласно формулировке 1833 г. «цель статистики заключается в представлении фактов в наиболее сжатой форме». Приведем еще два высказывания. Статистика состоит в наблюдении явлений, которые могут быть подсчитаны или выражены посредством чисел (1895). Статистика – это численное представление фактов из любой области исследования в их взаимосвязи (1909).
В ХХ в. статистику обычно рассматривают как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных (1925). В 1954 г. академик АН УССР Б.В. Гнеденко дал следующее определение: «Статистика состоит из трех разделов:
1) сбор статистических сведений, т.е. сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;
2) статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;
3) разработка приемов статистического наблюдения и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики».
Термин «статистика» употребляют еще в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, в специальной литературе статистикой называют функцию от результатов наблюдений, используемую для оценивания характеристик и параметров распределений и проверки гипотез.
Чтобы подойти к термину «нечисловая статистика», кратко рассмотрим историю реальных статистических работ.
Краткая история статистических методов. Типовые примеры раннего этапа применения статистических методов описаны в Ветхом Завете (см., например, Книгу Чисел). Там, в частности, приводится число воинов в различных племенах. С математической точки зрения дело сводилось к подсчету числа попаданий значений наблюдаемых признаков в определенные градации.
В дальнейшем результаты обработки статистических данных стали представлять в виде таблиц и диаграмм, как это и сейчас делает Госкомстат РФ. Надо признать, что по сравнению с Ветхим Заветом есть прогресс — в Библии не было таблиц и диаграмм. Однако у Госкомстата РФ нет продвижения по сравнению с работами российских статистиков конца девятнадцатого — начала двадцатого веков (типовой монографией тех времен можно считать книгу , которая в настоящее время ещё легко доступна).
Сразу после возникновения теории вероятностей (Паскаль, Ферма, 17 век) вероятностные модели стали использоваться при обработке статистических данных. Например, изучалась частота рождения мальчиков и девочек, было установлено отличие вероятности рождения мальчика от 0,5, анализировались причины того, что в парижских приютах эта вероятность не та, что в самом Париже, и т.д. Имеется достаточно много публикаций по истории теории вероятностей с описанием раннего этапа развития статистических методов, к лучшим из них относится очерк .
В 1794 г. (по другим данным — в 1795 г.) К.Гаусс разработал метод наименьших квадратов, один из наиболее популярных ныне статистических методов, и применил его при расчете орбиты астероида Церера — для борьбы с ошибками астрономических наблюдений . В Х1Х веке заметный вклад в развитие практической статистики внес бельгиец А. Кетле, на основе анализа большого числа реальных данных показавший устойчивость относительных статистических показателей, таких, как доля самоубийств среди всех смертей . Интересно, что основные идеи статистического приемочного контроля и сертификации продукции обсуждались академиком Петербургской АН М.В. Остроградским (1801-1862) и применялись в российской армии ещё в середине Х1Х в. . Статистические методы управления качеством и сертификации продукции сейчас весьма актуальны .
Современный этап развития статистических методов можно отсчитывать с 1900 г., когда англичанин К. Пирсон основан журнал «Biometrika». Первая треть ХХ в. прошла под знаком параметрической статистики. Разрабатывались методы, основанные на анализе данных из параметрических семейств распределений, описываемых кривыми семейства Пирсона. Наиболее популярным было нормальное (гауссово) распределение. Для проверки гипотез использовались критерии Пирсона, Стьюдента, Фишера. Были предложены метод максимального правдоподобия, дисперсионный анализ, сформулированы основные идеи планирования эксперимента.
Разработанную в первой трети ХХ в. теорию анализа данных называем параметрической статистикой, поскольку ее основной объект изучения — это выборки из распределений, описываемых одним или небольшим числом параметров. Наиболее общим является семейство кривых Пирсона, задаваемых четырьмя параметрами. Как правило, нельзя указать каких-либо веских причин, по которым распределение результатов конкретных наблюдений должно входить в то или иное параметрическое семейство. Исключения хорошо известны: если вероятностная модель предусматривает суммирование независимых случайных величин, то сумму естественно описывать нормальным распределением; если же в модели рассматривается произведение таких величин, то итог, видимо, приближается логарифмически нормальным распределением, и т.д. Однако подобных моделей нет в подавляющем большинстве реальных ситуаций, и приближение реального распределения с помощью кривых из семейства Пирсона или его подсемейств — чисто формальная операция.
Именно из таких соображений критиковал параметрическую статистику академик АН СССР С.Н.Бернштейн в 1927 г. в своем докладе на Всероссийском съезде математиков . Однако эта теория, к сожалению, до сих пор остается основой преподавания статистических методов и продолжает использоваться основной массой прикладников, далеких от новых веяний в статистике. Почему так происходит? Чтобы попытаться ответить на этот вопрос, обратимся к наукометрии.
Наукометрия статистических исследований. В рамках движения за создание Всесоюзной статистической ассоциации (учреждена в 1990 г.) был проведен анализ статистики как области научно-практической деятельности. Он показал, в частности, что актуальными для специалистов в настоящее время являются не менее чем 100 тысяч публикаций (подробнее см. статьи ). Реально же каждый из специалистов знаком с существенно меньшим количеством книг и статей. Так, в известном трехтомнике М Кендалла и А. Стьюарта – наиболее полном на русском языке издании по статистическим методам — всего около 2 тысяч литературных ссылок. При всей очевидности соображений о многократном дублировании в публикациях ценных идей приходится признать, что каждый специалист по статистическим методам владеет лишь небольшой частью накопленных в этой области знаний. Не удивительно, что приходится постоянно сталкиваться с игнорированием или повторением ранее полученных результатов, с уходом в тупиковые (с точки зрения практики) направления исследований, с беспомощностью при обращении к реальным данным, и т.д. Все это — одно из проявлений адапционного механизма торможения развития науки, о котором еще 30 лет назад писали В.В.Налимов и другие науковеды (см., например, ).
Традиционный предрассудок состоит в том, что каждый новый результат, полученный исследователем — это кирпич в непрерывно растущее здание науки, который непременно будет проанализирован и использован научным сообществом, а затем и при решении практических задач. Реальная ситуация — совсем иная. Основа профессиональных знаний исследователя, инженера, экономиста менеджера, социолога, историка, геолога, медика закладывается в период обучения. Затем знания пополняются в том узком направлении, в котором работает специалист. Следующий этап — их тиражирование новому поколению. В результате вузовские учебники отстоят от современного развития на десятки лет. Так, учебники по математической статистике, согласно мнению экспертов, по научному уровню в основном соответствуют 40-60-м годам ХХ в. А потому середине ХХ в. соответствует большинство вновь публикуемых исследований и тем более — прикладных работ. Одновременно приходится признать, что результаты, не вошедшие в учебники, независимо от их ценности почти все забываются.
Активно продолжается развитие тупиковых направлений. Психологически это понятно. Приведу пример из своего опыта. По заказу Госстандарта я разработал методы оценки параметров гамма-распределения . Поэтому мне близки и интересны работы по оцениванию параметров по выборкам из распределений, принадлежащих тем или иным параметрическим семействам, понятия функции максимального правдоподобия, эффективности оценок, использование неравенства Рао-Крамера и т.д. К сожалению, я знаю, что это — тупиковая ветвь теории статистики, поскольку реальные данные не подчиняются каким-либо параметрическим семействам, надо применять иные статистические методы — непараметрические. Понятно, что специалистам по параметрической статистике, потратившим многие годы на совершенствование в своей области, психологически трудно согласиться с этим утверждением. В том числе и мне. Но необходимо идти вперед.
Появление прикладной статистики. В нашей стране термин «прикладная статистика» вошел в широкое употребление в 1981 г. после издания массовым тиражом (33940 экз.) сборника «Современные проблемы кибернетики (прикладная статистика)». В этом сборнике обосновывалась трехкомпонентная структура прикладной статистики . Во-первых, в нее входят ориентированные на прикладную деятельность статистические методы анализа данных (эту область можно назвать прикладной математической статистикой и включать также и в прикладную математику). Однако прикладную статистику нельзя целиком относить к математике. Она включает в себя две явно внематематические области. Во-первых, методологию организации статистического исследования: как планировать исследование, как собирать данные, как подготавливать данные к обработке, как представлять результаты. Во-вторых, организацию компьютерной обработки данных, в том числе разработку и использование баз данных и электронных таблиц, статистических программных продуктов, например, диалоговых систем анализа данных.
В нашей стране термин «прикладная статистика» использовался и ранее 1981 г., но лишь внутри сравнительно небольших и замкнутых групп специалистов, о некоторых из которых рассказано в статье .
Прикладная статистика и математическая статистика – это две разные научные дисциплины. Различие четко проявляется и при преподавании. Курс математической статистики состоит в основном из доказательств теорем, как и соответствующие учебные пособия. В курсах прикладной статистики основное — методология анализа данных и алгоритмы расчетов, а теоремы приводятся как обоснования этих алгоритмов, доказательства же, как правило, опускаются (их можно найти в научной литературе).
Статистические методы. В области статистического анализа данных естественно выделить три вида научной и прикладной деятельности (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):
а) разработка и исследование методов прикладной статистики, предназначенных для анализа данных различной природы;
б) разработка и исследование вероятностно-статистических моделей в соответствии с конкретными потребностями науки и практики (моделей управления качеством, сбора и анализа оценок экспертов и др.);
в) применение статистических методов и моделей для анализа конкретных данных (например, данных о росте цен с целью изучения инфляции).
Кратко рассмотрим три только что выделенных вида научной и прикладной деятельности. По мере движения от а) к в) сужается широта области применения статистического метода, но при этом повышается его значение для анализа конкретной ситуации. Если работам вида а) соответствуют научные результаты, значимость которых оценивается по общенаучным критериям, то для работ вида в) основное — успешное решение задач конкретной области. Работы вида б) занимают промежуточное положение, поскольку, с одной стороны, теоретическое изучение статистических моделей может быть достаточно сложным и математизированным (см., например, монографию ), с другой — результаты представляют интерес не для всей науки, а лишь для некоторого направления в ней.
Структура современной статистики. Внутренняя структура статистики как науки была выявлена и обоснована при создании в 1990 г. Всесоюзной статистической ассоциации . Прикладная статистика — методическая дисциплина, являющаяся центром статистики. При применении методов прикладной статистики к конкретным областям знаний и отраслям народного хозяйства получаем научно-практические дисциплины типа «статистика в промышленности», «статистика в медицине» и др. С этой точки зрения эконометрика — это «статистические методы в экономике» . Математическая статистика играет роль математического фундамента для прикладной статистики.
К настоящему времени очевидно четко выраженное размежевание этих двух научных направлений. Математическая статистика исходит из сформулированных в 1930-50 гг. постановок математических задач, происхождение которых связано с анализом конкретных статистических данных. Начиная с 70-х годов ХХ в. исследования по математической статистике посвящены обобщению и дальнейшему математическому изучению этих задач. Поток новых математических результатов (теорем) не ослабевает, но новые практические рекомендации по обработке статистических данных при этом почти не появляются. Можно сказать, что математическая статистика как научное направление замкнулась внутри себя.
Сам термин «прикладная статистика» возник как реакция на описанную выше тенденцию. Прикладная статистика нацелена на решение реальных задач. Поэтому в ней возникают новые постановки математических задач анализа статистических данных, развиваются и обосновываются новые методы. Обоснование часто проводится математическими методами, т.е. путем доказательства теорем. Большую роль играет методологическая составляющая — как именно ставить задачи, какие предположения принять с целью дальнейшего математического изучения. Велика роль современных информационных технологий, в частности, компьютерного эксперимента.
Рассматриваемое соотношение математической и прикладной статистик отнюдь не являются исключением. Как правило, математические дисциплины проходят в своем развитии ряд этапов. Вначале в какой-либо прикладной области возникает необходимость в применении математических методов и накапливаются соответствующие эмпирические приемы (для геометрии это — «измерение земли», т.е. землемерие, в Древнем Египте). Затем возникает математическая дисциплина со своей аксиоматикой (для геометрии это — время Евклида). Затем идет внутриматематическое развитие и преподавание (считается, что большинство результатов элементарной геометрии получено учителями гимназий в XIX в.). При этом на запросы исходной прикладной области перестают обращать внимание, и та порождает новые научные дисциплины (сейчас «измерением земли» занимается не геометрия, а геодезия и картография). Затем научный интерес к исходной дисциплине иссякает, но преподавание по традиции продолжается (элементарная геометрия до сих пор изучается в средней школе, хотя трудно понять, в каких практических задачах может понадобиться, например, теорема о том, что высоты треугольника пересекаются в одной точке). Следующий этап — окончательное вытеснение дисциплины из реальной жизни в историю науки (объем преподавания элементарной геометрии в настоящее время постепенно сокращается, в частности, ей все меньше уделяется внимания на вступительных экзаменах в вузах). К интеллектуальным дисциплинам, уже закончившим свой жизненный путь, относится средневековая схоластика. Как справедливо отмечает проф. МГУ им. М.В. Ломоносова В.Н. Тутубалин , теория вероятностей и математическая статистика успешно двигаются по ее пути — вслед за элементарной геометрией.
Подведем итог. Хотя статистические данные собираются и анализируются с незапамятных времен (см., например, Книгу Чисел в Ветхом Завете), современная математическая статистика как наука была создана, по общему мнению специалистов, сравнительно недавно — в первой половине ХХ в. Именно тогда были разработаны основные идеи и получены результаты, излагаемые ныне в учебных курсах математической статистики. После чего специалисты по математической статистике занялись внутриматематическими проблемами, а для теоретического обслуживания проблем практического анализа статистических данных стала формироваться новая дисциплина — прикладная статистика.
В настоящее время статистическая обработка данных проводится, как правило, с помощью соответствующих программных продуктов. Разрыв между математической и прикладной статистикой проявляется, в частности, в том, что большинство методов, включенных в популярные среди исследователей статистические пакеты программ (например, в заслуженные Statgraphics и SPSS или в более новую систему Statistica), даже не упоминается в учебниках по математической статистике. В результате специалист по математической статистике оказывается зачастую беспомощным при обработке реальных данных, а пакеты программ применяют (что еще хуже — и разрабатывают) лица, не имеющие необходимой теоретической подготовки. Естественно, что они допускают разнообразные ошибки, в том числе в таких ответственных документах, как государственные стандарты по статистическим методам. Анализ грубых ошибок в стандартах дан в статье .
Что дает прикладная статистика народному хозяйству? Так называлась статья , в которой приводились многочисленные примеры успешного использования методов прикладной математической статистики при решении практических задач. Перечень примеров можно продолжать практически безгранично (см., например, недавнюю сводку ).
Методы прикладной статистики используются в зарубежных и отечественных экономических и технических исследованиях, работах по управлению (менеджменту), в медицине, социологии, психологии, истории, геологии и других областях. Их применение дает заметный экономический эффект. Например, в США — не менее 20 миллиардов долларов ежегодно только в области статистического контроля качества. Недавно появилась концепция «Шесть сигм» — система управления компанией или ее подразделениями на основе интенсивного использования статистических методов . Внедрение «Шести сигм» дает значительный экономический эффект. Исполнительный директор General Electric Джек Уэлч подчеркнул в ежегодном докладе, что всего за три года «Шесть сигм» сэкономили компании более 2 миллиардов долларов.
В 1988 г. затраты на статистический анализ данных в нашей стране оценивались в 2 миллиарда рублей ежегодно . Согласно расчетам сравнительной стоимости валют на основе потребительских паритетов , эту величину можно сопоставить с 2 миллиардами долларов США. Следовательно, объем отечественного «рынка статистических услуг» был на порядок меньше, чем в США, что совпадает с оценками и по другим показателям, например, по числу специалистов.
Публикации по новым статистическим методам, по их применениям в технико-экономических исследованиях, в инженерном деле постоянно появляются, например, в журнале «Заводская лаборатория», в секции «Математические методы исследования». Надо назвать также журналы «Автоматика и телемеханика» (издается Институтом проблем управления Российской академии наук), «Экономика и математические методы» (издается Центральным экономико-математическим институтом РАН).
Однако необходимо констатировать, что для большинства менеджеров, экономистов и инженеров прикладная статистика и другие статистические методы является пока экзотикой. Это объясняется тем, что в вузах современным статистическим методам почти не учат. Во всяком случае, по состоянию на 2004 г. каждый квалифицированный специалист в этой области — самоучка.
Этому выводу не мешает то, что в вузовских программах обычно есть два курса, связанных со статистическими методами. Один из них — «Теория вероятностей и математическая статистика». Этот небольшой курс обычно читают специалисты с математических кафедр. Они успевают дать лишь общее представление об основных понятиях математической статистики. Кроме того, внимание математиков обычно сосредоточено на внутриматематических проблемах, их больше интересует доказательства теорем, а не применение современных статистических методов в задачах экономики и менеджмента. Другой курс — «Статистика» или «Общая теория статистики», входящий в стандартный блок экономических дисциплин. Фактически он является введением в прикладную статистику и содержит первые начала эконометрических методов (по состоянию на 1900 г.).
Прикладная статистика и другие статистические методы опираются на два названных вводных курса. Цель — вооружить специалиста современным статистическим инструментарием. Специалист – это инженер, экономист, менеджер, геолог, медик, социолог, психолог, историк, химик, физик и т.д. Во многих странах мира — Японии и США, Франции и Швейцарии, Перу и Ботсване и др. — статистическим методам обучают в средней школе. ЮНЕСКО постоянно проводят конференции по вопросам такого обучения . В СССР и СЭВ, а теперь — по плохой традиции — и в России игнорируют этот предмет в средней школе и лишь слегка затрагивают его в высшей. Результат на рынке труда очевиден — снижение конкурентоспособности специалистов.
Проблемы прикладной статистики и других статистических методов постоянно обсуждаются специалистами. Широкий интерес вызвала дискуссия в журнале «Вестник статистики», в рамках которой были, в частности, опубликованы статьи . На появление в нашей стране прикладной статистики отреагировали и в США .
В нашей стране получены многие фундаментальные результаты прикладной статистики. Огромное значение имеют работы академика РАН А.Н. Колмогорова . Во многих случаях именно его работы дали первоначальный толчок дальнейшему развитию ряда направлений прикладной статистики. Зачастую еще 50-70 лет назад А.Н. Колмогоров рассматривал те проблемы, которые только сейчас начинают широко обсуждаться. Как правило, его работы не устарели и сейчас. Свою жизнь посвятили прикладной статистике члены-корреспонденты АН СССР Н.В. Смирнов и Л.Н. Большев. В настоящем учебнике постоянно встречаются ссылки на лучшую публикацию ХХ в. по прикладной статистике – составленные ими подробно откомментированные «Таблицы …» .
Основное продвижение в статистике конца ХХ в. — это создание нечисловой статистики. Ее называют также статистикой нечисловых данных или статистикой объектов нечисловой природы.