Математикалық статистика – статистикалық мәліметтер
бойынша зерттелінді құбылыстың ықтималдық моделін
құруға мүмкіндік беретін математикалық әдістер
туралы ғылым. Демек, бұл ғылыми және практикалық қорытындылар
жасауға арналған статистикалық мәліметтерді жинау, өңдеу,
қолдану мен жүйелеу мақсатындағы математикалық әдістерді
жасаушы ғылым саласы. Бұнда кездейсоқ құбылыстардың
ықтималдық моделін құру мақсатындағы бақылаулар
мен тәжірибелер нәтижесіндегі
деректерге анализ жасау, оларды сипаттау, өңдеу әдістері
жүргізіледі. Сонымен қатар, математикалық статистика модельдер құру, белгісіз
параметрлерді бағалау, гипотезаларды тексеру және болжам жасау әдістерін
де қамтиды.
Математикалық статистика ықтималдықтар
теориясына негізделген математиканың саласы болғанымен оған қандай
да бір мағынадағы кері есептерді қарастырады. Атап айтқанда,
ықтималдықтар теориясында құбылыс өзінің ықтималдық
моделімен алдын ала берілсе, математикалық статистикада зерттелінді құбылысты
сипаттайтын математикалық моделдің ең болмағанда бір
параметрі белгісіз болып, тәжірибелердің ақырлы санында пайда
болған мәліметтер қоры
негізінде зерттеледі.
Басты жиынтық, таңдама. Математикалық статистиканың
негізгі ұғымдарына тоқталайық.
Математикалық
статистика ықтималдықтар теориясы заңдылықтарын тікелей
қолданғанымен ондағы есептерге белгілі бір мағынада
кері есептерді зерттейтін математика саласы болып табылады. Табиғат пен қоғамдағы
физикалық, экономикалық құбылыстар әртүрлі
басқарылуы мүмкін емес факторларға тәуелді болғандықтан
олар кездейсоқ (детерминделмеген) құбылыс
ретінде зерттеледі. Осы мақсатта олар жайлы көптеген мәліметтер
жинақталып, үлкен көлемдегі деректер базасы құрылады
да, олар қандай да бір үлестірімі толық белгісіз не оның
параметрлері белгісіз кездейсоқ шаманы тудыратын тәжірибелердің
ақырлы рет тәуелсіз жүзеге асырылумен байланысты деп қабылданады. Дәл осы толық не параметрлері
белгісіз үлестірім функциясын анықтау математикалық
статистиканың ықтималдықтар теориясына белгілі бір мағынада
кері негізгі мәселесі болып табылады.
Сонымен, мәселе сандық тұрғыдан
сипатталатын қандай да бір заңдылықты (бөлмедегі
температура көрсеткіші, бір шығарылымдағы ақаулы бұйымдар
саны, алынған несиенің қайтарылу көлемі т.с.с.)
зерттеуден тұрып, бұл зерттелінді заңдылық белгілі бір үлестірім
функциясымен беріліп, тек оның параметрлерін анықтау қажет
болса, кейбірінде тіпті оның үлестірім функциясының түрін
анықтау керек болып жатады.
Параметрлеріне дейінгі дәлдікпен берілген түрі
анық немесе үлестірім функцияларының қандай да бір
классында жататындығы белгілі
кездейсоқ шамасының барлық мүмкін
мәндер жиыны
кездейсоқ
шамасының басты жиынтығы деп аталады.
Басты жиынтық қасиеттерін зерттеу үшін
тәжірибені бірдей жағдайда ақырлы рет орындау нәтижесінде
алынған кездейсоқ шама мәндері болатын тәжірибелік
(статистикалық) мәліметтер қолданылады. «Бірдей жағдайда
ақырлы рет орындалу» деген шарт ықтималдықтар теориясындағыдай математикалық статистикада да
тәжірибені ең болмағанда теория жүзінде бірдей жағдайларда
тәуелсіз қажетінше рет жүзеге асыруға болады дегенді
білдіреді. Әр орындаудағы нәтижеге сәйкес
кездейсоқ шамасы мүмкін мәндердің
бірін қабылдауынан математикалық статистикада
кездейсоқ шамасымен бірдей үлестірілген
тәуелсіз
кездейсоқ шамалары ретінде қарастыруға
болады.
Сонымен,
кездейсоқ шамасы статистикалық мәліметтер
жиыны оның мәндер жиыны болатын үлестірім функциясымен
берілсін.
Математикалық статистиканың негізгі ұғымдарының
бірі – таңдама.
Анықтама
1.1. Әрқайсысы басты жиынтықты тудыратын
кездейсоқ шамасының үлестірім
функциясымен берілген
тәуелсіз
кездейсоқ шамалар жиынтығы басты жиынтығының кездейсоқ таңдамасы
деп аталады және
түрінде
белгіленеді. Мұндағы
–
кездейсоқ таңдама көлемі деп, ал
– кездейсоқ таңдаманың
-ші
элементі деп аталады.
Анықтама
1.2.
кездейсоқ таңдамасының
әрбір мүмкін мәні басты жиынтықтан алынған таңдама немесе
кездейсоқ таңдаманың нәтижесі деп аталады да, оқулық
барысында
арқылы
белгіленеді, мұндағы
–
таңдама көлемі, ал
– таңдаманың
-ші элементі.
Сөйтіп, кездейсоқ таңдама
кездейсоқ шамалардан құралған вектор болса, таңдама
сол вектордың бір мәні.
Бұл анықтамадан
таңдамасы бірдей
жағдайларда
рет
тәуелсіз тәжірибелер жүзеге асырылғандағы
кездейсоқ шамасының
мәндері
деп пара-пар қарастыруға болғандықтан, оны
кездейсоқ шамасы арқылы туындайды
деп те айтуға болады.
Ескерту 1.1. Егер 1.1-анықтамасында
векторының координаталарының үлестірім
функцияларының бірдей болу шарты талап етілмей, олардың сәйкес
үлестірім
функциялары әртүрлі болса, онда
кездейсоқ
таңдамасы біртекті емес деп, ал анықтамадағыдай бірдей болған жағдайда
біртекті деп атайды. Осы оқулық барысында тек біртекті таңдамалар
зерттелінгендіктен, біртектілігі атап жазылмай, тек кездейсоқ таңдама
деп қана аталынды.
кездейсоқ таңдаманың
қабылдайтын мүмкін мәндер жиыны таңдамалық
кеңістік деп аталып, осы оқулықта
арқылы
белгіленеді.
кездейсоқ таңдамасының
элементтері тәуелсіз
және әрқайсысының үлестірім функциясы басты
жиынтықты тудыратын
кездейсоқ шамасының үлестірім
функциясымен бірдей болғандықтан кездейсоқ таңдаманың үлестірім функциясы үшін
![]()
![]()
теңдігі орындалады, мұндағы
–
кездейсоқ шамасының
үлестірім
функциясына тең
кездейсоқ шамасының үлестірім
функциясы.
Жоғарыда айтқанымыздай статистикалық
есептерді шешу барысында басты жиынтықты тудыратын
кездейсоқ шамасының үлестірім
функциясы жайлы мәліметтер барынша әртүрлі болуы мүмкін.
Айталық, кейбір жағдайда үлестірім функциясының тек үзіліссіз
болатындығы ғана белгілі болса, кейбірінде үлестірім түрі
белгілі болғанымен параметрлері анықталмаған болуы мүмкін.
Мысалы, кездейсоқ шама
тәжірибе
жүргізу барысында
рет
ұтыс болуын білдіретін
биномиалды үлестіріммен берілгені белгілі болғанымен бір рет
тәжірибе жүргізгенде ұтыс түсу ықтималдығы
белгісіз болуы мүмкін, сол сияқты бас жиынтықты тудыратын
кездейсоқ шама
Пуассон заңы бойынша үлестірілгені
белгілі болып, ондағы
параметрі белгісіз болуы мүмкін (мұндағы
) немесе басты жиынтықты
тудыратын кездейсоқ шама үлестірімінің үзіліссіз
екендігі ғана белгілі болуы мүмкін. Бұндай жағдайларда
априорлы (тәжірибеге дейінгі) мәліметті қамтитын кездейсоқ
таңдаманың үлестірім класстары атты үлестірім
функцияларының жиыны жайлы сөз қозғалады, яғни жоғарыдағы
мысалдардың алғашқы екеуінде үлестірім функциясының
түрі белгілі, олардағы үлестірім класстары сәйкесінше
және
болса,
соңғы мысалда үлестірім
классы барлық мүмкін үзіліссіз үлестірім функцияларының
жиынынан құралған жиын болады. Үлестірім функциясы параметрлік түрде
берілген жағдайда параметрдің қабылдайтын мәндері
скаляр немесе векторлық түрде болып, сәйкесінше
не
арқылы
белгіленеді.
Анықтама
1.3.
кездейсоқ таңдамасы
берілсін. Оның таңдамалық
кеңістігі мен басты жиынтықты тудыратын кездейсоқ шаманың
үлестірім функциясы жататын үлестірім классынан құралған
жұбы
статистикалық модель деп аталады.
Сонымен, тәуелсіз
тәжірибелер сипаттайтын үлестірім классы
берілген таңдамалық кеңістік
таңдамасын туындататын статистикалық модель
болады.
статистикалық моделі тәуелсіз тәжірибелер
тізбегі жағдайында басты жиынтықты тудыратын кездейсоқ шаманың
үлестірім
функциясы арқылы
таңдамалық кеңістігін де,
үлестірім
функциялар классын да толық анықтағандықтан
түрінде
де белгіленеді.
Ал үлестірім функциясының түрі
белгілі, бірақ мәндері қандай да бір
жиынында жататын
параметр-векторға дейінгі дәлдікпен
берілсе, онда бұндай статистикалық модель параметрлік модель
деп аталады да,
немесе
түрінде
белгіленеді.
жиыны параметрлік жиын деп аталады.
Жоғарыдағы үлестірім ықтималдығы
түрінде
берілген бірінші мысалда белгісіз параметрдің мүмкін мәндер
жиыны
интервалы болады. Ал егер бас жиынтық
нормал үлестіріммен берілсе, ондағы екі параметр де белгісіз болған
жағдайда оның статистикалық моделіндегі үлестірім тығыздығы
, параметрлік жиыны
түрінде
болады.
Статистикалық модель бас жиынтықты
тудыратын кездейсоқ шама дискретті
үлестірілген жағдайда сол кездейсоқ шама мәндерін қабылдау
ықтималдықтары арқылы, ал үзіліссіз үлестірілген
жағдайда үлестірім функциямен ғана емес үлестірім тығыздықтары
арқылы да берілуі мүмкін.
Жиі кездесетін параметрлік модель ондағы
параметрлік жиындарымен 1.1-кестесінде берілген.
1.1-кесте
|
Модель атауы |
Модель
белгілеуі |
|
|
|
Нормал-1 |
|
|
|
|
Нормал-2 |
|
|
|
|
Жалпы нормал |
|
|
|
|
Гамма |
|
|
|
|
Бірқалыпты-1 |
|
|
|
|
Жалпы бірқалыпты |
|
|
|
|
Коши |
|
|
|
|
Биномиалды |
|
|
|
|
Пуассон |
|
|
|
|
Теріс биномиалды |
|
|
|
Әрине қажетіне
қарай басқа да статистикалық параметрлік моделдер қолданылады.
Егер
кездейсоқ шамасының үлестірім
функциясы белгілі бір типтағы болса (мәселен,
геометриялық, бірқалыпты, нормал т.с.с.), онда модель де сол
белгілі атаумен аталады (сәйкес геометриялық модель, біртекті
модель, нормал модель т.с.с.).
кездейсоқ шамасының дискретті
немесе үзіліссіз болуына қарай статистикалық модель де сәйкес
дискретті не үзіліссіз болады.
Ал ықтималдықтар теориясында бар
екендігі көрсетілген дискретті де, үзіліссіз де болмайтын кездейсоқ
шамалар бұл оқулық көлемінде қарастырылмайды.
Статистикалық есептерді шешудегі алғашқы
қадам қолда бар мәліметтерді қолдануға ыңғайландыра
отырып, алдын ала өңдеу болып табылады. Осы әдістерді
сипаттауға көшейік.
Вариациялық қатар. Статистикалық мәліметтерді өңдеудің
ең қарапайым түрлерінің бірі – таңдама
элементтерін өсу ретімен орналастыру болып табылады.
Анықтама 1.4.
кездейсоқ шамасымен туындалған
басты жиынтықтан алынған
көлемді
таңдамасы берілсін. Оның мәндерін өсу ретімен орналастырғандағы
![]()
шартын қанағаттандыратын
сандардың ақырлы тізбегі таңдаманың вариациялық қатары
немесе қысқаша вариациялық қатар деп, ал
cандары вариациялық қатардың
-ші мүшесі деп аталады. Бұндай өңдеу статистикалық
мәліметтерді реттеу (ранжирлеу)
деп те аталады.
кездейсоқ таңдамасын әрбір жүзеге
асырудағы нәтижесіне сәйкес вариациялық қатарының
-ші мәнін қабылдайтын кездейсоқ
шаманы
арқылы
белгілейік.
Анықтама 1.5.
-ші мүшесі таңдаманың вариациалық қатарының
-ші мүшелерін қабылдайтын
кездейсоқ шамалар тізбесі кездейсоқ
таңдаманың вариациялық қатары
деп, ал
кездейсоқ таңдама вариациялық
қатарының
-ші мүшесі деп аталады. Кездейсоқ таңдаманың вариациялық қатарының
элементтері реттік статистикалар деп,
ал
шеткі элементтері экстремалды реттік
статистикалар деп аталады.
кездейсоқ таңдамасындағы
әрбір
кездейсоқ шамасының үлестірім
функциялары бірдей болғандықтан кездейсоқ таңдаманы
оның вариациялық қатарына ауыстыру мәліметтерді еш жоғалтпайды.
Вариациалық қатардағы
кездейсоқ таңдаманың
үлестірім функциясы басты жиынтықты туындатушы
кездейсоқ шамасының
үлестірім
функциясына тең емес болғанымен, сол арқылы

түрінде жазылады.
Оның ішінде, кездейсоқ таңдаманың вариациалық
қатарының бірінші
мүшесінің
үлестірім функциясы
![]()
![]()
![]()
түрінде өрнектеледі. Бұнда
теңсіздігі мен
вариациялық қатардың алғашқы
мүшесі болуынан
теңсіздіктерінің орындалуы және
кездейсоқ шамаларының тәуелсіздігі
қолданылған. Сол сияқты,
кездейсоқ шамасының үлестірім
функциясын анықтауға болады. Бұл қатынастар тәжірибелер
нәтижесінде тек
не
шамаларының өлшем нәтижелерін
білу арқылы басты жиынтықты туындататын
кездейсоқ шамасының белгісіз
үлестірім
функциясын анықтауға мүмкіндік береді.
Егер басты жиынтықты
туындататын
кездейсоқ шамасының үлестірім
функциясы
үлестірім
тығыздығы
болса, онда
реттік статистиканың үлестірім тығыздығы
![]()
түрінде анықталады.
Статистикалық қатар.
Таңдамаларды (статистикалық мәліметтерді)
топтастыру әдістерін қарастырайық.
таңдаманың
мәндерінің
арасында бірдей мәндер кездесуі мүмкін. Бұл бақылаудағы
кездейсоқ шама дискретті немесе мәндерін белгілі бір дәлдікке
дейін дөңгелектейтін үзіліссіз болғанда орын алады.
Айталық
мәндерінің
арасында бір-бірінен өзгеше
мән
бар делік, оларды өсу ретімен орналастырып, жаңа
белгілеу енгізейік және олардың
әрқайсысы сәйкесінше
рет
кездессін (
).
Анықтама 1.6. Таңдамалық
кеңістіктен алынған
көлемді
таңдамасы
берілсін.
шартын қанағаттандыратын өзара
тең емес, әрқайсысы сәйкесінше
рет кездесетін
мәндерінен
құрылған
жұптары статистикалық қатар деп, ал
ондағы әртүрлі мәндер варианталар
деп аталады.
Статистикалық қатар бірінші жолында
мәндері
– варианталар, екінші жолында олардың қайталану
саны көрсетілетін
1.2-кесте
|
|
|
|
|
|
|
|
|
|
кесте түрінде де беріледі.
жиілікпен қатар
вариантасынан
аспайтын варианталар санын білдіретін
жинақталған жиілік ұғымы
да қолданылады.
Анықтама
1.7. Таңдамалық кеңістіктен алынған
көлемді
таңдамасы
берілсін.
,
, мұндағы
шартын қанағаттандыратын
аралықтары мен
сол аралықтарда жататын таңдамалар
санынан құрылған
жұптары
таңдамасының интервалдық-статистикалық қатары деп аталады.
Интервалдық-статистикалық
қатар бірінші жолында әрбір
жартылай сегменті, екінші жолында сәйкес
оларда жататын таңдама мәндерінің
саны жазылатын
1.4-кесте
|
|
|
|
|
|
|
|
|
|
|
|
кесте түрінде де беріледі.
Бұнда
таңдамасының
элементтері
аралықтарының
тек біреуінде ғана және
міндетті түрде біреуінде жатады.
Кей кезде қажетіне қарай кестенің
бірінші жолында сандық аралық емес оның орташа мәні
алынады.
Және де, қажетіне
қарай статистикалық қатардың да, интервалдық-статистикалық
қатардың да екінші жолында
жиілік
орнына
салыстырмалы жиілік көрсетіледі, бұл жағдайда қатар сәйкесінше салыстырмалы статитикалық,
салыстырмалы интервалдық-статистикалық деп аталады. Сонымен,
Анықтама 1.8. Таңдамалық
кеңістігінен алынған
көлемді
таңдамасы
берілсін, оның
шартын қанағаттандыратын өзара
тең емес
мәндері
мен олардың сәйкес қайталану саны
болсын. Онда
жұптары салыстырмалы статистикалық қатар
деп аталады.
Анықтама
1.9. Таңдамалық кеңістіктен алынған
көлемді
таңдамасы
берілсін.
,
, мұндағы
шартын қанағаттандыратын
аралықтары мен
сол аралықтарда жататын таңдамалар
санына сәйкес
жұптары
таңдамасының салыстырмалы интервалдық-статистикалық қатары деп аталады.
Бұл салыстырмалы қатарларды
да статистикалық, интервалдық-статистикалық қатарлардағыдай кесте түрінде беруге
болады.
Таңдаманың интервалдық-статистикалық қатарындағы
аралықтар саны
таңдама көлеміне
тәуелді. Бұл
санын
санынан кем қылмай таңдау ұсынылады
және
артқан сайын
шамасы бөліктеу санына
жеткілікті болады. Сонымен, интервалдық қатар қадамын анықтау
үшін Стэнжес формуласы деп
аталатын
![]()
формуласы қолданылады,
мұндағы
– ең
үлкен,
– ең
кіші варианта.
Анықтама
1.10. Таңдамалық кеңістіктен алынған
көлемді
таңдамасы
берілсін.
,
,
, мұндағы
,
–
аралықтарында жататын таңдамалар саны болсын.
аралығында
мәніне,
ал
аралығынан тыс
нүктелерде нөлге тең функция, яғни

функциясы басты жиынтығынан алынған
кездейсоқ таңдаманың
нәтижесіне сәйкес эмпирикалық үлестірім
тығыздығы деп аталады.
аралығында бөлік-бөлік
тұрақты
функциясының графигі гистограмма деп аталады (1.1-сурет).
Гистограмманы ені
биіктігі
(
болатын тіктөртбұрыштардан
құрылған диаграмма деп те қарастырады. Және де,
барлық тіктөртбұрыштардың аудандарының қосындысы
бірге тең, ал әр тіктөртбұрыштың ауданы таңдама
элементтерінің сол аралықтарға түсуінің
салыстырмалы жиілігіне тең болады.
Кей жағдайларда
гистограмма ретінде ені
биіктігі
(
болатын тіктөртбұрыштардан
құрылған диаграмма қабылданып, ол гистограмма
деп, ал жоғарыдағы жағдай салыстырмалы гистограмма деп
аталады.
Анықтама
1.11.
кездейсоқ шамасымен туындалған
басты жиынтықтан алынған
кездейсоқ таңдаманың
нәтижесі берілсін. Егер таңдама статистикалық
қатар түрінде берілсе, онда жазықтықта
нүктелерін қосатын, ал таңдама интервалдық
қатар түрінде берілсе, онда гистограмманы құрайтын жоғарғы
кесінділердің орталарын қосатын сынық сызық жиілік
полигоны деп аталады. Ал жиілікті салыстырмалы жиілікпен алмастырылғанда
салыстырмалы жиілік полигоны деп аталады.

1.2-сурет.
Полигон
Анықтама
1.12.
кездейсоқ шамасымен туындалған
басты жиынтықтан алынған
кездейсоқ таңдаманың
нәтижесі берілсін. Егер таңдама жинақталған
жиілікті статистикалық қатар түрінде берілсе, яғни
|
|
|
|
|
|
|
|
|
|
|
|
кестесімен берілсе, онда жазықтықта
нүктелерін қосатын сынық сызық кумулятивті
қисық деп аталады. Ал жиілікті салыстырмалы жиілікпен алмастырғанда
салыстырмалы кумулятивті қисық деп аталады.
Статистикада полигон мен гистограмма сызуда жазықтықты
арифметикаландыратын өзара перпендикуляр
координаталық түзулер бойындағы бірлік масштабтардың
бірдей болу шарты мәліметтердің үлкендігі мен салыстырмалы
жиіліктердің 0 және
1 аралығында жату салдарынан сақталынбай
қолданылуы мүмкін.