मेन्यू

आत्मविश्वास की सीमा कैसे खोजें। Microsoft Excel में विश्वास अंतराल की गणना करना

सर्दियों के लिए पौधे तैयार करना

विश्वास अंतराल का आकलन

सीखने के मकसद

सांख्यिकी निम्नलिखित पर विचार करती है दो मुख्य कार्य:

    हमारे पास नमूना डेटा के आधार पर कुछ अनुमान हैं, और हम अनुमान लगाया जा रहा पैरामीटर का सही मूल्य कहां है, इसके बारे में कुछ संभाव्य बयान देना चाहते हैं।

    हमारे पास एक विशिष्ट परिकल्पना है जिसे नमूना डेटा के आधार पर परीक्षण करने की आवश्यकता है।

इस विषय में, हम पहले कार्य पर विचार करते हैं। हम कॉन्फिडेंस इंटरवल की परिभाषा भी पेश करते हैं।

कॉन्फिडेंस इंटरवल एक ऐसा अंतराल है जो अनुमानित पैरामीटर मान के आसपास बनाया गया है और दिखाता है कि अनुमानित पैरामीटर का सही मान प्राथमिकता दी गई संभावना के साथ कहां स्थित है।

इस विषय पर सामग्री का अध्ययन करने के बाद, आप:

    पता लगाएँ कि अनुमान का विश्वास अंतराल क्या है;

    सांख्यिकीय कार्यों को वर्गीकृत करना सीखें;

    सांख्यिकीय फ़ार्मुलों के अनुसार और सॉफ़्टवेयर टूल का उपयोग करके, विश्वास अंतराल के निर्माण की तकनीक में महारत हासिल करें;

    सांख्यिकीय अनुमानों की सटीकता के कुछ मापदंडों को प्राप्त करने के लिए आवश्यक नमूना आकार निर्धारित करना सीखें।

नमूना विशेषताओं का वितरण

टी वितरण

जैसा कि ऊपर चर्चा की गई है, यादृच्छिक चर का वितरण पैरामीटर 0 और 1 के साथ मानकीकृत सामान्य वितरण के करीब है। चूंकि हम σ का मान नहीं जानते हैं, इसलिए हम इसे कुछ अनुमान के साथ बदलते हैं। मात्रा का पहले से ही एक अलग वितरण है, अर्थात्, या छात्र का टी वितरण, जो पैरामीटर n -1 (स्वतंत्रता की डिग्री की संख्या) द्वारा निर्धारित किया जाता है। यह वितरण सामान्य वितरण के करीब है (बड़ा n, वितरण के करीब)।

अंजीर में। 95
स्वतंत्रता के 30 डिग्री के साथ छात्र का वितरण प्रस्तुत किया गया है। जैसा कि आप देख सकते हैं, यह सामान्य वितरण के बहुत करीब है।

इसी तरह सामान्य वितरण NORMDIST और NORMINV के साथ काम करने के लिए, t-वितरण के साथ काम करने के लिए कार्य हैं - TDIST और टिनव... इन कार्यों का उपयोग करने का एक उदाहरण TDIST.XLS फ़ाइल (टेम्पलेट और समाधान) और अंजीर में पाया जा सकता है। 96
.

अन्य विशेषताओं का वितरण

जैसा कि हम पहले से ही जानते हैं, गणितीय अपेक्षा के अनुमान की सटीकता को निर्धारित करने के लिए, हमें टी-वितरण की आवश्यकता है। अन्य मापदंडों का अनुमान लगाने के लिए, जैसे कि विचरण, विभिन्न वितरणों की आवश्यकता होती है। उनमें से दो एफ-वितरण हैं और एक्स 2-वितरण.

माध्य के लिए विश्वास अंतराल

विश्वास अंतरालएक अंतराल है जो अनुमानित पैरामीटर मान के आसपास बनाया गया है और दिखाता है कि अनुमानित पैरामीटर का सही मान प्राथमिकता दी गई संभावना के साथ कहां स्थित है।

माध्य के लिए विश्वास अंतराल का निर्माण होता है इस अनुसार:

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का आकलन करने के लिए, प्रबंधक ने उन लोगों में से 40 आगंतुकों का बेतरतीब ढंग से चयन करने की योजना बनाई है, जिन्होंने पहले से ही इसे आजमाया है और उन्हें 1 से 10 के अंकों में नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए आमंत्रित किया है। प्रबंधक अपेक्षित संख्या का अनुमान लगाना चाहता है। नए उत्पाद को प्राप्त होने वाले अंक और इस अनुमान के लिए 95% विश्वास अंतराल की साजिश रचेंगे। यह कैसे किया जा सकता है? (देखें फ़ाइल SANDWICH1.XLS (टेम्पलेट और समाधान)।

समाधान

इस समस्या को हल करने के लिए, आप उपयोग कर सकते हैं। परिणाम छवि में दिखाया गया है। 97
.

संचयी मूल्य के लिए विश्वास अंतराल

कभी-कभी, नमूना डेटा के आधार पर, गणितीय अपेक्षा का नहीं, बल्कि मूल्यों के कुल योग का अनुमान लगाना आवश्यक होता है। उदाहरण के लिए, एक लेखा परीक्षक की स्थिति में, किसी खाते के औसत मूल्य का अनुमान लगाना रुचि का नहीं हो सकता है, लेकिन सभी खातों का योग।

चलो एन - तत्वों की कुल संख्या, एन - नमूना आकार, टी 3 - नमूने में मूल्यों का योग, टी "- पूरी आबादी पर योग का अनुमान, फिर , और विश्वास अंतराल की गणना सूत्र द्वारा की जाती है, जहां s नमूने के लिए मानक विचलन का अनुमान है, नमूने के माध्य का अनुमान है।

उदाहरण

मान लें कि कुछ कर कार्यालय 10,000 करदाताओं के लिए कुल टैक्स रिफंड का अनुमान लगाना चाहते हैं। करदाता या तो धनवापसी प्राप्त करता है या अतिरिक्त करों का भुगतान करता है। लौटाई गई राशि के लिए 95% विश्वास अंतराल खोजें, मान लें कि नमूना आकार 500 लोग हैं (रिटर्न का योग देखें। एक्सएलएस (टेम्पलेट और समाधान)।

समाधान

इस मामले के लिए StatPro में कोई विशेष प्रक्रिया नहीं है, हालांकि, आप देखेंगे कि उपरोक्त सूत्रों (चित्र 98) के आधार पर सीमा से माध्य के लिए सीमाएं प्राप्त की जा सकती हैं।
).

अनुपात के लिए विश्वास अंतराल

मान लें कि p ग्राहकों के हिस्से की गणितीय अपेक्षा है, और p आकार n के नमूने से प्राप्त इस शेयर के अनुमान में है। यह दिखाया जा सकता है कि पर्याप्त रूप से बड़े के लिए अनुमान का वितरण औसत पी और मानक विचलन के साथ सामान्य के करीब होगा ... इस मामले में, अनुमान की मानक त्रुटि के रूप में व्यक्त किया जाता है , और विश्वास अंतराल के रूप में .

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक ने यादृच्छिक रूप से उन लोगों में से 40 आगंतुकों का चयन किया, जिन्होंने पहले से ही इसे आजमाया है और उन्हें 1 से 10 तक के अंकों में नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए आमंत्रित किया है। प्रबंधक ग्राहकों की अपेक्षित हिस्सेदारी का अनुमान लगाना चाहता है। जो नए उत्पाद को कम से कम 6 अंक से अधिक रेट करता है (वह उम्मीद करता है कि ये ग्राहक नए उत्पाद के उपभोक्ता होंगे)।

समाधान

प्रारंभ में, हम 1 के आधार पर एक नया कॉलम बनाते हैं यदि क्लाइंट का स्कोर 6 अंक से अधिक था और 0 अन्यथा (फाइल SANDWICH2.XLS (टेम्पलेट और समाधान) देखें)।

विधि 1

मात्रा 1 की गणना करते हुए, हम हिस्से का अनुमान लगाते हैं, और फिर हम सूत्रों का उपयोग करते हैं।

z cr मान सामान्य वितरण की विशेष तालिकाओं से लिया जाता है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।

95% अंतराल बनाने के लिए इस दृष्टिकोण और विशिष्ट डेटा का उपयोग करके, हम निम्नलिखित परिणाम प्राप्त करते हैं (चित्र 99 .)
) पैरामीटर z करोड़ का महत्वपूर्ण मान 1.96 है। अनुमान की मानक त्रुटि 0.077 है। विश्वास अंतराल की निचली सीमा 0.475 है। विश्वास अंतराल की ऊपरी सीमा 0.775 है। इस प्रकार, प्रबंधक को 95% विश्वास के साथ यह मानने का अधिकार है कि नए उत्पाद को 6 अंक या अधिक रेट करने वाले ग्राहकों का प्रतिशत 47.5 और 77.5 के बीच होगा।

विधि 2

इस कार्य को मानक StatPro टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, यह ध्यान देने योग्य है कि इस मामले में शेयर टाइप कॉलम के औसत मूल्य के साथ मेल खाता है। अगला, आइए आवेदन करें StatPro / सांख्यिकीय अनुमान / एक-नमूना विश्लेषणटाइप कॉलम के लिए माध्य (अपेक्षित मान का अनुमान) का विश्वास अंतराल बनाने के लिए। इस मामले में प्राप्त परिणाम पहली विधि (छवि 99) के परिणाम के बहुत करीब होगा।

मानक विचलन के लिए विश्वास अंतराल

मानक विचलन के अनुमान के रूप में, s का उपयोग किया जाता है (सूत्र खंड 1 में दिया गया है)। अनुमान s का घनत्व फलन ची-वर्ग फलन है, जिसमें t-वितरण की तरह n-1 डिग्री की स्वतंत्रता है। इस CHIDIST और CHIINV वितरण के साथ काम करने के लिए विशेष कार्य हैं।

इस मामले में विश्वास अंतराल अब सममित नहीं होगा। सीमाओं का एक योजनाबद्ध आरेख अंजीर में दिखाया गया है। एक सौ ।

उदाहरण

मशीन को 10 सेमी के व्यास के साथ भागों का उत्पादन करना चाहिए हालांकि, विभिन्न परिस्थितियों के कारण त्रुटियां होती हैं। गुणवत्ता निरीक्षक दो चीजों के बारे में चिंतित है: पहला, औसत 10 सेमी होना चाहिए; दूसरे, इस मामले में भी, यदि विचलन बड़े हैं, तो कई भागों को खारिज कर दिया जाएगा। हर दिन वह 50 भागों का एक नमूना बनाता है (फ़ाइल गुणवत्ता नियंत्रण देखें। XLS (टेम्पलेट और समाधान)। ऐसा नमूना क्या निष्कर्ष दे सकता है?

समाधान

माध्य और मानक विचलन का उपयोग करके 95% विश्वास अंतरालों को प्लॉट करें StatPro / सांख्यिकीय अनुमान / एक-नमूना विश्लेषण(अंजीर। 101
).

इसके अलावा, व्यास के सामान्य वितरण की धारणा का उपयोग करते हुए, हम दोषपूर्ण उत्पादों के अनुपात की गणना करते हैं, 0.065 का अधिकतम विचलन निर्धारित करते हैं। प्रतिस्थापन तालिका (दो मापदंडों का मामला) की क्षमताओं का उपयोग करते हुए, हम माध्य और मानक विचलन (चित्र। 102) पर अस्वीकार के हिस्से की निर्भरता का निर्माण करेंगे।
).

दो साधनों के बीच अंतर के लिए कॉन्फिडेंस इंटरवल

यह सांख्यिकीय विधियों के सबसे महत्वपूर्ण अनुप्रयोगों में से एक है। स्थितियों के उदाहरण।

    एक कपड़े की दुकान का प्रबंधक यह जानना चाहेगा कि एक औसत महिला दुकानदार एक पुरुष की तुलना में एक दुकान में कितना अधिक या कम खर्च करती है।

    दोनों एयरलाइंस समान मार्गों पर उड़ान भरती हैं। उपभोक्ता संगठन दोनों एयरलाइनों के लिए औसत अपेक्षित उड़ान विलंब के बीच अंतर की तुलना करना चाहेगा।

    कंपनी कुछ प्रकार के सामानों के लिए कूपन एक शहर में भेजती है और दूसरे में नहीं भेजती है। प्रबंधक अगले दो महीनों में इन वस्तुओं की औसत खरीद मात्रा की तुलना करना चाहते हैं।

    कार डीलर अक्सर प्रस्तुतियों में विवाहित जोड़ों के साथ व्यवहार करता है। एक प्रस्तुति के लिए उनकी व्यक्तिगत प्रतिक्रियाओं को समझने के लिए जोड़ों का अक्सर अलग-अलग साक्षात्कार किया जाता है। प्रबंधक पुरुषों और महिलाओं द्वारा रिपोर्ट की गई रेटिंग में अंतर का आकलन करना चाहता है।

स्वतंत्र नमूने का मामला

साधनों के बीच का अंतर n 1 + n 2 - 2 डिग्री स्वतंत्रता के साथ t-वितरण होगा। μ 1 - μ 2 के लिए विश्वास अंतराल अनुपात द्वारा व्यक्त किया जाता है:

यह कार्य न केवल उपरोक्त सूत्रों द्वारा हल किया जा सकता है, बल्कि मानक स्टेटप्रो टूल द्वारा भी हल किया जा सकता है। ऐसा करने के लिए, यह लागू करने के लिए पर्याप्त है

अनुपात के बीच अंतर के लिए विश्वास अंतराल

आइए शेयरों की गणितीय अपेक्षा करें। आज्ञा देना उनके नमूना अनुमान क्रमशः आकार n 1 और n 2 के नमूनों से निर्मित हैं। फिर अंतर के लिए अनुमान है। इसलिए, इस अंतर के लिए विश्वास अंतराल इस प्रकार व्यक्त किया जाता है:

यहाँ z cr विशेष तालिकाओं के अनुसार सामान्य वितरण से प्राप्त मूल्य है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।

अनुमान की मानक त्रुटि इस मामले में अनुपात द्वारा व्यक्त की जाती है:

.

उदाहरण

स्टोर ने बड़ी बिक्री की तैयारी में निम्नलिखित बाजार अनुसंधान किया है। शीर्ष 300 खरीदारों का चयन किया गया, जो बदले में बेतरतीब ढंग से 150 सदस्यों के दो समूहों में विभाजित हो गए। सभी चयनित खरीदारों को बिक्री में भाग लेने के लिए निमंत्रण भेजा गया था, लेकिन केवल पहले समूह के सदस्यों के लिए एक कूपन संलग्न किया गया था, जो उन्हें 5% छूट का हकदार था। सेल के दौरान सभी चयनित 300 खरीदारों की खरीदारी दर्ज की गई। एक प्रबंधक परिणामों की व्याख्या कैसे कर सकता है और कूपन वितरण की प्रभावशीलता पर निष्कर्ष निकाल सकता है? (फाइल देखें COUPONS.XLS (टेम्पलेट और समाधान))।

समाधान

हमारे विशेष मामले के लिए, छूट कूपन प्राप्त करने वाले 150 खरीदारों में से, 55 ने बिक्री पर खरीदारी की, और 150 में से जिन्हें कूपन नहीं मिला, केवल 35 ने खरीदारी की (चित्र 103)
) तब नमूना अनुपात का मान क्रमशः 0.3667 और 0.2333 है। और उनके बीच नमूना अंतर क्रमशः 0.1333 है। विश्वास अंतराल को 95% मानते हुए, हम सामान्य वितरण तालिका से z cr = 1.96 पाते हैं। नमूना अंतर की मानक त्रुटि की गणना 0.0524 है। अंत में, हम पाते हैं कि 95% विश्वास अंतराल की निचली सीमा क्रमशः 0.0307 है, और ऊपरी सीमा क्रमशः 0.2359 है। परिणामों का अर्थ यह निकाला जा सकता है कि छूट कूपन प्राप्त करने वाले प्रत्येक 100 ग्राहकों के लिए, आप 3 से 23 नए ग्राहकों की अपेक्षा कर सकते हैं। हालांकि, यह ध्यान में रखा जाना चाहिए कि इस निष्कर्ष का मतलब कूपन के उपयोग की प्रभावशीलता नहीं है (चूंकि, छूट प्रदान करके, हम लाभ में खो देते हैं!)। आइए विशिष्ट डेटा का उपयोग करके इसे प्रदर्शित करें। मान लीजिए कि औसत खरीद आकार 400 रूबल है, जिसमें से 50 रूबल। दुकान का लाभ है। फिर कूपन प्राप्त नहीं करने वाले प्रति 100 खरीदारों पर अपेक्षित लाभ है:

50 0.2333 100 = 1166.50 रूबल।

कूपन प्राप्त करने वाले 100 खरीदारों के लिए इसी तरह की गणना दें:

30 0.3667 100 = 1100.10 रूबल।

औसत लाभ में 30 की कमी इस तथ्य के कारण है कि छूट का उपयोग करके, कूपन प्राप्त करने वाले ग्राहक औसतन 380 रूबल की खरीदारी करेंगे।

इस प्रकार, अंतिम निष्कर्ष इस विशेष स्थिति में ऐसे कूपन का उपयोग करने की अप्रभावीता की बात करता है।

टिप्पणी। इस कार्य को मानक StatPro टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, इस समस्या को विधि द्वारा दो साधनों के अंतर का अनुमान लगाने की समस्या को कम करना और फिर लागू करना पर्याप्त है StatPro / सांख्यिकीय अनुमान / दो-नमूना विश्लेषणदो माध्य मानों के बीच अंतर के लिए एक विश्वास अंतराल बनाने के लिए।

कॉन्फिडेंस इंटरवल लेंथ कंट्रोल

विश्वास अंतराल की लंबाई निर्भर करती है निम्नलिखित शर्तें:

    प्रत्यक्ष डेटा (मानक विचलन);

    सार्थक तल;

    नमूने का आकार।

माध्य का अनुमान लगाने के लिए नमूना आकार

सबसे पहले, सामान्य मामले में समस्या पर विचार करें। आइए हम दिए गए विश्वास अंतराल की आधी लंबाई के मान को B के रूप में निर्दिष्ट करें (चित्र 104 .)
) हम जानते हैं कि कुछ यादृच्छिक चर X के माध्य मान के लिए विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है , कहाँ पे ... यह मानते हुए:

और n व्यक्त करते हुए, हम प्राप्त करते हैं।

दुर्भाग्य से, हम यादृच्छिक चर X के प्रसरण का सटीक मान नहीं जानते हैं। इसके अलावा, हम t करोड़ का मूल्य नहीं जानते हैं, क्योंकि यह स्वतंत्रता की डिग्री की संख्या के माध्यम से n पर निर्भर करता है। इस स्थिति में, हम निम्नानुसार आगे बढ़ सकते हैं। विचरण s के बजाय, हम अध्ययन के तहत यादृच्छिक चर के किसी भी उपलब्ध अहसास के आधार पर विचरण के अनुमान का उपयोग करते हैं। t cr मान के बजाय, हम सामान्य वितरण के लिए z cr मान का उपयोग करते हैं। यह काफी स्वीकार्य है, क्योंकि सामान्य और टी-वितरण के लिए वितरण घनत्व कार्य बहुत करीब हैं (छोटे एन के मामले को छोड़कर)। इस प्रकार, मांगा गया सूत्र रूप लेता है:

.

चूंकि सूत्र देता है, आम तौर पर बोलते हुए, गैर-पूर्णांक परिणाम, वांछित नमूना आकार परिणाम के अतिरिक्त गोलाई के रूप में लिया जाता है।

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसके लिए मांग का आकलन करने के लिए, प्रबंधक उन लोगों में से एक निश्चित संख्या में आगंतुकों का चयन करने की योजना बना रहा है जिन्होंने पहले से ही इसे आजमाया है और उन्हें 1 से 10 तक के अंकों में नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए आमंत्रित किया है। प्रबंधक अनुमान लगाना चाहता है अंक की अपेक्षित संख्या जो नए को प्राप्त होगी। इस अनुमान के लिए उत्पाद और 95% विश्वास अंतराल का निर्माण करें। साथ ही, वह चाहता है कि कॉन्फिडेंस इंटरवल की आधी चौड़ाई 0.3 से अधिक न हो। उसे कितने आगंतुकों का साक्षात्कार लेना चाहिए?

निम्नलिखित नुसार:

यहाँ आर ओटीएसअंश p का अनुमान है, और B विश्वास अंतराल की लंबाई का आधा दिया गया है। मान का उपयोग करके n के लिए एक overestimate प्राप्त किया जा सकता है आर ओटीएस= 0.5. इस मामले में, विश्वास अंतराल की लंबाई p के किसी भी वास्तविक मान के लिए B के दिए गए मान से अधिक नहीं होगी।

उदाहरण

पिछले उदाहरण के प्रबंधक को उन ग्राहकों के अनुपात का अनुमान लगाने की योजना बनाने दें, जो एक नए प्रकार के उत्पाद को पसंद करते हैं। वह 90% विश्वास अंतराल बनाना चाहता है जिसकी आधी लंबाई 0.05 से अधिक न हो। यादृच्छिक नमूने में कितने ग्राहकों को शामिल किया जाना चाहिए?

समाधान

हमारे मामले में, z करोड़ का मान = 1.645। इसलिए, आवश्यक राशि की गणना इस प्रकार की जाती है .

यदि प्रबंधक के पास यह मानने का कारण था कि p का वांछित मान, उदाहरण के लिए, लगभग 0.3 है, तो, इस मान को उपरोक्त सूत्र में प्रतिस्थापित करने पर, हमें यादृच्छिक नमूने का एक छोटा मान प्राप्त होगा, अर्थात् 228।

निर्धारण के लिए सूत्र यादृच्छिक नमूना आकार दो माध्यमों के बीच अंतर के मामले मेंके रूप में लिखा है:

.

उदाहरण

कुछ कंप्यूटर कंपनी का एक ग्राहक सेवा केंद्र है। हाल ही में, सेवा की खराब गुणवत्ता के बारे में ग्राहकों की शिकायतों की संख्या में वृद्धि हुई है। सेवा केंद्र मुख्य रूप से दो प्रकार के कर्मचारियों को नियुक्त करता है: जिनके पास अधिक अनुभव नहीं है, लेकिन जिन्होंने विशेष तैयारी पाठ्यक्रम पूरा कर लिया है, और जिनके पास व्यापक व्यावहारिक अनुभव है, लेकिन जिन्होंने विशेष पाठ्यक्रम पूरा नहीं किया है। कंपनी पिछले छह महीनों में ग्राहकों की शिकायतों का विश्लेषण करना चाहती है और कर्मचारियों के दो समूहों में से प्रत्येक के लिए उनकी औसत संख्या की तुलना करना चाहती है। यह माना जाता है कि दोनों समूहों के लिए नमूनों में मात्रा समान होगी। 95% अंतराल प्राप्त करने के लिए नमूने में कितने कर्मचारियों को शामिल किया जाना चाहिए, जिसकी आधी लंबाई 2 से अधिक नहीं होनी चाहिए?

समाधान

यहां оц दोनों यादृच्छिक चरों के मानक विचलन का अनुमान है, इस धारणा के तहत कि वे करीब हैं। इस प्रकार, हमारे कार्य में, हमें किसी तरह यह अनुमान प्राप्त करने की आवश्यकता है। यह किया जा सकता है, उदाहरण के लिए, इस प्रकार है। पिछले छह महीनों में ग्राहकों की शिकायतों के आंकड़ों को देखने के बाद, एक प्रबंधक यह देख सकता है कि प्रत्येक कर्मचारी के लिए आम तौर पर 6 से 36 शिकायतें होती हैं। यह जानते हुए कि एक सामान्य वितरण के लिए, लगभग सभी मूल्यों को तीन से अधिक मानक विचलन द्वारा माध्य से हटा दिया जाता है, वह यथोचित रूप से विश्वास कर सकता है कि:

, जहां से оц = 5.

इस मान को सूत्र में प्रतिस्थापित करने पर, हम प्राप्त करते हैं .

निर्धारण के लिए सूत्र शेयरों के बीच अंतर का अनुमान लगाने के मामले में यादृच्छिक नमूने का आकारकी तरह लगता है:

उदाहरण

एक निश्चित कंपनी के समान उत्पाद बनाने वाली दो फैक्ट्रियां हैं। एक कंपनी प्रबंधक दोनों कारखानों में दोषपूर्ण उत्पादों के अनुपात की तुलना करना चाहता है। उपलब्ध जानकारी के अनुसार दोनों फैक्ट्रियों में कबाड़ की दर 3 से 5 फीसदी के बीच है. इसे 99% कॉन्फिडेंस इंटरवल बनाना चाहिए जिसकी आधी लंबाई 0.005 (या 0.5%) से अधिक न हो। प्रत्येक कारखाने से कितनी वस्तुएँ लेनी चाहिए?

समाधान

यहाँ p 1ots और p 2ots पहली और दूसरी फ़ैक्टरियों में दो अज्ञात स्क्रैप दरों के अनुमान हैं। यदि हम p 1ots = p 2ots = 0.5 रखते हैं, तो हमें n के लिए एक अधिक अनुमानित मान प्राप्त होता है। लेकिन चूंकि हमारे मामले में हमारे पास इन शेयरों के बारे में कुछ प्राथमिक जानकारी है, इसलिए हम इन शेयरों का ऊपरी अनुमान, अर्थात् 0.05 लेते हैं। हम पाते हैं

जब नमूना डेटा से जनसंख्या के कुछ मापदंडों का अनुमान लगाया जाता है, तो यह न केवल पैरामीटर का एक बिंदु अनुमान देने के लिए उपयोगी होता है, बल्कि एक विश्वास अंतराल को इंगित करने के लिए भी उपयोगी होता है जो दर्शाता है कि अनुमानित पैरामीटर का सटीक मूल्य कहाँ स्थित हो सकता है।

इस अध्याय में, हम उन मात्रात्मक अनुपातों से भी परिचित हुए जो हमें विभिन्न मापदंडों के लिए ऐसे अंतरालों का निर्माण करने की अनुमति देते हैं; कॉन्फिडेंस इंटरवल की लंबाई को नियंत्रित करना सीखा।

यह भी ध्यान दें कि नमूना आकार (प्रयोग की योजना बनाने की समस्या) का अनुमान लगाने की समस्या को मानक स्टेटप्रो टूल्स का उपयोग करके हल किया जा सकता है, अर्थात् StatPro / सांख्यिकीय अनुमान / नमूना आकार चयन.

आंकड़ों के क्षेत्र से हमारे पास कॉन्फिडेंस इंटरवल आया। यह एक विशिष्ट श्रेणी है जिसका उपयोग उच्च स्तर की विश्वसनीयता वाले अज्ञात पैरामीटर का अनुमान लगाने के लिए किया जाता है। इसे समझाने का सबसे आसान तरीका एक उदाहरण है।

मान लीजिए कि आप कुछ यादृच्छिक चर की जांच करना चाहते हैं, उदाहरण के लिए, क्लाइंट अनुरोध के लिए सर्वर की प्रतिक्रिया दर। हर बार जब कोई उपयोगकर्ता किसी विशिष्ट साइट का पता टाइप करता है, तो सर्वर उस पर एक अलग गति से प्रतिक्रिया करता है। इस प्रकार, जांच की गई प्रतिक्रिया समय यादृच्छिक है। तो, विश्वास अंतराल हमें इस पैरामीटर की सीमाओं को निर्धारित करने की अनुमति देता है, और फिर यह तर्क दिया जा सकता है कि 95% की संभावना के साथ सर्वर हमारे द्वारा गणना की गई सीमा में होगा।

या आपको यह पता लगाने की जरूरत है कि कंपनी के ब्रांड के बारे में कितने लोग जानते हैं। जब विश्वास अंतराल की गणना की जाती है, उदाहरण के लिए, यह कहना संभव होगा कि 95% संभावना के साथ उपभोक्ताओं की हिस्सेदारी 27% से 34% के बीच है।

इस शब्द से निकटता से संबंधित एक ऐसा मूल्य है जो आत्मविश्वास का स्तर है। यह इस संभावना का प्रतिनिधित्व करता है कि वांछित पैरामीटर विश्वास अंतराल में शामिल है। हमारी वांछित सीमा कितनी बड़ी होगी यह इस मूल्य पर निर्भर करता है। यह जितना अधिक मूल्य लेता है, विश्वास अंतराल उतना ही संकीर्ण होता जाता है, और इसके विपरीत। आमतौर पर यह 90%, 95% या 99% पर सेट होता है। 95% मान सबसे लोकप्रिय है।

यह सूचक प्रेक्षणों के प्रसरण से भी प्रभावित होता है और इसकी परिभाषा इस धारणा पर आधारित है कि अध्ययन किया गया गुण पालन करता है इस कथन को गॉस का नियम भी कहा जाता है। उनके अनुसार, एक सतत यादृच्छिक चर की सभी संभावनाओं के इस तरह के वितरण को सामान्य कहा जाता है, जिसे संभाव्यता घनत्व द्वारा वर्णित किया जा सकता है। यदि सामान्य वितरण धारणा गलत हो जाती है, तो अनुमान गलत हो सकता है।

सबसे पहले, आइए जानें कि यहां के लिए कॉन्फिडेंस इंटरवल की गणना कैसे करें, दो मामले संभव हैं। प्रसरण (एक यादृच्छिक चर के फैलाव की डिग्री) ज्ञात किया जा सकता है या नहीं। यदि यह ज्ञात है, तो हमारे विश्वास अंतराल की गणना निम्न सूत्र का उपयोग करके की जाती है:

ср - टी * / (वर्ग (एन))<= α <= хср + t*σ / (sqrt(n)), где

α एक संकेत है,

टी - लाप्लास वितरण तालिका से पैरामीटर,

प्रसरण का वर्गमूल है।

यदि विचरण अज्ञात है, तो इसकी गणना की जा सकती है यदि हम वांछित विशेषता के सभी मूल्यों को जानते हैं। इसके लिए निम्न सूत्र का प्रयोग किया जाता है:

2 = х2ср - (хср) 2, जहां

2ср - जांच की गई सुविधा के वर्गों का औसत मूल्य,

(хср) 2 - दिए गए फीचर का वर्ग।

इस मामले में जिस सूत्र द्वारा विश्वास अंतराल की गणना की जाती है वह थोड़ा बदल जाता है:

एक्ससीआर - टी * एस / (वर्ग (एन))<= α <= хср + t*s / (sqrt(n)), где

ср - नमूना माध्य,

α एक संकेत है,

t एक पैरामीटर है जो छात्र की वितरण तालिका t = t (ɣ; n-1) का उपयोग करके पाया जाता है,

sqrt (n) - कुल नमूना आकार का वर्गमूल,

s विचरण का वर्गमूल है।

इस उदाहरण पर विचार करें। मान लीजिए कि 7 मापों के परिणामों के अनुसार, जांच की गई विशेषता 30 के बराबर और नमूना भिन्नता 36 के बराबर निर्धारित की गई थी। 99% आत्मविश्वास अंतराल की संभावना के साथ खोजना आवश्यक है, जिसमें मापा का सही मूल्य होता है पैरामीटर।

सबसे पहले, आइए निर्धारित करें कि t किसके बराबर है: t = t (0.99; 7-1) = 3.71। उपरोक्त सूत्र का उपयोग करते हुए, हम प्राप्त करते हैं:

एक्ससीआर - टी * एस / (वर्ग (एन))<= α <= хср + t*s / (sqrt(n))

30 - 3.71 * 36 / (वर्ग (7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

विचरण के लिए विश्वास अंतराल की गणना ज्ञात माध्य के मामले में की जाती है और जब गणितीय अपेक्षा पर कोई डेटा नहीं होता है, लेकिन विचरण के बिंदु निष्पक्ष अनुमान का मूल्य ही ज्ञात होता है। हम यहां इसकी गणना के लिए सूत्र नहीं देंगे, क्योंकि वे काफी जटिल हैं और यदि वांछित है, तो वे हमेशा नेट पर पाए जा सकते हैं।

हम केवल यह नोट करते हैं कि एक्सेल या नेटवर्क सेवा का उपयोग करके आत्मविश्वास अंतराल निर्धारित करना सुविधाजनक है, जिसे कहा जाता है।

कोई भी नमूना सामान्य जनसंख्या का केवल एक अनुमानित विचार देता है, और सभी नमूना सांख्यिकीय विशेषताओं (माध्य, मोड, विचरण ...) सामान्य जनसंख्या की अनुपलब्धता के लिए (चित्र 20) ...

चित्र 20. नमूनाकरण त्रुटि

लेकिन आप उस अंतराल को निर्दिष्ट कर सकते हैं जिसमें सांख्यिकीय विशेषता का सही (सामान्य) मान एक निश्चित डिग्री की संभावना के साथ होता है। इस अंतराल को कहा जाता है डी कॉन्फिडेंस इंटरवल (सीआई)।

तो 95% की संभावना के साथ सामान्य औसत के भीतर है

से, (20)

कहाँ पे टी - के लिए छात्र मानदंड का सारणीबद्ध मान α = 0.05 और एफ= एन-1

इस मामले में 99% सीआई पाया जा सकता है टी के लिए चयनित α =0,01.

विश्वास अंतराल का व्यावहारिक महत्व क्या है?

    एक विस्तृत विश्वास अंतराल इंगित करता है कि नमूना माध्य सामान्य माध्य को सटीक रूप से नहीं दर्शाता है। यह आमतौर पर अपर्याप्त नमूना आकार, या इसकी विविधता के कारण होता है, अर्थात। उच्च विचरण। दोनों माध्य की एक बड़ी त्रुटि देते हैं और, तदनुसार, एक व्यापक CI। और यह अध्ययन के नियोजन चरण में लौटने का आधार है।

    CI की ऊपरी और निचली सीमाएं यह आकलन करती हैं कि क्या परिणाम चिकित्सकीय रूप से महत्वपूर्ण होंगे

आइए हम समूह गुणों के अध्ययन के परिणामों के सांख्यिकीय और नैदानिक ​​​​महत्व के प्रश्न पर कुछ और विस्तार से ध्यान दें। याद रखें कि आँकड़ों का कार्य नमूना डेटा के आधार पर कम से कम आबादी में किसी भी अंतर का पता लगाना है। किसी भी (सभी नहीं) मतभेदों की पहचान करना चिकित्सक का काम है जो निदान या उपचार में सहायता करेगा। और हमेशा सांख्यिकीय निष्कर्ष नैदानिक ​​​​निष्कर्षों का आधार नहीं होते हैं। इस प्रकार, हीमोग्लोबिन में 3 ग्राम / लीटर की सांख्यिकीय रूप से महत्वपूर्ण कमी चिंता का कारण नहीं है। और, इसके विपरीत, यदि मानव शरीर में किसी समस्या का संपूर्ण जनसंख्या के स्तर पर एक व्यापक चरित्र नहीं है, तो यह इस समस्या से निपटने का कोई कारण नहीं है।

हम इस प्रावधान पर विचार करेंगे: उदाहरण.

शोधकर्ताओं ने सोचा कि क्या जिन लड़कों को कोई संक्रामक बीमारी थी, वे अपने साथियों से पिछड़ रहे थे। इसके लिए एक सैंपल स्टडी की गई, जिसमें इस बीमारी से पीड़ित 10 लड़कों ने हिस्सा लिया। परिणाम तालिका 23 में दिखाए गए हैं।

तालिका 23. सांख्यिकीय प्रसंस्करण परिणाम

निचली सीमा

ऊपरी सीमा

मानक (सेमी)

मध्यम

इन गणनाओं से यह पता चलता है कि 10 वर्षीय लड़कों की चयनात्मक औसत ऊंचाई, जो एक निश्चित संक्रामक बीमारी से गुज़रे हैं, आदर्श (132.5 सेमी) के करीब हैं। हालांकि, आत्मविश्वास अंतराल (126.6 सेमी) की निचली सीमा इंगित करती है कि 95% संभावना है कि इन बच्चों की वास्तविक औसत ऊंचाई "छोटी ऊंचाई" की अवधारणा से मेल खाती है, अर्थात। ये बच्चे बौने हैं।

इस उदाहरण में, सीआई गणना के परिणाम चिकित्सकीय रूप से महत्वपूर्ण हैं।

साधारण मापों के विशाल बहुमत के लिए, यादृच्छिक त्रुटियों का तथाकथित सामान्य नियम ( गॉस का नियम)निम्नलिखित अनुभवजन्य प्रावधानों से प्राप्त।

1) माप त्रुटियां मूल्यों की एक सतत श्रृंखला पर ले जा सकती हैं;

2) बड़ी संख्या में माप के साथ, एक ही परिमाण की त्रुटियां, लेकिन अलग-अलग संकेत, समान रूप से अक्सर होते हैं,

3) यादृच्छिक त्रुटि का मान जितना अधिक होगा, उसके घटित होने की संभावना उतनी ही कम होगी।

सामान्य गाऊसी वितरण का ग्राफ चित्र 1 में दिखाया गया है। वक्र के लिए समीकरण है

यादृच्छिक त्रुटियों (त्रुटियों) का वितरण कार्य कहाँ है, जो त्रुटि की संभावना को दर्शाता है, माध्य वर्ग त्रुटि है।

मान एक यादृच्छिक चर नहीं है और माप प्रक्रिया की विशेषता है। यदि माप की स्थिति नहीं बदलती है, तो स्थिर रहता है। इस मात्रा का वर्ग कहलाता है माप की भिन्नता।विचरण जितना छोटा होगा, व्यक्तिगत मूल्यों का बिखराव उतना ही छोटा होगा और माप सटीकता उतनी ही अधिक होगी।

मूल माध्य वर्ग त्रुटि का सटीक मान, साथ ही मापी गई मात्रा का सही मान अज्ञात है। इस पैरामीटर का एक तथाकथित सांख्यिकीय अनुमान है, जिसके अनुसार माध्य वर्ग त्रुटि अंकगणित माध्य के माध्य वर्ग त्रुटि के बराबर है। जिसका मान सूत्र द्वारा निर्धारित किया जाता है

परिणाम कहाँ है मैंवें माप; - प्राप्त मूल्यों का अंकगणितीय माध्य; एन- माप की संख्या।

माप की संख्या जितनी बड़ी होगी, उतना ही छोटा और जितना अधिक वह के करीब पहुंचेगा। यदि मापे गए मान का सही मान μ, माप के परिणामस्वरूप प्राप्त इसका अंकगणितीय माध्य मान और एक यादृच्छिक निरपेक्ष त्रुटि है, तो माप परिणाम को रूप में लिखा जाएगा।

से मानों की वह श्रेणी जिसमें मापे गए मान का वास्तविक मान μ गिरता है, कहलाता है विश्वास अंतराल।चूँकि यह एक यादृच्छिक चर है, वास्तविक मान एक प्रायिकता α के साथ विश्वास अंतराल में आता है, जिसे कहा जाता है आत्मविश्वास स्तर,या विश्वसनीयतामाप। यह मान संख्यात्मक रूप से छायांकित घुमावदार समलंब के क्षेत्रफल के बराबर है। (अंजीर देखें।)

यह सब पर्याप्त रूप से बड़ी संख्या में माप के लिए सच है जब यह के करीब होता है। कम संख्या में माप के लिए आत्मविश्वास अंतराल और आत्मविश्वास के स्तर को खोजने के लिए, जिसे हम प्रयोगशाला कार्य के दौरान व्यवहार करते हैं, हम उपयोग करते हैं छात्र की संभावना वितरण।यह एक यादृच्छिक चर का प्रायिकता वितरण है जिसे कहा जाता है छात्र का गुणांक, अंकगणित माध्य के माध्य वर्ग त्रुटि के अंशों में विश्वास अंतराल का मान देता है।


इस मात्रा का संभाव्यता वितरण 2 पर निर्भर नहीं करता है, लेकिन अनिवार्य रूप से प्रयोगों की संख्या पर निर्भर करता है एन।प्रयोगों की संख्या में वृद्धि के साथ एनविद्यार्थी का वितरण गाऊसी वितरण की ओर जाता है।

वितरण फलन सारणीबद्ध है (तालिका 1)। मापन की संख्या के अनुरूप रेखा के प्रतिच्छेदन पर विद्यार्थी के गुणांक का मान होता है एन, और विश्वास प्रायिकता के अनुरूप स्तंभ α

आवृत्तियों और भार के लिए विश्वास अंतराल

© 2008

सार्वजनिक स्वास्थ्य के राष्ट्रीय संस्थान, ओस्लो, नॉर्वे

लेख वाल्ड, विल्सन, क्लॉपर - पियर्सन के तरीकों के अनुसार आवृत्तियों और अंशों के लिए आत्मविश्वास अंतराल की गणना का वर्णन और चर्चा करता है, कोणीय परिवर्तन का उपयोग करके और वाल्ड विधि के अनुसार Agresti - Cole के अनुसार सुधार के साथ। प्रस्तुत सामग्री आवृत्तियों और अंशों के लिए विश्वास अंतराल की गणना के तरीकों के बारे में सामान्य जानकारी प्रदान करती है और इसका उद्देश्य पत्रिका के पाठकों की रुचि को न केवल अपने स्वयं के शोध के परिणामों को प्रस्तुत करते समय आत्मविश्वास अंतराल के उपयोग में जगाना है, बल्कि इसमें भी है भविष्य के प्रकाशनों पर काम शुरू करने से पहले विशेष साहित्य पढ़ना।

कीवर्ड: आत्मविश्वास अंतराल, आवृत्ति, अनुपात

पिछले प्रकाशनों में से एक में, गुणात्मक डेटा के विवरण का संक्षेप में उल्लेख किया गया था और यह बताया गया था कि सामान्य आबादी में अध्ययन की गई विशेषता की आवृत्ति का वर्णन करने के लिए उनके अंतराल अनुमान बिंदु अनुमान से बेहतर है। वास्तव में, चूंकि अध्ययन नमूना डेटा का उपयोग करके किया जाता है, सामान्य आबादी पर परिणामों के प्रक्षेपण में नमूना अनुमान में अशुद्धि का एक तत्व होना चाहिए। विश्वास अंतराल अनुमानित पैरामीटर की सटीकता का एक उपाय है। दिलचस्प बात यह है कि चिकित्सा पेशेवरों के लिए बुनियादी आंकड़ों पर कुछ पुस्तकों में, आवृत्तियों के लिए आत्मविश्वास अंतराल के विषय को पूरी तरह से नजरअंदाज कर दिया गया है। इस लेख में, हम आवृत्तियों के लिए आत्मविश्वास अंतराल की गणना के लिए कई तरीकों पर विचार करेंगे, जो नमूने की ऐसी विशेषताओं को गैर-पुनरावृत्ति और प्रतिनिधित्व के साथ-साथ एक दूसरे से टिप्पणियों की स्वतंत्रता के रूप में दर्शाते हैं। इस लेख में आवृत्ति को एक निरपेक्ष संख्या के रूप में नहीं समझा जाता है, जो यह दर्शाता है कि किसी दिए गए मान को कुल में कितनी बार आता है, लेकिन एक सापेक्ष मूल्य के रूप में जो अनुसंधान प्रतिभागियों के अनुपात को निर्धारित करता है जिसमें अध्ययन के तहत विशेषता होती है।


बायोमेडिकल रिसर्च में, 95% कॉन्फिडेंस इंटरवल का सबसे अधिक उपयोग किया जाता है। यह विश्वास अंतराल वह क्षेत्र है जहां वास्तविक अनुपात 95% समय के भीतर आता है। दूसरे शब्दों में, हम 95% विश्वास के साथ कह सकते हैं कि सामान्य जनसंख्या में किसी विशेषता के घटित होने की आवृत्ति का सही मूल्य 95% विश्वास अंतराल के भीतर होगा।

चिकित्सा शोधकर्ताओं के लिए अधिकांश सांख्यिकी मैनुअल रिपोर्ट करते हैं कि आवृत्ति त्रुटि की गणना सूत्र का उपयोग करके की जाती है

जहां पी नमूने में विशेषता की घटना की आवृत्ति है (0 से 1 तक मान)। अधिकांश रूसी वैज्ञानिक लेख नमूना (पी) में एक विशेषता की घटना की आवृत्ति के मूल्य के साथ-साथ पी ± एस के रूप में इसकी त्रुटि (ओं) को इंगित करते हैं। हालांकि, सामान्य आबादी में एक विशेषता की घटना की आवृत्ति के लिए 95% विश्वास अंतराल प्रस्तुत करना अधिक समीचीन है, जिसमें मूल्य शामिल होंगे

इससे पहले।

कुछ मैनुअल में, छोटे नमूनों के लिए 1.96 के मान को एन -1 डिग्री स्वतंत्रता के लिए टी मान के साथ बदलने की सिफारिश की जाती है, जहां एन नमूने में टिप्पणियों की संख्या है। t का मान t-वितरण के लिए तालिकाओं से पाया जाता है, जो सांख्यिकी पर लगभग सभी पाठ्यपुस्तकों में उपलब्ध हैं। वाल्ड की विधि के लिए टी वितरण का उपयोग नीचे चर्चा की गई अन्य विधियों पर दृश्य लाभ प्रदान नहीं करता है, और इसलिए कुछ लेखकों द्वारा प्रोत्साहित नहीं किया जाता है।

आवृत्तियों या बीट्स के लिए आत्मविश्वास अंतराल की गणना के लिए ऊपर प्रस्तुत विधि का नाम अब्राहम वाल्ड (1902-1950) के सम्मान में वाल्ड के नाम पर रखा गया है, क्योंकि इसका व्यापक उपयोग 1939 में वाल्ड और वोल्फोविट्ज के प्रकाशन के बाद शुरू हुआ था। हालाँकि, इस पद्धति का प्रस्ताव पियरे साइमन लाप्लास (1749-1827) ने 1812 में किया था।

वाल्ड की विधि बहुत लोकप्रिय है, लेकिन इसका उपयोग महत्वपूर्ण समस्याओं से जुड़ा है। छोटे नमूना आकारों के साथ-साथ ऐसे मामलों में जहां सुविधा की आवृत्ति की आवृत्ति 0 या 1 (0% या 100%) हो जाती है और आवृत्तियों 0 और 1 के लिए असंभव है, के लिए विधि की अनुशंसा नहीं की जाती है। इसके अलावा, सन्निकटन सामान्य वितरण का, जिसका उपयोग त्रुटि की गणना के लिए किया जाता है, "काम नहीं करता" उन मामलों में जहां n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.


चूंकि नया चर सामान्य रूप से वितरित किया जाता है, चर के लिए 95% विश्वास अंतराल की निचली और ऊपरी सीमा φ-1.96 और φ + 1.96बाएं "> होगी

छोटे नमूनों के लिए 1.96 के बजाय, एन -1 डिग्री स्वतंत्रता के लिए टी को प्रतिस्थापित करने की सिफारिश की जाती है। यह विधि नकारात्मक मान नहीं देती है और वाल्ड की विधि की तुलना में आवृत्तियों के लिए आत्मविश्वास अंतराल के अधिक सटीक अनुमान की अनुमति देती है। इसके अलावा, चिकित्सा आंकड़ों पर कई घरेलू संदर्भ पुस्तकों में इसका वर्णन किया गया है, हालांकि, चिकित्सा अनुसंधान में इसका व्यापक उपयोग नहीं हुआ। 0 या 1 के करीब आने वाली आवृत्तियों के लिए कोणीय परिवर्तन का उपयोग करके आत्मविश्वास अंतराल की गणना करने की अनुशंसा नहीं की जाती है।

यह वह जगह है जहां चिकित्सा शोधकर्ताओं के लिए आंकड़ों की मूल बातें पर अधिकांश पुस्तकों में आत्मविश्वास अंतराल का आकलन करने के तरीकों का वर्णन आमतौर पर समाप्त होता है, और यह समस्या न केवल घरेलू, बल्कि विदेशी साहित्य के लिए भी विशिष्ट है। दोनों विधियां केंद्रीय सीमा प्रमेय पर आधारित हैं, जो एक बड़ा नमूना मानती हैं।

उपरोक्त विधियों का उपयोग करके आत्मविश्वास अंतराल का अनुमान लगाने की कमियों को ध्यान में रखते हुए, क्लॉपर और पियर्सन ने 1934 में अध्ययन के तहत विशेषता के द्विपद वितरण को ध्यान में रखते हुए, तथाकथित सटीक आत्मविश्वास अंतराल की गणना के लिए एक विधि प्रस्तावित की। यह विधि कई ऑनलाइन कैलकुलेटर में उपलब्ध है, लेकिन इस तरह से प्राप्त आत्मविश्वास अंतराल ज्यादातर मामलों में बहुत व्यापक है। उसी समय, इस पद्धति का उपयोग उन मामलों में करने की सिफारिश की जाती है जहां एक रूढ़िवादी मूल्यांकन की आवश्यकता होती है। नमूना आकार घटने के साथ विधि के रूढ़िवाद की डिग्री बढ़ जाती है, खासकर जब एन< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

कई सांख्यिकीविदों के अनुसार, आवृत्तियों के लिए आत्मविश्वास अंतराल का सबसे इष्टतम अनुमान विल्सन विधि द्वारा किया जाता है, जिसे 1927 में वापस प्रस्तावित किया गया था, लेकिन व्यावहारिक रूप से घरेलू जैव चिकित्सा अनुसंधान में उपयोग नहीं किया गया था। यह विधि न केवल बहुत छोटी और बहुत उच्च आवृत्तियों दोनों के लिए विश्वास अंतराल का अनुमान लगाना संभव बनाती है, बल्कि कम संख्या में टिप्पणियों के लिए भी लागू होती है। सामान्य शब्दों में, विल्सन सूत्र के अनुसार विश्वास अंतराल का रूप होता है



जहां 95% विश्वास अंतराल की गणना करते समय 1.96 का मान लेता है, N अवलोकनों की संख्या है, और p नमूने में किसी विशेषता के घटित होने की आवृत्ति है। यह विधि ऑनलाइन कैलकुलेटर में उपलब्ध है, इसलिए इसका आवेदन समस्याग्रस्त नहीं है। और n p . के लिए इस पद्धति का उपयोग करने की अनुशंसा न करें< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

यह माना जाता है कि, विल्सन विधि के अलावा, वाल्ड एग्रेस्टी-कोल सुधारित विधि भी आवृत्तियों के लिए विश्वास अंतराल का एक इष्टतम अनुमान प्रदान करती है। Agresti के अनुसार सुधार - कोल नमूना (p) में p` द्वारा विशेषता की आवृत्ति के वाल्ड के सूत्र में एक प्रतिस्थापन है, जिसकी गणना में 2 को अंश में जोड़ा जाता है, और 4 को हर में जोड़ा जाता है, वह है, p` = (X + 2) / (N + 4), जहां X अध्ययन प्रतिभागियों की संख्या है जिनके पास अध्ययन के तहत विशेषता है, और N नमूना आकार है। यह संशोधन विल्सन फॉर्मूला के परिणामों के समान परिणाम देता है, उन मामलों को छोड़कर जहां घटना दर 0% या 100% तक पहुंच जाती है, और नमूना छोटा होता है। आवृत्तियों के लिए आत्मविश्वास अंतराल की गणना के लिए उपर्युक्त विधियों के अलावा, वाल्ड विधि और छोटे नमूनों के लिए विल्सन विधि दोनों के लिए निरंतरता सुधार प्रस्तावित किए गए थे, लेकिन अध्ययनों से पता चला है कि उनका उपयोग अव्यावहारिक है।

आइए दो उदाहरणों का उपयोग करके विश्वास अंतराल की गणना के लिए उपरोक्त विधियों के अनुप्रयोग पर विचार करें। पहले मामले में, हम बेतरतीब ढंग से चुने गए 1,000 अध्ययन प्रतिभागियों के एक बड़े नमूने का अध्ययन करते हैं, जिनमें से 450 में अध्ययन के तहत विशेषता है (यह एक जोखिम कारक, परिणाम या कोई अन्य लक्षण हो सकता है), जो कि 0.45, या 45% है। दूसरे मामले में, अध्ययन एक छोटे नमूने का उपयोग करके किया जाता है, कहते हैं, केवल 20 लोग, और अध्ययन किया गया गुण अध्ययन में केवल 1 प्रतिभागी (5%) में मौजूद है। वॉल्ड पद्धति के अनुसार कॉन्फिडेंस इंटरवल, एग्रेस्टी-कोल करेक्शन के साथ वाल्ड मेथड, और विल्सन मेथड की गणना जेफ सॉरो (http: // www. / Wald। Htm) द्वारा विकसित एक ऑनलाइन कैलकुलेटर का उपयोग करके की गई थी। निरंतरता-सुधारित विल्सन आत्मविश्वास अंतराल की गणना वासर स्टैट्स द्वारा प्रदान किए गए कैलकुलेटर का उपयोग करके की गई थी: सांख्यिकीय संगणना के लिए वेब साइट (http: // फैकल्टी.vassar.edu / Lowry / prop1.html)। कोणीय फिशर परिवर्तन का उपयोग करते हुए गणना क्रमशः 19 और 999 डिग्री स्वतंत्रता के लिए टी के महत्वपूर्ण मूल्य का उपयोग करके "मैन्युअल रूप से" की गई थी। गणना के परिणाम दोनों उदाहरणों के लिए तालिका में प्रस्तुत किए गए हैं।

पाठ में वर्णित दो उदाहरणों के लिए छह अलग-अलग तरीकों से गणना किए गए विश्वास अंतराल

कॉन्फिडेंस इंटरवल कैलकुलेशन मेथड

पी = 0.0500, या 5%

एक्स = 450, एन = 1000, पी = 0.4500, या 45% के लिए 95% सीआई

–0,0455–0,2541

एग्रेसी-कोल सुधार के साथ वाल्डा

<,0001–0,2541

निरंतरता सुधार के साथ विल्सन

क्लॉपर - पियर्सन "सटीक विधि"

कोणीय परिवर्तन

<0,0001–0,1967

जैसा कि तालिका से देखा जा सकता है, पहले उदाहरण के लिए, "आम तौर पर स्वीकृत" वाल्ड विधि द्वारा गणना की गई आत्मविश्वास अंतराल नकारात्मक क्षेत्र में जाती है, जो आवृत्तियों के मामले में नहीं हो सकती है। दुर्भाग्य से, रूसी साहित्य में ऐसी घटनाएं असामान्य नहीं हैं। आवृत्ति और इसकी त्रुटियों के संदर्भ में डेटा का प्रतिनिधित्व करने का पारंपरिक तरीका आंशिक रूप से इस समस्या को छुपाता है। उदाहरण के लिए, यदि किसी विशेषता की घटना की आवृत्ति (प्रतिशत में) 2.1 ± 1.4 के रूप में प्रस्तुत की जाती है, तो यह "आंखों के लिए दर्दनाक" 2.1% (95% सीआई: -0.7; 4.9) के रूप में नहीं है, हालांकि और इसका मतलब है वही। Agresti के साथ वाल्ड विधि - कोणीय परिवर्तन का उपयोग करके कोल सुधार और गणना शून्य को कम बाध्य प्रवृत्ति देती है। निरंतरता-सुधारित विल्सन की विधि और "सटीक विधि" विल्सन की विधि की तुलना में व्यापक आत्मविश्वास अंतराल देती है। दूसरे उदाहरण के लिए, सभी विधियाँ लगभग समान आत्मविश्वास अंतराल देती हैं (अंतर केवल हज़ारवें हिस्से में दिखाई देते हैं), जो आश्चर्य की बात नहीं है, क्योंकि इस उदाहरण में घटना की आवृत्ति 50% से बहुत भिन्न नहीं है, और नमूना आकार है काफी बड़ा।

इस समस्या में रुचि रखने वाले पाठकों के लिए, हम आर जी न्यूकॉम्ब और ब्राउन, कै और दासगुप्ता के कार्यों की सिफारिश कर सकते हैं, जो आत्मविश्वास अंतराल की गणना के लिए क्रमशः 7 और 10 विभिन्न तरीकों का उपयोग करने के पेशेवरों और विपक्षों को दिखाते हैं। घरेलू मैनुअल से, पुस्तक की सिफारिश की जाती है, जो सिद्धांत के विस्तृत विवरण के अलावा, वाल्ड, विल्सन के तरीकों के साथ-साथ द्विपद आवृत्ति वितरण को ध्यान में रखते हुए आत्मविश्वास अंतराल की गणना के लिए एक विधि प्रस्तुत करता है। मुफ्त ऑनलाइन कैलकुलेटर (http: // www. / Wald। Htm और http: // फैकल्टी। Vassar। Edu / Lowry / prop1.html) के अलावा, आवृत्तियों के लिए आत्मविश्वास अंतराल (और अधिक!) सीआईए का उपयोग करके गणना की जा सकती है। प्रोग्राम ( कॉन्फिडेंस इंटरवल एनालिसिस), जिसे http://www से डाउनलोड किया जा सकता है। माध्यमिक विद्यालय। सोटन एसी। यूके / सिया /।

अगला लेख गुणवत्ता डेटा की तुलना करने के एक-आयामी तरीकों पर विचार करेगा।

ग्रन्थसूची

सादा भाषा में चिकित्सा सांख्यिकी: एक परिचयात्मक पाठ्यक्रम / ए. बनर्जी। - एम .: प्रैक्टिकल मेडिसिन, 2007 .-- 287 पी। चिकित्सा सांख्यिकी /। - एम .: चिकित्सा सूचना एजेंसी, 2007 .-- 475 पी। बायोमेडिकल स्टैटिस्टिक्स / एस। ग्लैंड्स। - एम .: अभ्यास, 1998। डेटा प्रकार, वितरण जाँच और वर्णनात्मक आँकड़े // मानव पारिस्थितिकी - 2008। - संख्या 1. - पी। 52-58। साथ... चिकित्सा सांख्यिकी: पाठ्यपुस्तक /। - रोस्तोव एन / ए: फीनिक्स, 2007 .-- 160 पी। एप्लाइड मेडिकल स्टैटिस्टिक्स /,। - एसपीबी। : फोलियो, 2003 .-- 428 पी। एफ... बायोमेट्रिक्स /। - एम .: हायर स्कूल, 1990 ।-- 350 पी। ... चिकित्सा में गणितीय सांख्यिकी /,। - एम .: वित्त और सांख्यिकी, 2007 .-- 798 पी। नैदानिक ​​अनुसंधान में गणितीय सांख्यिकी /,। - एम .: जियोटार-मेड, 2001 .-- 256 पी। युंकेरोव वी. तथा... चिकित्सा अनुसंधान डेटा का चिकित्सा और सांख्यिकीय प्रसंस्करण /। - एसपीबी। : वीमेडए, 2002 .-- 266 पी। अग्रेस्टी ए.अनुमानित द्विपद अनुपात के अंतराल अनुमान के लिए सटीक से बेहतर है / ए। अग्रेस्टी, बी। कौल // अमेरिकी सांख्यिकीविद्। - 1998. - एन 52. - एस। 119-126। ऑल्टमैन डी.विश्वास के साथ सांख्यिकी // डी। ऑल्टमैन, डी। माचिन, टी। ब्रायंट, एमजे गार्डनर। - लंदन: बीएमजे बुक्स, 2000 .-- 240 पी। ब्राउन एल. डी.द्विपद अनुपात के लिए अंतराल अनुमान / एल डी ब्राउन, टी टी कै, ए दासगुप्ता // सांख्यिकीय विज्ञान। - 2001. - एन 2. - पी। 101-133। क्लॉपर सी. जे.द्विपद/सी.जे. क्लॉपर, ई.एस. पियर्सन // बायोमेट्रिका के मामले में सचित्र विश्वास या प्रत्ययी सीमाओं का उपयोग। - 1934. - एन 26. - पी। 404-413। गार्सिया-पेरेज़ एम. ए... द्विपद पैरामीटर के लिए विश्वास अंतराल पर / एम. ए. गार्सिया-पेरेज़ // गुणवत्ता और मात्रा। - 2005. - एन 39. - पी। 467-481। मोतुल्स्की एच.सहज बायोस्टैटिस्टिक्स // एच। मोटुल्स्की। - ऑक्सफोर्ड: ऑक्सफोर्ड यूनिवर्सिटी प्रेस, 1995 .-- 386 पी। न्यूकॉम्ब आर. जी.एकल अनुपात के लिए दो तरफा विश्वास अंतराल: सात विधियों की तुलना / आर जी न्यूकॉम्ब // चिकित्सा में सांख्यिकी। - 1998. - एन। 17. - पी। 857-872। सौरो जे.द्विपद विश्वास अंतराल का उपयोग करके छोटे नमूनों से पूर्णता दर का अनुमान लगाना: तुलना और सिफारिशें / जे. सौरो, जे. आर. लुईस // मानव कारकों और एर्गोनॉमिक्स सोसायटी की वार्षिक बैठक की कार्यवाही। - ऑरलैंडो, FL, 2005। वाल्ड ए.निरंतर वितरण कार्यों के लिए कॉन्फिडेंस लिमिट्स // ए। वाल्ड, जे। वोल्फोविट्ज // एनल्स ऑफ मैथमैटिकल स्टैटिस्टिक्स। - 1939. - एन 10. - पी। 105-118। विल्सन ई. बी... संभावित अनुमान, उत्तराधिकार का नियम, और सांख्यिकीय अनुमान / ई.बी. विल्सन // जर्नल ऑफ़ अमेरिकन स्टैटिस्टिकल एसोसिएशन। - 1927. - एन 22. - पी। 209-212।

अनुपात के लिए विश्वास अंतराल

ए। एम. ग्रजिबोव्स्की

सार्वजनिक स्वास्थ्य के राष्ट्रीय संस्थान, ओस्लो, नॉर्वे

लेख द्विपद अनुपातों के लिए विश्वास अंतराल की गणना के लिए कई तरीके प्रस्तुत करता है, अर्थात्, वाल्ड, विल्सन, आर्क्सिन, एग्रेस्टी-कूल और सटीक क्लॉपर-पियर्सन विधियां। पेपर एक द्विपद अनुपात के विश्वास अंतराल अनुमान की समस्या का केवल सामान्य परिचय देता है और इसका उद्देश्य न केवल पाठकों को अपने अनुभवजन्य शोध के परिणाम प्रस्तुत करते समय आत्मविश्वास अंतराल का उपयोग करने के लिए प्रोत्साहित करना है, बल्कि उन्हें पहले सांख्यिकी पुस्तकों से परामर्श करने के लिए प्रोत्साहित करना है। स्वयं के डेटा का विश्लेषण और पांडुलिपियां तैयार करना।

मुख्य शब्द: विश्वास अंतराल, अनुपात

संपर्क जानकारी:

वरिष्ठ सलाहकार, राष्ट्रीय सार्वजनिक स्वास्थ्य संस्थान, ओस्लो, नॉर्वे