خطای نمونه گیری تابع چه عواملی است

خطای نمونه گیری

خطای نمونه گیری چیست؟

خطای نمونه گیری انحراف در مقدار نمونه گیری در مقابل مقدار جامعه واقعی است. خطاهای نمونه گیری به این دلیل رخ می دهد که نمونه معرف جامعه نیست یا به نوعی مغرضانه است. حتی نمونه‌های تصادفی‌شده نیز درجاتی از خطای نمونه‌گیری را خواهند داشت، زیرا یک نمونه فقط تقریبی از جامعه‌ای است که از آن استخراج شده است.
خطای نمونه گیری یک خطای آماری است که زمانی رخ می دهد که یک تحلیلگر نمونه ای را انتخاب نکند که نشان دهنده کل جامعه داده باشد. در نتیجه، نتایج یافت شده در نمونه، نتایجی را که از کل جامعه به دست می آید، نشان نمی دهد.
نمونه گیری تجزیه و تحلیلی است که با انتخاب تعدادی مشاهدات از یک جمعیت بزرگتر انجام می شود. روش انتخاب می تواند هم خطاهای نمونه گیری و هم خطاهای غیر نمونه گیری ایجاد کند.
در هنگام انتخاب نمونه ای از مشاهدات از یک جامعه آماری، دو نوع اصلی خطا ممکن است رخ دهد: خطای نمونه گیری (sampling error) و خطای غیر نمونه گیری (nonsampling error). هر کسی که نتایج نظرسنجی ها و مطالعات نمونه ای را ملاحظه می کند، می بایست علت این خطاها را درک نماید.

موارد کلیدی در باره خطای نمونه گیری

– خطای نمونه گیری زمانی رخ می دهد که نمونه مورد استفاده در مطالعه نماینده کل جامعه نباشد.
– نمونه گیری تجزیه و تحلیلی است که با انتخاب تعدادی مشاهدات از یک جمعیت بزرگتر انجام می شود.
– حتی نمونه های تصادفی نیز درجاتی از خطای نمونه گیری را خواهند داشت، زیرا یک نمونه فقط تقریبی از جامعه ای است که از آن استخراج شده است.
– با افزایش حجم نمونه می توان شیوع خطاهای نمونه گیری را کاهش داد.
– نمونه گیری تصادفی روشی اضافی برای به حداقل رساندن وقوع خطاهای نمونه گیری است.
– به طور کلی خطاهای نمونه گیری را می توان در چهار دسته قرار داد: خطای خاص جامعه، خطای انتخاب، خطای فریم نمونه یا خطای عدم پاسخ.

خطای نمونه گیری

خطای نمونه گیری به تفاوت بین نمونه و جامعه آماری اشاره دارد که علت آن فقط مشاهداتی است که «اتفاقی به عنوان نمونه انتخاب شده اند». خطای نمونه گیری، خطایی است که انتظار داریم هنگامی رخ دهد که عبارت بیان شده ما درباره یک جامعه آماری، فقط بر مبنای مشاهدات موجود در نمونه اخذ شده از جامعه آماری است.

به بیان بهتر، فرض کنید قصد داریم میانگین درآمد سالانه کارگران را مشخص کنیم. برای تعیین این پارامتر (parameter)، می بایست از هر کارگر درآمدش را بپرسیم. از آنجا که اندازه این جامعه آماری میلیون ها نفر است، انجام این کار پر هزینه و غیر عملی است. لذا می توانیم از استنباط آماری برای برآورد میانگین درآمد جامعه آماری μ استفاده کنیم، البته اگر دقت کمتر از ۱۰۰% را قبول کنیم. ما درآمدهای نمونه ای از کارگران را ثبت می کنیم و میانگین این نمونه درآمدها (x بار) را پیدا می کنیم. این میانگین نمونه ای، برآوردی از میانگین جامعه آماری است. اما مقدار میانگین نمونه ای، بسته به شانس، متفاوت از میانگین جامعه آماری خواهد بود، زیرا مقدار میانگین نمونه ای به آن درآمدهایی بستگی دارد که به صورت اتفاقی به عنوان نمونه انتخاب شده اند. تفاوت بین مقدار واقعی (نامعلوم) میانگین جامعه آماری و برآورد آن، یعنی میانگین نمونه ای، خطای نمونه گیری است. اندازه این اختلاف ممکن است صرفا به خاطر بد شانسی، بزرگ باشد- بد شانسی از این بابت که به صورت اتفاقی، نمونه ای انتخاب شود که نماینده جامعه آماری نباشد. تنها راهی که می توانیم اندازه مورد انتظار این خطا را کاهش دهیم، انتخاب یک نمونه بزرگتر است.

 
بیشتر بخوانید  نرم افزار آماری EViews در حسابداری

انواع خطاهای نمونه گیری

به طور کلی، خطاهای نمونه گیری را می توان در چهار دسته قرار داد: خطای خاص جامعه، خطای انتخاب، خطای چارچوب نمونه یا خطای عدم پاسخ. یک خطای خاص جمعیت زمانی رخ می دهد که محقق نمی داند چه کسی باید نظرسنجی کند. خطای انتخاب زمانی رخ می دهد که پاسخ دهندگان شرکت خود را در مطالعه انتخاب کنند. (این فقط به کسانی منجر می شود که علاقه مند به پاسخگویی هستند، که نتایج را منحرف می کند.) خطای قاب نمونه زمانی رخ می دهد که از زیرجمعیت اشتباهی برای انتخاب یک نمونه استفاده شود. در نهایت، خطای عدم پاسخ زمانی رخ می دهد که پاسخ دهندگان بالقوه با موفقیت تماس نگیرند یا از پاسخ دادن امتناع کنند.

دسته بندی های مختلفی از خطاهای نمونه گیری وجود دارد.

خطای خاص جمعیت

یک خطای خاص جمعیت زمانی رخ می دهد که محقق نمی داند چه کسی را بررسی کند.

خطای انتخاب

خطای انتخاب زمانی رخ می دهد که نظرسنجی به صورت خود انتخابی باشد، یا زمانی که فقط شرکت کنندگانی که به نظرسنجی علاقه مند هستند به سوالات پاسخ می دهند. محققان می‌توانند با یافتن راه‌هایی برای تشویق مشارکت، بر خطای انتخاب غلبه کنند.

نمونه خطای فریم

خطای قاب نمونه زمانی رخ می دهد که یک نمونه از داده های جمعیت اشتباه انتخاب شود.

خطای عدم پاسخگویی

خطای عدم پاسخ زمانی رخ می دهد که پاسخ مفیدی از نظرسنجی ها به دست نیاید، زیرا محققان قادر به تماس با پاسخ دهندگان بالقوه نبودند (یا پاسخ دهندگان بالقوه از پاسخ دادن خودداری کردند).

حذف خطاهای نمونه گیری

با افزایش حجم نمونه می توان شیوع خطاهای نمونه گیری را کاهش داد. با افزایش حجم نمونه، نمونه به جمعیت واقعی نزدیک‌تر می‌شود که پتانسیل انحراف از جامعه واقعی را کاهش می‌دهد. در نظر بگیرید که میانگین یک نمونه ۱۰ نفری بیشتر از میانگین یک نمونه ۱۰۰ نفری متفاوت است. همچنین می توان برای اطمینان از اینکه نمونه به اندازه کافی کل جامعه را نشان می دهد اقداماتی انجام داد.
محققان ممکن است با تکرار مطالعه خود سعی در کاهش خطاهای نمونه گیری داشته باشند. این را می توان با اندازه گیری های یکسان به طور مکرر، با استفاده از بیش از یک موضوع یا چند گروه، یا انجام مطالعات متعدد انجام داد.
نمونه گیری تصادفی روشی اضافی برای به حداقل رساندن وقوع خطاهای نمونه گیری است. نمونه گیری تصادفی یک رویکرد سیستماتیک برای انتخاب نمونه ایجاد می کند. به عنوان مثال، یک محقق به جای انتخاب شرکت کنندگان برای مصاحبه تصادفی، ممکن است افرادی را انتخاب کند که نام آنها در لیست اول، دهم، بیستم، سی ام، چهلم و غیره باشد.

چرا خطای نمونه برداری مهم است؟

آگاهی از وجود خطاهای نمونه گیری مهم است زیرا می تواند نشانگر سطح اطمینانی باشد که می توان در نتایج قرار داد. خطای نمونه گیری همچنین در زمینه بحث در مورد اینکه چقدر نتایج تحقیق می تواند متفاوت باشد، مهم است.

نمونه هایی از خطاهای نمونه گیری

فرض کنید که شرکت XYZ یک سرویس مبتنی بر اشتراک ارائه می دهد که به مصرف کنندگان اجازه می دهد هزینه ماهانه برای پخش ویدیوها و سایر انواع برنامه نویسی از طریق اتصال به اینترنت بپردازند.
این شرکت می‌خواهد صاحبان خانه‌هایی را که حداقل ۱۰ ساعت برنامه در هفته از طریق اینترنت تماشا می‌کنند و هزینه یک سرویس پخش ویدیوی موجود را پرداخت می‌کنند، بررسی کند. XYZ می خواهد تعیین کند که چند درصد از جمعیت به خدمات اشتراکی با قیمت پایین تر علاقه مند هستند. اگر XYZ به دقت در مورد فرآیند نمونه گیری فکر نکند، ممکن است چندین نوع خطای نمونه گیری رخ دهد.
اگر شرکت XYZ انواع خاصی از مصرف کنندگان را که باید در نمونه گنجانده شوند، درک نکند، خطای مشخصات جمعیت رخ می دهد. به عنوان مثال، اگر XYZ جمعیتی از افراد بین ۱۵ تا ۲۵ سال ایجاد کند، بسیاری از این مصرف کنندگان تصمیم خرید در مورد یک سرویس پخش ویدئو را نمی گیرند زیرا ممکن است تمام وقت کار نکنند. از سوی دیگر، اگر XYZ نمونه‌ای از بزرگسالان شاغل را که تصمیم به خرید می‌گیرند جمع آوری کند، مصرف‌کنندگان این گروه ممکن است هر هفته ۱۰ ساعت برنامه ویدیویی تماشا نکنند.
خطای انتخاب نیز باعث ایجاد اعوجاج در نتایج یک نمونه می شود. یک مثال رایج، نظرسنجی است که تنها به بخش کوچکی از افراد متکی است که بلافاصله پاسخ می‌دهند. اگر XYZ تلاش کند مصرف‌کنندگانی را که در ابتدا پاسخ نمی‌دهند پیگیری کند، نتایج نظرسنجی ممکن است تغییر کند. علاوه بر این، اگر XYZ مصرف‌کنندگانی را که فوراً پاسخ نمی‌دهند حذف کند، نتایج نمونه ممکن است ترجیحات کل جمعیت را منعکس نکند.

خطای نمونه گیری در مقابل خطای غیر نمونه گیری

خطاهای نمونه گیری خطاهای آماری هستند که زمانی به وجود می آیند که نمونه کل جامعه را نشان نمی دهد. در آمار، نمونه گیری به معنای انتخاب گروهی است که در واقع از آن داده ها را در تحقیق خود جمع آوری خواهید کرد.

انواع مختلفی از خطاها در هنگام جمع آوری داده های آماری رخ می دهد. خطاهای نمونه گیری تفاوت های به ظاهر تصادفی بین ویژگی های یک جامعه نمونه و ویژگی های جامعه عمومی است. خطاهای نمونه گیری به این دلیل به وجود می آیند که حجم نمونه به طور اجتناب ناپذیر محدود است. (نمونه گیری کل جمعیت در یک نظرسنجی یا سرشماری غیرممکن است.)
نکته: یک خطای نمونه‌برداری ممکن است حتی زمانی که هیچ گونه اشتباهی مرتکب نشده باشد، ایجاد شود. خطاهای نمونه گیری به این دلیل رخ می دهد که هیچ نمونه ای هرگز با داده های موجود در دنیایی که نمونه از آن گرفته شده است مطابقت ندارد.
شرکت XYZ همچنین می خواهد از خطاهای غیر نمونه برداری اجتناب کند. خطاهای غیر نمونه گیری خطاهایی هستند که در حین جمع آوری داده ها ایجاد می شوند و باعث می شوند داده ها با مقادیر واقعی متفاوت باشند. خطاهای غیر نمونه برداری ناشی از خطای انسانی است، مانند اشتباهی که در فرآیند بررسی انجام شده است.
اگر یک گروه از مصرف کنندگان فقط پنج ساعت برنامه ویدیویی در هفته تماشا کنند و در نظرسنجی شرکت کنند، این تصمیم یک خطای غیر نمونه گیری است. پرسیدن سوالات مغرضانه نوع دیگری از خطا است.
 

فرمول خطای نمونه برداری چیست؟

برای محاسبه خطای نمونه گیری کلی در تحلیل های آماری از فرمول خطای نمونه گیری استفاده می شود. خطای نمونه گیری با تقسیم انحراف استاندارد جامعه بر جذر اندازه نمونه و سپس ضرب حاصل در مقدار Z که بر اساس فاصله اطمینان است، محاسبه می شود.

خطای نمونه گیری

برای مثال، اگر نظرسنجی بر اساس نتایج نمونه بیان کند که در انتخابات آتی کاندیدای فعلی از پشتیبانی ۵۴% رأی دهندگان واجد شرایط برخوردار است، عبارت پس از آن ممکن است چنین باشد: «این درصد در بازه ۳% درست است»، ۱۹ بار از ۲۰ بار. این عبارت یعنی ما برآورد می کنیم که سطح واقعی پشتیبانی از این کاندیدا بین ۵۱% و ۵۷% است و در بلندمدت، این روش در ۹۵% موارد درست است.

چگونه یک خطای نمونه برداری را پیدا می کنید؟

در تحقیقات پیمایشی، خطاهای نمونه‌گیری رخ می‌دهد زیرا همه نمونه‌ها نمونه‌های معرف هستند: گروه کوچک‌تری که برای کل جمعیت تحقیق شما قرار می‌گیرد. غیرممکن است که کل گروه افرادی را که می‌خواهید به آنها دسترسی پیدا کنید، نظرسنجی کنید.

نتیجه گیری

در این مقاله به نکاتی درباره خطای نمونه گیری در تحلیل های آماری که معمولاً نمی‌توان میزان خطای نمونه‌گیری را در یک مطالعه اندازه‌گیری کرد، زیرا جمع‌آوری داده‌های مرتبط از کل جمعیتی که مطالعه می‌کنید غیرممکن است. به همین دلیل است که محققان نمونه‌های نماینده را جمع‌آوری می‌کنند (و نمونه‌های نماینده دلیل وجود خطاهای نمونه‌گیری هستند). توضیح دادیم. با به انتها رسیدن این مطلب، شما بینندگان عزیز می توانید برای مشاهده و خواندن دیگر مقالات در این زمینه به صفحه مقالات مراجعه کنید. و همچنین  در ادامه مطالب بعدی بیشتر درباره موضوعات و مطالب مرتبط با حسابداری صحبت خواهیم کرد با ما همراه باشید.

بیشتر بخوانید  مدل سازی مالی چیست؟

دیدگاهتان را بنویسید