تعداد نشریات | 43 |
تعداد شمارهها | 1,682 |
تعداد مقالات | 13,762 |
تعداد مشاهده مقاله | 32,193,897 |
تعداد دریافت فایل اصل مقاله | 12,745,757 |
توسعۀ روشی استوار برای پایش پروفایلهای لجستیک در فاز 1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
پژوهش در مدیریت تولید و عملیات | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مقاله 6، دوره 9، شماره 1 - شماره پیاپی 16، اردیبهشت 1397، صفحه 107-118 اصل مقاله (974.94 K) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
نوع مقاله: مقاله پژوهشی | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
شناسه دیجیتال (DOI): 10.22108/jpom.2018.92335.0 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
نویسندگان | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
احمد حکیمی1؛ امیرحسین امیری* 2؛ رضا کامران راد3 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1کارشناس ارشد گروه مهندسی صنایع، دانشکده فنی و مهندسی، دانشگاه شاهد، تهران، ایران | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2استادیار گروه مهندسی صنایع، دانشکده فنی و مهندسی، دانشگاه شاهد، تهران، ایران | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3دانشجوی دکتری گروه مهندسی صنایع، دانشکده فنی و مهندسی، دانشگاه شاهد، تهران، ایران | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
چکیده | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
در برخی از فرآیندها، کیفیت محصولات یا عملکرد فرآیند بهوسیلۀ رابطۀ بین دو یا چند متغیر توصیف میشود. این رابطه میتواند خطی ساده، خطی چندگانه، چندمتغیره، غیرخطی و لجستیک باشد که به اصطلاح به آن پروفایل گفته میشود. برخی از روشهای توسعه دادهشده در پایش پروفایل مرتبط با پایش پروفایلهای لجستیک هستند. همچنین حضور دادههای پرت درون دادهها سبب میشود تا پارامترهای پروفایل بهدرستی تخمین زده نشوند. در این مقاله روش جدید حداکثر درستنماییِ وزنی مبتنی بر رویکرد استوار برای تخمین پارامترهای پروفایلهای لجستیک در فاز 1 ارائه شده است تا اثر دادههای پرت روی عملکرد آماری نمودار کنترلT2 برمبنای احتمال خطای نوع 1 برای پایش پروفایلهای لجستیک کاهش یابد. عملکرد روش پیشنهادی با استفاده از مثال عددی بررسی و نتایج آن با روش حداکثر درستنمایی مقایسه شده است. نتایج نشان میدهد روش پیشنهادی بهتر از روش حداکثر درستنمایی براساس توان نمودار کنترل T2 عمل میکند. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
کلیدواژهها | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
پروفایل لجستیک؛ دادههای پرت؛ رویکرد استوار؛ روش حداکثر درستنمایی وزنی؛ فاز1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
اصل مقاله | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مقدمه معمولاً در کنترل فرآیند آماری، کیفیت محصول یا فرآیند بهوسیلۀ مشخصۀ کیفی تک یا چندمتغیره توصیف میشود؛ ولی گاهی کیفیت محصول یا فرآیند بهوسیلۀ رابطۀ بین یک متغیر پاسخ و یک یا چند متغیر مستقل توصیف میشود که به این رابطه پروفایل گفته میشود. این رابطه میتواند خطی ساده، چندجملهای، غیرخطی، لجستیک و یا پیچیدهتر باشد. پایش پروفایلها در دو فاز 1 و 2 انجام میشود. هدف اصلی در فاز 1 تخمین پارامترهای پروفایل و در فاز 2 کشف تغییرات در زودترین زمان ممکن است. در پروفایلهای خطی رابطۀ بین متغیر پاسخ و متغیر(های) مستقل بهصورت خطی است. کنگ و آلباین[i] (2000) در فاز 2 پایش پروفایلهای خطی ساده را توصیف کردهاند. آنها روش تخمین پارامترهای پروفایل را تشریح و با استفاده از نمودار کنترل T2پارامترهای پروفایل را پایش کردند. آنها همچنین در روشی دیگر با استفاده از نمودار کنترل EWMA-R باقیماندههای مدل برازششده را پایش کردند. پس از این مقاله، پژوهشهای بسیاری در زمینۀ پایش انواع پروفایلها صورت گرفت که فهرست نسبتاً کاملی از پژوهشهای انجامشده در این حوزه در مقالات مروری محمود و وودال[ii] (2004) ، وودال (2007)، همچنین کتاب نورالسناء و همکاران (2011) وجود دارد. سقایی و همکاران (2009) روشی مبتنی بر آمارۀ CUSUM را برای پایش پروفایلهای خطی ساده ارائه کرده است. ژیانگ و همکاران[iii] (2009) با استفاده از آزمون نسبت درستنمایی روشی را برای پایش پروفایلهای خطی مطرح کردند. ژو و لین[iv] (2010) بر پایش شیب پروفایل خطی در هر دو فاز 1 و 2 تمرکز کردهاند. در فاز 2 آنها نشان دادند متوسط طول دنباله در نمودار کنترل پیشنهادی تنها به شیب وابسته است؛ درحالیکه متوسط طول دنباله در نمودار کنترل T2 به شیب، عرض از مبدأ و همبستگی بین این دو وابسته است. باتوجهبه اینکه پروفایلهای غیرخطی پیچیدگی بیشتری نسبت به پروفایلهای خطی دارند، پژوهشهای کمتری نسبت به پروفایلهای خطی روی آنها صورت گرفته است. بهطور موردی در حوزۀ پروفایلهای غیرخطی و خطیِ تعمیمیافته نیز پژوهشهایی انجام شده است؛ برای مثال ویلیامز و همکاران[v] (2003) روشهایی را برای پایش پروفایلهای غیرخطی در فاز 1 ارائه کردهاند. ویلیامز و همکاران (2007) روشهایی را مبتنی بر نمودار کنترل T2برای پایش پروفایلهای غیرخطی پیشنهاد دادهاند. زو و همکاران[vi] (2008) روشهایی را برای پایش پروفایلهای غیرخطی با استفاده از آمارۀ EWMA و آزمون نسبت درستنمایی تعمیمیافته ارائه کردهاند. واقفی و همکاران[vii] (2009) روشهای ارائهشده در فاز 1 بهوسیلۀ ویلیامز (2003) را به فاز 2 توسعه دادهاند. در این مقاله از سه رویکرد پارامتری، ناپارامتری و هوش مصنوعی مبتنی بر شبکههای عصبی برای پایش پروفایلهای غیرخطی در فاز 2 استفاده و کارایی آنها با استفاده از شبیهسازی بررسی شده است. در زمینۀ پایش پروفایلهای مبتنی بر الگوهای خطی تعمیمیافته[viii] (GLM)، یه و همکاران[ix] (2009) پنج روش مبتنی بر آمارۀ T2 را برای پایش پروفایلهای لجستیک در فاز ۱ ارائه دادند. سقایی و همکاران[x] (2012) نیز پایش پروفایلهای لجستیک در فاز 2 را بررسی کردند. نورالسناء و ایزدبخش (1391) برای پایش پروفایلهای لجستیک رستهای از نمودار کنترل T2 و آزمون نسبت درستنمایی استفاده کردهاند. در پایش پارامترهای پروفایل در فاز 1 ابتدا با نمونهگیری از فرآیند تحت کنترل و با استفاده از روشهای کلاسیک حداقل مربعات[xi] یا حداکثر درستنمایی[xii] پارامترهای مدل برآورد میشوند. نکتۀ درخور توجه این است که در زمان نمونهگیری برای برآورد پارامترهای فرآیند ممکن است در برخی از زیرگروهها دادههای بسیار بزرگ و بسیار کوچک نسبت به بقیۀ دادهها وجود داشته باشند. این دادهها که با عنوان دادههای پرت[xiii] شناخته میشوند برآورد روش کلاسیک را بهشدت تحت تأثیر قرار میدهند. این تأثیر باعث میشود نمودار کنترلی رسمشده بازتر شود و احتمال خطای نوع 1 افزایش یابد و عملکرد مناسبی در تشخیص و شناسایی انحرافات با دلیل در فاز 2 نداشته باشد. این امر باعث ظهور تخمینزنندههایی شد تا نسبت به دادههای پرت حساسیت کمتری داشته باشند و پارامترهای پروفایل را بهطریق مناسبتری برآورد کنند (مونتگومری و همکاران[xiv]، 2015؛ هابر[xv]، 1981). تاکنون پژوهشهای محدودی در زمینۀ پایش پروفایل با حضور دادههای آلوده انجام شده است؛ از جملۀ این پژوهشها، پژوهش عبادی و شهریاری[xvi] (2014) است که در آن از روشهای تخمین استوار برای پایش پروفایلهای خطی ساده استفاده کردهاند. در این پژوهش پارامترهای پروفایل با دو روش کلاسیک و استوار (M-estimator) با دو تابع وزنی هابر و دومربعی با حضور دادههای پرت و بدون آن تخمین زده شده است. نتایج این پژوهش نشان میدهد وقتی آلودگی وجود ندارد، بین روشهای تخمین تفاوت زیادی وجود ندارد؛ ولی با وجود دادههای آلوده تخمین روش استوار دقیقتر است و تابع وزنی دومربعی جواب بهتری نشان میدهد. هدف از این مقاله تخمین پارامتر در پروفایلهای لجستیک با حضور دادۀ پرت در مشاهدات با استفاده از روش استوار و بررسی اثر تخمین روی احتمال خطای نوع 1 و توان نمودار کنترل T2 است. سوالهای اصلی این پژوهش عبارتند از: 1- بررسی اثر دادۀ پرت روی میانگین و انحراف استاندارد تخمینزنندۀ پیشنهادی و کلاسیک پارامترهای رگرسیون لجستیک و احتمال خطای نوع 1 نمودار کنترل T2 ؛ 2- بررسی اثر تخمینزنندۀ پیشنهادی در مقایسه با تخمینزنندۀ کلاسیک در توان نمودار کنترل T2 تحت شیفتهای مختلف در پارامترهای رگرسیون لجستیک در حضور دادههای پرت. ساختار مقاله بدین صورت است که در بخش 2 روش حداکثر درستنمایی برای تخمین پارامترهای پروفایل لجستیک بیان میشود. بخش 3 مسئله را تعریف و سپس روش پیشنهادی را ارائه میکند. در بخش 4 با ارائۀ مثال عددی، عملکرد روش پیشنهادی با روش کلاسیک حداکثر درستنمایی مقایسه میشود. روش حداکثر درستنمایی برای برآورد پارامترهای پروفایل لجستیک الگوی رگرسیون لجستیک در عمل بیشتر از سایر انواع رگرسیون خطی تعمیمیافته استفاده میشود. این نوع رگرسیون برای مواردی بهکار میرود که مقادیر متغیر پاسخ بهصورت 0 یا 1 باشند؛ به عبارت دیگر مقادیر متغیر پاسخ دارای توزیع برنولی هستند. در رگرسیون لجستیک احتمال موفقیت در هر آزمایش مستقل برنولی با رابطۀ (1) به دست میآید:
در رابطۀ فوق احتمال موفقیت توزیع برنولی با πi نشان داده شده است و xi بردار متغیرهای مستقل و β بردار پارامترهای مدل هستند.
مفروضات و مدل مسئله فرض کنید n مجموعه آزمایش مستقل وجود دارد و در هر مجموعه بردار متغیرهای پیشبینی p بهصورت است بهنحویکه متغیر پاسخ بهصورت تعریف میشود. zi دارای توزیع برنولی با احتمال موفقیت πiاست. احتمال πiتابعی از xi بوده و در مدل رگرسیون لجستیک بهوسیلۀ تابع ارتباطی مطابق رابطۀ (2) مشخص شده است.
بردار بردار پارامتر مدل است. بهطوریکه β1 مقدار ثابت مدل است. باتوجهبه این تعاریف مقدار احتمال برای هر مجموعه از مشاهدات طبق رابطۀ (3) تعیین میشود.
در رابطۀ (3)، است. فرض میشود دادهها گروهی بوده طوریکه برای مجموعۀ iام متغیرهای کنترلی، mi مشاهده وجود دارد. بیانگر تعداد کل مشاهدات است. بدیهی است که ، دارای توزیع دوجملهای با پارامترهای (mi, πi) با میانگین و واریانس است. فرض کنید مشاهدات بینم در سطوح مختلف از یکدیگر مستقل هستند؛ بنابراین تابع درستنمایی توأم بهصورت رابطۀ (4) تعریف میشود.
طوریکه و است. از رابطۀ (4) لگاریتم گرفته و با در نظر گرفتن ، تابع لگاریتم درستنمایی طبق رابطۀ (5) تعریف میشود.
با مشتقگرفتن از رابطۀ (5) نسبت به β، رابطۀ (6) برقرار است.
که و ماتریس n×p است. طبق رابطۀ (6) است که بردار صفر pبعدی است. در عمل MLE را میتوان با تکرار تخمینهای روش حداقل مربعات وزنی نیز تقریب زد. بیانگر تخمینهای بردار پارامترهای β است بهنحویکه و . ماتریس وزن ماتریس قطری n×n است که دارای قطر اصلی و سایر عناصر صفر است. q بردار متغیرهای وابستۀ تعدیلشده بهصورت است؛ جاییکه برقرار است؛ بنابراین مطابق تعاریف بیانشده رابطۀ (7) حاصل میشود.
در رابطۀ (7)، است. هر دو سمت رابطۀ (6) را در ضرب کرده، رابطۀ (8) به دست میآید.
طبق فرض رابطۀ (8) به معادلۀ تخمینβ تبدیل میشود؛ بنابراین رابطۀ (9) برای تخمین پارامتر به کار گرفته میشود.
مقادیر β پس از چند تکرار و باتوجهبه شرط توقف مطابق گامهای زیر تخمین زده میشود. گامهای تخمین پارامتر 1) تخمین اولیهای از β را به دست آورده و بنامید. توجه کنید این مقدار اولیه براساس تخمین حداقل مربعات معمولی به دست میآید؛ یعنی
قرار دهید i=0. 2) براساس ، مقادیر ، و را محاسبه کنید. 3) را به دست آورید. 4) تخمین β را با استفاده از رابطۀ بههنگام کرده و قرار دهید i=i+1. 5) گام 2 تا 4 را تکرار کنید. تا زمانیکه شود. نرم اقلیدسی بردار v و ε مقدار ثابت کوچک (مثلا =10-5ε) است؛ آنگاه تخمینی مطلوب برای β است. تعریف مسئله و رویکرد پیشنهادی در جمعآوری داده ممکن است داده(های) پرتی درون دادهها وجود داشته باشند که باعث تخمین نادرست پارامترهای پروفایلها شوند. برای اینکه تأثیر این نوع دادهها حذف یا کمتر شود از روشهایی با نام استوار استفاده میشود. این روشها در مدلهای رگرسیونی استفاده شدهاند و عملکرد مناسب خود را در حالتی که دادۀ آلوده وجود دارد نشان دادهاند؛ اما در حوزۀ کنترل فرآیند آماری و بهطور خاص پروفایلها، پژوهشهای اندکی انجام شده است. در این مقاله رویکردی جدید برای مقاومسازی پروفایل لجستیک مبتنی بر روش حداکثر درستنمایی وزنی[xvii] (WMLE) ارائه شده است. این روش یکی از روشهای استوار برای تخمین پارامترهای رگرسیون لجستیک است که مارونا و همکاران[xviii] (2006) آن را ارائه دادهاند. این روش درواقع توسعهیافتۀ روش حداکثر درستنمایی است و بهگونهای به دادههای پرت موجود وزن کمتری اختصاص میدهد. معرفی روش حداکثر درستنمایی وزنی کارول و پدرسون (1993) روش سادهای مبتنی بر روش حداکثر تابع درستنمایی برای تخمین پارامترها پیشنهاد کردهاند. در این روش به دادههای دورافتاده بهصورت کاهشی وزن تخصیص داده میشود. یک مقیاس برای اندازهگیری مشاهدات بهصورت زیر تعریف میشود که این مقیاس شبیه به فاصلۀ ماهالانوبیس[xix] است. مارونا و همکاران (2006) این فاصله برای حالتی محاسبه میشود که متغیر x ثابت نبوده و فرآیند استوارسازی روی آن انجام شود.
بهطوریکه بردار میانگین مقادیر x و ماتریس واریانس-کوواریانس این مقادیر است و nتعداد مشاهدات را نشان میدهد. در کتاب مذکور، روش برمبنای توزیع برنولی توسعه داده شده است؛ ولی در این مقاله روش پیشنهادی برمبنای توزیع بینم است که در قسمت زیر تشریح میشود. روش پیشنهادی در پروفایلها چون مقادیر x ثابت فرض میشوند و قصد بر این است که مشاهدات (y) نسبت به میانگین آنها استوار شود، فاصلۀ آماری بهصورت زیر محاسبه میشود.
در رابطۀ فوق و است. درواقع این فاصله میخواهد مقیاسی استانداردشده از فاصلۀ مشاهدات از میانگین را نشان دهد. به این فاصله، باقیماندۀ پیرسون[xx] نیز اطلاق میشود. حال با استفاده از تابع توزیع دوجملهای رابطهای برای تخمین استوار پارامترها ارائه میشود. تابع چگالی احتمال متغیر تصادفی دوجملهای برابر است با:
تابع درستنمایی برای پارامتر در رابطۀ بالا بهصورت زیر نوشته میشود.
اگر از طرفین لگاریتم گرفته شود و عباراتی حذف شوند که به پارامتر بستگی ندارند، رابطۀ (15) به دست میآید.
تخمین استوار برای به دست آوردن پارامترها از حداقلکردن تابع فوق حاصل میشود؛ ولی برای اینکه به مشاهدات پرت وزن کمتری داده شود میتوان رابطه زیر را در نظر گرفت و آن را حداقل کرد.
بهصورت رابطۀ (17) محاسبه میشود.
در رابطۀ فوق W تابعی غیرصعودی است. کارول و پدرسون (1993) تابع زیر را برای محاسبۀ W پیشنهاد دادند. (c>0)
در رابطۀ فوق c مقداری دلخواه است و اگر باشد، مقدار تابع I برابر با یک است؛ در غیر این صورت صفر خواهد شد. الگوریتم محاسبۀ پارامتر بهصورت زیر است: 1- ابتدا مقدار اولیه برای در نظر گرفته میشود؛ مثلاً مقداری که بهوسیلۀ روش MLE به دست آمده است. 2- با قراردادن مقدار اولیه در رابطۀ (16) یک عدد حاصل و ثبت میشود. 3- سپس با تغییر پارامتر تعیین میشود که تغییر رابطۀ (16) افزایشی یا کاهشی است (مقدار کمتر برای این رابطه دنبال میشود). 4- پس از یافتن جهت حرکت، مقادیر تا آنجایی تغییر داده میشود که دیگر رابطۀ (16) تغییر محسوسی نداشته باشد؛ درواقع اختلاف دو جواب کمتر از ε شود (در اینجا ε برابر 10-4فرض شده است). در این بخش از روش حداکثر درستنمایی وزنی برای تخمین استوار پارامترهای مدل استفاده شد. در ادامه برای ارزیابی عملکرد روش پیشنهادی نتایج که شامل برآرود پارامترهای مدل و احتمال خطای نوع 1 و توان آزمون است با نتایج حاصل از روش حداکثر درستنمایی مقایسه میشود. پایش پروفایل لجستیک برای پایش پروفایلها در فاز 1 روشهای متداولی وجود دارد که از مهمترین آنها روش T2 است. در مقالۀ یه و همکاران (2009) نیز از این روش استفاده شده است. در مقالۀ مذکور با 5 روش T2 محاسبه شد که بهترین آنها از لحاظ کشف شیفتها است. این روش مبتنی بر میانگین نمونه و ادغام بین پروفایلها[xxi] است. در این روش پس از تخمین پارامترها، آماره T2 بهصورت زیر محاسبه میشود.
در این رابطه، SI از طریق رابطۀ زیر محاسبه میشود.
در رابطۀ فوق W از رابطهای که در بخش 2-1 ذکر شد به دست میآید. مثال عددی مثال منتخب برای این مقاله مثال موجود در یه و همکاران (2009) است. در این مثال x یا بردار متغیرهای مستقل دارای 9 سطح است و بهصورت زیر محاسبه میشود.
در این مثال هر متغیر پاسخ برابر با مجموع 30 m= متغیر برنولی است؛ درنتیجه دارای توزیع دوجملهای (بینم) با 30 آزمایش است و در هربار شبیهسازی 30 k= پروفایل تولید میشود. برای تولید این دادهها از تابع رابط لجیت بهصورت زیر استفاده میشود.
در این مثال است که 3 و 2 است. احتمال خطای نوع 1 روی مقدار 05/0 ثابت شده است. برای ایجاد دادههای پرت از رابطۀ (22) استفاده میشود.
در این رابطه ها دارای توزیع نرمال با میانگین صفر و واریانسσ2 هستند. در اینصورت مقادیر بهدستآمده احتمال خطای نوع 1 برای حد بالای کنترل تغییر مییابد. اگر واریانس خطاها (σ2) یک در نظر گرفته شود، تغییر احتمال خطای نوع 1 برای هر دو روشِ برآورد در جدول شماره 1 نشان داده شده است. 3 جدول1- مقادیر احتمال خطای نوع 1 پس از افزودن
پس از به دست آوردن حد بالای کنترل برای هریک از روشها برای رابطۀ (22)، اثر دادههای پرت بهوسیلۀ افزایش واریانس خطاها بررسی میشود. اگر برای پروفایلهای 5، 10، 15، 20، 25 و 30 از 9 سطح موجود برای x که سه سطح آن بهتصادف انتخاب شده است، واریانس خطاها از 1 به 4 افزایش یابد، مقادیر برآورد پارامترهای مدل برای 10000 بار شبیهسازی در جداول (2) تا (5) نشان داده شده است. در جدول 2 مقادیر میانگین و در جدول 3 مقادیر انحراف استاندارد برای برآورد پارامتر برای حالتی که به شیفت کرده است، تحت مقادیر مختلف با روش پیشنهادی و روش حداکثر درستنمایی نشان داده شده است.
جدول 2- مقادیر میانگین برآورد پارامتر درحالت افزایش واریانس خطاها
جدول 3- مقادیر انحراف استاندارد برآورد پارامتر در حالت افزایش واریانس خطاها
حال مقادیر میانگین و انحراف استاندارد برآورد پارامتر درحالتیکه این پارامتر به شیفت کرده است، برای مقادیر مختلف با دو روش برآوردِ ذکرشده محاسبه و در جداول 4 و 5 آورده شده است.
جدول 4- مقادیر میانگین برآورد پارامتر در حالت افزایش واریانس خطاها
جدول 5- مقادیر انحراف استاندارد برآورد پارامتر در حالت افزایش واریانس خطاها
همانطورکه مشاهده میشود درحالتیکه واریانس خطاها افزایش مییابد، میانگین و انحراف استاندارد تخمین پارامترها بهشدت تحت تأثیر قرار میگیرد. این تغییرات بسیار محسوستر از حالتی است که فقط در پروفایلها شیفت باشد؛ زیرا با تغییر واریانس خطاها، دادههای پرتی درون پروفایلها ایجاد میشود که روش کلاسیک MLE از آنها تأثیر زیادی میپذیرد و روی تخمین پارامترها اثر منفی میگذارد. از سوی دیگر همانگونه در جداول بالا مشخص است روش پیشنهادی بهمراتب تأثیرپذیری کمتری از دادههای پرت دارد و با وزندادن به دادههایی که دورافتاده هستند تخمین بهتری از پارامترها به دست میآید. حال احتمال خطای نوع 1 نمودار کنترل در حضور دادههای پرت در سطوح مشخص از طریق افزایش واریانس خطاها محاسبه و نتایج در جدول 6 نشان داده شده است.
جدول 6- مقادیر احتمال خطای نوع 1 پس از افزایش واریانس خطاها
همانگونهکه از جدول 6 مشخص است درصورت وجود دادههای آلوده که از طریق افزایش واریانس خطاها به دست میآید، روش استوار بهمراتب عملکرد بهتری از خود نشان میدهد. حال برای مقایسۀ توان نمودار کنترل زمانیکه پارامترهای پروفایل با روش پیشنهادی و روش کلاسیک تخمین زده میشوند، حد کنترل بالا بهگونهای تنظیم میشود که احتمال خطای نوع 1 برابر 05/0 برای نمودار کنترل برمبنای هر دو روش تخمین به دست آید. سپس با شیفتدادن در پارامترهای رگرسیون لجستیک توان نمودار کنترل تحت شیفتهای مختلف در پارامترهای و محاسبه میشود.
جدول 7- مقادیر احتمال خطای نوع 1 و توان آزمون برای شیفت در پارامتر
جدول 8- مقادیر احتمال خطای نوع 1 و توان آزمون برای شیفت در پارامتر
باتوجهبه جداول 7 و 8 نتیجه میشود که با ایجاد شیفت در پارامترهای رگرسیون لجستیک، توان نمودار کنترل برمبنای روش پیشنهادی از روش کلاسیک حداکثر درستنمایی بالاتر است. این مطلب نشاندهندۀ عملکرد بهتر روش پیشنهادی است. در این بخش نحوۀ آلودهکردن دادهها تغییر داده میشود؛ به این صورت که درصدی ((r از کل دادههای موجود با افزایش واریانس خطاها آلوده میشود. در جدول 9 برای r برابر با 07/0 و 15/0 واریانس خطاها از 1 به 4 تغییر داده شده و احتمال خطای نوع 1 نمودار کنترل تحت هر دو روش پیشنهادی و کلاسیک تخمین محاسبه و گزارش شده است. جدول 9- احتمال خطای نوع 1 در حالت خطای کلی
همانطورکه مشخص است در روش کلاسیک احتمال خطای نوع 1 بهشدت تحت تأثیر دادههای پرت قرار میگیرد؛ ولی روش پیشنهادی بهمراتب عملکرد بهتری نسبت به روش معمول دارد.
نتیجهگیری در این مقاله از روش استوار برای تخمین پارامترهای پروفایل لجستیک استفاده و با روش کلاسیکِ حداکثر درستنمایی مقایسه شد. این دو روش در حالتی که دادههای پرت درون دادهها وجود دارند از لحاظ تخمین پارامترها و احتمال خطای نوع 1 و توان نمودار کنترل با هم مقایسه شدند. البته در این مقاله دو نوع آلودگی بهصورت جداگانه در نظر گرفته شد. با مقایسۀ نتایج مشخص میشود هرگاه دادۀ پرت در مشاهدات وجود داشته باشد، روش کلاسیکِ حداکثر درستنمایی کارایی خود را بهطور کامل از دست میدهد. در مقابل روش پیشنهادی حداکثر درستنمایی وزنی بهمراتب عملکرد مناسبتری نسبت به روش کلاسیک دارد. این نتیجه از تخمینهای پارامترها، احتمال خطای نوع 1 و توان نمودار کنترل برای پایش پروفایلهای لجستیک در فاز 1 مشاهده میشود؛ به عبارت دیگر هدف از این پژوهش نشاندادن عملکرد روش WMLE نسبت به روش MLE برای تخمین پارامترهای پروفایل رگرسیون لجستیک با حضور دادههای پرت بوده که بدینمنظور از مثال شبیهسازی استفاده و برمبنای تخمین پارامترها، معیارهای هشدار اشتباهی و توان نمودار کنترل تحلیل شده است. نتایج حاصل از شبیهسازی نشان داد روش WMLE بهدلیل تخصیص وزن کمتر به دادههای پرت و کاهش اثر این دادهها، عملکرد بهتری را در تخمین پارامتر از خود نشان داده است. بسیاری از پژوهشگران نیز برای نشاندادن و ارزیابی عملکرد روشهای پیشنهادی خود از مثال شبیهسازی استفاده کردهاند؛ برای مثال میتوان به پژوهشهای اسدزاده و همکاران[xxii] (2009)، شهریاری و همکاران[xxiii](2009)، و عبادی و شهریاری (2014) اشاره کرد. [i] Kang and Albin [ii] Mahmoud and Woodall [iii] Zhang et al. [iv] Zhu and Lin [v] Williams et al. [vi] Zou et al. [vii] Vaghefi et al. [viii] Generalized Linear Model [ix] Yeh et al. [x] Saghaei et al. [xi] Mean Square [xii] Maximum Likelihood [xiii] Outlier [xiv] Montgomery et al. [xv] Huber [xvi] Ebadi and Shahriari [xvii] Weighted Maximum Likelihood Method [xviii] Maronna et al. [xix] Mahalanobis [xx] Pearson Residual [xxi] T2 based on sample average and intra profile pooling [xxii] Asadzadeh et al. [xxiii] Shahriari et al. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
مراجع | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Noorossana, R., & Izadbakhsh, H.R., (2013), “Profile Monitoring for Multinomial Responses” International Journal of Industrial Engineering & Production Managemen, 23) 4), 417-429.
Asadzadeh, S. Aghaie, A, Shahriari, H. (2009), “Monitoring Dependent Process Steps Using Robust Cause-selecting Control Charts”, Quality and Reliability Engineering International, 25(2), 851–874.
Carroll, R.J., & Pederson, S., (1993), "On robustness in the logistic regression model", Journal of the Royal Statistical Society (B), 2(55), 693–706.
Ebadi, M., & Shahriari, H., (2014), "سادهRobust Estimation of Parameters in Simple Linear Profiles Using M-Estimators", Communications in Statistics - Theory and Methods, 43(20), 4308-4323.Huber, P. J., (1981), "Robust Statistics", John Wiley & Sons, New York.
Kang, L., & Albin, S.L., (2000), "On-Line Monitoring When the Process Yields a Linear Profile", Journal of Quality Technology, 32(4), 418-426.
Mahmoud, M.A., & Woodall, W.H., (2004), "Phase I Analysis of Linear Profiles with Calibration Applications", Technometrics, 3(46), 380-391.
Maronna, AR., Martin, R.D., & Yohai, V.J., (2006), Robust Statistics Theory and Methods, John Wiley, New York.
Montgomery, D.C., Peck, & E.A., Vining, G., (2015), Introduction to linear regression analysis (4th ed.), John Wiley & Sons, New York.
Noorossana, R., Saghaei, A., & Amiri, A., (2011), "Statistical Analysis of Profile Monitoring", John Wiley & Sons, Inc.
Saghaei, A., Mehrjoo, M., & Amiri, A., (2009), "A CUSUM-based Method for Monitoring Simple Linear Profiles". International Journal of Advanced Manufacturing Technology, 45(10), 1252-1260.
Saghaei, A., Rezazadeh-Saghaei, M,. Noorossana, R., & Dorri, M., (2012),"Phase II Logistic Profile Monitoring",International Journal of Industrial Engineering & Production Research, 23(4), 291-299.
Shahriari, H., Maddahi, A., Shokouhi, A.H. (2009), “A Robust Dispersion Control Chart Based on M-estimate”, Journal of Industrial and System Engineering, 2(4), 297-307.
Vaghefi, A., Tajbakhsh S.D., & Noorossana, R., (2009), "Phase II Monitoring of Nonlinear Profiles", Communications in Statistics-Theory and Methods, 21(38), 1834-1851.
Williams, J. D., Woodall, W. H., & Birch, J. B., (2003), "Phase I Monitoring of Nonlinear Profiles"., paper presented at the 2003 Quality and Productivity Research Conference, Yorktown Heights, New York.
Williams J.D., Woodall W.H., & Birch, J.B, (2007), "Statistical Monitoring of Nonlinear Product and Process Quality Profiles", Quality and Reliability Engineering International, 23(2), 925-941.
Woodall, W.H., (2007), "Current Research on Profile Monitoring", Revista Producão, 12(17), 420-436.
Yeh A.B., Huwang L., & Li Y.M., (2009), "Profile Monitoring for a Binary Response", IIE Transactions, 41(13), 931-941.
Zhang J., Li Z. H., & Wang Z. H, (2009), "Control Chart Based on Likelihood Ratio for Monitoring Linear Profiles". Computational Statistics and Data Analysis, 53(7), 1440-1448.
Zhu J., & Lin D.K., (2010), "Monitoring the Slopes of Linear Profiles". Quality Engineering, 33(1), 1-12.
Zou, C., Tsung, F., & Wang, Z., (2008), "Monitoring Profiles Based on Nonparametric Regression Methods", Technometrics, 21(50), 512-526. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
آمار تعداد مشاهده مقاله: 809 تعداد دریافت فایل اصل مقاله: 486 |