آرگومانها | توضیحات |
Start Year | سال شروع دادهها را وارد کنید |
Start Month | ماه شروع دادهها را وارد کنید |
Start Day | روز شروع دادهها را وارد کنید |
Mtilde | تعداد مشاهداتی که برای برازش مدل HMM با استفاده از مشاهده فعلی و مشاهدات قبل از آن بکار میرود راهنما: این مقدار باید مضربی از دوره تناوب دادهها باشد. مثلاً انتخاب عدد 2 به معنی دو برابر دوره تناوب است و زمانی که کل دادهها مدنظر است، 1- را انتخاب کنید |
Range of Data(min) | ابتدای بازه تحت بررسی را وارد کنید راهنما: توجه نمائید که بر خلاف الگوریتمهای دیگر، برآورد پارامترهای اولیه توسط HMM انجام میشود؛ لذا محدوده باید به اندازه کافی طولانی باشد تا اطلاعات لازم برای برآورد HMM وجود داشته باشد |
Range of Data(max) | انتهای بازه تحت بررسی را وارد کنید |
Frequency | دوره تناوب داده ها (ماهانه، هفتگی) را انتخاب کنید |
Trend | مشخص کنید که آیا یک روند زمانی خطی وجود دارد یا خیر؛ yes (حالت پیش فرض) نشاندهندهی وجود روند است |
Choose xlsx File | در این بخش فایل دادهها را آپلود نمائید. ساختار دادهها طبق نمونه مورد نظر باشد |
توجه: اجرای این الگوریتم نسبت به سایر الگوریتمها مدت زمان بیشتری نیاز دارد |
Hidden Markov Model
برخلاف اکثر روشهای رگرسیونی، روشهای سری زمانی در شرایطی که در داده ها همبستگی دیده میشود، به کار میرود. برای دادههای سندرمیک و آزمایشگاهی که عموماً روزانه یا هفتگی جمع آوری میشوند، همبستگی های اصلی عبارتند از خودهمبستگی در یک دوره زمانی (همبستگی پیاپی) و همبستگی های مرتبط با الگوی فصلی در داده ها، که میتواند ترکیبی از هفتگی، فصلی یا سالانه باشد. استفاده از روشهای سری زمانی مستلزم مانا بودن سری است. تبدیل داده ها منجر به یک سری زمانی مانا میشود، که برای آن یک توزیع احتمال فرض میشود. با این حال، همواره تبدیل داده ها و یافتن توزیع آنها، امکانپذیر نیست. داده ها ممکن است تغییرات ناگهانی و گسترده در مقدار و همچنین تناوب نامنظم را در شرایطی مانند اپیدمی ها، تغییر در تعریف مورد، غربالگری یا واکسیناسیون نشان دهند. روشهای بهبودیافته ای برای تشخیص رخدادهای غیرمنتظره و داده های نامانا نیز توسعه یافته اند که مبتنی بر الگوریتم های بیزی هستند و از حوزه زیست پزشکی به مراقبت اپیدمیولوژیک منتقل شده اند. انتخاب مقادیر اولیه پارامترهای مدل در این روشها دشوار است، زیرا باید بر اساس دانش قبلی از پدیده مورد مطالعه باشد؛ دانشی که همیشه در دسترس نیست. هنوز روشهای دیگری در تشخیص همه گیری ها وجود دارند که پیشنهاد شده اند و نشان داده اند که کارآمد هستند؛ اما از معایب آنها این است که نیاز به فرضیاتی در مورد ماهیت بیماریهای تحت مراقبت دارند. روش دیگری برای پایش دادههای نظام مراقبت، مبتنی بر مدلهای مارکوف پنهان (HMM) پیشنهاد شده است؛ در این روش فرض میشود که دادهها از توزیعی تولید می شوند که این توزیع آمیخته متناهی از توزیع های دیگر است و از یک HMM پیروی می کنند. درسال های اخیر بسیاری از نوآوری های آماری در زمینه تشخیص طغیان بیماری ها، متمایل به مدل های سری زمانی پیچیده تر، از جمله مدل های بیزی و HMM است. استرات و کارات (1999) استفاده از HMM را برای پایش دادههای اپیدمیولوژی پیشنهاد دادند. مدل های مارکوف پنهان تا قبل از آن در بسیاری از زمینه ها، از جمله تجزیه و تحلیل سیگنال الکتروکاردیوگرافی، تجزیه و تحلیل فرکانس تشنج در بیماری صرع، تجزیه و تحلیل توالی DNA، مدلسازی نورون “ring18” و هواشناسی استفاده شده بود. ایده اصلی در این روش آن است که سری زمانی بیماری های ثبت شده را به دو بخش، دوره اپیدمی و دوره غیر اپیدمی تقسیم میکند.
فرض کنید که yt برای 𝑛 , ⋯ ,2 ,1 = 𝑡، یک مقدار مشاهده شده از فرآیند تصادفی (Y = (Yt; t =1,2, ….., n است و با یک 𝑡 متغیر پنهان همچون St که توزیع شرطی 𝑌 را مشخص می کند، مرتبط است.
اگر St آنگاه توزیع شرطی Yt دارای چگالی
است؛ به طوریکه 𝑓jt چگالی از پیش تعیین شده مانند توزیع پواسن یا گاوسی است و θj پارامتری است که باید برآورد شود. فرض میشود که دنباله پنهان St برای 𝑛 , ⋯ ,2 ,1 = 𝑡 از یک زنجیره مارکوف همگن دو حالته از مرتبه 1 با احتمالات انتقال ثابت
پیروی میکند. به عنوان مثال فرض کنید که 𝑡𝑦 نرخ بروز مشاهده شده ILI در هفته t ام است و دو توزیع متناسب با نرخ بروز ILI در دوره اپیدمی و غیر اپیدمی وجود دارد؛ 0,1 = 𝑗. 𝑝01 احتمال تغییر حالت از دوره غیر اپیدمی به دوره اپیدمی است. استرات و کارات HMMهایی را با بیش از دو حالت پنهان در نظر گرفتند و با استفاده از معیار اطلاعات بیزی انتخاب مدل را انجام دادند. تخمین پارامترها با استفاده از یک نسخه اصلاح شده از الگوریتم EM به دست آمد.
منابع
Le Strat, Y., & Carrat, F. (1999). Monitoring epidemiologic surveillance data using hidden Markov models. Statistics in medicine, 18(24), 3463-3478
زارعی، بشرا و همکاران (1401). طراحی مجموعه ابزارهای ارزشیابی الگوریتمهای شناسایی طغیان در کشف بهنگام انواع اپیدمیهای تک منبعی و پیشرونده. پایان نامه دکترای تخصصی. دانشگاه علوم پزشکی همدان.