HMM

راهنمای استفاده از HMM Algorithm

آرگومان‌ها	توضیحات
Start Year	سال شروع داده‌ها را وارد کنید
Start Month	ماه شروع داده‌ها را وارد کنید
Start Day	روز شروع داده‌ها را وارد کنید
Mtilde	تعداد مشاهداتی که برای برازش مدل HMM با استفاده از مشاهده فعلی و مشاهدات قبل از آن بکار می‌رود راهنما: این مقدار باید مضربی از دوره تناوب داده‌ها باشد. مثلاً انتخاب عدد 2 به معنی دو برابر دوره تناوب است و زمانی که کل داده‌ها مدنظر است، 1- را انتخاب کنید
Range of Data(min)	ابتدای بازه تحت بررسی را وارد کنید راهنما: توجه نمائید که بر خلاف الگوریتم‌های دیگر، برآورد پارامترهای اولیه توسط HMM انجام می‌شود؛ لذا محدوده باید به اندازه کافی طولانی باشد تا اطلاعات لازم برای برآورد HMM وجود داشته باشد
Range of Data(max)	انتهای بازه تحت بررسی را وارد کنید
Frequency	دوره تناوب داده ها (ماهانه، هفتگی) را انتخاب کنید
Trend	مشخص کنید که آیا یک روند زمانی خطی وجود دارد یا خیر؛ yes (حالت پیش فرض) نشان‌دهنده‌ی وجود روند است
Choose xlsx File	در این بخش فایل داده‌ها را آپلود نمائید. ساختار داده‌ها طبق نمونه مورد نظر باشد
توجه: اجرای این الگوریتم نسبت به سایر الگوریتم‌ها مدت زمان بیشتری نیاز دارد

Hidden Markov Model

برخلاف اکثر روشهای رگرسیونی، روشهای سری زمانی در شرایطی که در داده ها همبستگی دیده میشود، به کار میرود. برای دادههای سندرمیک و آزمایشگاهی که عموماً روزانه یا هفتگی جمع آوری میشوند، همبستگی های اصلی عبارتند از خودهمبستگی در یک دوره زمانی (همبستگی پیاپی) و همبستگی های مرتبط با الگوی فصلی در داده ها، که میتواند ترکیبی از هفتگی، فصلی یا سالانه باشد. استفاده از روشهای سری زمانی مستلزم مانا بودن سری است. تبدیل داده ها منجر به یک سری زمانی مانا میشود، که برای آن یک توزیع احتمال فرض میشود. با این حال، همواره تبدیل داده ها و یافتن توزیع آنها، امکانپذیر نیست. داده ها ممکن است تغییرات ناگهانی و گسترده در مقدار و همچنین تناوب نامنظم را در شرایطی مانند اپیدمی ها، تغییر در تعریف مورد، غربالگری یا واکسیناسیون نشان دهند. روشهای بهبودیافته ای برای تشخیص رخدادهای غیرمنتظره و داده های نامانا نیز توسعه یافته اند که مبتنی بر الگوریتم های بیزی هستند و از حوزه زیست پزشکی به مراقبت اپیدمیولوژیک منتقل شده اند. انتخاب مقادیر اولیه پارامترهای مدل در این روشها دشوار است، زیرا باید بر اساس دانش قبلی از پدیده مورد مطالعه باشد؛ دانشی که همیشه در دسترس نیست. هنوز روشهای دیگری در تشخیص همه گیری ها وجود دارند که پیشنهاد شده اند و نشان داده اند که کارآمد هستند؛ اما از معایب آنها این است که نیاز به فرضیاتی در مورد ماهیت بیماریهای تحت مراقبت دارند. روش دیگری برای پایش دادههای نظام مراقبت، مبتنی بر مدلهای مارکوف پنهان (HMM) پیشنهاد شده است؛ در این روش فرض میشود که دادهها از توزیعی تولید می شوند که این توزیع آمیخته متناهی از توزیع های دیگر است و از یک HMM پیروی می کنند. درسال های اخیر بسیاری از نوآوری های آماری در زمینه تشخیص طغیان بیماری ها، متمایل به مدل های سری زمانی پیچیده تر، از جمله مدل های بیزی و HMM است. استرات و کارات (1999) استفاده از HMM را برای پایش دادههای اپیدمیولوژی پیشنهاد دادند. مدل های مارکوف پنهان تا قبل از آن در بسیاری از زمینه ها، از جمله تجزیه و تحلیل سیگنال الکتروکاردیوگرافی، تجزیه و تحلیل فرکانس تشنج در بیماری صرع، تجزیه و تحلیل توالی DNA، مدلسازی نورون “ring18” و هواشناسی استفاده شده بود. ایده اصلی در این روش آن است که سری زمانی بیماری های ثبت شده را به دو بخش، دوره اپیدمی و دوره غیر اپیدمی تقسیم میکند.

فرض کنید که y_t برای 𝑛 , ⋯ ,2 ,1 = 𝑡، یک مقدار مشاهده شده از فرآیند تصادفی (Y = (Y_t; t =1,2, ….., n است و با یک 𝑡 متغیر پنهان همچون S_tکه توزیع شرطی 𝑌 را مشخص می کند، مرتبط است.

اگر S_t آنگاه توزیع شرطی Y_t دارای چگالی

است؛ به طوریکه 𝑓jt چگالی از پیش تعیین شده مانند توزیع پواسن یا گاوسی است و θj پارامتری است که باید برآورد شود. فرض میشود که دنباله پنهان St برای 𝑛 , ⋯ ,2 ,1 = 𝑡 از یک زنجیره مارکوف همگن دو حالته از مرتبه 1 با احتمالات انتقال ثابت

پیروی میکند. به عنوان مثال فرض کنید که 𝑡𝑦 نرخ بروز مشاهده شده ILI در هفته t ام است و دو توزیع متناسب با نرخ بروز ILI در دوره اپیدمی و غیر اپیدمی وجود دارد؛ 0,1 = 𝑗. 𝑝01 احتمال تغییر حالت از دوره غیر اپیدمی به دوره اپیدمی است. استرات و کارات HMMهایی را با بیش از دو حالت پنهان در نظر گرفتند و با استفاده از معیار اطلاعات بیزی انتخاب مدل را انجام دادند. تخمین پارامترها با استفاده از یک نسخه اصلاح شده از الگوریتم EM به دست آمد.

منابع
Le Strat, Y., & Carrat, F. (1999). Monitoring epidemiologic surveillance data using hidden Markov models. Statistics in medicine, 18(24), 3463-3478

زارعی، بشرا و همکاران (1401). طراحی مجموعه ابزارهای ارزشیابی الگوریتمهای شناسایی طغیان در کشف بهنگام انواع اپیدمیهای تک منبعی و پیشرونده. پایان نامه دکترای تخصصی. دانشگاه علوم پزشکی همدان.