مرکز تحقیقات روماتولوژی، دانشگاه علوم پزشکی تهران، تهران، ایران
چکیده: (54 مشاهده)
وجود دادههای گم شده، یکی از چالشهای شایع و اغلب اجتنابناپذیر در علم داده و پژوهش های بالینی محسوب میشود. این مسئله میتواند بر دقت، اعتبار درونی و تفسیر نتایج پژوهش تأثیر بگذارد. در این مسیر، درک دقیق مجموعه دادهها به تحلیلگران سلامت امکان میدهد تا راهبردهایی برای پیشگیری و کاهش دادههای گم شده در مراحل طراحی و اجرای مطالعه به کار گیرند. با این حال به دلیل ماهیت تحقیقات بالینی، وجود دادههای ناقص همچنان اجتنابناپذیر می باشد و استفاده از راهکارهای عملی برای مدیریت دادههای گم شده ضروری است. این مقاله روشهای اصلی نحوه برخورد با داده های گم شده را مرور میکند و به معرفی انواع مکانیزم و الگوی گم شدگی و همچنین نسبت دادههای گم شده قابل چشم پوشی می پردازد. در پایان با ارائه یک مثال بر روی مجموعه داده فرضی مربوط به بیماری آرتریت روماتوئید، یکی از کاربردیترین روش های جایگذاری داده های گمشده (جانهی چندگانه با معادلات زنجیره ایی) را معرفی نموده و با استفاده از بسته mice از نرم افزار R، کد های مربوطه اجرا و تفسیر می گردند. لازم به ذکر است محققان با هر سطح دانش نسبت به علم آمارزیستی و نرم افزارR، می توانند با اجرای کدهای ضمیمه شده در مقاله حاضر،درصورت برقرار بودن پیش فرض های مربوطه، به برآورد داده های گمشده در دیتاست پژوهش خود بپردازند. وجود دادههای گم شده، یکی از چالشهای شایع و اغلب اجتنابناپذیر در علم داده و پژوهش های بالینی محسوب میشود. این مسئله میتواند بر دقت، اعتبار درونی و تفسیر نتایج پژوهش تأثیر بگذارد. در این مسیر، درک دقیق مجموعه دادهها به تحلیلگران سلامت امکان میدهد تا راهبردهایی برای پیشگیری و کاهش دادههای گم شده در مراحل طراحی و اجرای مطالعه به کار گیرند. با این حال به دلیل ماهیت تحقیقات بالینی، وجود دادههای ناقص همچنان اجتنابناپذیر می باشد و استفاده از راهکارهای عملی برای مدیریت دادههای گم شده ضروری است. این مقاله روشهای اصلی نحوه برخورد با داده های گم شده را مرور میکند و به معرفی انواع مکانیزم و الگوی گم شدگی و همچنین نسبت دادههای گم شده قابل چشم پوشی می پردازد. در پایان با ارائه یک مثال بر روی مجموعه داده فرضی مربوط به بیماری آرتریت روماتوئید، یکی از کاربردیترین روش های جایگذاری داده های گمشده (جانهی چندگانه با معادلات زنجیره ایی) را معرفی نموده و با استفاده از بسته mice از نرم افزار R، کد های مربوطه اجرا و تفسیر می گردند. لازم به ذکر است محققان با هر سطح دانش نسبت به علم آمارزیستی و نرم افزارR، می توانند با اجرای کدهای ضمیمه شده در مقاله حاضر،درصورت برقرار بودن پیش فرض های مربوطه، به برآورد داده های گمشده در دیتاست پژوهش خود بپردازند.
Madreseh E, Hosseingholizadeh N, Akhlaghi M, Alikhani M, Sadeghi S. Handling Missing Data in Clinical and Medical Research: Concepts, Challenges, and Implementation in R Software. Journal title 2025; 1 (3) : 7 URL: http://idap.ir/article-1-52-fa.html
مدرسه الهام، حسینقلی زاده نسرین، اخلاقی معصومه، علیخانی مجید، صادقی شکوفه. مدیریت دادههای گم شده در پژوهشهای بالینی: مفاهیم، چالش ها و روشهای برخورد با آنها با استفاده از نرم افزار R. عنوان نشریه. 1404; 1 (3) :54-62