زمان تخمینی مطالعه: 4 دقیقه
دادههای اسمی(Nominal Data) یکی از اساسیترین انواع دادهها در تجزیه و تحلیل دادهها است. شناسایی و تفسیر آن در بسیاری از زمینهها از جمله آمار، علوم کامپیوتر، روانشناسی و بازاریابی ضروری است. این مقاله ویژگیها، کاربردها و تفاوتهای دادههای اسمی را با سایر انواع دادهها را بررسی میکند.
دادههای اسمی چیست؟
دادههای اسمی برخلاف دادههای ترتیبی، متغیرها را با یک ترتیب اساسی برچسبگذاری یا دستهبندی میکند. به عنوان مثال، هنگام جمعآوری دادهها در مورد اشکال حملونقل ترجیحی، مانند دوچرخه، اتومبیل، اتوبوس، قطار، تراموا یا قطار، هر دسته منحصر به فرد و غیرقابل سنجش است. مشخصات اصلی دادههای اسمی به شرح زیر است:
- دستهبندی بدون ترتیب: متغیرها را بدون ارائه سلسله مراتب یا رتبهبندی در میان آنها به گروههای مجزا دستهبندی میکند. به عنوان مثال، انواع خون (A، B، AB، O) به طور اسمی طبقهبندی میشوند، زیرا هیچ نظم ذاتی در آنها وجود ندارد.
- برچسبهای غیر عددی: نامها، برچسبها یا کدها اغلب برای نشان دادن این نوع دادهها استفاده میشوند. این برچسبها هیچ رابطه عددی را نشان نمیدهند. آنها فقط توصیفی هستند.
- انحصاری متقابل: هیچ همپوشانی بین دستهها وجود ندارد. هر قطعه داده برای دسته خود منحصر به فرد است. برای مثال، جنسیت پاسخگوی نظرسنجی اسمی است. آنها فقط میتوانند در یک گروه قرار گیرند.
- بدون عملیات حسابی: رویههای حسابی مانند جمع و تفریق برای Nominal Data اعمال نمیشود. این به این دلیل است که آنها فاقد یک مقدار عددی معنادار هستند.
کاربردهای دادههای اسمی
دادههای اسمی در زمینههای مختلف برای دستهبندی و تجزیه و تحلیل ویژگیهایی که نظم طبیعی ندارند استفاده میشود. در ادامه برخی از کاربردیهای رایج این نوع داده آورده شده است:
- تحقیقات بازار: تقسیمبندی مصرفکنندگان بر اساس ترجیحات برند یا انتخاب محصول.
- مراقبتهای بهداشتی: طبقهبندی بیماران بر اساس گروه خونی یا صفات ژنتیکی.
- مطالعات جامعه شناختی: شناسایی گروههای جمعیتی بر اساس مقولاتی مانند مذهب یا قومیت.
- منابع انسانی: سازماندهی کارکنان بر اساس بخش یا نقش شغلی.
دادههای اسمی در مقابل دادههای ترتیبی
در ادامه و در جدول زیر مقایسهای مابین Nominal Data و دادههای ترتیبی آورده شده است.
منظر | دادههای اسمی | دادههای ترتیبی |
---|---|---|
تعریف | متغیرها را بدون ترتیب طبقهبندی میکنند | متغیرها را به ترتیب معنیدار دستهبندی و رتبهبندی میکند. |
نظم | فاقد نظم ذاتی است | دارای رتبه یا ترتیب مشخص است |
مثال | رنگ چشم، جنس، انواع میوهها | سطح تحصیلات، رضایت مشتری، وضعیت اجتماعی-اقتصادی. |
تکنیکهای تحلیل | شمارش فرکانس، حالت | میانهها، دامنهها و روشهای آماری مبتنی بر مرتبه |
نحوه نمایش رایج | برچسبهای طبقهبندی شده | دستهها یا رتبههای مرتب شده |
مقیاس | غیر عددی یا طبقهبندی شده بدون دنباله | دستههای مرتب شده اغلب مقادیر عددی را برای رتبه اختصاص میدهند |
عملیات آماری | محدود به شمارش و گروهبندی | امکان ترتیب و مقایسه را فراهم میکند، اما عملیات حسابی را نه |
چگونه دادههای اسمی را تجزیه و تحلیل کنیم؟
تجزیه و تحلیل Nominal Data معمولاً شامل خلاصه کردن فراوانی هر دسته است. در این بخش چند تکنیک رایج برای تجزیه و تحلیل دادههای اسمی آورده شده است:
- توزیع فراوانی: شمارش تعداد وقوع برای هر دسته.
- حالت Mode: شناسایی دسته با بیشترین فراوانی.
- جداول احتمالی: برای بررسی رابطه بین دو متغیر اسمی استفاده میشود.
- تجسم: نمایش بصری دادههای اسمی اغلب شامل موارد زیر است:
- نمودار میلهای: نمایش فرکانس هر دسته با نوار.
- نمودار دایرهای: نشان دادن نسبت هر دسته در یک کل.
نتیجه گیری
دادههای اسمی در سازماندهی و تفسیر اطلاعات طبقهبندی شده در زمینههای مختلف بسیار مهم است. درک ویژگیهای آن و نحوه تجزیه و تحلیل آن برای تجزیه و تحلیل دادههای عملی و تصمیم گیری ضروری است. چه در تحقیقات بازار، چه در مراقبتهای بهداشتی و چه در جامعه شناسی، به دستهبندی دنیای اطراف ما کمک میکند و پایهای برای تحلیل و بینش بیشتر فراهم میکند.