• مسابقه Power BI
    • اولین مسابقه Power BI
    • دومین مسابقه Power BI
  • جدیدترین مطالب آموزشی
  • تحلیل داده نرم افزاری (فنّی)
  • تحلیل داده غیرفنّی
  • دوره‌های آفلاین
  • سبد خرید
  • تماس با ما
  • حساب کاربری

سبد خرید شما خالی است.

گروه تحلیلگری
  • مسابقات Power BI
    • اولین مسابقه Power BI ایران
    • دومین مسابقه Power BI ایران
  • مطالب آموزشی
    • تمام مطالب آموزشی
    • Excel
    • Power BI
    • Power Query
    • DAX
  • مسیرهای یادگیری
    • مسیر یادگیری تحلیل داده (فنی)
    • مسیر یادگیری غیرفنّی تحلیلگر داده
  • دوره‌های آموزشی
    • مهارت‌های غیرفنّی تحلیلگر داده
    • اکسل
    • Power BI
    • Power Query
    • SQL
    • تحلیل داده با پایتون
    • سبد خرید
  • ارتباط با ما
    • تماس
    • اینستاگرام
0
حساب کاربری

مقالات

تشخیص داده‎های پرت در اکسل

یکی از مراحل پروژه های داده کاوی و علم داده پیش پردازش داده ها می باشد. تشخیص داده‎های پرت در اکسل مهمترین بخش از پیش پردازش داده هاست.

وجود داده های پرت دلایل گوناگونی دارد. گاهی در وارد کردن داده‌ها اشتباهی صورت می گیرد و مقادیری بزرگتر و یا کوچکتر از حد معمول وارد می شوند که به آن‌ها داده‌های پرت (دورافتاده) گفته می‌شود.  نام دیگری داده های پرت Outlier است و به عمل جداسازی داده های پرت Outlier Detection گفته می شود. گاهی نیز در وارد کردن داده‌ها اشتباهی صورت نگرفته است و ایراد از داده‌های اصلی است مثلاً حقوق یک نفر خیلی کمتر و دورتر از میانگین حقوق های دریافتی کلیه پرسنل شرکت است.

فرض کنید بگویند میانگین ثروت افراد حاضر درمایکروسافت ۱۰۰میلیون دلار است. طبیعتا شخصی مانند بیل گیتس که ثروت او به اندازه چندین کشور است، میانگین را به بسیار بالاتر از میانگین واقعی تبدیل کرده‌است و یک متخصص داده‌کاوی باید بتواند این این مسئله را تشخیص دهد. در واقع ثروت بیل گیتس یک داده پرت یا همان Outlier در میان ثروت کارکنان و مدیران مایکروسافت است.

چرا داده های پرت باید حذف شوند؟

وجود داده های پرت باعث می شود تا ارتباط بین دو متغیر از بین برود. همچنین برای انتخاب روش های آماری و داده کاوی باید ابتدا نرمال بودن؛ همسان بودن و واریانس داد ها محاسبه شوند.

روش حذف داده‎های پرت در اکسل

روش های گوناگونی برای تشخیص داده‎های پرت در اکسل وجود دارد، ما در این آموزش با کمک محاسبه چارک اول و چارک سوم به داده های پرت می رسیم و با کمک Conditional Formatting آن ها را مشخص می کنیم.

با کمک فرمول Quartile می توانید با دادن ورودی آخر چارک مورد نظر یعنی چارک های اول و سوم را محاسبه کنید:

تشخیص داده های پرت در اکسل

سپس آن ها را از هم کم کنید تا 50% داده ها مشخص شود. در نهایت اختلاف چارک اول و سوم از حد وسط حد بالا و پایین داده ها را مشخص می کند. هرداده ای که از حد بالا و پایین خارج باشد داده پرت خواهد بود.

 

از این قسمت می توانید فایل اکسل آموزش فوق را دانلود کنید:

دانلود فایل اکسل
برچسب ها: اکسل پیشرفته
درباره پوریا بغدادی

یادگیری و آموزش برای من فراتر از یک حرفه است. بدون ترس از این مسیر لذت می برم. بقیه‌اش مهم نیست. 💛

نوشته های بیشتر از پوریا بغدادی
در تلگرام
کانال ما را دنبال کنید!
در اینستاگرام
ما را دنبال کنید!
مطالب زیر را حتما بخوانید
  • آموزش کامل تابع CHOOSE در اکسل با مثال

    1.31k بازدید

  • آموزش کامل تابع IF در اکسل با مثال

    1.07k بازدید

  • آموزش کامل تابع VLOOKUP در اکسل با مثال

    1.51k بازدید

  • ایجاد فرمت سفارشی در اکسل

    3.7k بازدید

  • کتاب مرجع اکسل پیشرفته 2019

    3.57k بازدید

  • جستجوی چند شرطی در اکسل

    6.91k بازدید

عضویت
به دوستتان خبر دهید.
guest
تعداد ماههای سال به عدد
guest
14 نظر
قدیمی ها
جدید ها بیشترین رای
Inline Feedbacks
View all comments
مصطفی
مصطفی

اقا ممنون جالب بود

1
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  مصطفی

سلامت باشید.

0
پاسخ
سجاد دلاوری
سجاد دلاوری

عالی بود چقدر مسلط و با حوصله و با کلامی شیوا توضیح دادید ممنونم

3
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  سجاد دلاوری

خواهش می کنم.

0
پاسخ
پیام
پیام

با سلام و عرض ادب . اسم آکادمیک این روش به چه نامی است؟؟؟

0
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  پیام

سلام
تشخیص داده های پَرت
Outlier Detection

0
پاسخ
پرویز
پرویز
در پاسخ به  پیام

روشهای مختلفی برای محاسبه داده های پرت داریم ولی عموماً سه روش زیر بیشتر مورد تایید و استفاده هستند
Dixon
Grubbs
Hampel
که این روش اصلا شبیه به هیچکدوم از این سه روش نیست

0
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  پرویز

با توجه به تک متغیره و یا چند متغیره بودن داده ها روش های مختلفی برای تشخیص داده های پَرت وجود دارد. نام این روش که معمولا با رسم نمودار Boxplot نمایش داده می شود Tukey می باشد.

0
پاسخ
گلناز
گلناز

عالی بود ممنون

0
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  گلناز

خواهش می کنم.

0
پاسخ
Mousavi
Mousavi

عالی👌

0
پاسخ
بنده خدا
بنده خدا

ممنون
عالی بود

0
پاسخ
mrmashoof
mrmashoof

وقتی این عبارت “فرمول محاسبه داده های پرت” رو گوگل کنی و اولین یافته سایت مهندس بغدادی باشه، مهر تایید دیگه ای بر کاردرست بودن ایشون و سیستم کاریشون هست

1
پاسخ
سجادیان
سجادیان

فقط خواستم بگم خیلی مخلصیم استاد عزیر عرض دیگه ای نداشتم

0
پاسخ
جستجو
جستجو برای:
دسته بندی مطالب
  • Charts
  • DAX
  • Excel
  • Power BI
  • Power Query
  • تحلیل داده
  • هوش تجاری
پکیج های آموزشی
  • Data Analysis
  • Excel
  • Power BI
  • Power Query
  • Python
  • SQL
درباره گروه تحلیلگری

معتقدیم آموزش شروع یک تعهد بلند مدت است. این را از مشتریان ما سوال کنید.

اطلاعات تماس
  • تهران، خیابان مطهری، ابتدای خیابان سنایی، کوچه بیست و یکم
  • 42 12 600 - 0919 فقط تلگرام و واتساپ
  • info@tahlilgary.com
پیوندها
  • آموزش رایگان و اصولی اکسل
  • دوره رایگان آموزش Power BI | پاور بی آی
  • آموزش دستورات پایه SQL
  • آمار و تحلیل داده با پایتون
  • دومین مسابقه‌ Power BI ایران
دسته بندی محصولات
Data Analysis Excel Power BI Power Query Python SQL
wpDiscuz

ورود

رمز عبور را فراموش کرده اید؟

هنوز عضو نشده اید؟ عضویت در سایت