• مسابقه Power BI
    • اولین مسابقه Power BI
    • دومین مسابقه Power BI
    • سومین مسابقه Power BI
    • چهارمین مسابقه Power BI
  • جدیدترین مطالب آموزشی
  • دوره‌های رایگان
  • تحلیل داده نرم افزاری (فنّی)
  • تحلیل داده غیرفنّی
  • دوره‌های آفلاین
  • سبد خرید
  • ارتباط با ما
    • تماس
    • درخواست مشاوره فردی
    • درخواست جابجایی دوره
    • کانال تلگرام تحلیلگری
    • کانال تحلیلگری در «بله»
    • نماد الکترونیک
  • حساب کاربری از داخل ایران
  • حساب کاربری از خارج ایران

سبد خرید شما خالی است.

گروه تحلیلگری
  • مسابقات Power BI
    • اولین مسابقه Power BI ایران
    • دومین مسابقه Power BI ایران
    • سومین مسابقه Power BI ایران
    • چهارمین مسابقه Power BI ایران
  • مطالب آموزشی
    • تمام مطالب آموزشی
    • اکسل (Excel)
    • پاور‌بی‌آی (Power BI)
    • پاورکوئری (Power Query)
    • دکس (DAX)
  • مسیرهای یادگیری
    • مسیر یادگیری تحلیل داده (فنی)
    • مسیر یادگیری غیرفنّی تحلیلگر داده
  • دوره‌های آموزشی
    • دوره‌های رایگان
    • مهارت‌های غیرفنّی تحلیلگر داده
    • اکسل (Excel)
    • پاور‌بی‌آی (Power BI)
    • پاورکوئری (Power Query)
    • زبان اس‌کیو‌ال (SQL)
    • تحلیل داده با پایتون (Python)
    • سبد خرید
  • ارتباط با ما
    • تماس
    • درخواست مشاوره فردی
    • درخواست جابجایی دوره
    • حساب کاربری از داخل ایران
    • حساب کاربری از خارج ایران
    • کانال تلگرام تحلیلگری
    • کانال تحلیلگری در «بله»
    • نماد الکترونیک
0
حساب کاربری

مقالات

تشخیص داده‎های پرت در اکسل

یکی از مراحل پروژه های داده کاوی و علم داده پیش پردازش داده ها می باشد. تشخیص داده‎های پرت در اکسل مهمترین بخش از پیش پردازش داده هاست.

وجود داده های پرت دلایل گوناگونی دارد. گاهی در وارد کردن داده‌ها اشتباهی صورت می گیرد و مقادیری بزرگتر و یا کوچکتر از حد معمول وارد می شوند که به آن‌ها داده‌های پرت (دورافتاده) گفته می‌شود.  نام دیگری داده های پرت Outlier است و به عمل جداسازی داده های پرت Outlier Detection گفته می شود. گاهی نیز در وارد کردن داده‌ها اشتباهی صورت نگرفته است و ایراد از داده‌های اصلی است مثلاً حقوق یک نفر خیلی کمتر و دورتر از میانگین حقوق های دریافتی کلیه پرسنل شرکت است.

فرض کنید بگویند میانگین ثروت افراد حاضر درمایکروسافت ۱۰۰میلیون دلار است. طبیعتا شخصی مانند بیل گیتس که ثروت او به اندازه چندین کشور است، میانگین را به بسیار بالاتر از میانگین واقعی تبدیل کرده‌است و یک متخصص داده‌کاوی باید بتواند این این مسئله را تشخیص دهد. در واقع ثروت بیل گیتس یک داده پرت یا همان Outlier در میان ثروت کارکنان و مدیران مایکروسافت است.

چرا داده های پرت باید حذف شوند؟

وجود داده های پرت باعث می شود تا ارتباط بین دو متغیر از بین برود. همچنین برای انتخاب روش های آماری و داده کاوی باید ابتدا نرمال بودن؛ همسان بودن و واریانس داد ها محاسبه شوند.

روش حذف داده‎های پرت در اکسل

روش های گوناگونی برای تشخیص داده‎های پرت در اکسل وجود دارد، ما در این آموزش با کمک محاسبه چارک اول و چارک سوم به داده های پرت می رسیم و با کمک Conditional Formatting آن ها را مشخص می کنیم.

با کمک فرمول Quartile می توانید با دادن ورودی آخر چارک مورد نظر یعنی چارک های اول و سوم را محاسبه کنید:

تشخیص داده های پرت در اکسل

سپس آن ها را از هم کم کنید تا 50% داده ها مشخص شود. در نهایت اختلاف چارک اول و سوم از حد وسط حد بالا و پایین داده ها را مشخص می کند. هرداده ای که از حد بالا و پایین خارج باشد داده پرت خواهد بود.

 

از این قسمت می توانید فایل اکسل آموزش فوق را دانلود کنید:

دانلود فایل اکسل
برچسب ها: اکسل پیشرفته
درباره پوریا بغدادی

یادگیری و آموزش برای من فراتر از یک حرفه است. بدون ترس از این مسیر لذت می برم. بقیه‌اش مهم نیست. 💛

نوشته های بیشتر از پوریا بغدادی
در تلگرام
کانال ما را دنبال کنید!
در اینستاگرام
ما را دنبال کنید!
مطالب زیر را حتما بخوانید
  • محاسبه مالیات حقوق سال 1405 در اکسل بدون IF و SUMPRODUCT

    16 بازدید

  • آموزش کامل تابع CHOOSE در اکسل با مثال

    2.16k بازدید

  • آموزش کامل تابع IF در اکسل با مثال

    1.74k بازدید

  • آموزش کامل تابع VLOOKUP در اکسل با مثال

    2.26k بازدید

  • ایجاد فرمت سفارشی در اکسل

    4.12k بازدید

  • کتاب مرجع اکسل پیشرفته 2019

    4k بازدید

guest
تعداد ماههای سال به عدد
guest
16 نظر
قدیمی ها
جدید ها بیشترین رای
Inline Feedbacks
View all comments
مصطفی
مصطفی

اقا ممنون جالب بود

1
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  مصطفی

سلامت باشید.

0
پاسخ
سجاد دلاوری
سجاد دلاوری

عالی بود چقدر مسلط و با حوصله و با کلامی شیوا توضیح دادید ممنونم

3
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  سجاد دلاوری

خواهش می کنم.

0
پاسخ
پیام
پیام

با سلام و عرض ادب . اسم آکادمیک این روش به چه نامی است؟؟؟

0
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  پیام

سلام
تشخیص داده های پَرت
Outlier Detection

0
پاسخ
پرویز
پرویز
در پاسخ به  پیام

روشهای مختلفی برای محاسبه داده های پرت داریم ولی عموماً سه روش زیر بیشتر مورد تایید و استفاده هستند
Dixon
Grubbs
Hampel
که این روش اصلا شبیه به هیچکدوم از این سه روش نیست

0
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  پرویز

با توجه به تک متغیره و یا چند متغیره بودن داده ها روش های مختلفی برای تشخیص داده های پَرت وجود دارد. نام این روش که معمولا با رسم نمودار Boxplot نمایش داده می شود Tukey می باشد.

0
پاسخ
گلناز
گلناز

عالی بود ممنون

0
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  گلناز

خواهش می کنم.

0
پاسخ
Mousavi
Mousavi

عالی👌

0
پاسخ
بنده خدا
بنده خدا

ممنون
عالی بود

0
پاسخ
mrmashoof
mrmashoof

وقتی این عبارت “فرمول محاسبه داده های پرت” رو گوگل کنی و اولین یافته سایت مهندس بغدادی باشه، مهر تایید دیگه ای بر کاردرست بودن ایشون و سیستم کاریشون هست

1
پاسخ
سجادیان
سجادیان

فقط خواستم بگم خیلی مخلصیم استاد عزیر عرض دیگه ای نداشتم

0
پاسخ
THR
THR

مأخذ این مطلب چیست؟ مثلا یک کتاب یا استانداردی که این را معرفی کرده باشد

0
پاسخ
پوریا بغدادی
پوریا بغدادی
نویسنده
در پاسخ به  THR

این روش منسوب به آقای تاکی (John Tukey) هست در کتاب Exploratory Data Analysis. فصل اول قسمت Box‑and‑Whisker plot

0
پاسخ
جستجو
جستجو برای:
دسته بندی مطالب
  • Charts
  • DAX
  • Excel
  • Power BI
  • Power Query
  • تحلیل داده
  • هوش تجاری
پکیج های آموزشی
  • Data Analysis
  • Excel
  • Power BI
  • Power Query
  • Python
  • SQL
درباره گروه تحلیلگری

معتقدیم آموزش شروع یک تعهد بلند مدت است. این را از مشتریان ما سوال کنید.

اطلاعات تماس
  • تهران، خیابان دکتر فاطمی غربی، کوچه پروین
  • 42 12 600 - 0919 فقط تلگرام و پیامک
پیوندها
  • آموزش رایگان و اصولی اکسل (Excel)
  • دوره رایگان آموزش پاور بی آی (Power BI)
  • آموزش رایگان پاورکوئری (Power Query)
  • کانال تحلیلگری در «بله»
دسته بندی محصولات
Data Analysis Excel Power BI Power Query Python SQL
wpDiscuz

ورود

رمز عبور را فراموش کرده اید؟

هنوز عضو نشده اید؟ عضویت در سایت