مقدمه
برای ورود به دنیای شغلی جذاب و پرتقاضای تحلیل داده نیاز است تا در دو بُعد فنی (نرم افزاری) و نرم (غیرفنی) مهارت های لازم را داشته باشید. در این مطلب آموزشی قصد داریم شما را با مسیر یادگیری فنی (نرم افزاری) تحلیل داده آشنا کنیم. البته ابزارها و نرم افزارهای مختلفی برای پیاده سازی گزارشات و رسیدن به تحلیلها وجود دارد اما پیشنهاداتی که در این مطلب ارائه میشود کاملا تجربه شده و عملی بوده و سال ها در کشورمان ایران و حتی توسط دانشجویانمان در سایر کشورها نیز مورد استفاده قرار گرفته است.
توضیحات صوتی
نرم افزار Excel
ابزارهای اکسل برای تحلیل داده
خواه نا خواه اکسل نرم افزاری جامع و فراگیر است و هرفردی بسته به نیاز، شغل، هدف و فعالیت خود از آن استفاده می کند. در واقع اکسل یک ابزار جامع است که مخاطبان مختلف و متفاوتی دارد. از دستیار مدیر عامل یا مدیر یک ساختمان گرفته تا مسئول کنترل پروژه یک شرکت پیمانکاری و یا یک حسابدار حرفه ای هرکدام از اکسل به نحوی استفاده می کنند. این بدان معناست که در اکسل ابزارها و توابع گوناگونی وجود دارد. اما از منظر تحلیل داده اکسل حاوی یکسری ابزارهای مشخص می باشد که در اینجا به عناوین هریک اشاره می کنیم:
Table, Sort, Filter, Charts, Pivot Table, Vlookup, Xlookup, IF, Sum, Sumif, Subtotal, Analysis Toolpak, Solver, What-if, …
نحوه یادگیری ابزارها
شما می توانید این عناوین را با جستجو در اینترنت یاد بگیرید و لزوما نیازی به شرکت در دوره اکسل آفلاین یا آنلاین یا حضوری نیست چرا که به عنوان مثال دوره آموزشی جامع اکسل کاربردی به تدریس آقای پوریا بغدادی حاوی مباحث کاملی در خصوص فرمول نویسی کاربردی و گزارش گیری با Pivot Table می باشد و لزوما در این دوره آموزشی ابزار های تحلیل داده بطور کامل پوشش داده نشده است چرا که هدف از تدریس اکسل آموزش دادن این نرم افزار برای استفاده در شرکت ها و مشاغل مختلف بوده و رویکرد تحلیل داده نداشته است.
به طور کلی برای یادگیری نرمافزار اکسل نیاز به صرف چند ماه زمان وجود دارد. البته یادگیری اکسل انتها ندارد و بعد از آشنایی با این نرم افزار شما وارد یک مسیر جذاب و همیشگی خواهید شد اما برای یادگیری این نرمافزار با رویکرد تحلیل داده لزوماً نیازی به صرف زمان زیاد ندارید و حتی می توانید برای آن انتهای مشخصی متصور شوید.
دورههای پیشنهادی مرتبط با اکسل
زمان یادگیری
برای یادگیری اکسل با هدف تحلیل داده یعنی ابزارهایی که بالاتر به آن ها اشاره شده نیاز به صرف زمان زیادی ندارید. شاید روش بهتر این باشد که ابزارهای یاد شده را در هنگام کار و یادگیری نرم افزار Power BI (گام بعدی ابزارهای تحلیل داده) به طور موازی یاد بگیرید بدین معنا که هرجا به یک نیاز جدید برخورد کردید ابزار آن در اکسل را پیدا کرده و یاد بگیرید. با این روش هم اضطراب و نگرانی شما برای یادگیری اکسل کم میشود و هم بر اساس نیازهایی که به وجود میآید به سراغ ابزارها میروید پس کیفیت و سرعت یادگیری بسیار بالاتر خواهد بود.
نرم افزار Power BI
نرمافزار پاور بی آی (Power BI) یکی از بهترین نرمافزارهای تحلیل داده و ساخت گزارشهای مدیریتی میباشد. امروزه این نرمافزار محبوبترین ابزار طراحی داشبورد مدیریتی و رسم نمودار است. (گزارش های متعدد شرکت گارتنر و سایت های مقایسه و ارزیابی مطرح و نظرات کاربران)
با Power BI تحلیل هر نوع داده ساخت یافته از دادههای اقتصادی گرفته تا دادههای شخصی و سازمانی را به خوبی میتوان انجام داد. مثلاً فرض کنید میخواهیم اطلاعات یک یا چند نماد بورسی، دادههای قیمت مسکن، نرخ ارز، آب و هوا و یا فروش یا منابع انسانی یک شرکت را تحلیل کنیم. این کارها به راحتی و به شکل جذابی با نرمافزار پاور بی آی قابل انجام است.
پاور بی ای ویژگی های مثبت زیادی دارد اما رایگان بودن، مایکروسافتی بودن و همچنین نظم در به روز رسانی آن را از سایر رقبایش جدا کرده است.
اجزاء Power BI
نرم افزار Power BI دارای 4 نرمافزار داخلی برای انجام کل فرایند تحلیل داده میباشد. اولین بخش آن پاورکوئری (Power Query) نام دارد که وظیفه آن پاکسازی و تغییر شکل دادهها (Transformation) میباشد. این نرمافزار انقلابی در حوزه تغییر شکل و پاکسازی داده می باشد.
بخش دوم این نرمافزار مدل سازی (Data Modeling) است که در آن جداول و ارتباطات بین آنها (Relationship) مشخص میشوند تا بتوان یک گزارش جامع از دادهها و جداول مختلف گرفت.
در بخش سوم مصورسازی را داریم که با تعداد حدود ۳۰۰ نمودار و قابلیتهای مصورسازی دیگر به ما کمک میکند تا به بهترین شکل دادهها را به نمودار تبدیل کنیم. قابلیت هایی مانند Tooltip و Drilldown و Drillthrough و …
اجزاء معرفی شده تا اینجا ابزارهای بسیار خوبی بوده اند و کمک میکنند تا به خوبی فرایند تبدیل داده به اطلاعات (تحلیل داده) را طی کنیم اما قطعا در هنگام کار با نمودارها به نواقص و محدودیتهایی برخورد خواهیم کرد. به عنوان مثال نمودارهای رایج قابلیت نمایش تجمعی یا نرخ رشد را ندارند. برای رفع این محدودیتها و محاسبات بهتر و پیچیدهتر از فرمول نویسی DAX استفاده می شود. نرمافزار Power BI با این چهار بخش قدرتمند میشود که میتوانید دادههای خود را در این برنامه به نمودار و تحلیلهای حرفهای تبدیل کنید.
زمان لازم برای یادگیری Power BI
برای یادگیری نرمافزار Power BI یک بازه زمانی ۴ الی ۵ ماهه نیاز است که مقدار دقیق این زمان به رشته، شغل و سن هر فرد بستگی دارد.
دورههای پیشنهادی مرتبط با Power BI
زبان SQL
اگر به دنیای تحلیل داده وارد شوید حتما به زودی با یک دیتابیس SQL Server یا Oracle روبرو خواهید شد. در این دیتابیس ها زبان پرس و جوی SQL حاکم است و برای کند و کاو جداول و داده ها و ستون ها باید به این زبان آشنایی کافی داشته باشید.
به عنوان مثال برای پیدا کردن جداول و ستون های مورد نظر برای وارد کردن آن ها به ابزار هایی مانند Power BI احتمالا شما با چالش روبرو خواهید شد چرا که با این دیتابیس و ساختار و دیاگرام آن آشنایی ندارید. در بسیاری از موارد شرکت سازنده نرم افزار که این دیتابیس را طراحی کرده است هم دیاگرام یا مستندات مناسبی برای پیدا کردن ساختار های آن ندارد یا آن را در اختیار شما قرار نمی دهد.
ما بطور مشخص برای شما یکسری دستورات ضروری و کاربردی زبان SQL را به همراه نکات کلیدی برای پیداکردن جداول و اطلاعات این پایگاه داده در یک دوره تحت عنوان دستورات کاربردی زبان SQL برای شما آماده کرده ایم.
دورههای پیشنهادی مرتبط با زبان SQL
زبان Python
با ابزارهایی نظیر Excel و Power BI شما می توانید صرفا داده های ثبت شده را بصورت گذشته نگر تحلیل کنید و روی آن ها تحلیل های آماری و توصیفی و تشخیصی داشته باشید. دروصورتی که بخواهید پیش بینی انجام دهید ابزارهای یادشده قابلیت های کافی برای این منظور ندارند. حال چه باید کرد؟
یکی از بهترین و کاملترین و ساده ترین زبان های برنامه نویسی در این خصوص زبان Python است که به دلیل داشتن پکیج های رایگان و امکانات فراوان محبوبترین زبان تحلیل داده و یادگیری ماشین در حال حاضر به شمار می رود.
اهمیت یادگیری این زبان برنامه نویسی به قدری است که از سال 2023 مایکروسافت قابلیت های تحلیل داده این زبان را به نرم افزار اکسل 365 اضافه کرده است و این ویژگی مهم به مرور به تمام اکسل های فعال دنیا اضافه خواهد شد.
حداقل چیزی که علاوه بر زبان Python در دوره تحلیل داده با پایتون یاد خواهید گرفت مفاهیم آماری و نحوه استفاده از آن ها در این زبان، انواع نمودارهای کاربردی و EDA (Exploratory Data Analysis) و الگوریتم های پایه ای یادگیری ماشین به جهت پیش بینی و تحلیل های پیشرفته روی داده ها می باشد.
قابلیت های مهم زبان پایتون برای تحلیل داده
زبان پایتون دارای پکیج های متعدد و رایگان بسیار کامل و حرفه ای برای تحلیل داده می باشد. در این قسمت به فهرستی خلاصه از این قابلیت ها و پکیج ها اشاره می شود:
پکیج Matplotlib برای رسم نمودار
پکیج Seaborn برای رسم نمودار
پکیج Pandas برای کار با داده ها
پکیج Numpy برای کار با ماتریس ها و جداول
پکیج Scikit-learn برای یادگیری ماشین
زمان یادگیری Python
برای یادگیری مباحث ارائه شده در دوره تحلیل داده با پایتون باید حداقل 3 ماه زمان صرف کنید و با یادگیری هر درس حتما در داده های رایگانی که در بستر وب وجود دارد برای خود مثال های تمرینی ایجاد کنید و تحلیل ها و پیش بینی های مختلفی انجام دهید.