در این قسمت تیم کدگیت سورس پیش بینی قیمت خانه با Decision Tree را تهیه کرده است. یادگیری ماشین وارد دنیای روزمره ما انسانها شده است. دیگر از طریق یک تلفن همراه و نصب اپلیکیشن میتوان یک بیماری را تشخیص داد. یادگیری ماشین، هوش مصنوعی و تمامی شاخههای آن در دنیای امروز کاربردهای بسیاری پیدا کرده است. با توجه به گسترش این شاخه از علم، ما نیز تصمیم گرفتیم سورسی از همین رشته تهیه و آماده سازی نماییم. سورس پیش بینی قیمت خانه که از الگوریتم Decision Tree استفاده میکند. با ما همراه باشید تا این سورس جذاب را معرفی کنیم.
سورس پیش بینی قیمت خانه با Decision Tree
تکنولوژی امروزه به سرعت در حال پیشرفت است. تشخیص عینک، تشخیص خودرو، تشخیص چشم و … تنها بخشی از پیشرفت تکنولوژی است که با کمک پردازش تصویر، بینایی ماشین و هوش مصنوعی قابل انجام است. در این قسمت سورس پیش بینی قیمت خانه با Decision Tree در پایتون را تهیه کردهایم. برای این کار ما از ماژول sklearn و seaborn و numpy و pandas و matplotlib کمک میگیریم. در صورتی که با این ماژولها آشنایی ندارید پیشنهاد میکنیم دوره آموزش پیش نیاز علم داده را مطالعه نمایید چراکه در این دوره تمامی ماژولهای فوق (به استثنا sklearn) آموزش داده میشوند. همچنین دیتاست استفاده گردیده در این پروژه Boston House Prices میباشد.
نحوه اجرا سورس پیش بینی قیمت خانه
زبان برنامه نویسی سورس پیش بینی قیمت خانه، پایتون بوده و فرمت فایل .py است. بعد از تهیه سورس از سایت کدگیت فایلی با فرمت zip در اختیار شما قرار میگیرد. فایل را از حالت zip خارج کرده تا بتوانید سورس کد را ببینید. فایل اصلی برنامه با نام Decision Tree housing price.py میباشد. این فایل را اجرا کنید تا برنامه اجرا شود. پس از اجرا خروجی زیر را مشاهده خواهید کرد:
مقایسه متغیرهای دیتاست در یک نمودار
بررسی وابستگی ویژگیها
مقایسه وابستگی هر ستون دیتاست با ستون Y
علاوه بر تصاویر بالا در کنسول، خروجی زیر را خواهید دید:
CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO B LSTAT MEDV
0 0.00632 18.0 2.31 0 0.538 6.575 65.2 4.0900 1 296.0 15.3 396.90 4.98 24.0
1 0.02731 0.0 7.07 0 0.469 6.421 78.9 4.9671 2 242.0 17.8 396.90 9.14 21.6
2 0.02729 0.0 7.07 0 0.469 7.185 61.1 4.9671 2 242.0 17.8 392.83 4.03 34.7
3 0.03237 0.0 2.18 0 0.458 6.998 45.8 6.0622 3 222.0 18.7 394.63 2.94 33.4
4 0.06905 0.0 2.18 0 0.458 7.147 54.2 6.0622 3 222.0 18.7 396.90 5.33 36.2
The Boston housing Price Prediction Dataset has
Number of Factors : 13
Number of Samples : 506
CRIM ZN INDUS CHAS ... PTRATIO B LSTAT MEDV
count 506.000000 506.000000 506.000000 506.000000 ... 506.000000 506.000000 506.000000 506.000000
mean 3.613524 11.363636 11.136779 0.069170 ... 18.455534 356.674032 12.653063 22.532806
std 8.601545 23.322453 6.860353 0.253994 ... 2.164946 91.294864 7.141062 9.197104
min 0.006320 0.000000 0.460000 0.000000 ... 12.600000 0.320000 1.730000 5.000000
25% 0.082045 0.000000 5.190000 0.000000 ... 17.400000 375.377500 6.950000 17.025000
50% 0.256510 0.000000 9.690000 0.000000 ... 19.050000 391.440000 11.360000 21.200000
75% 3.677083 12.500000 18.100000 0.000000 ... 20.200000 396.225000 16.955000 25.000000
max 88.976200 100.000000 27.740000 1.000000 ... 22.000000 396.900000 37.970000 50.000000
[8 rows x 14 columns]
is Null?
CRIM 0
ZN 0
INDUS 0
CHAS 0
NOX 0
RM 0
AGE 0
DIS 0
RAD 0
TAX 0
PTRATIO 0
B 0
LSTAT 0
MEDV 0
dtype: int64
Training Score : 0.9983902854991537
Testing Score : 0.7080943086546287
R2 Score : 0.7080943086546287
MSE : 21.406548672385618
در خروجی بالا اطلاعات زیر قرار گرفته است:
- ابعاد دیتاست
- اطلاعات آماری دیتاست
- بررسی وجود دیتا Null
- دقت مدل پس از train
- …
فایلها و ماژولها سورس کد
در سورس پیش بینی قیمت خانه از فایلها و ماژولهای زیر استفاده گردیده است:
- Numpy: نصب numpy با دستور pip install numpy از طریق cmd انجام میشود.
- pandas: با دستور pip install pandas از طریق cmd، نصب این ماژول انجام میشود.
- matplotlib: دستور pip install matplotlib را در cmd بزنید.
- seaborn: برای نصب seaborn نیز در cmd دستور pip install seaborn را بنویسید.
- scikit-learn: نصب scikit-learn با دستور pip install scikit-learn از طریق cmd انجام میشود.
برای نصب پایتون به طوری که در CMD بتوانید کدهای پایتون را اجرا و ماژولها را نصب نمایید ویدئو زیر را حتماً مشاهده کنید:
نقد و بررسیها
هنوز بررسیای ثبت نشده است.