در این قسمت تیم کدگیت سورس Linear Regression با دیتاست Mobile Price را تهیه کرده است. یادگیری ماشین وارد دنیای روزمره ما انسانها شده است. دیگر از طریق یک تلفن همراه و نصب اپلیکیشن میتوان یک بیماری را تشخیص داد. یادگیری ماشین، هوش مصنوعی و تمامی شاخههای آن در دنیای امروز کاربردهای بسیاری پیدا کرده است. با توجه به گسترش این شاخه از علم، ما نیز تصمیم گرفتیم سورسی از همین رشته تهیه و آماده سازی نماییم. سورس پیشبینی قیمت موبایل که از الگوریتم Linear Regression استفاده میکند. با ما همراه باشید تا این سورس جذاب را معرفی کنیم.
سورس Linear Regression با دیتاست Mobile Price
تکنولوژی امروزه به سرعت در حال پیشرفت است. تشخیص عینک، تشخیص خودرو، تشخیص چشم و … تنها بخشی از پیشرفت تکنولوژی است که با کمک پردازش تصویر، بینایی ماشین و هوش مصنوعی قابل انجام است. در این قسمت سورس Linear Regression با دیتاست Mobile Price در پایتون را تهیه کردهایم. برای این کار ما از ماژول sklearn و seaborn و numpy و pandas و matplotlib کمک میگیریم. در صورتی که با این ماژولها آشنایی ندارید پیشنهاد میکنیم دوره آموزش پیش نیاز علم داده را مطالعه نمایید چراکه در این دوره تمامی ماژولهای فوق (به استثنا sklearn) آموزش داده میشوند. همچنین دیتاست استفاده گردیده در این پروژه Mobile Price میباشد.
دیتاست Mobile Price
طبقه بندی قیمت موبایل یکی از مشکلات شرکتهای بزرگ میباشد. در دیتاست Mobile Price Classification قیمت دو هزار (2000) دستگاه موبایل با بیست (20) ویژگی ذخیرهسازی میگردد. ستونهای دیتاست ما به صورت زیر میباشد:
- battery_power: کل انرژی باتری به mAh
- blue: دارای بلوتوث میباشد یا خیر.
- clock_speed: سرعتی که ریزپردازنده دستورالعمل ها را اجرا می کند.
- dual_sim: تک سیم کارت و دو سیم کارت بودن موبایل
- FC: مخفف Front Camera یا دوربین جلو بوده و مقدار این ستون به مگاپیکسل میباشد.
- four_g: قابلیت g4 را دارد یا خیر.
- int_memory: مخفف internal memory بوده و مقدار آن به گیگابایت میباشد.
- m_dep: عرض تلفن همراه به سانتی متر (Mobile depth)
- mobile_wt: وزن موبایل.
- n_cores: تعداد هستههای پردازنده
- Pc: مخفف Primary camera یا دوربین اصلی بوده و مقدار آن به مگاپیکسل است.
- px_height: وضوح تصویر (ارتفاع)
- px_width: وضوح تصویر (عرض)
- ram: این ستون برای همه ما شفاف هست
- sc_h: ارتفاع صفحه نمایش تلفن همراه در سانتی متر
- sc_w: عرض صفحه تلفن همراه در سانتی متر
- talk_time: طولانی ترین زمانی که یک بار شارژ باتری دوام میآورد.
- three_g: پشتیبانی از 3g
- touch_screen: صفحه لمسی دارد یا خیر
- wifi: پشتیبانی از wifi
- price_range: رنج قیمت تلفن همراه. در این دیتاست تلفنهای همراه در چهار (4) رنج قیمت با توجه به قابلیتهای موبایل قرار میگیرند.
- رنج قیمت صفر به معنی قیمت پایین است.
- رنج قیمت 1 به معنی قیمت متوسط است.
- رنج قیمت 2 به معنی قیمت بالا است.
- نج قیمت 3 به معنی خیلی بالا میباشد.
نحوه اجرا سورس پیشبینی قیمت موبایل
زبان برنامه نویسی سورس پیشبینی قیمت موبایل، پایتون بوده و فرمت فایل .py است. بعد از تهیه سورس از سایت کدگیت فایلی با فرمت zip در اختیار شما قرار میگیرد. فایل را از حالت zip خارج کرده تا بتوانید سورس کد را ببینید. فایل اصلی برنامه با نام LinearRegression Mobile Price.py میباشد. این فایل را اجرا کنید تا برنامه اجرا شود. پس از اجرا خروجی زیر را مشاهده خواهید کرد:

بررسی دو متغیر دیتاست

مقایسه دو متغیر دیتاست

بررسی درصد دو متغیر دیتاست

بررسی درصد دو متغیر دیتاست

مقایسه دو متغیر دیتاست

مقایسه دو متغیر دیتاست

بررسی دو متغیر دیتاست

مقایسه دو متغیر دیتاست
علاوه بر تصاویر بالا در کنسول، خروجی زیر را خواهید دید:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2000 entries, 0 to 1999
Data columns (total 21 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 battery_power 2000 non-null int64
1 blue 2000 non-null int64
2 clock_speed 2000 non-null float64
3 dual_sim 2000 non-null int64
4 fc 2000 non-null int64
5 four_g 2000 non-null int64
6 int_memory 2000 non-null int64
7 m_dep 2000 non-null float64
8 mobile_wt 2000 non-null int64
9 n_cores 2000 non-null int64
10 pc 2000 non-null int64
11 px_height 2000 non-null int64
12 px_width 2000 non-null int64
13 ram 2000 non-null int64
14 sc_h 2000 non-null int64
15 sc_w 2000 non-null int64
16 talk_time 2000 non-null int64
17 three_g 2000 non-null int64
18 touch_screen 2000 non-null int64
19 wifi 2000 non-null int64
20 price_range 2000 non-null int64
dtypes: float64(2), int64(19)
memory usage: 328.3 KB
0.9132801488185277
در خروجی بالا اطلاعات زیر قرار گرفته است:
- ابعاد دیتاست
- اطلاعات آماری دیتاست
- دقت مدل پس از train برابر با 0.9132801488185277 (حدود 91 درصد) میباشد.
- …
فایلها و ماژولها سورس کد
در سورس پیشبینی قیمت موبایل از فایلها و ماژولهای زیر استفاده گردیده است:
- Numpy: نصب numpy با دستور pip install numpy از طریق cmd انجام میشود.
- pandas: با دستور pip install pandas از طریق cmd، نصب این ماژول انجام میشود.
- matplotlib: دستور pip install matplotlib را در cmd بزنید.
- seaborn: برای نصب seaborn نیز در cmd دستور pip install seaborn را بنویسید.
- scikit-learn: نصب scikit-learn با دستور pip install scikit-learn از طریق cmd انجام میشود.
برای نصب پایتون به طوری که در CMD بتوانید کدهای پایتون را اجرا و ماژولها را نصب نمایید ویدئو زیر را حتماً مشاهده کنید:
نقد و بررسیها
هنوز بررسیای ثبت نشده است.