Skip to content

Latest commit

 

History

History
15 lines (11 loc) · 1.49 KB

README.md

File metadata and controls

15 lines (11 loc) · 1.49 KB

ML-learning-datasets

مجموعه‌ای از دیتا ست های آموزشی مخصوص ماشین لرنینگ از Data Science Dojo و... تعداد کنونی :۴۳ دیتاست

این دیتاست ها قبلا در گیتهاب بوده و بنابر سیاست خود مجموعه DSD از گیتهاب حذف و در سایت اصلی (هم تحریم و هم فیلتر!) گذاشته شدند.

  • دیتاست ها به دو دسته تخصصی طبقه‌بندی-خوشه-بندی و رگرسیون دسته بندی شده‌اند.
    • بنا بر ویژگی برخی از داده ها، ممکن است هم در پوشه رگرسیون و هم طبقه‌بندی-خوشه‌بندی حضور داشته باشد.
  • از جنبه آموزشی به ۳ دسته آسان و متوسط و سخت دسته‌بندی شده اند.
    • معیار دسته‌بندی داده ها فایل README.mdدر پوشه مادر است. من فقط داده هارا از شلختگی خارج و دسته‌بندی کردم.
      • منظور از سختی، میزان داده‌ها، رابطه بین ویژگی‌ها، پخش بودن داده هادر جند سند و... می‌باشد.
  • در هر پوشه، یک فایل README.md وجود دارد که اطلاعات اولیه، معرفی ویژگی ها، منابع و ماخذ داده ها در آن تشریح شده است.

اگر دیتاست خوبی دارید، حتما به این لیست اضافه کنید!