پیشپردازش دادهها (Data Preprocessing) یک تکنیک دادهکاوی شامل تبدیل دادههای خام به دادههای قابل فهم و در واقع گام مهمی در فرآیند حل مسائل یادگیری ماشین است. در دنیای واقعی دادهها اغلب ناکامل، ناسازگار و فاقد رفتار یا گرایشهای مشخص و احتمالا همراه تعداد زیادی خطا هستند. پیشپردازش دادهها یک روش اثبات شده برای حل این مشکلات هستند. اغلب دیتاسیتهای مورد استفاده در یادگیری ماشین نیاز به پردازش و فرمتبندی دارند تا الگوریتم یادگیری ماشین را بتوان به وسیله آنها آموزش داد. پیشپردازش دادهها، دادههای خام را برای پردازشهای بعدی آماده میکند.