دیتاست فایل

در حال تکمیل فعال رایگان

کلاس هلپر FilesDataset، داده‌ها را از فایل‌ها می‌خواند. از نام پوشه‌ها به عنوان تارگت استفاده می‌شود. این کلاس از کلاس ArrayDataset مشتق می‌شود.

پارامترهای سازنده

  • $rootPath - (استرینگ) مسیر به پوشه روت که حاوی فایل‌های دیتاست است
use Phpml\Dataset\FilesDataset;

$dataset = new FilesDataset('path/to/data');

برای اطلاعات بیشتر، پست دیتاست آرایه را مطالعه کنید.

مثال

ساختار فایل‌ها:

data
    business
        001.txt
        002.txt
        ...
    entertainment
        001.txt
        002.txt
        ...
    politics
        001.txt
        002.txt
        ...
    sport
        001.txt
        002.txt
        ...
    tech
        001.txt
        002.txt
        ...

داده‌های فایل‌ها را باFilesDataset لود کنید:

use Phpml\Dataset\FilesDataset;

$dataset = new FilesDataset('path/to/data');

$dataset->getSamples()[0][0]  // content from file path/to/data/business/001.txt
$dataset->getTargets()[0]     // business

$dataset->getSamples()[40][0] // content from file path/to/data/tech/001.txt
$dataset->getTargets()[0]     // tech

سایر پست‌های داکیومنت

  • مقدمه
  • یادگیری قانون وابستگی
    • آپریوری در صف ترجمه
  • طبقه‌بندی
    • Support Vector Classification در صف ترجمه
    • KNearestNeighbors Classifier در صف ترجمه
    • NaiveBayes Classifier در صف ترجمه
  • Regression
    • LeastSquares Linear Regression در صف ترجمه
    • Support Vector Regression در صف ترجمه
  • Clustering
    • K-means clustering در صف ترجمه
    • DBSCAN clustering در صف ترجمه
  • Metric
    • Accuracy در صف ترجمه
    • Confusion Matrix در صف ترجمه
    • Classification Report در صف ترجمه
  • Workflow
    • پایپ‌لاین در صف ترجمه
  • Neural Network
    • MLPClassifier در صف ترجمه
  • Cross Validation در صف ترجمه
    • Random Split در صف ترجمه
    • Stratified Random Split در صف ترجمه
  • Feature Selection
    • Variance Threshold در صف ترجمه
    • SelectKBest در صف ترجمه
  • Preprocessing
    • Normalization در صف ترجمه
    • Imputation missing values در صف ترجمه
  • Feature Extraction
    • Token Count Vectorizer در صف ترجمه
    • Tf-idf Transformer در صف ترجمه
  • دیتاست‌ها
  • Models management
    • Persistency در صف ترجمه
  • ریاضی