• 0.6.2
  • در حال تکمیل
  • فعال

کلاس هلپر FilesDataset، داده‌ها را از فایل‌ها می‌خواند. از نام پوشه‌ها به عنوان تارگت استفاده می‌شود. این کلاس از کلاس ArrayDataset مشتق می‌شود.

پارامترهای سازنده

  • $rootPath - (استرینگ) مسیر به پوشه روت که حاوی فایل‌های دیتاست است
use Phpml\Dataset\FilesDataset;

$dataset = new FilesDataset('path/to/data');

برای اطلاعات بیشتر، پست دیتاست آرایه را مطالعه کنید.

مثال

ساختار فایل‌ها:

data
    business
        001.txt
        002.txt
        ...
    entertainment
        001.txt
        002.txt
        ...
    politics
        001.txt
        002.txt
        ...
    sport
        001.txt
        002.txt
        ...
    tech
        001.txt
        002.txt
        ...

داده‌های فایل‌ها را باFilesDataset لود کنید:

use Phpml\Dataset\FilesDataset;

$dataset = new FilesDataset('path/to/data');

$dataset->getSamples()[0][0]  // content from file path/to/data/business/001.txt
$dataset->getTargets()[0]     // business

$dataset->getSamples()[40][0] // content from file path/to/data/tech/001.txt
$dataset->getTargets()[0]     // tech

سایر پست‌های داکیومنت

  • مقدمه
  • یادگیری قانون وابستگی
    • آپریوری در صف ترجمه
  • طبقه‌بندی
    • Support Vector Classification در صف ترجمه
    • KNearestNeighbors Classifier در صف ترجمه
    • NaiveBayes Classifier در صف ترجمه
  • Regression
    • LeastSquares Linear Regression در صف ترجمه
    • Support Vector Regression در صف ترجمه
  • Clustering
    • K-means clustering در صف ترجمه
    • DBSCAN clustering در صف ترجمه
  • Metric
    • Accuracy در صف ترجمه
    • Confusion Matrix در صف ترجمه
    • Classification Report در صف ترجمه
  • Workflow
    • پایپ‌لاین در صف ترجمه
  • Neural Network
    • MLPClassifier در صف ترجمه
  • Cross Validation در صف ترجمه
    • Random Split در صف ترجمه
    • Stratified Random Split در صف ترجمه
  • Feature Selection
    • Variance Threshold در صف ترجمه
    • SelectKBest در صف ترجمه
  • Preprocessing
    • Normalization در صف ترجمه
    • Imputation missing values در صف ترجمه
  • Feature Extraction
    • Token Count Vectorizer در صف ترجمه
    • Tf-idf Transformer در صف ترجمه
  • دیتاست‌ها
  • Models management
    • Persistency در صف ترجمه
  • ریاضی