`simpleml.pipelines.ordered_dict.split_pipelines`

Derivative OrderedDict pipeline wrappers

Module Contents

Classes

`ExplicitSplitOrderedDictPipeline`	Native python dict pipeline implementation
`RandomSplitOrderedDictPipeline`	Class to randomly split dataset into different sets

Attributes

__author__

simpleml.pipelines.ordered_dict.split_pipelines.__author__ = Elisha Yadgaran[source]

class simpleml.pipelines.ordered_dict.split_pipelines.ExplicitSplitOrderedDictPipeline(has_external_files=True, transformers=None, fitted=False, dataset_id=None, **kwargs)[source]

Bases: simpleml.pipelines.validation_split_mixins.ExplicitSplitMixin, simpleml.pipelines.ordered_dict.base.OrderedDictPipeline

Native python dict pipeline implementation

Parameters

has_external_files (bool) –
transformers (Optional[List[Any]]) –
fitted (bool) –
dataset_id (Optional[Union[str, uuid.uuid4]]) –

class simpleml.pipelines.ordered_dict.split_pipelines.RandomSplitOrderedDictPipeline(train_size, test_size=None, validation_size=0.0, random_state=123, shuffle=True, **kwargs)[source]

Bases: simpleml.pipelines.validation_split_mixins.RandomSplitMixin, simpleml.pipelines.ordered_dict.base.OrderedDictPipeline

Class to randomly split dataset into different sets

Redefines splits so custom named splits in dataset cannot be referenced by the same names. Only TRAIN/TEST/VALIDATION

Set splitting params: By default validation is 0.0 because it is only used for hyperparameter tuning

Parameters

train_size (Union[float, int]) –
test_size (Optional[Union[float, int]]) –
validation_size (Union[float, int]) –
random_state (int) –
shuffle (bool) –

simpleml.pipelines.ordered_dict.split_pipelines

Module Contents

Classes

Attributes

`simpleml.pipelines.ordered_dict.split_pipelines`