Все объекты используют единый API в Scikit-Learn. В этом блоге представлены некоторые распространенные интерфейсы.

Оценщики

Любой объект, который может оценивать некоторые параметры на основе набора данных, называется оценщиком. Сама оценка выполняется методом fit() и принимает в качестве параметра только набор данных. Любой другой параметр, необходимый для управления процессом оценки, считается гиперпараметром и должен быть установлен как переменная экземпляра, как правило, через параметр конструктора.

Трансформеры

Оценщики, которые также могут преобразовывать набор данных, называются преобразователями. Преобразование выполняется методом transform() с набором данных для преобразования в качестве параметра. Он возвращает преобразованный набор данных. Это преобразование обычно зависит от изученных параметров. Все преобразователи также имеют удобный метод, называемый fit_transform(), который эквивалентен вызову fit(), а затем transform(), но иногда >fit_transform() оптимизирован и работает намного быстрее.

предикторы

Оценщики, учитывая набор данных, которые способны делать прогнозы, называются предикторами. У предиктора есть метод predict(), который берет набор данных новых экземпляров и возвращает набор данных соответствующих прогнозов. Он также имеет метод score(), который измеряет качество прогнозов, учитывая набор тестов и соответствующие метки, в случае алгоритмов обучения с учителем.

осмотр

Все гиперпараметры оценщика доступны напрямую через общедоступные переменные экземпляра, а все изученные параметры оценщика доступны через общедоступные переменные экземпляра с суффиксом подчеркивания. Наборы данных представлены в виде массивов NumPy или разреженных матриц SciPy вместо самодельных классов. Гиперпараметры — это обычные строки или числа Python. Существующие строительные блоки максимально повторно используются. Scikit-Learn предоставляет разумные значения по умолчанию для большинства параметров, что упрощает быстрое создание базовой рабочей системы.