Генерация искусственных данных на основе функции Friedman-1 воплощенной в StatSim
In [1]:
from iframer import *
iframer('https://statsim.com/app/?m=friedman1&preview=1')
Модель Friedman-1¶
Синтетический датасет Friedman-1 был впервые описан в работе Multivariate Adaptive Regression Splines Джерома Фридмана в 1991. Все вводные параметры $\mathbf{x}$ являются независимыми случайными переменными равномерно распределенными на интервале от 0 до 1. Результат $y$ рассчитывается по формуле:
$$ f(\mathbf{x}) = 10 sin(\pi x_1 x_2) + 20 (x_3 - 0.5)^2 + 10 x_4 + 5 x_5 + \mathcal{N}(0, sigma) $$По умолчанию, генерируются 10 различных переменных $\mathbf{x}$, из которых только первые 5 используются в формуле. Это делает такой датасет удобным для проверки методов отбора переменных.
После успешной генерации, нажмите Download (CSV) для загрузки данных на локальный диск.
Этот датасет также доступен в:
- sklearn.datasets.make_friedman1 (Python)
- MLBench (R)
- StatSim Gen (Web)