Синтетические данные Friedman-1

Генерация искусственных данных на основе функции Friedman-1 воплощенной в StatSim

In [1]:
from iframer import *
iframer('https://statsim.com/app/?m=friedman1&preview=1')

Модель Friedman-1

Синтетический датасет Friedman-1 был впервые описан в работе Multivariate Adaptive Regression Splines Джерома Фридмана в 1991. Все вводные параметры $\mathbf{x}$ являются независимыми случайными переменными равномерно распределенными на интервале от 0 до 1. Результат $y$ рассчитывается по формуле:

$$ f(\mathbf{x}) = 10 sin(\pi x_1 x_2) + 20 (x_3 - 0.5)^2 + 10 x_4 + 5 x_5 + \mathcal{N}(0, sigma) $$

По умолчанию, генерируются 10 различных переменных $\mathbf{x}$, из которых только первые 5 используются в формуле. Это делает такой датасет удобным для проверки методов отбора переменных.

После успешной генерации, нажмите Download (CSV) для загрузки данных на локальный диск.

Этот датасет также доступен в:

By Антон Землянский in