у меня есть csv-файл
Date,Open,High,Low,Close,Adj Close,Volume,Cash EPS,Book Value,Div/share,Net profit/share,NPM,ROE,ROCE,ROA,DEBT/EQ,ATR,CR
2004-04-26,82.924217,82.924217,82.924217,82.924217,60.026066,0,221.24,488.21,129.5,186.6,26.11,38.22,38.22,24.2,0,92.67,1.65
2004-04-27,82.778122,82.778122,79.765625,80.24453,58.086323,28616000,221.24,488.21,129.5,186.6,26.11,38.22,38.22,24.2,0,92.67,1.65
Даю только 2 строки для удобства вычислений. Я создал фрейм данных
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.preprocessing import MinMaxScaler
dataframe1 = pd.read_csv('test.csv')
df = dataframe1.dropna()
scaler=MinMaxScaler(feature_range=(0,1))
df1=scaler.fit_transform(np.array(df1).reshape(-1,1))
min_max_scaler = MinMaxScaler()
df[["Open", "High", "Low", "Close", "Adj Close", "Volume", "Book Value", "Div/share", "Net profit/share", "NPM", "ROE", "ROCE", "ROA", "DEBT/EQ", "ATR", "CR"]] = min_max_scaler.fit_transform(df[["Open", "High", "Low", "Close", "Adj Close", "Volume", "Book Value", "Div/share", "Net profit/share", "NPM", "ROE", "ROCE", "ROA", "DEBT/EQ", "ATR", "CR"]])
Чтобы обучить набор данных, мне нужна дата, а также прогноз, т.е. закрыть столбец. Но значение столбца Close зависит от нескольких столбцов (т.е. всех столбцов, присутствующих в этом csv)
Как я могу обучить данные для столбцов даты и закрытия, но на основе всех других столбцов, чтобы можно было прогнозировать будущее закрытие?