У меня есть кадр данных со следующей информацией:
Departure Time Offset Dep Arrival Time Offset Arr
0 07:10 +01:00 08:25 +01:00
1 09:05 +01:00 10:10 +01:00
2 10:50 +01:00 12:05 +01:00
3 11:55 +01:00 14:15 +00:00
4 14:55 +02:00 18:40 +01:00
df.dtypes
Departure Time object
Offset Departure object
Arrival Time object
Offset Arrival object
dtype: object
Я хотел бы рассчитать продолжительность времени: время прибытия + смещение прибытия - время отправления - смещение отправления
Сначала я попытался преобразовать их все в формат времени, но смог сделать это только с фактическим временем, а не со сдвигом времени:
df["Arrival Time"] = pd.to_datetime(df ["Arrival Time"]).dt.time
df["Departure Time"] = pd.to_datetime(df ["Departure Time"]).dt.time
Итак, моя проблема заключается, с одной стороны, в преобразовании столбцов смещения в формат, который я могу использовать для расчета времени, а затем в том, как эффективно рассчитать продолжительность времени.
Поскольку я хочу использовать продолжительность времени для расчета науки о данных (Gradient Boosting), было бы здорово, если бы вы могли предложить формат продолжительности, который можно было бы сразу подключить к алгоритму.