У меня есть набор данных с маркетинговыми кампаниями, где каждый дом получает действия кампании, такие как «флаер» или «звонок». У каждого действия есть своя собственная дата создания и окончания. В некоторых домах всего 1 действие, а в некоторых - пара.
Что я хочу сделать:
Я хочу рассчитать продолжительность кампании для каждого дома, поэтому время между первым действием (например, флаером) и последним записанным действием для каждого дома. Если бы в каждом доме было только одно действие, я мог бы легко решить эту проблему, вычтя столбец даты окончания из столбца даты начала.
Поскольку у некоторых домов есть несколько действий, я решил, что могу сгруппировать все дома с помощью функции Pandas GroupBy. Кто-нибудь знает, как вычитать внутри объекта groupby?
Данные выглядят так:
house1 flyer 01-12-2014 05-12-2014
house1 phonecall 06-12-2014 06-12-2014
house2 flyer 01-12-2014 31-12-2014
мой ожидаемый результат выглядит так:
house1 ; 5 days
house2 ; 30 days
house3 ; 12 days
house4 ; 60 days
etc