Я относительно новичок в Pandas и Python. Я ищу совета о самом быстром способе выполнить следующую задачу. Я пытаюсь написать код, похожий на команду pd.get_dummies()
, но обобщающий ее более чем на один столбец.
Я хочу выбрать столбцы dx1, dx2 и dx3 и вернуть фиктивную информацию о том, содержит ли какой-либо из этих столбцов заданное значение.
Пример входных данных:
In [2]: df
Out[2]:
dx1 dx2 dx3 othervar
0 1 2 3 4
1 1 3 5
2 3 4 2
Выходные данные:
In [2]: df
Out[2]:
dx1 dx2 dx3 othervar dx_any1 dx_any2 dx_any 3 dx_any4
0 1 2 3 4 1 1 1 0
1 1 3 5 1 0 1 0
2 3 4 2 0 0 1 1