Хотя обычно об этом не думают в этих терминах, фотографирование включает в себя запись четырехмерного блока пространства-времени и проецирование его на двумерное представление. С достаточно чувствительным материалом (и достаточно быстрым затвором) можно создавать изображения более или менее мгновенно, но более длительные выдержки раскрывают присущую этому процессу временность, показывая нам нечто, явно основанное на мире, но совершенно отличное от нашего опыта восприятия. Это. Сегодня способность создавать изображения, конечно, настолько обыденна, что мы легко принимаем ее как должное, но ранние комментарии к фотографии показывают, насколько необыкновенной она была когда-то. Действительно, история фотографии представляет собой как убедительный пример силы репрезентации, так и полезную параллель с более поздними формами технологической магии, особенно с машинным обучением.

Как и в случае со многими изобретениями, рождение фотографии невозможно точно определить, поскольку многие составные части, такие как линзы, химическое производство и камера-обскура, существовали в течение многих лет, прежде чем они были объединены в согласованную систему создания изображений. . Тем не менее, 1839 год — год, когда методы Дагера и Тальбота были впервые обнародованы, — служит удобной отметкой того, когда практическая фотография стала широко известна и доступна миру.

Реакция публики была быстрой и драматичной. Через несколько месяцев после объявления Дагера в журналах появилась первая реклама комплектов для домашней фотосъемки. Десятки доступных портретных студий быстро возникли в таких городах, как Париж, подорвав небольшое количество профессиональных художников-портретистов, которые ранее существовали за счет заказов от элитной клиентуры. В течение нескольких лет каждый год производились миллионы дагерротипов.

Дальнейшие усовершенствования и механизация процесса дали фотографам возможность делать изображения еще дешевле и в большем разнообразии условий, и вскоре фотографии стали широко распространяться, особенно в виде коллекционных карточек посещения. ». В то время как это новое технологическое чудо дало почти каждому возможность сохранять лица любимых или создавать свои собственные личные архивы, фотография также быстро внедрялась в правительственную бюрократию, как в методе Альфонса Бертильона для систематического документирования и сохранения записей всех арестованных. . Вскоре, как отмечает историк Джон Тэгг в Бремя репрезентации, быть изображенным перестало быть привилегией, а стало бременем нового класса тех, за кем ведется наблюдение. [1]

Помимо замечательной способности фотографии улавливать, казалось бы, бесконечное количество деталей, наиболее широко отмеченной особенностью первых комментаторов был ее якобы научный или объективный характер. Хотя опытные рисовальщики могли создавать чрезвычайно подробные рисованные иллюстрации сцены, не было никакой гарантии, что их изображение будет свободным от предвзятости или субъективности. Фотография, напротив, воспринималась как чистая и первозданная, просто действие солнечного света. Для Дагера они дали природе «способность воспроизводить себя». [2] Талбот также описал свои образы как «впечатленные действием только Света». [3]

Такие понятия сейчас кажутся, конечно, диковинными, особенно в эпоху глубоких фейков и прочих искусственных, но обманчиво реалистичных изображений и видео. Однако даже до Photoshop было очевидно, что фотография гораздо менее объективна, чем предполагалось изначально. Почти сразу же умные художники начали манипулировать изображениями совершенно механическим образом, либо используя многократную экспозицию, либо объединяя несколько негативов в один отпечаток, как в Двух образах жизни Оскара Рейландера (1857 г. ).

Что еще более важно, как отмечали все, от Сьюзан Зонтаг до Эррола Морриса, даже самые чистые изображения являются результатом человеческих решений, включая выбор уровня освещенности, экспозиции, кадрирования и так далее. Помимо явных манипуляций, фотография — это всегда вид откуда-то, под определенным углом и с определенным фокусом. Несмотря на свою верность первоисточнику, фотографии совершенно очевидно остаются репрезентацией, частичным изображением, которое обязательно упускает одни детали и затемняет другие.

Если сегодня и существует технология, которая может претендовать на столь же мифический статус и широкое влияние на общество, то это, несомненно, машинное обучение. Подобно фотографии, эта относительно новая технология представляет собой совокупность компонентов, которые либо существовали, либо разрабатывались в течение многих лет, включая принципы статистического вывода, достижения в алгоритмах и компьютерном оборудовании, а также нормализацию массового сбора данных. Более того, как и фотография, машинное обучение облачается в одеяния колдовства, по-видимому, порождая невозможное, например, автомобили, которые могут управлять собой, компьютеры, которые могут переводить с одного языка на другой, и программы, которые могут победить своих изобретателей в самых сложных человеческих ситуациях. игры.

Действительно, метафорические связи уходят глубоко. В то время как фотография изначально превозносилась как инструмент, который можно использовать для документирования несправедливости мира, разоблачения лицемерия и выявления условий жизни самых бедных, машинное обучение аналогичным образом продвигалось как способ продлить человеческую жизнь, заменить ошибочные суждения. , и предотвратить злодеяния. Точно так же, как фотография была быстро принята государственными интересами для целей наблюдения и контроля, новые системы мониторинга, привязанные к прогностическим моделям, сейчас создаются в беспрецедентных масштабах.

Утверждения о предполагаемой объективности алгоритмов также легко найти, и, конечно же, они в равной степени вводят в заблуждение. Конечно, любой подходящий алгоритм машинного обучения будет точно сжимать набор данных в модель, точно так же, как камера будет точно преломлять свет, отражающийся от сцены, чтобы создать изображение. Однако выбор, сделанный в ходе этого процесса, нельзя игнорировать. В то время как фотограф делает выбор в отношении уровня освещенности, положения камеры, времени экспозиции и, что наиболее важно, что фотографировать, использование машинного обучения включает в себя выбор того, какую модель использовать, какие предположения делать, откуда брать данные, и прежде всего, какие модели стоит делать.

Вместо того, чтобы фиксировать момент с одной точки зрения, машинное обучение берет данные, извлеченные из нескольких источников, распределенных в пространстве и времени, и кристаллизует их в статическую конструкцию, своего рода миниатюру, на основе которой затем можно делать прогнозы. Хотя можно продолжать обновлять модели новыми данными до бесконечности, большинство реальных систем избегают этой более сложной задачи и просто создают замороженное представление, отражающее данные и предположения, на основе которых оно было построено. Расширяя метафору, можно сказать, что модель машинного обучения это фотография, но сделанная из данных, а не из света.

Многие из ранних дебатов о фотографии теперь несколько устарели, но остается один вопрос, а именно: что именно фотографии говорят нам? С одной стороны, они довольно явно представляют только поверхность того, что было перед камерой. Тем не менее, обычно утверждается, что фотографии могут раскрыть нечто более глубокое, каким-то образом уловив истинную природу предмета. В то время как лучшие фотографии, кажется, раскрывают и сохраняют что-то уникальное в тех, кого мы знаем лучше всего, эта линия мышления также была доведена до крайности евгенистами, такими как статистик Фрэнсис Гальтон, который создал составные портреты с многократной экспозицией в надежде выявить основные черты. характер различных групп, таких как уголовники или «еврейский тип».

В машинном обучении моделирование скрытых свойств гораздо более явное. Одна из фундаментальных идей статистики состоит в том, чтобы допустить существование «скрытых переменных», объясняющих наблюдаемые данные. Комбинируя наблюдения из многих случаев, мы можем вывести значения этих неизвестных, даже если они никогда не наблюдались напрямую. Достоверность этих выводов зависит, конечно, от того, правильную ли мы модель указали. Даже неправильно определенные модели могут быть чрезвычайно полезными для получения более точных прогнозов, но легко забыть, что высокая точность сама по себе не доказывает правильность лежащих в основе предположений.

Хотя недавний рост глубокого обучения повлек за собой шаг в сторону от такого рода явного моделирования скрытых переменных (заменив его слоями нелинейных функций, которые не имеют какого-либо конкретного предполагаемого значения), даже глубокие модели, тем не менее, предполагают существование по крайней мере одной названной модели. переменная, которая в основном не наблюдается — это метка, которую модель пытается предсказать. Хотя могут быть случаи, когда такого рода классификация является относительно безобидной (возможно, например, идентификация типов галактик, присутствующих на астрономических изображениях), предсказание метки, особенно когда дело доходит до предсказаний о людях, влечет за собой класс вред, который Кейт Кроуфорд назвала «вредом репрезентации». [4]

Трудность заключается не только в возможности предсказания «неправильного» ярлыка (например, неправильного определения пола людей или даже в неспособности признать их людьми), но, скорее, в самом создании и овеществлении самих категорий. Пол и раса — наиболее доступные примеры (каждый из которых обычно рассматривается как набор дискретных, взаимоисключающих категорий в рамках моделей машинного обучения), но поле возможного вреда здесь огромно. Важно отметить, что важны не только сами предсказания, но и то, как они осмысливаются, описываются и, в некоторых случаях, мифологизируются.

В Верить значит видеть, одном из лучших современных комментариев к фотографии, Эррол Моррис подробно исследует, как значение фотографии возникает не только из изображения, но и из сопровождающего его текст и истории, которые мы рассказываем о нем. [5] Действительно, хотя люди часто беспокоятся о том, что фотографы манипулируют их изображениями с помощью механических средств, наиболее важные манипуляции часто происходят при описании фотографий.

Одним из лучших примеров этого Морриса является фотография, сделанная Артуром Ротштейном во время Великой депрессии под эгидой Администрации безопасности ферм. На фотографии, снятой в Южной Дакоте в 1936 году, изображен коровий череп на пыльном ландшафте. Его широко перепечатывали, в том числе в Вашингтон пост, где он появился под заголовком Ущерб от засухи в западных штатах растет. Подпись под изображением гласила: Из Пеннингтона, С. Дак., пришла эта фотография обесцвеченного черепа на выжженной солнцем голой равнине, дающая торжественное предупреждение о том, что это земля, которой угрожает пустыня.».

Однако оказывается, что Ротштейн сделал несколько фотографий из одной серии, меняя положение черепа между кадрами. Ротштейн признал это, заявив, что стремился создать определенный эффект.

Как только об этом стало известно, первое изображение было внезапно объявлено «фальшивой фотографией» или правительственной пропагандой, особенно теми, кто выступал против администрации Рузвельта. Предположение в основном состоит в том, что Ротштейн поставил сцену, чтобы создать ложное впечатление сильной засухи. Но сомнений в том, что там действительно была сильная засуха, не было. Более того, Ротштейн нигде не утверждал, что фотография представляет собой именно тот пейзаж, который он нашел, или что он пытался представить доказательства засухи. Скорее, мы делаем неявные предположения о том, как возникают образы и как мы должны их интерпретировать. Подпись в «Вашингтон пост» утверждает, что это изображение является «торжественным предупреждением», но само изображение не заявляет об этом. Скорее, это значение, проецируемое на образ словами, которые мы используем, чтобы говорить о нем.

Как пишет Аллан Секула в Photography Against the Grain: «Единственная «объективная» истина, которую предлагают фотографии, — это утверждение, что кто-то или что-то… был где-то и сделал снимок. Все остальное, все, кроме запечатления следа, можно забрать». [6] Или, как сказал сам Ротстайн: «Обе фотографии были точными и правдивыми. Слова, написанные или отредактированные другими, в сочетании с фотографиями были неправильными и неправильными». [7]

Я, конечно, хочу сказать, что то же самое относится и к машинному обучению. Одно дело собрать набор данных, обучить модель и предсказать вероятности, связанные с набором придуманных категорий. Совсем другое дело утверждать, что это модель рецидивизма, или преступности, или кредитоспособности, или любого количества других возможных ярлыков. Такие простые и наводящие на размышления названия неизбежно упускают из виду важные детали, которые способствовали созданию такой модели — откуда взялись данные, как они были собраны, что было исключено и какие предположения были сделаны. В большинстве случаев к тому времени, когда модель создается и развертывается, мир движется дальше, оставляя только модель и ее описание как след некоторых данных и выбор, который был сделан при превращении ее в представление мира. .

В конечном счете, самое важное влияние технологии заключается в ее способности изменить отношения власти. Как отмечает Сьюзен Зонтаг, например, фотография не только дала нам возможность документировать жизнь других, но и переопределила то, что приемлемо наблюдать. [8] Первоначально только небольшая, технически продвинутая элита имела возможность делать фотографии. Однако эта сила быстро получила широкое распространение с появлением в конце девятнадцатого века простых и доступных портативных устройств, таких как первые фотоаппараты Kodak.

И фотография, и машинное обучение имеют, по крайней мере, некоторый потенциал для демократизации технологий, предоставляя людям больше возможностей документировать, делать выводы и сообщать о неправомерном поведении и лицемерии сильных мира сего. Ранние фотографии действительно (по крайней мере, на мгновение) шокировали элиту, показав им условия лишений, в которых многие жили. Точно так же массовое распространение телефонов с камерами привело к тому, что сейчас гораздо больше шансов получить видеодокументацию любого применения силы государством. Тем не менее, как правило, сохраняется фундаментальный дисбаланс сил в создании изображений. Точно так же, как мы никогда не видим человека (или компьютер) за камерами наблюдения, фиксирующими наши передвижения в общественном пространстве, крупнейшие компании теперь контролируют данные о нас в масштабах, которые никогда не смогут сравниться с отдельными людьми.

Крайности этого дисбаланса неоднократно проявлялись в истории фотографии, например, хорошо известные фотографии рабов на юге Соединенных Штатов, сделанные в 1850-х годах под руководством Луи Агассиса, который хотел доказать, что были разные расы, которые были отдельно созданы. [9] В последние годы наблюдалось такое же оскорбительное использование машинного обучения, как, например, статья, предлагающая предсказывать преступность китайских мужчин по фотографиям на государственных удостоверениях личности. В то время как сообщество машинного обучения с готовностью осудило эти и другие очевидные ошибки, также необходимо остерегаться тонкого, но постоянного разделения людей на более или менее произвольные группы.

В конце концов, говорим ли мы о создании изображений или создании моделей, наиболее актуальным остается вопрос: кто имеет право документировать и определять чье поведение? Хотя он писал о фотографии, Секула в равной степени мог иметь в виду машинное обучение, когда писал, как оно привело к «репрезентативным проектам, посвященным новым методам социальной диагностики и контроля, к систематическому именованию, категоризации и изоляции инаковости, которую считали единственной». определяться биологией и проявляться через «язык» самого тела». [10] Это своего рода «инструментальный реализм» (как его называет Секула), которому мы должны продолжать сопротивляться. Несмотря на неоспоримую магию всех этих технологий, карта — не территория, фотография — не зеркало, а машинное обучение — не оракул.

использованная литература

[1] Бремя репрезентации: очерки фотографий и историй Джона Тэгга. Университет Миннесоты Press (1993).

[2] «Дагерротип» Луи Жака Манде Дагера. В Классических очерках о фотографии. Под редакцией Алана Трахтенберга. Книги острова Иете (1980).

[3] Вставка к Карандашу природы Уильяма Генри Фокса Талбота. Лонгман, Браун, Грин и Лонгманс (1844 г.).

[4] Проблема с предвзятостью Кейт Кроуфорд. Основной доклад на NeurIPS (2017).

[5] Верить значит видеть (Наблюдения за тайнами фотографии) Эррола Морриса. Пингвин Пресс (2011).

[6] «Разборка модернизма, новое изобретение документального кино (заметки о политике репрезентации)» Аллана Секулы. В Фотография против зерна: очерки и фотоработы 1973–1983. МАК (2016).

[7] Цитируется по книге Эррола Морриса Верить — значит видеть (Наблюдения за тайнами фотографии). Пингвин Пресс (2011).

[8] О фотографии Сьюзен Зонтаг. Пикадор (1973).

[9] «Черные тела, белая наука: дагерротипы рабов Луи Агассиса» Брайана Уоллиса. В Американском искусстве, Vol. 9 (1995).

[10] «Трафик фотографий» Аллана Секулы. В Фотография против зерна: очерки и фотоработы 1973–1983. МАК (2016).