Как работает PigStorage для S3?

Мне интересно, как PigStorage в Pig хранит данные на S3? Сохраняет ли он выходные данные в HDFS, а затем копирует их? Или сохранить каждый вывод редуктора в локальный каталог каждого редуктора, а затем скопировать их на S3? Я предполагаю, что это не может быть потоковой передачей, поскольку S3 поддерживает только размещение файлов или каталогов?

amazon-s3 apache-pig

kee 25.11.2012 источник

Ответы (1)

arrow_upward
2
arrow_downward

Насколько я понимаю, каждый редуктор записывает свой вывод локально, а затем копирует вывод в S3.

Как вы правильно заметили, поскольку S3 не поддерживает потоковую передачу, редуктор может копировать свой вывод только после завершения обработки.

seedhead 30.11.2012

Как работает PigStorage для S3?

Ответы (1)

Похожие вопросы