Импорт BigQuery — файл CS не найден

Наша система запускает импорт CSV-файла BQ (~ 8 МБ) из CS каждые 10 минут. Но сегодня по крайней мере 4 раза произошла ошибка: «Не найдено: файл хранилища Google ...». Я дважды проверил файл на CS и скачал его без проблем. Я попытался (повторно) запустить импорт BQ (job_610b149c0d9041b7a3145ee245b80653), снова получил сообщение «не найдено...». Все остальные импорты (их сотни) в порядке.

Мы используем GAE (java) для размещения CSV-файлов в CS, а затем запускаем задания на импорт (GAE -> CS -> BQ). В целом система работает нормально, но не очень надежно. Итак, борюсь с пробелами (отсутствующими данными) или иногда с дублированием чуть ли не каждый день. Существуют ли другие способы (передовой опыт) импорта «постоянного потока» данных в BQ? Потоковое?

Когда у нас есть данные в таблице BQ, все становится намного проще. BigQuery — действительно отличный продукт! Спасибо, саша


person Sasa    schedule 14.03.2013    source источник
comment
У меня такая же проблема сегодня. Мы загружаем и обрабатываем файлы из GAE и сохраняем их в облачном хранилище. Затем мы запускаем задание BQ, чтобы использовать эти файлы для нас. Мы случайным образом получаем ошибки «Файл не найден» и сбой задания.   -  person someone1    schedule 14.03.2013
comment
Это должно быть исправлено немедленно.   -  person Jordan Tigani    schedule 14.03.2013


Ответы (1)


Это должно быть исправлено. Возникла проблема с конфигурацией, из-за которой некоторые файлы облачного хранилища были недоступны между примерно 17:00 вчера вечером и 10:15 сегодня утром (по тихоокеанскому стандартному времени). Пожалуйста, пропингуйте эту ветку, если у вас возникнут дополнительные проблемы.

person Jordan Tigani    schedule 14.03.2013
comment
Задание импорта (job_c4d1a16f62144cdbabc703fc902c24d9) сообщает о следующих ошибках: Слишком много столбцов: ожидалось 28 столбцов, но получено 29 столбцов. Для получения дополнительной справки: goo.gl/RWuPQ ... Когда я повторяю импорт одного и того же файла (неизмененного), несколько через несколько часов все было в порядке (job_05f6217c70d44a10b183e026733ddfc0) - person Sasa; 15.03.2013