Таблица MySQL с dept_id в качестве первичного ключа
|dept_id | dept_name |
| 2 | Fitness
| 3 | Footwear
| 4 | Apparel
| 5 | Golf
| 6 | Outdoors
| 7 | Fan Shop
Запрос Sqoop
sqoop import \
-m 2 \
--connect "jdbc:mysql://quickstart.cloudera:3306/retail_db" \
--username retail_dba \
-P \
--query 'select * from departments where dept_id < 6 AND $CONDITIONS' \
--target-dir /user/cloudera/sqoop_import/departments;
Результаты с ошибкой на консоли:
При параллельном импорте результатов запроса необходимо указать
--split-by
---Вопрос!---
Несмотря на то, что в таблице есть первичный ключ и разбиения могут быть поровну распределены между двумя картографами, тогда зачем нужен --spit-by или -m 1 ??
Направь меня к тому же.
Спасибо.