Слияние Cloudera и Hortonworks: подробный обзор

Неожиданное слияние?

Должен признаться, что объявление о слиянии на прошлой неделе стало для меня неожиданностью. Это были две компании, раздвигающие границы науки о данных с открытым исходным кодом посредством здоровой конкуренции друг с другом. И всего за неделю до этого на конференции по искусственному интеллекту под Сан-Диего я говорил об относительных различиях в их, казалось бы, идентичных продуктовых линейках. В мире дистрибутивов Hadoop CDH и HDP почти синонимы.

Однако для таких специалистов, как мы, которые работают под капотом и которым приходится подкручивать гайки и болты, между ними есть несколько различий. Во время моего последнего задания моя команда потратила много времени на размышления о том, имеет ли смысл сделать так, чтобы лояльность переключилась с CDH на HDP. Однако много раз я рассматривал HDP как, возможно, более жизнеспособную альтернативу. С коммерческой точки зрения Cloudera имеет преимущество перед Hortonworks, хотя Hortonworks вышла на IPO с завидной скоростью. Хотя слияние рекламируется как слияние равных, те, кто видел более мелкие отпечатки в пресс-релизе, поймут, что доминирование Cloudera во всей сделке.

Что сделало Cloudera доминирующей, несмотря на то, что Hortonworks был «лучшим» продуктом с открытым исходным кодом?

Сначала рассмотрим вторую часть утверждения. Ценообразование HDP больше соответствует духу открытого исходного кода, в то время как Cloudera Enterprise стоит дорого. Ценообразование — это лишь малая часть принятия решения о продукте, который еще предстоит коммерциализировать, и конкурентное преимущество, которое Cloudera имеет перед Hortonworks, заключается не в дистрибутиве Hadoop, а в сложности его утилиты управления данными. В то время как Cloudera Manager значительно эволюционировал по сравнению с версиями 5.X до текущей версии 6.0, HDP Ambari по-прежнему отличается уровнем взаимодействия с пользователем с открытым исходным кодом. Согласование с открытым исходным кодом полезно для инженеров и разработчиков, поскольку они могут лучше понять тонкости распределенного хранения и вычислений, и при параллельном найме я видел, как инженеры, имеющие опыт работы в Hortonworks, чувствовали себя комфортно в CDH, но не совсем наоборот. Однако с корпоративной точки зрения взаимодействие с пользователем имеет большое значение для крупных установок Hadoop — команда оптимизирует время и ресурсы для администрирования, усовершенствования и устранения неполадок. Поэтому неудивительно, что крупные предприятия в основном склоняются в пользу Cloudera при принятии решения о покупке.

Что еще помогло Cloudera получить преимущество 60:40:

Более важной причиной, которая дала Cloudera фору, является внедрение машинного обучения и облачных технологий. Cloudera смогла лучше интегрировать Spark MLLib в свой портфель CDH в качестве единой сущности, в то время как Hortonworks пришлось столкнуться с инерцией, чтобы добиться этого. В то время как доходы обеих компаний были в основном связаны с внедрением собственных центров обработки данных, Cloudera смогла лучше понять и принять тенденцию миграции в облако и развернуть свое облачное предложение Altus, тесно связанное с CDH. В то время как Hortonworks последовала стратегической связи с интеграцией Google Cloud. Облако Google еще не полюбилось корпоративным клиентам, и собственное облако HDP могло бы сделать его более приемлемым для этого сегмента.

Что в магазине:

Слияние, вероятно, заставит задуматься третьего независимого игрока MapR. Объединенная компания, вероятно, будет иметь доход более чем в 2,5 раза выше (и в несколько раз больше оценки) MapR и с более надежной маркетинговой инфраструктурой и базой установки. Еще неизвестно, пересмотрит ли MapR свою стратегию проприетарной распределенной файловой системы, которая препятствует переходу потенциальных клиентов с существующих установок CDH или HDP. Ресурс, находящийся в распоряжении объединенной организации, также может позволить ей использовать мощь AWS как для своих облачных сервисов машинного обучения, так и для сервисов EMR Hadoop.

Генеральный директор Cloudera (также генеральный директор объединения) Том Рейли упомянул Джиму Крамеру из CNBC, что люди хотят, чтобы новая организация стала Oracle будущего, и неорганический рост, который обещает это слияние, несомненно, может катапультировать компанию на новый уровень.