Машинное обучение без программирования, часть 1

Машинное обучение (ML) может найти множество приложений в области здравоохранения. Одно из перспективных приложений - в области анатомической патологии. ML позволяет использовать репрезентативные изображения для обучения компьютера распознаванию закономерностей на помеченных фотографиях. На основе набора изображений, выбранных для представления конкретной ткани или процесса заболевания, компьютер можно обучить оценивать и распознавать новые уникальные изображения пациентов и ставить диагноз.

Аденокарцинома легких и толстой кишки - одни из наиболее распространенных видов рака, поражающих многих пациентов во всем мире. Они часто распространяются на другие участки тела. Нередко перед патологом возникает вопрос, произошла ли биопсия, показывающая аденокарциному, из первичного очага легкого или толстой кишки. Патологи часто вынуждены использовать специальные красители, чтобы помочь им сделать это определение.

Я использовал две разные библиотеки машинного обучения (fastai и Keras), чтобы выяснить происхождение метастатической аденокарциномы в моем предыдущем посте на Medium. В этой статье я использую приложение для автоматического машинного обучения Lobe, чтобы решить эту важную проблему.

Lobe - это бесплатное настольное приложение, которое вы можете использовать для обучения своих моделей и экспорта их для производства. Он доступен как для операционных систем Windows, так и для macOS. Вы можете скачать его с сайта lobe.ai. По состоянию на ноябрь 2020 года приложение находится в бета-версии. Теперь вы можете использовать только приложение Lobe для классификации изображений, но разработчик обещает расширить приложение для решения большего количества задач машинного обучения в будущем.

Lobe - долгожданный новичок в приложениях AutoML. Это еще одно крупное настольное приложение AutoML после Apple CreateML. Подавляющее большинство приложений AutoML являются облачными. Основным преимуществом настольных приложений AutoML является безопасность данных, что особенно важно для медицинских данных. В прошлом году я опубликовал статью, сравнивающую Apple CreateML и Google AutoML для гистопатологической диагностики рака. Я рассмотрел плюсы и минусы локальных приложений машинного обучения по сравнению с облачными. Поскольку Apple CreateML доступен только для macOS, приятно видеть, что Lobe доступен как для платформ Windows, так и для macOS. Чтобы сделать его еще лучше, разработчики также обещают версию для Linux.

Как только вы откроете Lobe, вам будет представлен экран приветствия.

Затем вы импортируете изображения. Если ваши изображения организованы в папки с обозначениями классов, вы можете перетащить их в приложение. Таким образом, вам не нужно маркировать изображения. В противном случае вам придется маркировать изображения вручную.

Я использовал изображения из набора данных LC25000. К сожалению, я не смог обучить все 10000 изображений. Приложение просто вылетело. Все работало нормально, как только я уменьшил набор данных до 2000 изображений (по 1000 для каждого класса, аденокарциномы легких и аденокарциномы толстой кишки соответственно).

Приложение Lobe позволяет вам оптимизировать настройки проекта по точности или скорости. Основным движком Lobe является трансферное обучение с помощью TensorFlow. Если вы выберете точность, программа будет использовать ResNet50V2 для обучения, что дает лучшие результаты, но требует больше времени для обучения. Если вы оптимизируете скорость, программа использует MobileNetV2, что является более быстрым, но менее точным выбором.

Во-первых, я оптимизировал тренировку по скорости. На обучение модели ушло 8 минут. После обучения модель точно классифицировала 98% изображений.

Далее я оптимизировал тренировку на точность. На обучение модели ушло 12 минут. После обучения модель точно классифицировала 99% изображений.

Самым большим недостатком программы является отсутствие поддержки графического процессора. Все обучение основано на ЦП. Еще раз, разработчик обещает предоставить его в будущем.

Ниже показан монитор активности, использующий быстрый / менее точный вариант:

И монитор активности, использующий более медленный / более точный вариант:

Программа автоматически делит набор данных на набор данных для обучения 80% и набор данных для тестирования 20%. Вы можете увидеть результаты для набора данных тестирования, перейдя в «Просмотр» и выбрав «Тестовые изображения».

Затем я проверил обученную модель на 20 неизвестных изображениях, нажав кнопку «Воспроизвести» и перетащив изображения в программу.

Модель правильно предсказала 9 из 10 (90%) изображений аденокарциномы толстой кишки.

Модель правильно предсказала 10 из 10 (100%) изображений аденокарциномы легких.

После обучения вы можете экспортировать свою модель для Интернета, мобильного или локального использования.

Таким образом, я действительно впечатлен бета-версией Lobe. Он прост в использовании и не требует навыков программирования для обучения модели и экспорта модели для производства. Хотя он не такой универсальный, как Apple CreateML, он может стать серьезным конкурентом в будущем из-за независимости от операционной системы. Текущие самые большие недостатки - это отсутствие поддержки графического процессора и узкий выбор типа проблемы машинного обучения, ограниченный классификацией изображений. Я особенно ценю яркое Reddit Lobe Community с отзывчивой командой разработчиков Lobe. Благодаря компетентной команде разработчиков и адекватному финансированию со стороны материнской компании Microsoft, Lobe имеет большой потенциал, чтобы успешно конкурировать с другими платформами AutoML.

Спасибо, что нашли время прочитать этот пост.

Эндрю

@Tampapath