ПОСТРОЕНИЕ МОДЕЛИ ДЛЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ОБЗОРОВ AMAZON Целью статьи является извлечение мнений и выявление областей улучшения продукта, касающихся различных аспектов продукта, из их онлайн-обзоров.

Почему именно эта газета?

Плохая оценка продукта редко означает, что он плох во всех аспектах. Если доставка на Amazon была отложена на неделю, плохой отзыв не обязательно будет отражать качество продукта. Покупателям и продавцам важно понимать, о чем именно был отрицательный отзыв.

Потребители и продавцы тратят много времени на чтение длинных обзоров, чтобы выяснить, что считается хорошим и плохим в продукте. В настоящее время Amazon имеет функцию, которая позволяет пользователям фильтровать отзывы по популярным ключевым словам, что по-прежнему утомительно и требует много времени для клиентов. Пользователи должны прочитать многочисленные обзоры, чтобы получить актуальную информацию о необходимых им продуктах. Продавцы Amazon или новые участники также должны найти пробелы в характеристиках продукта для определенной категории. Например, если мнение о «вкусовых качествах» всех продуктов в определенной категории отрицательное, есть потенциал для разработки и внедрения нового продукта с лучшим вкусом. Для маркетологов мнения, основанные на аспектах, могут указывать, какие настроения улучшить или преуменьшить рекламу, в зависимости от того, сколько людей говорят о них в обзоре.

Глядя на приведенный ниже пример, мы можем заметить, что почему аспект бутылки отрицательный,

Обзор решения

Когда мы отступаем и думаем о различных этапах процесса, конвейер кажется очень сложным. Интуиция, лежащая в основе нашей модели, заключается в том, что аспекты, извлеченные из набора обзоров продукта, могут быть похожи или связаны друг с другом. Пользователи могут описывать одни и те же функции продукта разными словами. Кроме того, это также гарантирует отсутствие избыточности.

Мы разбили весь процесс на подмодули -

01. Получение данных

На этом этапе мы удаляем данные отзывов от AMAZON.

02. Выявление аспектов

Целью этого шага было извлечение примеров аспектов продукта, которые выражают мнение о конкретном аспекте.

03. Визуализация результатов

Стремясь разработать конечный продукт, мы смоделировали интерактивную информационную панель, чтобы продавцы и пользователи могли получать информацию из обзоров.

Наша модель

В этом разделе представлена ​​вся использованная нами модель с высоты птичьего полета. Чтобы сделать его интуитивно понятным, мы использовали один примерный обзор, с помощью которого мы исследуем всю модель.

Сбор данных

Данные - один из важнейших аспектов любой проблемы машинного обучения. Текст обзора, который мы извлекли из AMAZON, содержал много нечистых данных, поэтому мы создали сценарий очистки для набора данных. Он удалил ненужные символы, гиперссылки, символы, лишние пробелы и другие образцы текста, которые не могли быть обработаны нашей системой. Из очищенного набора данных мы извлекли текстовое описание обзора для нашего анализа.

Извлечение аспектов

Целью этого шага было извлечение экземпляров аспектов продукта и модификаторов, которые выражают мнение о конкретном аспекте. Мы использовали Python spaCy, NLTK, ABSA извлекает аспекты и уважает мнение. Результатом этого шага стал список таких существительных с уважаемым мнением и обзором.

Краткий обзор панели инструментов

На приведенной выше панели инструментов в поле поиска введите ASIN (стандартный идентификационный номер Amazon), через некоторое время вы увидите удаленные данные с помощью параметра загрузить, чтобы вы могли загрузить все обзоры, а затем гистограмму положительный и отрицательный аспект с параметром Результат, чтобы мы могли проверить вручную.

Заключение и дальнейшие шаги

Вывод

Аспекты извлечения оказались основным узким местом для всего процесса, поэтому мы можем найти области улучшения продукта, а производители могут работать над продуктом или заменить текущий продукт на другой.

В нашем случае нашим продуктом является яблочный уксус, некоторым людям не нравится вкус продукта, поэтому вкус - это область улучшения яблочного уксуса, поэтому производитель может напрямую работать над вкусом продукта. и Т. Д.

Путь вперед

  • Создание интерактивного пользовательского интерфейса, разработка веб-плагина для пользовательского интерфейса - это гарантирует, что пользователю не придется посещать новую среду для доступа к нашей модели.
  • Используйте корзины Amazon S3 вместо очистки фреймворка.

Первоначально опубликовано на https://47billion.com 21 июля 2020 г.