Возможно, вы слышали о новом Google Cloud Vision API. Если нет, вам стоит это проверить. Он позволяет загружать изображение и получать из него ТОННУ информации на основе машинного обучения, включая обнаружение ориентиров, обнаружение лиц, обнаружение эмоций, обнаружение контента для взрослых и даже распознавание текста.

Моя любимая функция - это обнаружение этикеток. Дайте Cloud Vision изображение, и оно расскажет вам, что на нем изображено!

Это делает то, что раньше было невозможно, очень легко делать!

Включение Vision API

Чтобы использовать API, вам необходимо включить API:

  1. Убедитесь, что у вас есть проект Google Cloud
  2. Щелкните по этой ссылке
  3. Выберите свой проект и включите API

Использование модуля gcloud npm

Самым простым было использование Cloud Vision API - это модуль gcloud npm.

Обязательно создайте учетную запись службы и загрузите ключевой файл JSON.

Да серьезно, вот и все! Есть функции, которые нацелены на все различные функции Cloud Vision API, и есть общая функция «обнаружения», которая может выполнять несколько типов обнаружения одновременно!

Создание «настоящего» приложения

Вот пример приложения, которое я сделал. Он создает небольшой экспресс-сервер, который позволяет загружать изображения и анализировать их с помощью Cloud Vision API.



Взгляните на строку 52. Вы можете указать, что должен обнаруживать Cloud Vision API, например лица, ориентиры, метки, логотипы, свойства, контент для взрослых и текст! Это позволяет вам сэкономить за счет определения только тех функций, которые вам нужны.

Я загрузил свое изображение несколько лет назад:

Сумасшедший!

За дополнительной информацией обращайтесь к документации. API предоставляет вам МНОГО подробной информации, если вы этого хотите; Я только поцарапал поверхность!