Возможно, вы слышали о новом Google Cloud Vision API. Если нет, вам стоит это проверить. Он позволяет загружать изображение и получать из него ТОННУ информации на основе машинного обучения, включая обнаружение ориентиров, обнаружение лиц, обнаружение эмоций, обнаружение контента для взрослых и даже распознавание текста.
Моя любимая функция - это обнаружение этикеток. Дайте Cloud Vision изображение, и оно расскажет вам, что на нем изображено!
Это делает то, что раньше было невозможно, очень легко делать!
Включение Vision API
Чтобы использовать API, вам необходимо включить API:
- Убедитесь, что у вас есть проект Google Cloud
- Щелкните по этой ссылке
- Выберите свой проект и включите API
Использование модуля gcloud npm
Самым простым было использование Cloud Vision API - это модуль gcloud npm.
Обязательно создайте учетную запись службы и загрузите ключевой файл JSON.
Да серьезно, вот и все! Есть функции, которые нацелены на все различные функции Cloud Vision API, и есть общая функция «обнаружения», которая может выполнять несколько типов обнаружения одновременно!
Создание «настоящего» приложения
Вот пример приложения, которое я сделал. Он создает небольшой экспресс-сервер, который позволяет загружать изображения и анализировать их с помощью Cloud Vision API.
Взгляните на строку 52. Вы можете указать, что должен обнаруживать Cloud Vision API, например лица, ориентиры, метки, логотипы, свойства, контент для взрослых и текст! Это позволяет вам сэкономить за счет определения только тех функций, которые вам нужны.
Я загрузил свое изображение несколько лет назад:
Сумасшедший!
За дополнительной информацией обращайтесь к документации. API предоставляет вам МНОГО подробной информации, если вы этого хотите; Я только поцарапал поверхность!