За последнее десятилетие машинное обучение расширило наши возможности по созданию полезных идей на основе данных. Наряду с этим машинное обучение позволяет нам использовать наши данные для создания интеллектуальных автоматизированных инструментов. Будь то создание инструментов для выявления мошеннических транзакций или создание больших языковых моделей для инструментов NLP, DataHub дает вам гибкость для ускорения вашего рабочего процесса.

Ведущий специалист по машинному обучению

Руководителю машинного обучения необходимо управлять всем в стеке машинного обучения, от данных обучения до моделей. Во всем стеке лид должен будет убедиться, что для каждой задачи используются правильные данные и что данные являются надежными и качественными. DataHub упрощает многие рабочие процессы, связанные с машинным обучением, легко предоставляя соответствующие метаданные о наборах данных и о том, как они связаны.

Как я могу убедиться, что мои функции машинного обучения исключают данные PII?

DataHub позволяет нам легко просматривать, включают ли наборы данных данные личной идентифицируемой информации (PII). Представление таблицы объектов в DataHub позволяет нам увидеть, какие объекты включены в набор данных, чтобы мы знали, содержат ли они данные PII. Кроме того, мы можем даже связать термины глоссария с набором данных, чтобы указать, что он содержит данные PII. Фильтрация этих данных позволяет нам гарантировать, что модели, которые мы создаем, соответствуют политикам конфиденциальности данных.

Мои функции основаны на надежных источниках?

Если вы хотите проверить, основаны ли ваши функции на надежных источниках, функция отслеживания происхождения DataHub упрощает эту проверку. Помогая вам найти соответствующую часть стека данных, DataHub позволяет вам просмотреть всю линию передачи данных вплоть до исходного источника. Это позволяет просматривать исходные источники данных, на которых построена функция, и проверять, обновлены ли они и надежны ли они.

Acryl Data и сообщество DataHub со временем добавляют еще больше функций, чтобы увеличить положительное влияние, которое могут оказать ваши данные. Поэтому мы будем рады, если вы станете частью сообщества DataHub! Хотите принять участие? Приходите поздороваться в нашем Slack, загляните на наш Github и посмотрите запись нашей июньской ратуши, чтобы узнать о последних новостях в DataHub.