Изучаем мировой опыт.
Успешное выполнение корпоративной стратегии искусственного интеллекта зависит от качества данных, лежащих в ее основе, так как же компании могут убедиться, что они на правильном пути, когда дело доходит до внедрения ранних стадий этого процесса?
Поиск и получение нужных данных для создания корпоративного набора данных, пожалуй, самая важная задача, стоящая перед организациями, которые хотят создавать свои собственные модели искусственного интеллекта (ИИ).
Даже при наличии практического опыта все может легко пойти не так. Если ваши данные не соответствуют действительности, то и модель ИИ не будет хорошей.
Вместо этого, довольно часто, задача предприятий должна заключаться не в том, чтобы захотеть захватить мир своим первым проектом, а в том, чтобы провести пилотный проект, который позволит им продвинуться дальше.
Европейские эксперты советуют, изучите конкретные бизнес-потребности и требования к данным или цифровому проекту и спросите, какую проблему необходимо решить, и какую «догадку» нужно проверить. Но сначала избегайте глубоких размышлений о «глобальных последствиях».
Исходите из первых принципов получения данных для конкретного варианта использования, о котором идет речь.
Сравните свой статус-кво с тем, что вам нужно улучшить. Какие доступные данные необходимо собрать? Делайте это небольшим или конечным способом, только для данного варианта использования.
Сначала рассмотрите соответствующие данные и наборы данных, которые бизнес уже имеет или может использовать. Обычно это предполагает тесное сотрудничество с юридическими специалистами и специалистами по защите конфиденциальности, даже в промышленных условиях.
Убедитесь, что данные, предназначенные для использования, не содержат никакой личной информации. И, исходя из этого, предприятия могут построить модель, которую они хотят использовать, и обучить ее – при условии, что затраты и осуществимость будут на месте.
Отсюда может возникнуть прозрачность точек принятия решений, необходимых для того, чтобы все заработало, и значения сигналов для оценки таких факторов, как удобство использования и жизнеспособность, влияние на бизнес или потенциальная производительность в сравнении с данными конкурентов.
Что касается данных, которыми в настоящее время не располагает предприятие, то могут потребоваться переговоры с некоторыми партнерами или клиентами о их приобретении.
Качество и простота данных могут иметь важное значение
Упрощайте, где это возможно. Сложность затрудняет принятие правильных решений и наносит ущерб результатам, а кроме того, необходимо учитывать предвзятость и интеллектуальную собственность. Внутренние данные не идеальны, но, по крайней мере, у вас будет представление о том, насколько они хороши.
По сравнению с простой в использовании 2D-подгонкой линий или даже 3D-подгонкой линий, сложная многомерная подгонка линий на базе AI / ML может обеспечить гораздо лучшие результаты – оптимизацию производства, «рецепты решений», минимизацию отходов и многое другое, если предприятия «теряют контроль» над нужными данными.
Например, определенный атрибут через призму определенного стандарта должен работать достаточно хорошо, чтобы его можно было передать следующей команде, которая принимает эти стандарты и допуски, результаты этих измерений и точки наблюдения, а затем работает с управлением данными для сбора, обработки и поддержания данных.
Предприятиям необходимо «знать, как выглядит товар», чтобы повысить производительность данных и получить аналитические данные, которые затем можно объединить. Формулируйте задачи четко, сужая круг данных для требуемых наборов данных. Тщательные аннотации и метаданные могут обеспечить кураторство контрольных наборов данных и по-настоящему научный подход, который выявляет предвзятость и помогает минимизировать ее.
Даже собственные данные предприятия, как правило, фрагментированы и скрыты в разных местах, облаках или локально.
Внесите в каталог все свои информационные ресурсы и поймите, где эти данные хранятся. Используйте искусственный интеллект и для более быстрого управления данными.
Обеспечьте управление перед внедрением
Применяйте все правила качества данных перед использованием движком искусственного интеллекта, предполагая надлежащее управление и соответствие требованиям. Если предприятие не проводит измерения, количественную оценку и фиксацию, то оно просто будет принимать неправильные решения в ускоренном темпе.
Рамки управления данными могут потребовать расширения за счет включения моделей ИИ. Тем не менее, потенциальных вариантов использования ИИ предостаточно.
Однако создание моделей искусственного интеллекта, особенно генеративного искусственного интеллекта (GenAI), может оказаться дорогостоящим.
Изображение сгенерировано ИИ