В мире бизнеса данным придается огромное значение, однако их подлинная ценность кроется не столько в объеме, сколько в качестве. Данные плохого качества могут препятствовать развитию вашего бизнеса, а также стать причиной принятия неверных решений и утраты возможностей. В данной статье мы углубимся в практические аспекты управления качеством данных, чтобы помочь раскрыть истинный потенциал информации и принимать решения, основанные на надежных и точных данных.
Некачественные данные могут вызывать существенные финансовые последствия для предприятий. Например, в 2022 году компания Unity Software понесла убытки, достигшие 110 миллионов долларов США в виде поступлений и 4,2 миллиарда долларов США в виде рыночной стоимости, получив неточные данные от крупного клиента. Исследования IBM свидетельствуют о том, что некачественные данные ежегодно обходятся экономике США приблизительно в 3,1 триллиона долларов. Однако последствия плохого качества данных не ограничиваются финансовым ущербом – они также оказывают влияние на возможности инноваций и репутацию предприятий. Исследования Experian Data Quality показывают, что лишь 3% данных предприятия соответствуют стандартам качества и 90% данных не используются в стратегических целях. Перечисленные факты подчеркивают, насколько критично качество данных в современной бизнес-среде и насколько существенны инвестиции в улучшение качества данных.
Управление качеством данных не является универсальным решением. Оно требует адаптированного подхода, соответствующего уникальным проблемам и потребностям каждой организации. Рассмотрим некоторые проверенные стратегии, позволяющие улучшить качество данных.
Внедрение системы управления основными данными (Master Data Management, или MDM)
MDM позволяет создать единый, надежный источник важнейших бизнес-данных, обеспечивая последовательность и точность в разных системах и отделах. Это помогает устранить раздробленность данных и уменьшить количество ошибок. В число популярных решений MDM входят SAP Master Data Governance, Informatica MDM и IBM InfoSphere MDM.
Стандартизация данных
Используйте средства профилирования (Extract, Transform, Load) данных, например Talend или Informatica Data Quality, чтобы выявлять и исправлять ошибки, расхождения и дубликаты, а также генерировать условия стандартизации данных. Условия стандартизации данных обеспечивают соответствие данных, определяя форматы, условия именования и критерии валидации конкретных элементов данных. Например, условие может требовать, чтобы все адреса клиентов соответствовали определенному формату или чтобы все коды изделий представляли собой буквенно-цифровую комбинацию.
Валидация и обогащение данных
Используйте средства валидации данных, например Great Expectations или Apache Spark, чтобы обеспечить целостность данных. Apache Spark можно применять для разработки процедур валидации (pipelines), которые выполняют проверку полноты, последовательности и точности данных. При этом они способны обогащать данные, объединяя их с внешними наборами данных или используя модели машинного обучения, чтобы получить новые выводы.
Используя средства надзора за качеством данных, например Collibra или Ataccama, можно отслеживать основные показатели данных и определять области, требующие улучшения. Регулярный мониторинг качества данных позволяет своевременно выявлять проблемы и предпринимать корректирующие действия, тем самым обеспечивая постоянное соответствие данных потребностям и стратегическим целям вашего бизнеса.
Показатель |
Значения в среднем наборе данных |
Последствия в случае низкого показателя |
Полнота – какая часть записей содержит все необходимые значения. |
80–95% |
Неполнота информации может привести к принятию ошибочных решений и неэффективной деятельности. Например, если в базе данных клиентов не хватает контактной информации, это может затруднить обслуживание и общение с клиентами. |
Точность – какая часть записей соответствует действительности и поддается проверке. |
90–99% |
Неточные данные могут привести к искажению финансовой отчетности или иметь юридические последствия. Например, если клиент в бухгалтерской системе неверно определен как предприятие ЕС с зарегистрированным номером НДС, к которому должна применяться нулевая ставка НДС, но фактически является физическим лицом, к которому применяется НДС по ставке 21%, это может привести к неверному начислению налогов и неправильно выписанным счетам. Такая ошибка может повлечь не только финансовые последствия, но и юридические проблемы у предприятия, если будут обнаружены несоответствующие налоговые платежи. |
Последовательность – каков уровень согласованности значений данных в разных системах. |
95–99% |
Расхождения данных могут вызвать неясность и затруднить процесс принятия решений. Например, если цена товара на платформе э-коммерции ниже себестоимости, указанной в бухгалтерской системе предприятия, это может причинить убытки, поскольку предприятие будет продавать товар по цене ниже фактических расходов на него. Если цена на платформе завышена, это может оказать негативное влияние на объемы продаж. Поэтому важно обеспечивать последовательность как цен, так и учетных данных. |
Актуальность – насколько часто обновляются данные. |
Зависит от вида данных, но обычно данные считаются актуальными, если обновлялись в течение предыдущих 24 часов. |
Устаревшие данные могут стать причиной принятия неверных решений и утраты возможностей. Например, устаревшая информация об акционных ценах может привести к невыгодным вложениям. |
Уникальность – процентная доля уникальных записей. |
95–100% |
Дубликаты данных могут вызвать неясность, затруднить анализ и привести к ошибочным выводам. Например, если в базе данных клиентов есть несколько записей об одном и том же клиенте, это может вызвать проблемы при обслуживании клиентов и персонализации маркетинговых кампаний. |
Указанные показатели качества данных подчеркивают, насколько важно обеспечить, чтобы данные, которыми вы располагаете, были не только объемными, но и точными, полными, последовательными, актуальными и уникальными. Только тогда вы сможете полностью задействовать потенциал своих данных и принимать решения, исходя из надежной информации.
В современной конкурентной среде качество данных уже не роскошь, а стратегическое требование. Отдавая приоритет качеству данных и внедряя практики проактивного управления, предприятия могут использовать потенциал своих данных, содействовать инновациям и достигать устойчивого успеха. Сделайте качество данных привычкой в своей организации!
Если у Вас возникли какие либо комментарии к этой статье, просим отправить здесь lv_mindlink@pwc.com
Ваш вопросСегментация издержек – важный вопрос для предприятий, старающихся повысить свою рентабельность и эффективность деятельности. Классификация расходов помогает предприятиям найти возможности для сокращения издержек, улучшить распределение ресурсов и принимать стратегические решения, основанные на данных. Этот процесс создает детальное представление о различных факторах издержек и их влиянии на общее финансовое положение предприятия.
Система искусственного интеллекта (ИИ) способна обеспечивать все более эффективную, конкурентоспособную и продуктивную повседневную работу как в частном, так и в общественном секторе. На рынке существуют разные модели систем ИИ, которые можно внедрить, адаптировать к потребностям своего предприятия и в дальнейшем использовать в повседневной работе. Необходимо помнить о том, что, например, при использовании системы ИИ в профессиональных целях в своей организации согласно Регламенту ЕС № 2024/1689 («Акт об ИИ») на содержателей систем ИИ возлагаются различные обязанности.
Популярность электронно структурированных счетов, или э-счетов, постоянно растет в международном масштабе – как в обороте между коммерсантами (B2B), так и в обороте между коммерсантами и государственными учреждениями (B2G). Они постепенно заменяют старомодные бумажные счета и счета в формате PDF. В последние годы страны – участницы ЕС трудились над внедрением э-счетов, латвийское законодательство тоже предусматривает введение обязательного обмена э-счетами в сегменте B2G уже в следующем году, а в сегменте B2B – с 2026 года.
Мы используем cookie-файлы для персонализации контента, улучшения пользовательского опыта и сбора статистики.
Нажимая «Принять все cookie-файлы», вы соглашаетесь на использование всех типов cookie-файлов. Если вы хотите выбрать, каких cookie-файлов мы можем использовать, выберите соответствующих.
Чтобы получить дополнительную информацию, вы можете ознакомиться с нашей «Политикой использования cookie-файлов».
Эти cookie-файлы обеспечивают работу веб-сайта, и отключить их нельзя. Обычно они применяются в ответ на производимые вами действия, т.е. на ваши запросы, например, установить настройки конфиденциальности или заполнить какие-либо формы и служат для того, чтобы сделать использование вами веб-сайта более удобным для вас. Вы можетe настроить свой браузер таким образом, чтобы он блокировал эти cookie-файлы или оповещал вас о них, но в этом случае некоторые компоненты сайта перестанут работать. Эти cookie-файлы не хранят данные, идентифицирующие личность.
Эти cookie-файлы помогают нам вести подсчет статистики количества посетителей и исследовать источники трафика, чтобы мы могли оценивать и повышать эффективность и удобство работы нашего сайта для вас. Они позволяют нам узнать, какие страницы являются самыми популярными или пользуются наименьшим интересом пользователей, каким образом посетители перемещаются по сайту. Вся информация, собираемая этими cookie-файлами, обобщается и, соответственно, является анонимной. Если вы запретите использовать эти cookie-файлы, мы не сможем отслеживать посещаемость сайта и не сможем регулировать его работу.
В целях продвижения своих услуг, сбора статистики и проведения исследований, PwC и MindLink.lv может размещать на других сайтах рекламу, которая будет видна вам. Cookie-файлы используются для того, чтобы сделать предложения ориентированными на вас и ваши интересы. Кроме того, они нужны для предотвращения частого появления одной и той же рекламы. Эти рекламные обращения предназначены исключительно для того, чтобы ознакомить вас с потенциально интересными для вас предложениями. PwC не продает ваши данные третьим лицам.