Сегодня данные заставляют мир вращаться, возможно, даже больше, чем деньги. Благодаря точному и привлекательному представлению данных компании могут привлекать инвесторов, удовлетворять требования регулирующих органов, увеличивать продажи, экономить деньги и работать как простые и эффективные механизмы. Очевидно, это предполагает, что они знают, где находятся данные и для каждой цели; данные, необходимые для годового отчета, конечно, будут отличаться от данных, необходимых для маркетинговой кампании, ориентированной на клиентов среднего размера. Но получить необходимые данные не всегда просто; в большинстве организаций найти правильные данные и получить к ним доступ гораздо сложнее, чем нажать несколько кнопок. Данные могут быть неправильно маркированы, плохо храниться или не организованы. Из-за этих проблем с метаданными данные, которые должны иметь большую ценность для организации, гораздо менее полезны. В результате отчеты могут не содержать данных, потому что их трудно найти, что может создать путаницу, срыв сроков и даже нормативные штрафы. Чтобы избежать проблем такого типа, важно усилить метаданные, обеспечивая прозрачность и происхождение данных. Системы, которые позволяют организациям контролировать свои данные, могут предотвратить эти потери и проблемы и обеспечить их процветание. Метаданные (данные данных) могут состоять из десятков, сотен или тысяч тегов, все они используются в областях хранения данных, включая базы данных для различных услуг, информацию о клиентах, базы данных для всей организации, бизнес-документы, инструменты ETL, инструменты анализа, единицы хранения данных. для социальных сетей, инструментов отчетности и т. д. Все эти источники являются источниками данных для автоматического поиска. все они должны содержать согласованные теги метаданных, что означает, что все члены организации, которые участвуют в сборе и хранении данных, должны придерживаться согласованных соглашений о том, какие теги метаданных использовать. Контроль данныхL & # 39; Неспособность контролировать данные, часто из-за неправильного управления метаданными, является довольно распространенным явлением. Согласно исследованию, 85% компаний предприняли важные шаги, чтобы доверять данным, но только 37% говорят, что им это удалось. А контроль данных имеет решающее значение для некоторых из самых важных задач, которые должны выполнять компании. Как эти 63% из них терпят неудачу? Конечно, с вашими командами бизнес-аналитики. Например, в случае годового отчета о доходах всей организации, результаты которого не совпадают с результатами каждой службы в целом, группа бизнес-аналитики организации проверяет базы данных и пытается сопоставить соответствующую информацию. Именно в этом в основном ручном обзоре команда бизнес-аналитики обнаружит и, надеюсь, исправит неточности в метаданных. Но это может занять много времени и стоить продавцу немалых денег. Для решения этой проблемы, помимо других метаданных, организации нужна автоматизированная система, которая может предоставить необходимые инструменты для решения этих проблем. Идеальная система могла бы распознавать по самим данным, к какой категории метаданных она принадлежит. Таким образом, вы увидите тег метаданных под названием «Расходы» с соответствующей записью данных в одной базе данных, тег под названием «Расходы» за одну секунду и тег под названием «Затраты» в третьей. Автоматизированная система была бы достаточно умной, чтобы вычислить, что числа для всех трех соответствуют одному и тому же, несмотря на различия в метаданных. Бизнес-кейс очевиден; экономит время как для команд бизнес-аналитики, у которых теперь есть автоматизированные инструменты, которые помогают им выполнять свою работу более точно и эффективно, так и для экономии времени и денег. Более эффективные операции для любой части организации, которая зависит от данных (то есть для всех). Но помимо шума, решение проблем с метаданными также может помочь решить проблемы регулирования, которые с появлением GDPR, Калифорнийского CCPR, новых правил HIPAA и других, которые, вероятно, стали предметом большого прорыва, теперь очень много. . настоящее. GDPR, например, требует от организаций продемонстрировать, что они способны находить данные о физических лицах в соответствии с правилами «права на забвение». Сам факт невозможности доказать, что это уважительная причина в соответствии с правилами. И без точного контроля метаданных, где информация помечена по-разному в разных источниках данных, он округляет все данные до одного человека (одного из миллионов, которые могут появиться в базе данных). Организация) будет практически невозможна. Данные быстро растут. Ежедневно во всем мире генерируется более 2.5 миллиардов байтов данных. К 2020 году на каждого жителя планеты будет приходиться 5,200 ГБ данных. И революция Интернета вещей, которая только начинается, обещает увеличить эти цифры в геометрической прогрессии. Ожидается, что все организации, устройства, системы, базы данных и т. Д., Даже внутри организации, будут соответствовать единому стандарту метаданных. Автоматическое разрешение метаданных должно быть частью революции данных для любой организации, планирующей использовать данные (то есть все).