相反,使用 的语义技术 基于开源标准,可补充组织现有的 基础架构。它们可确保企业面向未来,防止供应商锁定,并提供所有数据的统一视图(无论格式、类型和结构有何差异),这对于数据集成、数据治理和货币化机会而言都是最佳选择。
来自外部来源的非结构化和半结构化数 马耳他 手机号码数据 据的激增是当前对语义层的需求的部分原因。数据结构、数据湖和 数据湖屋 包含大量此类数据,这些数据对从数据科学家到 用户的每个人都很有用。在这些架构上应用标准化语义层,可让最终用户通过业务理解的视角选择数据,其中数据资产通过熟悉的业务术语中的元数据来描述。
这一层可无限重复用于任何用例,从构建机器学习模型到设计应用程序或运行分析。标准化语义技术通过 知识图谱提供语义层,其中包含标准化数据模型、词汇表和分类法。标准化语义层的三个主要元素包括:
数字资产知识图谱: 此知识图谱通过上述元数据和数据模型描述了组织拥有的每项数据资产。它是一张有效的地图,展示了数据结构中的内容、位置、所有者等。
业务概念本体: 此语义数据模型描述了赋予数字资产目录中数据意义的重要业务概念。它以业务用户理解的语言形式包含术语、元数据描述、分类法和架构。