元数据的定义是什么
大家好!今天让创意岭的小编来大家介绍下关于元数据的定义是什么的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端
创意岭作为行业内优秀的企业,服务客户遍布全球各地,如需了解SEO相关业务请拨打电话175-8598-2043,或添加微信:1454722008
本文目录:
一、什么是元数据?(metadata)
元数据,就是描述数据的数据。好,本章完,请期待下一篇文章。
有时候我们经常能在CDISC文件中看到metadata,翻译过来就是“元数据,源数据”,我感觉好像都可以,而且还偏向于“源数据”,源头嘛,最原始的数据。但是了解过后,发现还是“元数据”可能更合适。
那么如何理解呢?请先看下面这一组数据:
09/02/21
这一组数据我相信大部分人都认为是日期,但是这是2021年9月2号还是2021年2月9号或者是09年2月21号呢?都有可能,放在不同国家,读法不一样,得出来的日期就不一样。实际上我们根本不知道这些数据的具体含义,因为我们不知道这个日期遵循的格式标准是什么。
所以,为了使上面的日期含义变得明确,就需要对这三组数字进行描述,像下面这样
这个描述就成为元数据,可以看到,这个描述对你的数据至关重要,它能保证别人看到你的数据后,知道是怎么回事,作用是什么,所以,元数据一般被称为“数据的数据。”
CDISC已经为研究所需的数据(应采集的数据和对数据的描述或元数据)制定了标准,CDISC有两类基础标准:
一类是规定内容、数据、元数据和术语的标准,这就是define文件的作用,以前是提交define.pdf文件就好了,但现在随着技术的发展,于是又出现了另一种标准,也就是第二类标准。
二类是数据操作模型(ODM)的传输标准,传输标准利用XML技术来传输数据,所以我们经常能看到CDISC文件中提到的define.xml。
不过最重要的还是要了解什么是元数据,也就是metadata,这样就不会在看IG的时候被这些词汇弄的糊里糊涂了。
-----------------------------------------
想知道大家的作息时间,像我的话一般10:30就睡了,然后每天差不多8个小时左右的睡眠,但是白天还是困成狗,这是为什么呢?是因为8小时定律给我造成的心里影响吗?
但是有时候我明明睡了比8小时还久,还是没有精神,所以我只能归于是工作给我造成的影响,所以,人生之一大幸事就是找到自己喜欢并且热爱的工作,在元气满满中顺便把钱挣了,而我们现在只是为了工作而工作(这也是人类必须经受的一个考验吧)。
想想父母从以前那么艰苦的环境下一步步把我们拉扯大,真的很好奇她们是怎么挺过来的,是我们年青一代变得娇气了、弱不禁风了?我想其中一个原因就是以前他们信息闭塞,即使外面的人花天酒地她们也不知道,所以也没有什么怨气,所有的信息都是看着周围人怎么样,大家都过得不好,那就这样一天是一天呗。
但是现在不一样了,每每看到那些贪官贪污了多少钱,我去,我都会在脑海里想象这么多钱能不能把我的出租屋塞满?然后想象床上都是钱,自己躺在钱海里,遨游,遨游.......
二、什么是元数据?它的作用及应用是什么?
元数据是对数据资源的描述,英文名称是“Metadata”,通常被解释为data about data,即关于数据的数据。元数据是信息共享和交换的基础和前提,用于描述数据集的内容、质量、表示方式、空间参考、管理方式以及数据集的其他特征。随着信息技术不断发展,以及人们对信息共享的迫切需求,元数据技术被应用于更多的领域,如:在图书馆与信息界,元数据被定为提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述;在数据仓库领域中,元数据被 被定义为描述数据及其环境的数据;在软件构造领域,元数据被定义为在程序中不是被加工的对象,而是通过其值的改变来改变程序的行为的数据。
三、【第一节】元数据概念及其作用
按照传统的定义,元数据(Metadata)是关于数据的数据,任何文件系统中的数据都分数据与元数据,数据是指普通文件中的实际数据,而元数据指用来描述一个文件的特征的系统数据,诸如访问权限、文件拥有者以及文件数据块的分布信息(inode...)等等。在集群文件系统中,分布信息包括文件在磁盘上的位置以及磁盘在集群中的位置。用户需要操作一个文件必须首先得到它的元数据,才能定位到文件的位置并且得到文件的内容或相关属性。
比如:我们要访问linux上一个文件,我们是不是要知道这个文件的路径,文件名?如下图:
从上面图可以看到,我们我们访问一个路径 /home/hadoop/test
那么这个路径就是这个目录的一个元数据信息,当然目录下面有三个文件,每个文件对应的权限rw,属于哪个用户,组,每个文件大小,创建时间,文件名这些都是这个目录的元数据,而我们真实的数据就是在da.log,deal.py里的数据如下图:
如果我们想知道上面这些表里要查询数据,是不是需要写sql:
select * from tb_ky
那么这样查出来的数据就是保存在此表的真实数据
这张表的元数据也显然可见,那就是
表名,表所在的库,表中的字段名,字段类型,长度,是否为空,用的什么引挚,编码等。
其实说为什么要用元数据,就是元数据能给我们带来哪些作用,这样的问题网上答案太多了,不同的行业有不同的观点,就我们从大数据数据仓库来说吧,一般的公司做数仓时,都会多层架构的搭建,比如普遍的 ODS,DWD DWE DM等这样三四层的结构,那么上一层的数据要依赖与下层,这就可以看到我们的数据从最低层到最高层的有向流动。那么我们元数据就可以做下面的事了:
四、十六、什么是元数据?
谢海洋 王素娟 元数据,英文拼写为Metadata,目前已被广泛应用于各种信息资源的管理领域中。在档案界,最早使用“元数据”的是美国的电子文件管理专家戴维?比尔曼,他在20世纪90年代初发表的有关电子文件管理方面的论文中首先使用了元数据这一术语。 元数据的概念目前在档案界还没有一个统一的定论,目前比较有代表性的描述有: 1.元数据是“关于数据的数据(Data about Data)”,其中,后一个Data是指被描述的信息资源,前一个Data则是指为理解该信息资源而存储的有关信息,即元数据。这是元数据目前公认最为经典、通俗和简洁的定义。 2.国际档案理事会《电子文件管理指南》(1997)认为“元数据是关于文件的背景信息和结构的数据,是有关电子文件的技术性信息。” 3.《澳大利亚联邦机构电子文件保管元数据标准》(1999)认为“文件保管元数据是关于电子文件背景的描述信息。” 4.英国国家档案馆《电子文件管理指南》(1999)认为“元数据是关于文件和文件集合的背景及其相互关系的结构化描述和编目数据。” 5.冯惠玲主编的《电子文件管理教程》认为元数据是“由电子文件系统自动记录的关于文件形成时间、地点、人员、活动、文件系统、结构及内容方面的具体数据。” 6.“元数据可以理解为用来描述资源的属性与特征的信息。”-刘家真《电子文件管理理论与实践》,科学出版社2003年版。 7.“元数据是对数据对象规范描述所形成的数据集合,通过计算机可读的开放语言来标记元数据,就能在系统间发现、交换、转换和理解相应的数字对象,支持系统间互操作。”-张晓林《开放元数据机制:理念与原则》,《中国图书馆学报》2003年3期。 以上描述虽然表述各不相同,但我们可以发现一个共同点,即元数据主要是动态地描述电子文档各种特征的信息数据集合,并且它能为分散的、由多种数字化资源有机构成的档案信息体系提供整合的工具与纽带。随着研究的深入,我们对元数据的认识在逐步深化。 档案工作人员为便于理解,可以简单把电子文档的元数据视为两方面:一是“著录信息或著录数据”。其中,“元数据元素就是著录项目,元数据格式就是著录项目之间关系的结构化表示,元数据编码就是著录信息的编制。”(刘越南《对电子文件管理元数据的再认识》,《档案学通讯》2005年2期);二是电子文档的内容、背景和结构等方面的信息。 国外学者将元数据喻为电子文件管理系统中的“血液”,足见元数据在数字档案馆电子文件管理中发挥着举足轻重的作用。元数据的作用主要可以概括为以下几方面: 1.元数据能协助数字档案馆构建信息检索机制。元数据具有动态跟踪功能,能够即时动态地获取电子文件管理的各项信息。在数字档案馆的海量信息库中,借助元数据,可以快速发现并获取特定的信息单元。 2.元数据能维护信息的识别与读取。电子文件所携带的元数据信息可以完整地记录电子文件的原始状态,能够系统地映射出电子文件的信息内容、背景和结构等;还能够映射出电子文件的生成环境和行政管理环境。只有在获取数据对象的同时也获取这些元数据信息,被检索到的数据单元才是可理解的、可读的。 3.元数据能保障电子文件的真实性与凭证性。元数据系统能够跟踪记录电子文件从产生那一刻起的载体、设备及所用技术的变迁史以及使用干预该文件的整个历史过程,即不论载体、设备、技术如何更新换代,不论使用者、使用人数的多少都全部作为历史数据保存下来,记录备案。这些为数字信息单元真实性和凭证性提供了重要的佐证。
以上就是关于元数据的定义是什么相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读: