**章元数据概览
隐形的元数据/ 006
元数据简史/ 007
元数据,不再仅仅用于图书馆/ 014
形形色色的元数据/ 015
第二章定义元数据
数据中的信息/ 021
描述主题/ 024
元数据是对信息的陈述/ 027
编码体系/ 031
规范文档/ 036
叙词表/ 038
网络分析/ 043<p>**章 元数据概览</p> <p>隐形的元数据 / 006</p> <p>元数据简史 / 007</p> <p>元数据,不再仅仅用于图书馆 / 014</p> <p>形形色色的元数据 / 015</p> <p> </p> <p>第二章 定义元数据</p> <p>数据中的信息 / 021</p> <p>描述主题 / 024</p> <p>元数据是对信息的陈述 / 027</p> <p>编码体系 / 031</p> <p>规范文档 / 036</p> <p>叙词表 / 038</p> <p>网络分析 / 043</p> <p>本体论 / 046</p> <p>失控的元数据 / 048</p> <p>元数据记录 / 053</p> <p>内部元数据与外部元数据 / 055</p> <p>**识别符 / 060</p> <p> </p> <p>第三章 描述性元数据</p> <p>都柏林核心元数据元素集 / 067</p> <p>采纳创新的成本 / 069</p> <p>15 个元素 / 072</p> <p>元素与值 / 074</p> <p>描述性记录 / 078</p> <p>都柏林核心修饰词 / 080</p> <p>网页中的元数据 / 084</p> <p>都柏林核心元数据元素集的意义 / 088</p> <p> </p> <p>第四章 管理性元数据</p> <p>技术性元数据 / 095</p> <p>结构性元数据 / 098</p> <p>溯源元数据 / 099</p> <p>保存性元数据 / 103</p> <p>权限元数据 / 105</p> <p>元– 元数据 / 108</p> <p>管理性元数据的功能 / 112</p> <p>数据废气 / 121</p> <p>并行数据 / 122</p> <p> </p> <p>第五章 使用性元数据</p> <p>数据废气 / 121</p> <p>并行数据 / 122</p> <p>第六章 实现元数据的技术</p> <p>结构化数据 / 129</p> <p>描述资源的框架 / 134</p> <p>都柏林核心元数据的抽象模型 / 136</p> <p>可扩展标记语言 / 139</p> <p>文档类型定义 / 141</p> <p> </p> <p>第七章 语义网</p> <p>什么是语义网 / 148</p> <p>软件代理 / 149</p> <p>什么是关联数据 / 151</p> <p>一切都是相连的 / 154</p> <p>艺术关联数据 / 156</p> <p>来源于维基百科内容的数据集 / 160</p> <p>关联开放数据 / 166</p> <p>多即是多 / 168</p> <p>微数据 / 170</p> <p>语义网的愿景 / 175</p> <p> </p> <p>第八章 元数据的未来</p> <p>特定领域中的元数据 / 181</p> <p>应用编程接口 / 184</p> <p>以数据为基础的分析 / 187</p> <p>元数据的策略 / 190</p> <p> </p> <p>致 谢 / 197</p> <p>图表来源 / 201</p> <p>延伸阅读 / 203</p> <div></div> <div></div>显示全部信息前 言元数据(metadata)在我们的周围无时不在,无处不在。当代社会中随处可见的电子设备,不是依靠元数据来运行,就是用于产生元数据,或者两者皆有。但当元数据真正发挥作用的时候,它却隐于幕后、默默无闻,就像根本不存在一样。一定程度上来说,这也让元数据在2013 年夏天突然成了一个广受关注且具有争议性的话题。
2013 年5 月,美国****局前外聘员工爱德华·斯诺登(Edward Snowden)飞往中国香港与英国《卫报》记者会面,向其披露了大量有关美国****局在本土进行监听活动的机密文件。这些监听项目之一——“棱镜”(PRISM),涉及直接向电信公司搜集电话呼叫的数据。不用说,《卫报》对此事的报道成为轰动一时的大新闻。
美国媒体对斯诺登泄密事件反应不一,随着事态的发展,这些反应的变化耐人寻味。对于美国****局暗中搜集美国公民数据的行为,公众当时*直接的反应就是群情激愤。然而随着事件日趋明朗,让人们如释重负的是,美国****局搜集的仅仅是与电话呼叫有关的元数据,而不是电话呼叫本身的内容。换句话说,美国****局没有进行窃听活动。这很快缓和了公众的怒火。事态随后急转直下,媒体通过调查才发现,凭借区区元数据居然能推断出如此多的个人信息。在此之后,对这一事件的权威解读才终于公之于众。<p>元数据(metadata)在我们的周围无时不在,无处不在。当代社会中随处可见的电子设备,不是依靠元数据来运行,就是用于产生元数据,或者两者皆有。但当元数据真正发挥作用的时候,它却隐于幕后、默默无闻,就像根本不存在一样。一定程度上来说,这也让元数据在2013 年夏天突然成了一个广受关注且具有争议性的话题。</p> <p>2013 年5 月,美国****局前外聘员工爱德华·斯诺登(Edward Snowden)飞往中国香港与英国《卫报》记者会面,向其披露了大量有关美国****局在本土进行监听活动的机密文件。这些监听项目之一——“棱镜”(PRISM),涉及直接向电信公司搜集电话呼叫的数据。不用说,《卫报》对此事的报道成为轰动一时的大新闻。</p> <p>美国媒体对斯诺登泄密事件反应不一,随着事态的发展,这些反应的变化耐人寻味。对于美国****局暗中搜集美国公民数据的行为,公众当时*直接的反应就是群情激愤。然而随着事件日趋明朗,让人们如释重负的是,美国****局搜集的仅仅是与电话呼叫有关的元数据,而不是电话呼叫本身的内容。换句话说,美国****局没有进行窃听活动。这很快缓和了公众的怒火。事态随后急转直下,媒体通过调查才发现,凭借区区元数据居然能推断出如此多的个人信息。在此之后,对这一事件的权威解读才终于公之于众。</p> <p>MetaPhone项目是斯坦福大学法学院互联网与社会研究**(Stanford Law School Center for Internet and Society)的研究人员于2013 年年底进行的一项研究,旨在重现美国****局搜集电话呼叫元数据采取的方法。他们发现,用区区元数据居然能推断出如此令人难以置信的信息量。MetaPhone的研究人员在报告中提到了这样一个案例:一位研究对象分别打电话联系了“家庭装修用品店、锁匠、水培植物经销商还有烟草大麻用具店”。也许,打这些电话是出于非常单纯、合理的原因,也许它们之间完全没有关系……但是这可能并不是我们大多数人会得出的结论。</p> <p>许多元数据都与电话呼叫有关,尤其是手机呼叫。而在与电话呼叫有关的元数据片段中,*显而易见的就是拨打与接听双方的电话号码,其次就是电话呼叫的时间与通话时长。如果使用具备GPS(全球定位系统)功能的智能手机拨打电话,还可搜集到拨打与接听双方的地理位置信息,至少可以**到通话双方手机所在地区手机信号塔的信号范围。与手机呼叫关联的元数据还有很多,但是如此少量的信息也足以让倡导保护隐私的人士再三思忖。因为即使你没有在打电话,你的手机也会与本地手机信号塔之间交换数据。这样一来,移动运营商就能随时搜集你的位置信息以及一段时间内的活动轨迹—根据斯诺登披露的机密文件显示,移动运营商实际也在这样做。当然,前提是你一直带着自己的手机。</p> <p>元数据这个词就这样成了一个公众话题。鉴于元数据如此广泛地存在,人们理应更好地去了解它,而公众也早应该进行这样的讨论。在当代世界中,计算活动无处不在,因此元数据像电网和高速公路网一样成了一种基础设施。这些当代基础设施的构成部分一方面发挥着不可或缺的作用,另一方面它们展现在我们面前的又只是冰山一角。比如,当你触动照明开关时,你就变成了大量技术与策略的*终用户。</p> <p>分开来看,这些技术或策略也许微不足道、无关紧要,但是聚合在一起,就能带来深远的文化与经济影响。元数据亦是如此。就像电网和高速公路网一样,元数据不知不觉地融入日常生活的背景之中,理所当然地成为当代社会得以稳步前进的动力之一。</p> <p>作为生活在现代世界的公民,我们熟悉电网、高速公路网以及其他现代的基础设施,也对其有着合理(尽管可能并不完整)的了解。但是除非你是一位信息技术科学家,或者是为美国****局工作的情报分析师,否则可能无法对元数据形成这样的认识。</p> <p>这就是我写作本书的目的—向你介绍元数据,以及元数据涉及的诸多主题与问题。我将探讨什么是元数据及其存在的原因、适用于不同用户与用例的各类元数据以及使现代元数据</p> <p>成为可能的一些技术,还会预测元数据的未来路在何方。读完本书,你无论身在何处都会看到元数据。</p> <p>这是一个元数据的世界,而你就身处其中。</p> <div></div>显示全部信息媒体评论弄懂元数据,越来越被公认为是理解下一代互联网——语义网的基础,甚至是打开整个信息科学体系、复杂数据世界的钥匙。本书用通俗易懂的语言讲清楚了这个基础的问题,十分难得。
涂子沛**大数据专家 《大数据》、《数据之巅》作者
元数据是解释数据库的数据的科学与艺术!如何从大数据中发现知识,寻找隐藏在数据中的趋势、模式和相关性,都需要我们拥有更好的数据洞察力,而这种洞察的基础来自我们对元数据的理解。
沈浩中国传媒大学新闻学院教授、博导
元数据*会告诉你关于别人生活的一切。如果你有足够的元数据,你就不需要数据内容。
斯图尔特·贝克尔美国****局前总法律顾问<p>弄懂元数据,越来越被公认为是理解下一代互联网——语义网的基础,甚至是打开整个信息科学体系、复杂数据世界的钥匙。本书用通俗易懂的语言讲清楚了这个基础的问题,十分难得。</p> <p>涂子沛 **大数据专家 《大数据》、《数据之巅》作者</p> <p> </p> <p>元数据是解释数据库的数据的科学与艺术!如何从大数据中发现知识,寻找隐藏在数据中的趋势、模式和相关性,都需要我们拥有更好的数据洞察力,而这种洞察的基础来自我们对元数据的理解。</p> <p>沈浩 中国传媒大学新闻学院教授、博导</p> <p>元数据*会告诉你关于别人生活的一切。如果你有足够的元数据,你就不需要数据内容。</p> <p>斯图尔特·贝克尔 美国****局前总法律顾问</p> <div></div>显示全部信息免费在线读元数据(metadata)在我们的周围无时不在,无处不在。当代社会中随处可见的电子设备,不是依靠元数据来运行,就是用于产生元数据,或者两者皆有。但当元数据真正发挥作用的时候,它却隐于幕后、默默无闻,就像根本不存在一样。一定程度上来说,这也让元数据在2013 年夏天突然成了一个广受关注且具有争议性的话题。
2013 年5 月,美国****局前外聘员工爱德华·斯诺登(Edward Snowden)飞往中国香港与英国《卫报》记者会面,向其披露了大量有关美国****局在本土进行监听活动的机密文件。这些监听项目之一——“棱镜”(PRISM),涉及直接向电信公司搜集电话呼叫的数据。不用说,《卫报》对此事的报道成为轰动一时的大新闻。
美国媒体对斯诺登泄密事件反应不一,随着事态的发展,这些反应的变化耐人寻味。对于美国****局暗中搜集美国公民数据的行为,公众当时*直接的反应就是群情激愤。然而随着事件日趋明朗,让人们如释重负的是,美国****局搜集的仅仅是与电话呼叫有关的元数据,而不是电话呼叫本身的内容。换句话说,美国****局没有进行窃听活动。这很快缓和了公众的怒火。事态随后急转直下,媒体通过调查才发现,凭借区区元数据居然能推断出如此多的个人信息。在此之后,对这一事件的权威解读才终于公之于众。
MetaPhone项目是斯坦福大学法学院互联网与社会研究**(Stanford Law School Center for Internet and Society)的研究人员于2013 年年底进行的一项研究,旨在重现美国****局搜集电话呼叫元数据采取的方法。他们发现,用区区元数据居然能推断出如此令人难以置信的信息量。MetaPhone的研究人员在报告中提到了这样一个案例:一位研究对象分别打电话联系了“家庭装修用品店、锁匠、水培植物经销商还有烟草大麻用具店”。也许,打这些电话是出于非常单纯、合理的原因,也许它们之间完全没有关系……但是这可能并不是我们大多数人会得出的结论。
许多元数据都与电话呼叫有关,尤其是手机呼叫。而在与电话呼叫有关的元数据片段中,*显而易见的就是拨打与接听双方的电话号码,其次就是电话呼叫的时间与通话时长。如果使用具备GPS(全球定位系统)功能的智能手机拨打电话,还可搜集到拨打与接听双方的地理位置信息,至少可以**到通话双方手机所在地区手机信号塔的信号范围。与手机呼叫关联的元数据还有很多,但是如此少量的信息也足以让倡导保护隐私的人士再三思忖。因为即使你没有在打电话,你的手机也会与本地手机信号塔之间交换数据。这样一来,移动运营商就能随时搜集你的位置信息以及一段时间内的活动轨迹—根据斯诺登披露的机密文件显示,移动运营商实际也在这样做。当然,前提是你一直带着自己的手机。
元数据这个词就这样成了一个公众话题。鉴于元数据如此广泛地存在,人们理应更好地去了解它,而公众也早应该进行这样的讨论。在当代世界中,计算活动无处不在,因此元数据像电网和高速公路网一样成了一种基础设施。这些当代基础设施的构成部分一方面发挥着不可或缺的作用,另一方面它们展现在我们面前的又只是冰山一角。比如,当你触动照明开关时,你就变成了大量技术与策略的*终用户。