|
参考官方网址
MAESTRO是一个数据集,由大约200小时的钢琴演奏组成,在音符标签和音频波形之间进行了精细的排列(约3ms)。
我们与国际钢琴比赛的组织者合作,获得了本数据集中使用的原始数据。在每期比赛中,演奏家们在雅马哈Disklavier钢琴上表演,这些钢琴除了是音乐会级别的原声三角钢琴外,还使用了一个集成的高精度MIDI捕获和播放系统。记录的MIDI数据具有足够的保真度,可以通过聆听参赛者在另一台Disklavier乐器上的表演,对比赛的试听阶段进行远程判断。
该数据集包含约200小时的配对音频和MIDI记录,这些记录来自十年的国际钢琴比赛。MIDI数据包括击键速度和延音/慢板/低音踏板的位置。音频和MIDI文件以3毫秒的精度对齐,并切成单个的音乐作品,上面有作曲家、标题和演出年份的注释。未压缩的音频是CD或更高的质量(44.1-48 kHz 16位PCM立体声)。
还提出了一个训练/验证/测试的分割配置,这样一来,即使是由多名选手演奏的同一作品,也不会出现在多个子集中。曲目主要是古典音乐,包括从17世纪到20世纪初的作曲家。
MAESTRO以压缩文件的形式提供,其中包括MIDI和WAV文件,以及CSV和JSON格式的元数据。此外,还提供了一个仅有MIDI的数据集档案。
什么是元数据(metadata)?
元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元数据的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员、电脑专家,共同制定规格,创建一套描述网络上电子文件之特征。元数据文件对每一对MIDI/WAV都有以下字段:
数据格式提供了MIDI和wav两种,wav的大概100G,MIDI的大概几十M。
里面的是这样的,其实就是给了类似于目录一样的东西
|
|