|
论文链接[PDF] POP909: A Pop-song Dataset for Music Arrangement Generation | Semantic Scholar
这个数据集是上海纽约大学Music X Lab贡献的一个数据集,文件清晰明了,很适合用于音乐方面的研究。
其中包含由专业音乐家创作的909首流行歌曲的钢琴编曲的多个版本。数据集的主体包含 MIDI 格式的每首歌曲的人声旋律、主音乐器旋律和钢琴伴奏,这些歌曲与原始音频文件对齐。此外,还提供了速度,节拍,键和和弦的注释,其中速度曲线是手工标记的,其他的由MIR算法完成。
在计算机音乐领域,尽管有几种很有前途的音高估计模型,但缺乏合适的数据集成为这一研究领域的主要瓶颈之一。所需的排列数据集应具有三个特征:
- 首先,数据集的制作应该是风格一致的重新编排,而不是从原始编排中任意选择曲目。
- 第二,这种安排应该与一种原始形式的音乐(音频、导联表)搭配使用,并具有精确的时间对齐,作为学习算法的监督。
- 第三,数据集应提供外部标签(例如和弦、降拍标签),这些标签通常用于提高生成过程的可控性。
POP909数据集。它包含909首流行歌曲,每首都有专业音乐家创作的多个版本的钢琴曲。这些安排采用MIDI格式,与主旋律(也采用MIDI格式)和原始音频对齐。此外,每首歌曲都配有手动标记的节奏曲线,以及使用音乐信息检索算法机器提取的节拍、关键点和和弦标签。
目录如下所示:
POP数据集文件结构
上图展示了POP909的文件夹结构。根目录中有909个文件夹,对应909首歌曲。在每个文件夹中,提供MIDI格式排列、文本格式注释,以及迭代过程中生成的所有排列版本的文件夹。
每首钢琴曲都以MIDI格式存储,共有三首曲目。图2显示了一个三轨MIDI文件的示例,其中不同的轨用不同的颜色标记。这三条轨道是:
MELODY:主唱(声乐)的旋律转录桥牌;
BRIDGE: 次要旋律或主乐器的安排
PIANO:伴奏主体的安排,包括断弦、琶音和许多其他纹理。
MIDI文件的示例。不同的颜色代表不同的曲目(红色代表MELODY,黄色代表BRIDGE,绿色代表PIANO)。
注释文件包含纯文本格式的节拍、和弦和关键点注释。下表以表格形式显示了song 003的部分注释,以便更好地进行说明。对于节拍注释,beat_audio和beat_midi分别是从音频和midi中提取的注释文件。和弦和键注释的来源以类似的方式表示。
song 003的部分注释
这一部分是对节拍和和弦的注释,对于音乐生成很有指导意义。
重要的是:
其中提供了从MIDI和音频文件中提取的和弦标签。对于音频和弦识别,提出的大词汇量和弦转录算法。由于流行音乐中的和弦变化最有可能发生在节拍位置,通过将和弦边界与节拍对齐来对其进行后期处理,从而生成最终的和弦标签。
最后, 这是一个为音乐生成量身定制的数据集。它包含909首流行歌曲的MIDI格式的多个版本的专业钢琴编排,以及与原始录音对齐的精确节奏曲线。还提供了节奏、节拍、降拍、关键点和和弦标签的注释。为了保证高质量的数据,数据集是通过两组专业音乐家、编曲和评论员在互动过程中协作收集的。除了排列问题之外,POP909数据集还是结构化音乐生成和跨模态音乐生成的优质资源。
非常推荐的一个数据集。 |
|