《大模型+知识图谱:另类AI争鸣国际音乐图书馆协会萨尔茨堡年会》
Large Language Models + Knowledge Graphs: An Alternative AI Exposition at the IAML Annual Congress (2025) in Salzburg
2025年7月12日,第72届国际音乐图书馆年会在奥地利萨尔茨堡圆满结束。来自近40个国家和地区的音乐学者、图书馆馆员、企业人员出席了此次会议,做出精彩的成果展示与热烈讨论。
音乐图书馆事业在欧美地区有深厚的积淀和成熟的运营模式,所以,此次会议仍然展现出西方音乐主导的局面。然而,中国学界也带来别具一格的产品,并做出精彩汇报——中国音乐学院图书馆校内科研专项特邀研究员曹军军博士在年会“数字人文”板块做了题名为《中华传统音乐文化知识库(知识图谱+关联数据)构建研究》的发言展示。此课题植根于中国音乐学院图书馆历经20余年的同名资源库。展示中,他介绍了基于关联数据技术初步建成的中华传统音乐文化知识图谱/知识库。所谓知识图谱,是以节点代表各类资源,以其间不同语义类型的连边做关联的一种知识组织技术。称其为知识库而非数据库,是因为它基于特殊的知识组织方式——元数据本体,从而让一般意义上的知识库更具“智慧”,具体体现在:
(1)灵活的知识组织,以传统音乐学知识结构为支撑;(2)灵活的知识推理,可根据已知数据推断衍生出新的数据与知识;(3)灵活的知识可视化——这往往人们对知识图谱的第一印象,即以知识网络图达到“一图胜千言”的远读效果,以及数据游历和交互功能;(4)语义检索,可以让数字人文学者采用图谱检索语言进行任何目的的数据提取,从而为更灵活的数据分析(如社会网络、地理信息分析)提供支撑;(5)智能问答与推荐系统:用户可以直接输入自然语言问题,而数据库后台通过大语言模型生成检索语言从而获取答案并做相关信息推荐。
这款产品不但彰显了中国音乐特色,而且它是对音乐人工智能的一种新探索和实践。目前,主流的音乐人工智能技术是从深度学习到神经网络——即所谓连接主义,并集中应用于音乐创作、表演、教育等领域。而所谓知识图谱和知识推理,其实是人工智能在符号主义一脉的代表,将它的应用场景放在音乐的图书馆和情报、音乐文献研究方面恰到好处。
值得一提的是,称这款产品体现了大模型+知识图谱,则别有缘由:国内外各式大语言模型和生成式人工智能已如火如荼地地发展与革新,它们已经可以很好地回答相当一部分音乐问题。那么试问,这对当前高校的音乐学研究事业,究竟是挑战还是机遇?
其实,音乐的领域知识和人工智能是相辅相成的关系。在此智能问答系统开发的环节,有意地突出了‘检索增强生成’技术,即本质上是利用大模型检索知识图谱中实时更新的结构化知识,并与大模型预训练的音乐知识进行结合,从而可以更全面地实现音乐知识问答。这样,未来开发智能问答系统,就可以让音乐学者和研究馆员从容地加入进来。另一方面,大语言模型本质上擅长处理非结构化知识,而图书馆界对知识的编目和分类其实反映了始终追求知识‘结构化’的一种取向,即人类的理性决定了我们是喜欢结构化知识的。也就是说,将大模型与音乐行业的各种数据库检索对接,是文理融合、产学融合的新机遇。
本次会议上,我们看到关联数据的应用在国际音乐学界已经开始普及,其他项目中,值得一提的还有麦吉尔大学音乐科技系分布式数字音乐档案和图书馆实验室展示的“关联音乐:整合共建在线音乐数据库”。该项目是由军军博士在麦吉尔大学博士后工作期间的合作导师Ichiro Fujinaga主导负责的,其间,军军担任此项目关联数据技术总监。据其陈述:“关联数据反映了FAIR四原则,即可找寻(Findable)、可接入(Accessible)、可交互(Interoperable)、可复用(Reuse-able)。基于这种技术的任何知识库建设可以为未来的可信数据接入与交换提供坚实的基础。”
在此,也特别感谢中国音乐学院图书馆付晓东馆长、技术部罗四洪主任、张瑜老师、洪伟老师,还有中山大学信息管理学院陈涛老师,我在麦吉尔大学的合作导师Ichiro Fujinaga先生,等等前辈或同仁在背后的长期支持——筚路蓝缕,以启山林,其实更期待的是,如果各个机构的在线数据库能够开放元数据端口,就可以将其接入一个综合的‘语义网’空间,实现跨数据库的联合检索与组合。这不仅可以保护原有各自的版权,也有利于各国各院校机构音乐资源的共建,为音乐数字人文研究与文化传播搭建更广阔和实用的平台。”
- Facebook Like
- Share on Facebook
- Log in to post comments