下一种吹学即将奏响——AI吹学初探

2024年4月7日,京吹宇宙诞生正值“久”周年,北宇治吹奏部奋三世余烈勇夺全国金之路亦将走向最后一程。 这“久”年间,吹学研究蓬勃发展,涌现出一大批领军吹学家,为探求京吹真理而前赴后继。然而,吹学研究面临着一个重大矛盾:一方面,吹学的至高真理是无限的,仰之弥高、钻之弥深;另一方面,吹学家的生命却是有限的,人生匆匆数十载,在吹学真理面前犹如蜉蝣。这样的残酷现实呼唤着一种新的吹学,一种能让吹学家在有限的生命里追寻无限的吹学真理,但又不至落入“以有涯随无涯,殆已”的困境之中的吹学。如何发展出这种新吹学,可谓是“新时代吹学的根本难题”(The Fundamental Problem of Neo-Hibikeology)。 古人云,一个学科的命运,当然要靠研究者的自我奋斗,但也要考虑到历史的行程。纵览人类历史发展的潮流,笔者认为,这下一种吹学正是AI吹学。AlphaGo、chatGPT等AI系统的出现,已经深刻变革了几乎所有学术领域。作为人类知识体系中不可分割的关键一环,吹学自不能逆潮流而行。事实上,将AI全面引入吹学研究不仅是解决新时代吹学根本难题的关键举措,更是将吹学研究推向新高度的必由之路。历史将证明,在未来的AI吹学中,吹学家只要充分利用AI强大的能力,就能够创造性地发现新的高价值吹学课题,并自动化、并行化地攻克吹学难题,实现在有限的生命里一睹吹学真理的宏愿。 秉承“做特别的人”的吹学精神,在以chatGPT为代表的生成式AI诞生之初,笔者就对其在吹学研究中的应用做了一些粗浅的探索。最初的方案主要是结合大语言模型和检索增强生成技术,在调用大模型前,从一个外部知识库(例如《武吹原典》)中检索出与问题最相关的文本作为上下文。不幸的是,此方案无法让模型对整部作品产生宏观的理解,因而效果并不理想。然而,随着模型上下文窗口容量的增加,将整部小说纳入对话分析已变得可行。趁着拥有高达100万tokens处理能力的Gemini 1.5 Pro正式开放的历史机遇,笔者开始了新一轮的尝试,并取得了一些初步的研究发现。兹将相关研究结果分享给吹学同仁。