来源:“文艺报1949”公众号 | 黄尚恩 时间 : 2025-12-16
分享到:
近些年来,随着新技术的迅猛发展,数字人文日益成为备受关注的学科交叉领域。11月22日,由中国社会科学院“登峰战略”古代文学优势学科,中国社会科学院文学研究所数字信息室、数字人文与计算批评实验室主办的“文学计算批评的未来:数字人文青年实干家论坛”在京举行。这次会议所聚焦的“计算批评”,是数字人文领域的具体方法和标志性概念,强调通过数据化和计算建模对文本与文化现象进行深度阐释与批评。来自海内外的40余专家学者以线上线下相结合的方式探讨计算批评的实践路径,旨在加快推动数字人文从理论探索走向文学研究的具体场域。
中国社会科学院文学研究所纪委书记、副所长饶望京表示,数字人文作为哲学社会科学创新体系的重要构成要素,已成为驱动学科交叉融合、促进青年学者学术成长的关键引擎。正是基于这一核心价值定位,数字人文的根本要义不在于对技术工具的浅层应用,而在于构建支撑深度学术思辨的研究框架与范式。
中国社会科学院“登峰战略”古代文学优势学科负责人刘宁谈到,中国社会科学院文学研究所古代文学学科始终以“传承学脉、探索前沿”为核心要旨,在当代中国学术体系构建中不断深耕拓新。立足古代文学的学术传统与时代诉求,数字人文研究更需坚守“实践为本”的核心原则,继而在数字时代延续人文精神。
在论坛上,青年学者们结合各自的研究实践,展现了数字人文真正落地的可能,并就计算批评乃至整个数字人文研究提出自己的思考。郑永晓、刘方喜等十余位学者参与主持、评议等环节。
第一,计算批评可以更直观地呈现文本背后的“情感”趋向。香港岭南大学中文系助理教授马杰注意到,从古至今的中文小说中,有许多表征“内心世界”的词语,比如“心”“脑”“肚”等。他基于小说语料库,采用“词嵌入模型”与“时间参照法”,考察这些隐喻词的语义关联之变化。这些表述“内心世界”的词语在不同文本、不同角色中呈现不平衡分布的状况,进而引导和塑造读者的共情。重庆大学中文系副教授刘洋运用文本标记与情感计算方法,对12位中国科幻作家的261篇科幻小说进行系统分析,发现了叙事视角选择中的性别差异。当作者使用与自身性别一致的视角进行叙事时,文本表现出更高的“情感丰富度”和更负面的“情感极性”。华中科技大学外语学院教授惠海峰建构平台,对18至19世纪英国小说中的情绪词进行提取与量化。由此,可以对200年的英国小说进行情绪趋势分析,并对不同作家的同种情绪书写进行对比研究。
第二,计算批评可以更精细地呈现艺术手段与艺术效果之间的关联。中国人民大学文学院教授陈涛注意到,红色经典电影经常会彰显出一种“崇高美学”。以计量电影学对这些影片进行分析发现,这种美学风格的形成与镜头时长、画面构成、场面调度等三种因素有关。中国社会科学院文学研究所数字人文与计算批评实验室负责人、副研究员赵薇训练机器学习模型,深入分析了新诗和散文诗的内在节奏与韵律,找出使它们相互独立的重要特征,从而从全新的视角审视现代汉诗的节奏理论以及新诗散文化等一系列重要诗学问题。南开大学文学院讲师郝若辰则对古典诗歌的风格计量进行层级化拆解。最基础的一层关注语言层面要素;第二层为风格的语义表达;最宏观的一层模拟读者对作品的整体认知。通过多角度的考察,可以对作品的风格进行更准确的定位和聚合。清华大学中文系博士生陆泉宇通过对全宋词押韵情况的周遍考察,分析了宋词上去声独用情况与韵段长度及词调的关联,并对“上去通押”与“浊上变去”语音现象的关系做了阐释。
第三,计算批评可以更系统地呈现研究对象之间的相似性与差异性。新加坡国立大学助理教授杜琳使用“数字历史取证”方法,对跨出版物重复使用的图片进行考察。一张图片,第一次发表时是一个样子;第二次、第三次使用时,编辑会对图像进行裁剪、修改,添加新的说明文字。计算批评可以帮助我们描绘图像传播和变化的隐性网络,将历史图像重构为意义竞逐的动态场域而非凝固的知识表征。北京师范大学副教授诸雨辰依托古汉语语料的预训练模型对元明清诗歌进行风格测量,同时以唐诗、宋诗作为参照。研究发现,元代诗歌整体风格近于宋诗,明代复古派诗歌具有较强的宗唐色彩,清代诗歌则复归宋诗传统。北京大学中文系助理教授李林芳以《老子》文本为案例,借助图算法探索考察异文的计算方法。新南威尔士大学工程学院硕士研究生王子尧开发了基于RAG架构的文本再生检测系统,对诗词作者在创作中化用前人诗句的现象进行分析。对于此类研究,如果只是依靠目识心记,研究者很难覆盖海量的文本。现在依托大模型,可以借助庞大的数据库来进行诗句溯源,使文本再生现象得以系统显现。清华大学计算机科学与技术系博士后韩玉凤运用模型分析了北宋交往诗的群体分布特征,并通过“诗人-交往人-主题”的三元关系映射考证了北宋“新变派”的新成员。清华大学中文系博士生宋佳霏提取《红楼梦》“芙蓉女儿诔”意象做相似度计算,认为芙蓉意象与宋代以降诗歌传统一脉相承。
第四,计算批评的实施,往往依托一定的知识库和资源基础设施。清华大学人文学院副教授唐宸针对全球汉籍资源分散的问题,和团队一起建设“全球汉籍影像开放集成系统”并不断迭代升级,以期最终实现“中国古典知识库”的建构。中国社会科学院文学研究所助理研究员程宁构建唐诗用典知识库,讨论唐诗中的常用典故、典涉人物以及典出文献,从“量”的角度把握唐诗整体的用典情况,同时分析初唐、盛唐、中唐、晚唐的用典差异。
数字人文的崛起,让文学艺术研究更具“定量分析”的特征。这让以往很多模模糊糊的感性认识获得了数据上的确凿证明。但其中也存在很多需要我们应对的挑战。我们通过复杂的计算,最终得到的结论是有效的吗?复旦大学副教授战玉冰结合自己的研究实践谈到,这其中涉及数据源的信度和效度问题。而且,数字人文研究方法背后往往隐含着主观预设的问题。因此,我们需要将计算方法和传统的文本细读融合起来做计算批评研究,将研究过程中不可避免的“主观性”转化为具有生产潜能的“主体性”。在赵薇看来,人工智能时代,很多大模型的运作过程,对于人文学者来说是一种“算法黑箱”。因而真正的人文建模,就是要破解“算法黑箱”,让模型成为推理、论证和反思的关键一环。要实现这一目标,关键在于培育将实操、实践、建模放到历史脉络里去与理论、现实、文本展开对话的能力,尤其要捕捉批评意识闪现的时刻。这正是计算批评的旨归。
湖南省作家协会 | 版权所有 : 湘ICP备05001310号
Copyright ? 2005 - 2012 Frguo. All Rights Reserved