来源:中国作家网 时间 : 2025-06-23
分享到:
编者按:
2025年6月18日至22日,第三十一届北京国际图书博览会(BIBF)在京举办。博览会期间,由中国作家协会和浙江省委宣传部领导和支持,浙江省作家协会协调统筹,中国现代文学馆和浙江文学馆负责具体实施的重大文学数字化项目——中国新时代文学大数据中心部分成果亮相“中国作家馆”,以数字化展示我国新时代文学壮阔气象的新探索受到广泛关注。藉此机会,浙江省作家协会、中国现代文学馆会同中国作家网,对2023年以来中国新时代文学大数据中心建设成就予以回顾和总结。
中国新时代文学大数据中心,是在中国作家协会和浙江省委宣传部领导和支持下,由浙江省作家协会协调统筹,中国现代文学馆和浙江文学馆负责具体实施的重大文学数字化项目。该中心是我国首个全面、系统的文学大数据综合应用平台,旨在以大数据和人工智能技术为驱动力,深入践行习近平文化思想,实现文学领域的“观古今于须臾,抚四海于一瞬”,全面提升中国文学的传承、研究、教育、传播能力。
2023年4月启动建设以来,在浙江省委宣传部的关心推动下,中国现代文学馆携手浙江文学馆,持续打造了浙江文学馆智慧场馆、全国首个文学数字体验展厅、全国首个文学智能体、全国文学场馆综合管理服务平台、全国首个文学数据标准、中国文学地图等标志性成果,以“文化+科技”赋能新时代文学事业,奋力打造新时代文学高地。新华社、《人民日报》《文艺报》《浙江日报》、浙江卫视、“潮新闻”等各级媒体对中国新时代文学大数据中心建设持续关注并宣传报道,业界认为该中心是“实践中华优秀传统文化创造性转换、创新性发展的创举”,为中国文学数字化开辟了一条新路。中国新时代文学大数据中心建设入选2023年浙江省文化创新案例。
全面系统搭建文学数字化工作体系
当前,我国文学类场馆大多是“小散户”,除个别新建场馆外,都存在不少通病:面积小,多数是用一些文学故居和老旧建筑改建而成;功能少,主要以文学创作、研究为主,在社会公共服务方面相当欠缺;运营方式陈旧,通常是只有简单的展陈布置,场馆往往门可罗雀;经费少,日常维护的经费都比较紧张,更谈不上数字化。
为以数字化整合文学场馆资源,提升文学公共服务水平,推动高水平文化强省建设,两年来,共统筹安排各类财政资金近2000万元,构建起中国新时代文学大数据中心“五大体系、一个计划”整体框架。“五大体系、一个计划”主要包括文学数据标准体系、数据体系、平台体系、应用体系、安全体系和红色经典文学普及教育成长计划。
以项目为统领,中国新时代文学大数据中心率先构筑文学数据标准体系,聚焦文学数据管理与应用,持续建立和完善文学数据分类与描述、采集、存储等要求,并在项目推进中不断归纳总结经验。持续推动文学数据体系建设,建设全国基础文学数据库、红色经典文学数据库、文学金句数据库等一系列数据库,并在多类型文化体验终端打通和互动展示。打造文学数据服务平台体系,通过打造大数据中心基座平台、大模型平台、全国文学场馆管理服务平台等系列支撑平台,为文学数据应用提供基础平台支撑。建立文学数据应用体系,基于数据资源和支撑平台,推出系列数字化文学应用,对各类文学数据的采集、分析和利用,服务教育传播、展览展示、活动推广等场景。扎实做好安全体系建设,以人防、物防、技防构建立体的防护体系,确保中心建设安全。此外,还推出红色经典文学普及教育成长计划,通过整合红色经典文学资源,推出活态表演、数字展陈、红色经典文学“关键词”展陈等应用场景,推动红色经典深入人心。
构建智能化数据库
和图书馆、阅读平台等机构侧重以数据库服务电子阅读不同,中国新时代文学大数据中心侧重于以开发平台和应用为手段,对数据库里的数据进行综合分析和可视化呈现。该数据库系统除了数据管理等基础功能外,还充分利用AI算力提升智能检索等能力,智能化水平居于全国前列。
2023年以来,中国新时代文学大数据中心基于数据体系,完成了全国基础文学数据库(“正在发生的文学”数据库)、文学金句数据库、红色经典文学数据库等系列数据库搭建,并持续收录文学数据。其中,全国基础文学数据库(“正在发生的文学”数据库)收录全国文学地标1200余条、文学作品8000余册、作家数据6900余条,注重采集汇聚主流文学期刊目录、全国重要文学活动、重要文学出版、重点文学作品改编传播等“生长的数据”,在驾驶舱上呈现“正在发生的文学”,实现对文学动态的即时掌握;文学金句数据库收录1000余部作品的10000句金句。收录有中华古诗词作品110余万首,古籍、方志等5000余种。
将红色经典文学数据库作为数据库建设的重点,完成《红藏:进步期刊总汇(1915-1949)》《延安文艺档案》《左联文艺期刊全编》等600余册图书的数字化扫描,入库各类红色文学文献数字版6400余种,视频、音频、图片等其他各类红色文学主题资源300余种。
全国首个文学数据标准填补行业空白
长期以来,中国文学领域相关单位面临文学数据“无标可依”、数据建设“不系统”、数据管理“不规范”、数据应用“不充分”的问题。不同场馆之间字段设定、数据采集方式不一,带来跨地区、跨场馆的数据整合不便,出现“数据孤岛”的情况,影响文学资源的高效利用和传承。同时,人工智能技术的高速发展,加速推动文学业态的数字化转型升级,为文学数据的处理和应用带来新的机遇和挑战。
在此背景下,中国现代文学馆和浙江文学馆牵头起草了全国首个文学数据标准《文学数据管理与应用总体要求》。该标准规定了文学数据管理与应用的基本要求,以及文学数据分类与描述、采集、存储、交换、分析、应用、安全的总体要求。
2025年4月,在《文学数据管理与应用总体要求》在中国现代文学馆发布。发布之际,《文艺报》发表社论指出,标准发布是主动应对挑战,破解发展难题,构建新时代文学高质量发展新格局的“破冰之举”,是探索发展新路径,打造文学新形态,将文学资源优势转化为文化发展优势的“破题之举”,是夯实文学基础性地位,培育文化新质生产力,推动文学在文化强国建设中发挥更大作用的“创新之举”。《人民日报(海外版)》也报道了文学数据标准,认为“文学数据管理标准填补行业空白”。
打造创新性、标志性应用成果
作为浙江加快建设高水平文化强省重点任务清单项目之一,打造创新性、标志性应用成果,让文学数据以更直观、更智慧方式服务场馆运营和社会公众,是中国新时代文学大数据建设的重要内容。
2023年浙江文学馆建成开馆,中国新时代文学大数据中心便在馆内落地了全国首个数字文学体验厅。在该展厅内,所有展项内容均以庞大的文学数据为支撑,并同步联通文学大数据中台,保持随时更新。同时,观众参与互动产生的数据,也通过数据留存成为本展厅的一部分。比如,“文学长卷”数字应用将《浙江通志·文学志》中的“文学大事记”进行数据采集,同时采用AI图像生成技术,使浙江从上古到当代的“文学大事记”由“书页”变为了“画卷”,改变了以往展示单一的困难,该长卷还可以通过数字收藏、制作成实体文创等,拓宽内容的传播方式。“一木一石”数字化展项将数据库中的作家作品进行分析呈现,在一块屏幕内集中展示作家的朋友圈、手稿、照片、文学史上的今天、作家文学大事记等内容,还可随时一键切换,看似“一木一石”,实则“万象共生”。
文学场馆散落各地,如何紧密联系实现资源共享?中国新时代文学大数据中心也给出了解决方案。
2024年,在全国文学馆联盟年会上,中国新时代文学大数据中心发起“共建计划”,并迅速打造推出全国首个文学场馆管理服务平台“馆际通”。该平台通过数据所有权和使用权分离,统一数据接入、管理和使用标准,既可为全国文学类场馆提供本地数据资源管理、全国数据共建共享、馆际信息互联互通的基础服务,也可根据各地实际需求开发个性化服务模块,实现全国文学类场馆数据互通有无、一网集成,文学类应用一地开发、全国共享,为全国文学类场馆提升数字化水平、推进公共服务水平提供平台支持。
2025年,中国新时代文学大数据中心还发布了全国首个文学类智能体“中国现代文学馆-浙江文学馆文学智能体”。该智能体采取大数据和大模型AI的“双轮驱动”模式,即一方面通过对接文学数据库中的数据内容,为智能体提供海量且持续更新的知识,另一方面,通过对接文学大模型系统为智能体赋予认知和感知等智能能力,从而实现智能体的高效运行和广泛存在。
基于文学智能体,新开发了两组、8个形象的AI数字人。这些数字人通过线上的“AI文学家”小程序和线下的一体机部署展示,拥有智能客服、AI生图、文本分析等“十八般武艺”,可以和用户进行多模态交互,实现文学智能服务“千人千面、因时而变、因人而异”。
在数据中台的支持下,中国新时代文学大数据中心打通了数据和应用,实现了数据实时流动,应用相互支撑。在2025年6月举办的北京国际图书博览会上,中国新时代文学大数据中心再次发布了最新应用成果——中国文学地图。该地图接入全国首个文学智能体,呈现出数据丰富、可持续生长、应用可挂载迭代等特点,是一张智能化的文学地图。同时,作家、作品、活动等数据库建成的文学数据,也得以在中国地图上标注呈现,观众可以从地域视角一屏纵览古今文学提供便利。在可挂载迭代方面,中国新时代文学大数据中心同步推出了“文学西湖”这一地标级文学地图,通过大数据挖掘和分析,把西湖文学的方方面面清晰地呈现在观众面前,包括哪个景点的文学作品最多、哪个朝代写西湖的作品最多、作家们到西湖都去了哪里等。在文学数据标准的规范下,各地都可以参照“西湖文学”,单独扩展本地文学地标为文学+地理、文学+旅游的全景式数字化展项,并最终接入到中国文学地图中,形成应用“一地建设,全国共享”。
此外,在2023年浙江文学馆开馆时,中国新时代文学大数据中心还建成了浙江文学馆智慧场馆管理系统。在该系统中,既有预约小程序、网站等基础性常规性应用,又有可监控预警安防水电的物联网数据中台、数字孪生场馆等管理平台,还有文学知识图谱、文学地图等文学应用平台,较为完整地构成了场馆智慧管理体系,也为其他文学场馆的智慧化提升提供了借鉴。
探索文学数据赋能新方式
随着中国新时代文学大数据中心建设持续推进,文学+大数据+人工智能+N所产生赋能效应,正在逐渐溢出文学的边界,为传承红色革命精神、构建中华民族共同体意识、促进精神共富等提供了新的抓手。
作为落地浙江的“国字号”平台,中国新时代文学大数据中心充分发挥浙江在数字资源、技术等方面的优势,以数字化赋能助推民族地区文学文化领域共同富裕,持续推动铸牢中华民族共同体意识。
两年来,先后在新疆、内蒙古等地落地实施,社会反响热烈。一是民族文学数据库和数字化应用成果丰硕。在丽水景宁畲族自治县建成全国首个畲族文学和文献数据库,收集各类畲族文学文献100余种;在呼和浩特建成全国首个少数民族文学“骏马奖”数据库。两个数据库共收录作家作品等各类数据信息2000余条。以“馆际通”平台为依托,在内蒙古、新疆先后建成数字化展厅、开发数字人,在景宁落地全国首个畲族文学数字化展项。数字人互动已超10万次,有效传播了民族文学文化。二是模板作用广受关注。2024年浙江省推出文化特派员机制后,中国新时代文学大数据中心支持省文化特派员落地畲族文学数字化展项,助力景宁大均村打造智慧礼堂,为民族地区乡村的小型文化场馆如何在数字化时代能同步发展提供了借鉴和模版。三是有力助推民族地区文学文化场馆火出圈。在数字展厅开放后,内蒙古文学馆的客流量增加了3倍,观众群体不再受限于文学爱好者。畲族传统节日“三月三”期间,景宁大均文化礼堂数字化展项推出10余个微主题,以内容丰富、形式新颖的展示手段宣传畲族文化,吸引众多游客参与互动。项目的建设为民族地区社会公众了解、体验最新科技、开拓视野提供了新渠道,也通过数字化赋能,为促进民族团结、文化共富搭建了全新的途径和载体。
持续推进浙江文化数据库(红色经典文学)建设,传承和弘扬红色革命精神。中国新时代文学大数据中心以红色经典文学数据资源建设作为本期“浙江文化数据库”的主题主线,充分用好浙江省委宣传部“两项资金”,探索数据资源开发“1+2”模式(打造1个数据库,推出活态表演和数字展陈2个运用场景)。扎实推进红色经典文学普及教育成长计划,在暑期推出表演工作坊6期,国庆期间举办红色文学革命文物数字展暨国庆假期话剧展演活动,以12个红色话剧剧目28场演出致敬从建党到建国的28年奋斗历程。同时,这些展演的剧目,已全部形成标准化剧本和示范演出视频,具备向高校、中小学铺开的基础条件。
在采集中国现代文学馆“坐标——中国现代文学馆馆藏革命文物特展”的基础上,利用中国现代文学馆馆藏图片、手稿等数字版,联合推出数字展,使手稿等珍贵革命文物以清晰、直观方式感染人、教育人。此外,还根据《青春之歌》《红岩》等红色经典文学作品场景制作了AIGC视频。
千里之行,始于足下。志之所趋,无远弗届。中国文学大数据中心建设势头迅猛,中国文学数字化的瑰丽画卷徐徐绘就。
下一步,中国新时代文学大数据中心将在中国作协和浙江省委宣传部的领导下,以全国文学馆联盟为依托,奋力推动“五个体系、一个计划”取得更大突破,在持续深化“八项工程”,更好担负新时代文化使命的征程上,更好提供高质量的文学公共服务。
(供稿:浙江省作家协会、中国现代文学馆)
湖南省作家协会 | 版权所有 : 湘ICP备05001310号
Copyright ? 2005 - 2012 Frguo. All Rights Reserved