分享缩略图

分享到:
链接已复制
首页> 中国政务> 滚动新闻>

我与文化科技融合20年(3):文化和科技融合能带来怎样的变化?

2025-11-04 16:22

来源:中国网

分享到:
链接已复制
字体:

■ 高书生

《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》再次明确,推进文化和科技融合,推动文化建设数智化赋能、信息化转型,发展新型文化业态。怎么推进?抓手是什么?2025年6月,我在湖南湘西以“文化和科技融合能带来怎样的变化”为题谈了些想法,现整理如下,供大家参考。

2025年5月,由中央宣传部主办的“2025文化强国建设高峰论坛”提出:要推动文化和科技融合,深入实施国家文化数字化战略,用好人工智能等前沿技术,加快文化建设数字化赋能、信息化转型。

这就是说,在文化和科技融合、数智化赋能之间,有两个环节作为媒介或抓手,一是实施国家文化数字化战略,二是用好人工智能等前沿技术。

一、从当下炙手可热的人工智能谈起

党的二十届三中全会《决定》在深化文化体制机制改革部分中强调一句话,即加快适应信息技术迅猛发展新形势(四中全会《规划建议》在文化部分强调“顺应信息技术发展潮流”)。这是最应该引起宣传思想文化战线重视的内容。

习近平总书记向2019中国国际智能产业博览会致贺信时指出:当前,以互联网、大数据、人工智能等为代表的现代信息技术日新月异,新一轮科技革命和产业变革蓬勃推进,智能产业快速发展,对经济发展、社会进步、全球治理等方面产生重大而深远影响。

习近平总书记在中共中央政治局第九次集体学习时强调:人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。

自2023年ChatGPT出世后,国内涌现了上百个人工智能大语言模型,我们也在研究人工智能如何在宣传文化领域落地应用。但同技术公司、互联网大厂等深入接触后,我们感觉是人工智能落地应用成本过高,大多数宣传文化机构承受不起。

DeepSeek的横空出世,打破了国际上“高算力和高投入是发展人工智能唯一途径”的迷信,开辟了一条低成本发展人工智能的可行之路。

低成本是技术普及的基本要求,蒸汽机、电力和计算机的普及如此,人工智能落地应用肯定也会走这条路。

人工智能在宣传文化领域落地应用,比成本更重要的问题是“幻觉”。

我问DeepSeek,人工智能是否存在“偏科”现象?得到的答案是肯定的。DeepSeek还从技术上做出解释:理工科知识通常有明确的结构化逻辑和标准答案,更适合AI的符号推理和模式匹配能力;人文社科涉及主观性、文化语境、价值判断等复杂维度,对模糊性和多样性的处理能力仍是AI的短板。

“偏科”的后果就是“幻觉”,即生成与事实不符或文化背景错位的虚构内容。

在历史文化问题上的“幻觉”,这是意识形态管理不能容忍的,也是人工智能落地应用的“一道坎”。

据DeepSeek透露:OpenAI内部评估显示,约40%的幻觉可追溯至语料问题。

语料来源于数据。而数据恰恰是宣传文化机构的天然优势,数字化的人类知识成果,是当前人工智能最短缺的“食粮”。

人工智能有三要素,算力、算法和数据。算力和算法是科技的问题,数据是我们的优势。

人工智能是文化和科技双向奔赴,是文化和科技融合的产物,用公式表达:

人工智能=科技(算力+算法)+文化(数据)

科技已经发力,文化不能缺席。

二、宣传思想文化战线每个单位手里都有“牌”

数据从哪里来?

2022年中共中央办公厅 国务院办公厅印发的《关于推进实施国家文化数字化战略的意见》明确三个渠道:一是汇集,汇聚全国性文化资源普查数据;二是采集,采集中华民族文化基因数据;三是贯通,贯通已建或在建文化专题数据库。

1、汇集,全国性文化资源普查数据量十分浩大:

——全国第三次文物普查显示,全国共登记的不可移动文物共766722处,普查共制作电子数据包2868个,其中文本文件462.1万个,各类图纸156.8万幅,照片228.1万张,所占空间近8TB;

——第一次全国可移动文物普查仅照片就5000万张,数据总量超过140TB;

——共著录登记汉文古籍270余万部和藏文古籍1.8万函,2861家单位参与并完成古籍普查登记工作,已累计完成645家收藏单位的《全国古籍普查登记目录》,共计137种215册,收录147万余条款目;

——全国美术馆藏品普查,藏品实际数量592663件,藏品图片820288幅,数据总量6.9TB;

——全国现存348个剧种,参加普查的戏曲演出团体共有1.2万个,共收入表格11万份、图片4.7万张;

——被誉为“文化长城”、耗时30年完成的《中国民族民间文艺集成志书》,共计298卷、400册,约4.5亿字,收集相关资料逾50亿字(包括曲谱、图片)。

2、采集,包括开展红色基因库建设,对红色纪念馆藏品进行高精度采集、标注,并实现全国联网,形成中华民族文化基因库。在数据采集方面,故宫博物院保存约186万件文物藏品,已有90万件套实现了数字化采集,占48%左右。中国国家博物馆有约143万件套,70万件套实现数字化采集,约占49%。中国美术馆有约13万件套藏品,有10万件套已经实现了数字化采集,约占76.9%。国家图书馆的古籍大约317万册件,目前有61万册件实现了数字化采集,约占19.3%。

3、贯通,就是按照物理分布、逻辑关联原则,通过标识解析体系,把已建或在建的文化专题数据库关联起来,实现数据互联互通,通过释放数据解放文化生产力。

至于已建数据库(媒资库)就更多了。比如出版领域,具有一定规模的数据库已经不少,期刊领域有同方知网、万方数据、龙源期刊、维普期刊等大型期刊数据库,在图书领域有综合性的国家数字图书馆、读秀网、掌阅科技、中文在线、方正电子书等图书数据库,专题性的如人民出版社的中国共产党思想理论资源数据库、科学出版社的科学文库、社科文献出版社的皮书数据库等,以及专业性的如中华古籍资源库、爱如生、翰堂典藏、书同文等古籍数据库等,还有许多出版社、报社建设了自己的数据库。

三、文化资源数据如何从能源转化为能量

数据是新能源,如何将其转化为能量?这是我们需要进一步探索的问题。

1、数据不标注等于没内涵

这些年,每个宣传文化机构都拥有一定数量的数据,但由于大多数没有标注,许多数据缺乏文化内涵,不能成为真正的生产要素。

数据成为文化创新创造的素材,需要进行深加工:一是要对文化数据进行科学分类。分类标准可参照联合国教科文组织的文化统计框架,将数据划分为六大类别,即文化和自然遗产、表演和节庆活动、视觉艺术和手工艺、书籍和报刊、视听(音像)和交互媒体、设计和创意服务;二是按照专业性的知识图谱进行编目,确定每个数据的方位;三是对文化资源数据的特征进行描述并进行数据标签化;四是为每一个元素级数据分配ISLI标识编码。

数据标注具有很强的专业性,同时也是规模巨大的新兴产业。

2、数据不标识不易被发现

数据标注完后不标识,别人无法发现。从2023年开始,我们在全国建立国家文化大数据标识基地,除了标注外,我们还需要做一个标识。

2021年10月,《文化资源数据分类与代码》团体标准(/CPRA 301—2021)发布,按照联合国教科文组织划分的六大类别进行分类,代码采用七位代码四级分类表示,其中,第1位使用英文大写字母表示第一级分类,第2位~第3位用十进制表示指定二级分类代码,第4位~第5位用十进制表示指定三级分类代码,第6位~第7位用十进制表示四级分类代码。

四、“数据+”动能转换催生文化新质生产力

如何将能量转化为生产力,即新质生产力,这是一个急迫问题。

新质生产力的核心要素也有三个,即新劳动对象、新劳动工具、新型基础设施。如果不抓住这三个要素,文化新质生产力就无法变成现实。

1、新劳动对象

数据作为新型生产要素已经成为重要劳动对象,这已成为共识。但数据是要分类的,不是指数据分为公共的、个人的、商业的,而是指从供给和需求角度分类。

当下讨论较多的数据,都是在消费过程中产生的,我称之为需求侧数据,这类数据通常包含个人信息,因此确权较为困难。

还有另一类数据,我称之为供给侧数据,它能够进入生产过程,成为二次创作素材,是真正意义上的生产要素。文化数据属于这一类,数据的权属非常清晰。

供给侧数据和需求侧数据所遵循的规律是完全不同的。这一点被忽略了,数据要素市场之所以不够活跃,与没有认识到数据实际上包含这两类有直接关系。

2022年中办国办文件使用“文化资源数据”一词,其用意是强调数据来源于文化资源,即文化资源数据是来源于文化资源的数据。

2、新劳动工具

提到新劳动工具,大家不约而同地指向了生成式人工智能。

如前所述,幻觉率高是人工智能在宣传文化领域落地应用的“一道坎”,怎么降低幻觉率是关键问题。

我提出一个观点:人工智能一定要分层,即基础层、行业层和应用层,通过每一层来降低幻觉率。

在基础层,即通用大模型训练层,科技公司要攻克AI在人文社会科学方面的短板,将历史文化特别是中华历史和文化的数据转化为语料,能够“喂养”大语言模型,降低大语言模型在历史文化方面的幻觉率。

在行业层,我提出了对象化模型的概念,怎么理解?举个例子,中国戏曲出版社接入开源大语言模型,运用自有数据研发出“戏曲模型”,通过蒸馏或其他方式提供给全国1888家院团使用,院团接入“戏曲模型”运用自有数据研发出场景模型,这样做既可以把“幻觉率”降到最低程度,又可以让人工智能低成本落地应用,还可以打消院团数据外泄的顾虑。以此类推,中国文物出版社或中国文物报可以研发“文物模型”,供全国6000多家博物馆使用。

每一个文化机构在开发场景应用时,通过私有化部署,用数据进一步降低幻觉率,人工智能才可以真正地落地。

3、新型基础设施

新型基础设施,即信息基础设施或数据基础设施,宣传文化领域是否有数据基础设施?

夯实文化数字化基础设施,是2022年《关于推进实施国家文化数字化战略的意见》文件明确的八项重点任务之一,即依托现有有线电视网络设施,广电5G网络与互联互通平台,部署提供标识编码注册登记和解析服务的技术系统,完善结算支付功能,形成国家文化专网以及国家文化大数据体系的省域中心和区域中心,服务于文化资源数据的存储、传输、交易和文化数字内容分发,这就是宣传文化领域的新型基础设施。

关联形成中华文化数据库,是2022年《关于推进实施国家文化数字化战略的意见》文件明确的第一项重点任务,即依托信息和文献领域相关国际标准,在文化机构数据中心部署底层关联服务引擎和应用软件,按照物理分布、逻辑关联原则,关联形成中华文化数据库。

中华文化数据库并非将所有宣传文化机构的数据汇集在一起,而是按照统一的标准以及物理分布、逻辑关联原则,将零散的、不同领域、不同形态的数据关联起来。

怎么关联?关联的标准和接口必须统一。

标准统一就是依托我国提案创建的国际标准,即关联标识符国际标准——ISLI(英文全称International Standard Link Identifier),这是信息与文献领域唯一标识实体之间关联关系的全球通用标识符,但不替代各个行业正在执行的标识符标准。

依托我国提案创建的关联标识符国际标准(ISLI)进行技术架构,即在广电网络公司机房部署提供标识编码注册登记和解析服务的技术系统、在文化机构数据中心部署底层关联服务引擎和应用软件,就可以形成了全国范围内互联互通的数据基础设施,即国家数据局正在推动的“可信数据空间”,我称之为“文化数字化的技术底座”。

五、接入国家文化专网轻松跨越“数字鸿沟”

如何跨越“数字鸿沟”,即完成数字化转型升级,是所有宣传文化机构面临的棘手问题,也是非常大的挑战。

宣传文化机构在数字化转型升级中的痛点主要有三个,第一是数据安全,第二是数据确权,第三是技术。

这几年,我们组织成员单位基于国家文化专网开发了8项基础性业务,包括数据安全、数据确权、数据加工、数据交易、数据分发、算力服务、人工智能服务和数据资源入表服务等,每一项都直击宣传文化机构在数字化转型升级过程中的痛点。

只要接入国家文化专网,宣传文化机构就可以搭建一条文化数字化生产线,这条生产线集成了以上8项基础性服务,为宣传文化机构排忧解难。

文化人最擅长做内容,最不擅长做生意。

宣传文化机构有两块短板,第一是经营,第二是技术。

实施国家文化数字化战略,就是要解放文化人,让他们从不擅长、不熟悉、不精通的业务中解放出来,专心做内容。

推动宣传文化机构数字化转型升级,一定要便捷化,便捷到文化数字化跟数码相机一样简单,用数码相机照相不需要懂光学原理,只要会取景、会按快门,就能照出好照片(好内容)。

实施国家文化数字化战略催生出一条新赛道:

国家文化专网如同高速路,每一个宣传文化机构如同跑在高速路上的新能源车,文化产权交易所如同高速路上的服务区,版权保护如同装在新能源车上的ETC,8项基础性服务可以集成到充电桩,新能源车只要能够接通充电桩,就可以享受基础性服务。

六、挖掘地域文化助力文化和旅游深度融合

虽然我在文化和旅游融合领域研究不多,但可以从另一个角度助力文化和旅游深度融合,即挖掘地域文化。

过去我们不太讲地域文化,实际上地域文化对整个旅游带来许多意想不到的好处。

只要有中华民族鲜明生活的地方,都有特色鲜明的地域文化,可以从中挖掘出许多有价值的内涵和内容。地域文化应该成为旅游地文化体验的重点。

在公共文化机构中,无论是地方志还是档案馆、文化馆、图书馆和博物馆都与地域文化密切相关,这些都是地域文化的物化或者载体。

将原本收藏在地方志、博物馆、图书馆、美术馆以及电台电视台的数据活化到旅游景区,就可以实现白天看景、晚上体验文化,留住游客。

七、数字化赋能公共文化服务“即时可得”

2010年我们在制定国家“十二五”时期文化改革发展规划纲要时,曾提出一个“公共文化服务圈”的概念,城市叫“15分钟服务圈”,农村叫“1小时服务圈”。其实,在数字化时代,公共文化服务不存在时间差,无论在什么地方,在什么时间都可以享受到公共文化服务。即时可得应当成为数字化时代公共文化服务应当追求和能够实现的目标。

党的二十届三中全会明确提出要完善公共文化服务体系,建立优质文化资源直达基层机制。我们在10多年前进行过探索,即电视图书馆实验项目,将其作为“十二五”时期文化数字化建设的先导工程。

该项目把电视机作为公共图书馆的终端,通过有线电视网络将百万图书进入千万家庭。2012年在北京歌华有线进行试点,2017年扩大到其他9个省市,覆盖5000万高清用户。

该项目证明,优质文化资源直达基层是可以实现的,文化企业也可以承担公共文化服务的任务(通过政府购买)。

更为重要的是,电视图书馆试验项目运行7年多,没有发生过一起盗版事件,充分证明数据安全是有保障的。

八、数字化文化消费新场景“近在咫尺”

2022年《关于推进实施国家文化数字化战略的意见》文件明确提出:集成全息呈现、数字孪生、多语言交互、高逼真、跨时空等新型体验技术,大力发展线上线下一体化、在线在场相结合的数字化文化新体验。

数字化文化消费新场景包括线上和线下两部分,线上主要是指大屏和小屏,大屏主要指电视机;线下包括新时代文明实践中心、学校、公共图书馆、文化馆、博物馆、美术馆、影剧院、新华书店、农家书屋等文化教育设施,以及旅游服务场所、社区、购物中心、城市广场、商业街区、机场车站等公共场所。

文化重在体验,这点大家都已经认识到了,但文化体验需要场景。现在的技术已经实现,只要有空间就能营造出场景。在这方面宣传文化系统大有可为。公共文化设施存在闲置、利用率不高的问题,文化体验可以弥补这个问题。

《关于推进实施国家文化数字化战略的意见》明确提出,要巩固和扩大中华文化数字化创新成果的展示空间,包括在旅游服务场所、城市广场等建设文化体验园,在学校、公共图书馆、文化馆、博物馆、美术馆等建设文化体验馆,在影剧院、新华书店、农家书屋、社区、购物中心、城市广场、商业街区、机场车站等建设文化体验厅。

总而言之,可以将数据活化到数字化文化消费新场景之中。

文化消费并非仅通过发放几张消费券就可以解决。我一直强调一个观点,在文化领域供给决定需求,并非是大家不消费,而是没有提供优质产品吸引大家消费。

中央一直强调供给侧结构性改革,在宣传文化领域如何推进?需要探讨如何激活文化资源,将其转化为数据,并利用这些数据打造新的场景和产品。

我有个预言:未来3到5年内,文化体验将成为文化消费的主流。

(本文作者高书生,系中共中央宣传部原文改办副主任、一级巡视员)

【责任编辑:胡俊】
返回顶部