当前位置: 首页 > 新闻中心 > 要闻速递 > 正文

新闻中心

要闻速递

NEWS

袁晓如:人文智能(AI4Humanities)新视野:从数据到洞见的文化计算探索

时间:2026-01-19    来源:

  • 分享

在近日举办的2025中国文化计算大会上,北京大学智能学院研究员、北京大学教材建设博雅特聘教授、大数据分析与应用技术国家工程实验室常务副主任袁晓如以《人文智能(AI4Humanities)新视野:从数据到洞见的文化计算探索》为题发表演讲。

(以下发言全文根据速记稿整理。)

大家好!我从学术界的角度来做一些分享,希望能为整个文化数字化大厦的建设做一些基础技术和局部构件的工作,也为将来的进一步开展工作,提供一些思路和想法。

我们的文化历史有很多维度,在历史的记载中,文字和图像扮演了很重要的角色。除了记录历史的史书中的文字,我们还有很多的记载是通过的图案形式。甚至从上古的象形文字,商代的甲骨文记录,中国文字本身高度图形化。留存下来还有书画和书法都是文字与图形相结合的典型。所以今天我来介绍一下和领域学者合作理解文字和图像的一些工作。这些工作为研究学者与大众进一步探索文化密码提供了新的可能。

今天第一个例子讨论中国古代是怎么表达知识的,中国古代也是广泛采用用图形化、可视化的形式表达信息;第二个例子是怎么比较书法,能不能用数字化方式比较各种书法的形式;第三个是在文物,特别是彩陶上的花纹能不能做比较分享;再进一步,博物馆里面的碑刻和碑文,能不能有更加生动展陈分析的可能;最后介绍一个小例子,对于报刊,除了看新闻文字内容,能不能快速理解一种报刊几十年发生了什么变化。这一些都需要对于文字和图形有更强大的理解分析能力。

中国古代的可视化

针对古代可视化研究,我们构建了一个专题数据集。该数据集的内容主要来源于历代古籍,通过自动化算法进行采集与提取——在此过程中,我们也构建了相应的训练集以支持算法识别。通过这些数据,我们可以追溯并理解自宋代以来古人如何获取与表达数据。选择以宋代为起点,主要是因为宋代以前的古籍存世量少,仅有零星文物残存,而宋代以后古籍数量大幅增加,为研究提供了较为充足的资料基础。目前,我们已基于一万两千余种古籍,获取了超过五百万拍图像资料,并通过自动提取共得到十七万幅图案。这些图案中既包括可视化图表,也有辅助文字理解的插画。这个数据集可为图像史、艺术史、可视化史等相关领域的研究提供重要支持。整个数据处理过程结合了人工干预与自动处理技术。

我们应如何理解这些古代文化现象呢?书籍中大量出现图案的情况,尤其在宋代之后更为显著,这与科举制度的推行有关——图像常被用来辅助理解深奥的知识内容。基于此,我们可以系统地考察古人如何借助图像进行知识表达。

以表格为例,中国古籍中表格的出现时间很早。司马迁《史记》中已见其雏形,依据某些不太严格的考据,表格的起源甚至可以追溯至甲骨文时期,尽管这一点尚存争议。相比之下,西方严格形式的表格出现较中国晚了数百年。实际上,古埃及等文明古国也曾较早使用表格,这反映出古代文明在知识表达方面的前瞻性与令人惊讶的先进性。

总结中国古代图表的特征,可见其与文字之间存在紧密联系。例如,在一幅古代地图中,文字与图像高度融合,其结合程度甚至超过许多当代设计。此外,古人亦常纯以文字构成图形,或通过汉字的方向排列来编码方位信息——有些字通过旋转以指示方向。这些做法体现出古人对角度、方向与位置的巧妙运用,其智慧在某些方面至今仍值得我们借鉴。将这些内容进行解读与推广,不仅有助于年轻人了解传统文化,也能引起更广泛年龄层读者的兴趣,通过客观存在的视觉材料激发公众对文化探索的好奇心。


汉字在古人表达概念关系时也扮演了节点角色。通过文字布局,可以表现概念间的关联与共性,这可视作古代文字在可视化中的一种运用。

在古代可视化中,图像同样发挥了重要作用。例如,古人所绘地图常具有立体感,而中医穴位图则采用象形化的表达。对比古今可视化实践,一般认为现代可视化方法多源于西方,但中国的古代可视化既有与之相通之处,亦存在独特差异,值得进一步深入探究。

再举一例:通过比较不同版本的“四诗传授图”(一种类似家谱的图谱),可以发现历代六个版本之间存在差异。这些差异可能源于刻工刊刻时的变动,或是对谱系人物的调整,背后往往涉及复杂的历史与文献背景。此类比较可为版本学研究提供线索,并与相关学者展开对话,揭示更多有趣的历史层面。

书法的比较计算

我们的研究试图通过发展计算分析方法,探索如何解码中国古代文化的特质。其中中国书法尤为独特,并在汉字书写艺术中占有重要地位,日本书法亦源于中国。而西方文字虽亦有装饰性字体,但其文化内涵与审美意蕴与中国书法相去甚远,多限于装饰或早期文献中的花体字,在文化层面上差异显著。以颜真卿的《祭侄文稿》为例,即使有机会见到原件,若无专家指导,普通观者亦难以解读其内容与笔法细节,甚至其中的涂改痕迹也难以理解。我们与北京大学历史学系的书法研究专家展开合作,尝试探讨书法是否能够被计算分析——这也呼应了本次大会以“计算”为主题的方向。

然而,将文化现象转化为可计算的对象极为困难。尽管人工智能已取得显著进展,但人文学者往往存有疑虑:书法所承载的意境与美感,如何能以计算方式捕捉?我们初期虽认为具有可行性,却无从着手。通过与专家讨论,我们了解到书法研究中对字形常概括为八个字:“平画宽结、斜画紧结”。这八个字是东晋以后书法演变的重要总结,凝聚了历代学者对字体结构、笔画态势的深刻洞察,体现了人文学者长期积累的知识智慧。我们的任务在于将其转化为可计算的维度。

我们将这八个字进一步解构为四个可操作维度:整体性、倾斜度、紧凑性、粗细度。为进一步便于计算,又将这四个维度细分为11项具体指标。例如,“宽高比”可通过界定单字外接矩形,计算其像素宽度与高度的比值;“墨色比”则可计算字迹部分所占像素与总像素之比,即墨迹在纸面上的覆盖密度。这些指标在计算上并不复杂,但需通过训练模型以实现定量化分析。在此基础上,我们建立了一套系统的分析流程。

书法分析的整体流程始于作品概览,终于深入的结构分析。具体而言,在这个例子里面,我们选取与王羲之相关的碑帖(包括集字碑及唐代崇王书法家的作品),首先在时间序列上观察其风格变化。接着,针对特定字符进行聚焦分析——例如王羲之的“之”字在不同碑帖中反复出现,我们将其提取并重叠比对,同时考察其上下文关系(古人书法常因文意连贯而字形相应变化,与今印刷字体各自独立不同)。之后,将该字分解至上述11个维度,并以像素图等形式呈现各维度数值,例如我们可以看到其中红色方块的大小与横线角度代表计算得到的对应系数。

举例来说,某个“之”字可能在第五个维度上表现特殊,这种差异类似人的体貌特征(如高、矮、胖、瘦),可对应到特定结构系数上。我们进一步利用机器学习算法(如降维方法)将王羲之及其影响下的“之”字投影至二维平面,使结构相近的字聚集在一起,从而分析某字是否因更宽、更平等特征而归类。这种方法亦可应用于书法学习:学习者可将自己所写字形与范本对齐,通过计算比对找出差异。此外,类似的计算思路也可扩展至古代绘画的分析中。

彩陶花纹的溯源计算

我们的研究也关注史前彩陶纹饰,这些纹饰反映了文字出现之前不同部落文化之间的交流与关联。通过对彩陶纹饰进行量化分析,我们可以计算不同纹饰之间的相似性与差异性。传统上,这类研究依赖学者基于长期经验与知识积累所形成的主观判断;我们则尝试引入计算方法,通过度量纹样间的“距离”,将其按不同规则(如地域分布或形态相似性)进行排列与可视化。

在完成基于相似性的排序后,系统可针对某一特定纹饰推荐相似图案,再由研究人员进一步判定两者之间的文化联系。此项工作的意义在于:在缺乏文字记载与实物记录的情况下,纹饰的相似性可为推测彩陶的演化路径提供线索。计算机可以帮助用户建立不同部落彩陶纹饰之间的关联,我们得以从非文字的角度推断史前部落间可能存在的联姻、贸易、吞并等社会动态,进而窥见中华史前文明的发展脉络。及其计算的介入,可以大大提高效能。当然,目前这仅是初步探索,我们正致力于使该分析过程更具可解释性与可靠性。

我们在现有方法的基础上进行了简化,并增强了某些特征元素的提取与比对能力,以期借助计算工具更高效地完成纹饰分析工作。目前研究仍在进行中,未来将继续完善并汇报进展。此外,这些分析结果可被投影至二维平面,形成直观的可视化图谱,既可用于博物馆公众教育,也可作为开放协作的基础,吸引更多研究者与公众共同参与纹饰资料的整理与文化解读。

墓志的关联记录

我们再以古代墓志为例讨论其可计算问题。我们关注墓志的研究,是因为它们承载着重要的历史与社会信息。例如,辽宁省博物馆收藏了大量具有重要价值的北方墓志,西安碑林博物馆亦保存有众多墓志实物。然而,目前多数墓志在博物馆中的展陈形式仍较为传统,通常以悬挂于墙面或平铺于展柜中的静态方式呈现。我几天前刚刚到访辽宁省博物馆,尽管展厅条件良好,参观者却并不多。在场有观众表示,虽然墓志上文字密布,却因难以识读而无法深入理解。因此,我们希望尝试探索能否通过数字化的方式,使其“动”起来,增强其可读性与互动性。

我们首先尝试将这些墓志铭进行关联与整合,构建起一个互联的系统,既服务于学术研究,也可用于博物馆的新型展陈。具体而言,我们不仅聚焦于单方墓志,更注重将多方墓志联系起来进行综合分析。例如,在清河崔氏家族——这一历史上名人辈出的世家——的墓志群中,我们以图形化方式呈现家族谱系,并以深色标识存有墓志的成员。当点选其中某位人物时,系统不仅展示其墓志内容,还将关联其在墓志中提及的其他人物,形成关系网络。这实际上相当于为古代墓志构建起一种“超文本链接”。

在此基础上,可进一步实现动态化展示。通过结合家谱资料与墓志文本,系统能够揭示不同墓志之间的关联,并支持用户逐层查看具体内容。同样在数字空间可以提供更为清晰的墓志录文与释读,置于原始拓片图像之前,以便对照。此外,系统还可集成更多分析功能,例如人物关系挖掘、文字词频统计等,从而为历史学者提供支持,推动墓志文献的深入利用与研究。

报刊头版颜色的分析

此外,我们还可以从单纯颜色的维度展开分析。通过对大量报刊的考察——此处以《人民日报》为例,我们将《人民日报》自1946年5月创刊至今约80年间数万份头版颜色进行提取与整合,形成一套完整的色彩集合。从整体演变来看,头版颜色结构蕴含着丰富的历史与编辑规律。

总体来看,很明显可见近年来头版已转为全彩印刷——实际上自2014年起,《人民日报》实现常态化全彩出版,而在此之前,红色通常仅用于元旦、五一、七一、十一等重要节庆日的版面渲染。这一变化不仅体现了印刷技术的发展,也反映出媒体视觉表达方式的变迁。而在六七十年代在报纸大部分为黑白的情况下,对应重要颜色红色的出现也往往代表了当时的社会政治状态。

我们由此构建了一个基于颜色维度的交互入口:用户可通过点击相应色块,直接定位并查看具体日期的报纸版面。若无此类结构化入口,普通读者很难从长达80年、每日一版的庞大体量中快速定位目标内容。该入口不仅直观展示头版颜色随时间的分布与变化,也为公众接触历史报刊提供了一种轻量而引人入胜的路径。读者可借此逐步深入,发现更多有趣的信息层面。

对研究者而言,这一视角可为版面研究提供辅助;对大众而言,它则是一种生动的内容导览,能够在引发兴趣的同时,传递相关知识,推动报刊这类重要文化资产在数字时代的理解与利用。

结论

最后呼应今天大会的主题:我们致力研究提供基础性的构建材料,通过智能AI与人文的结合(AI4Humanities),面向公众及产业推动文化计算,提供相应的算法支持与发展可能。为此,我们正与学术界共同推进此项工作——高主任亦是人文智能分会的共同发起人之一。我们旨在吸引更多人工智能和人文文化的学者、业者加入,共同促进研究与人文领域的深度融合。我们希望通过这一途径共同构筑文化计算的大厦。即便每人只添一块砖、一片瓦,亦具有重要价值。

文章来源:伏羲云

转载本网文章请注明出处

版权所有©北京大学大数据分析与应用技术国家工程实验室 京ICP备05065075号-1 京公网安备 110402430047 号