为查阅古籍文献,要出差到各地,探访各家图书馆——这是许多古籍研究者的共同记忆。在数字时代,这种情况正发生改变。国家图书馆(国家古籍保护中心)等6家单位近日在线新增发布古籍数字资源6786部(件)。至此,全国已累计在线发布古籍数字资源13万部(件)。依托数字化手段,卷帙浩繁的古籍走出“深闺高阁”,让文明触手可及。
兼顾“藏”与“用”
(资料图片仅供参考)
古籍,作为文物必须保护,作为文献必须为读者所用。兼顾“藏”与“用”,一直是古籍保护工作的重点,而数字化是最好的方法。中国古籍数字化起步于20世纪90年代。随着数字技术不断成熟,科技赋能古籍工作取得可喜进展。
“2016年国家图书馆搭建起‘中华古籍资源库’平台,发布了普通古籍、甲骨、敦煌文献等数字资源,并全部实现免登录在线阅览。”国家图书馆副研究员南江涛介绍,国家图书馆还联合海内外收藏机构发布“法藏敦煌遗书”“天津图书馆古籍”“云南省图书馆古籍”等,基本搭建“国家古籍数字平台”架构。
随着“中华古籍保护计划”深入开展,各地图书馆陆续投入人力物力,大力推进古籍数字化。国家图书馆先后联合39家单位发布数字古籍,1月4日是第7次联合发布,其中不仅包含明清版刻,还有碑帖拓本等特色资源。相关数据显示,在现有的13万部(件)数字古籍中,超过10.2万部(件)归属于“中华古籍资源库”。
“这13万部(件)古籍数字资源,对于我们研究者来说格外珍贵。”北京大学中文系教授杨海峥感叹,在线查阅免去了往返奔波图书馆的时间,平衡了古籍的文物性与文献性。
AI助力古籍整理
把纸质古籍转化成数字文本,只是古籍保护的第一步。“现有的数字古籍大多由缩微胶片转换而成,分辨率低,使用也不方便。”杨海峥举例解释,这类古籍通常不具备检索功能,想查阅某个内容,需逐篇逐页阅读原文,很难快速找到想要的知识。
人工智能的快速发展,为数字古籍的整理分类带来革命性变化。2022年10月,由字节跳动与北京大学数字人文研究中心合作研发的数字古籍平台“识典古籍”便是一个生动案例。
进入“识典古籍”的网站,记者看到《周易》《左传》《礼记》等陈列于首页上。随机点开一本,左侧为章节目录,右侧为正文,排版形式既顺应现代人的阅读习惯,又还原了古籍纸张的阅读美感。
“与一些数字化平台不同,‘识典古籍’是完全免费的,而且增加了简繁体转换、底本影像对照、全文检索等一系列便捷功能。”抖音集团企业社会责任部产品总经理唐垲鑫介绍,该平台主要应用了文字识别、自动标点和命名实体识别这3种技术,不仅能将影印本上的文字提取整理,还能通过序列标注识别文本中的人名、地名等信息,准确率达到96%至97%。
“平台已整理上线了685部经典古籍,共计7900多万字,主要来自《四部丛刊》。”唐垲鑫说,“识典古籍”已上线手机移动版,未来平台中的书目将持续更新。
业内人士预测,随着AI技术的运用,古籍文献中所蕴藏的古代历史文化知识将不断被抽取,构造成各种各样的知识库,并将以知识图谱的形式支持互联网前端应用。
跨界合作成趋势
事实上,在“识典古籍”上线之前,文保机构、科研院校与互联网公司的跨界合作已越来越普遍。比如,腾讯联合敦煌研究院开发了AI病害识别技术,帮助“问诊”敦煌千年壁画。
由于在产品研发、设计方面存在优势,互联网公司等社会力量的加入会进一步保障古籍数字化平台的服务质量。“我们有优秀的产品经理、设计师、软件工程师,能够不断优化数字古籍平台的产品功能。”唐垲鑫说。
“识典古籍”的诞生离不开专家学者支持。北京大学数字人文研究中心主任王军表示,北大在这次合作中负责人工审核与校对,弥补人工智能有识别错误率的短板,并利用自有学术平台,连接更多专业研究者和学生群体。
专家认为,在古籍整理中,人文社科学者要积极介入,并加强与技术人员的合作,那样才能更好地利用机器而不是被机器牵着鼻子走,从而保证结果的准确性。
“高校古典文献学等相关专业如何培养兼具技术与学术能力的复合型人才、如何形成多学科交叉的课程体系等,都是需要综合考虑的问题。”王军说。
标签:最近更新
- 天天热资讯!数字化助古籍走出“深闺高阁”2023-01-31
- 全球互联网能像《流浪地球2》那样关闭或重启吗?专家为你解答所有疑惑|世界新要闻2023-01-31
- 当前观点:26层高楼养猪科技感十足2023-01-31
- 天天快讯:科学论证改写关键剧情 科研国家队为《流浪地球2》注入“硬核”2023-01-31
- 汽车安全气囊多少钱?汽车安全气囊是什么气体?2023-01-31
- 玛驰油耗是多少?玛驰是哪个国家的品牌?2023-01-31
- 电动汽车充电费用是什么?电动汽车是手动挡还是自动挡?2023-01-31
- 进口跑车有哪些?进口跑车是什么意思?2023-01-31
- 二手车置换补贴是什么?二手车置换补贴多久能下来?2023-01-31
- 【全球新要闻】大裁员一来,美国技术企业多年“人设”塌了2023-01-31
- 会员也分三六九等?影视平台“套娃”式收费自欺欺人-世界百事通2023-01-31
- 热议:中科院金属所研发新型仿生金属陶瓷2023-01-31
- 世界即时:首台自主研制F级50兆瓦重型燃气轮机攻关之路2023-01-31
- 在固态体系首次实现高保真度量子受控非门2023-01-31
- 板凳龙闹初九_当前通讯2023-01-31
- ST中嘉:预计2022年度净利润亏损5000万元~7500万元 焦点要闻2023-01-30
- 三六零:预计2022年亏损24.8亿元 同比扭盈为亏-世界新要闻2023-01-30
- 每日速递:恒生指数收盘大跌近3% 南向资金净流出69.04亿港元2023-01-30
- 3D机器视觉企业图漾科技宣布完成C轮融资-全球关注2023-01-30
- 甘南01月30日13时疫情有多少例 _昨日新增0例本土确诊病例、0例本土无症状感染者|每日热议2023-01-30
- 看星星难了!人造卫星猛增,“满船清梦压星河”光景正逐渐消逝2023-01-30
- 我国成为世界上第三个具备量子计算机整机交付能力的国家2023-01-30
- 荣耀Magic 5 Lite曝光:后置相机模组似曾相识 环球焦点2023-01-30
- 苹果iPhone车祸检测功能误报不断 导致救援部门负担增加-每日热闻2023-01-30
- 智能建造时代来临建筑业升级迎机遇2023-01-30
- 【当前热闻】朱晓彤卸任特斯拉北京销售公司法人 仍任董事长2023-01-30
- AI写作火了!云从科技、科大讯飞、视觉中国纷纷涨停!人类会被取代吗?2023-01-30
- 让旗舰体验全面普及 一加Ace 2定档2月7日发布2023-01-30
- 科思创聚碳酸酯助力打造安全可靠储能系统2023-01-30
- 母亲为救两个落水的孩子不幸遇难,家属:她救子心切,但不会游泳2023-01-30