课题组以“海外藏中国民俗资源数据库的数据录入操作”为主要议题,召开了网络视频会议。
发布时间:2020-06-06 阅读:2246次

202066,国家社科基金重大项目“海外藏珍稀中国民俗文献与文物资料整理、研究暨数据库建设”(项目编号:16ZDA163)召开了专题线上会议。

此次会议以网络视频形式举行,以“海外藏中国民俗资源数据库的数据录入操作”为主要议题,来自中山大学的王霄冰教授、中国海洋大学的李扬教授、北京中研世纪科技有限公司的李刚总工程师、湖南工业大学青年教师阮将军、信阳师范学院青年教师周波,以及来自中山大学、中国海洋大学、北京社会科学院的硕士生与博士生等近20人参加了此次会议。国立日本民俗博物馆松尾恒一教授虽未能出席会议,但是为此次会议内容提供了宝贵的书面建议。会议主要包括以下内容:

一、新版数据采集表展示

首席专家王霄冰教授向大家展示了“海外藏民俗资源数据采集表”与“海外藏民俗资源网分类表”,详细解释了表格各项条目的含义与注意事项,与会者对数据库的数据录入规则与操作方法加深了了解。两份表格都是中英双语形式,“海外藏民俗资源数据采集表”包括资源标识及分类、基本属性、知识产权属性、形式属性、扩展属性五大部分;“海外藏民俗资源网分类表”包括文本类、图画类、实物类、音像类、研究资料类五大部分。王霄冰教授结合之前录入工作中出现的问题,与参会者共同探讨了数据采集的一些细节。讨论主要集中在以下几个方面:

1.资源标识及分类。(1)标识符/序号。数据采用统一的编号方式,即项目类型符号+国别+馆藏机构缩写+序号,负责同一项目的不同录入者应注意编号的统一衔接。(2)分类属性。表格分为三级分类,其中二级分类目前有27大项,王霄冰教授指出二级分类的数量可扩充。

2.基本属性。(1)题名。录入者应明确区分内题名、外题名、认定题名,并注明认定依据与内外题名所使用的语言。(2)描述。描述分为内容描述与形式描述,描述语言应简单明了,如果录入者对该项目有深入研究可详细补充。(3)来源。典藏号采用馆藏机构的原始编号,需要写出馆藏机构的基本信息。(4)覆盖范围。需要特别注意各个时代的行政区域划分差异,明确区分原生区域与现在的行政区域。

3.知识产权属性。知识产权归属不清楚时,应注明不详/Unknown

4.形式属性。部分项目有多张代表图,为了便于技术人员导入,数据录入者应对每张代表图都进行命名、编号。

5.扩展属性。录入者可以在扩展属性中补充每类资料的特殊属性。

6.表格条目的中英文翻译。松尾恒一教授在会前对表格条目的英文翻译提出了修改意见,王霄冰教授根据松尾恒一教授的意见逐条与大家进行了讨论并确定了最终译名。例如题名,根据中国文献学的分类方式,数据采集表的题名分为内题名、外题名、认定题名,为方便理解,意译为Original TitleGiven TitleAssigned Title

7.国家缩写与收藏机构缩写。王霄冰教授提醒大家注意收藏机构的缩写问题,收藏机构的缩写应该根据收藏机构的原语言名称,例如奥地利国家图书馆 Austrian National Library,原文Österreichische Nationalbibliothek,缩写为ONB

8.分类译名和类型编号。目前课题组仅提供了一级和二级分类项目的英文翻译及其缩写。王霄冰教授建议数据录入者可以尝试进行三级分类,尤其对于一些没有标准分类的藏品项目,录入者提出的分类方式极有可能成为新的理论贡献。

新版数据采集表包括中英文两张表格。李刚总工程师建议录入者同时录入中英文版本的数据,并在录入完成后将中英文版本独立保存提交。

二、数据录入经验分享

目前已经开展录入工作的课题组成员,就自己的项目数据录入情况进行了分享交流。

1.林海聪介绍了图片类-老照片的录入情况。林海聪指出有时照片收集者不能准确理解照片中的民俗含义,因此他的认定题名采用了自拟题名,在自拟题名中补充了民俗行为的确切含义。林海聪认为照片的内容可以根据时间、地点、人物、事件和器物进行一般性描述。林海聪特别提出了关联文件的填写问题:关联文件应怎样填写?关联关系应如何呈现?王霄冰教授建议以列表的形式,直接关联本数据库的数据编号,在展示页面的下方把所有相关的资料图片都显现出来。林海聪还提出,照片的年代应细分为照片的拍摄年代、洗印年代和出版发行年代,还应注意区分照片的拍摄者与持有者是否为同一人。

2.周波介绍了文本类-宝卷的录入情况。周波以《无极金母五更家书》为例,将该宝卷纳入文本类-宝卷-教派宝卷三个级别的分类中。在出版者填写方面,周波提出一个疑问,即是否应将初版的信息填入,王霄冰教授认为只需注明此本的出版者即可,其他信息可在“扩展属性”中注明。此外,周波认为,宝卷的其他译名、相似版本应在扩展属性一栏中详细注明。

3.崔若男介绍了研究资料类-民俗志/民族志的录入情况,与会专家给出了建议。王霄冰教授建议以图书的封面和封底作为出版图书的代表性图片。出版图书的原生区域难以确定时,应以文字描述形式说明图书内容所涵盖的大致区域范围。李扬教授进一步指出出版图书的原生区域应依据图书内容而不是出版地。崔若男建议收录劳弗(Berthold Laufer1874-193420世纪初期在中国收集的民族、民俗文物的数据。(访问地址:http://anthro.amnh.org/laufer-collection)。

4.王玉冰介绍了实物类-人物雕像的录入情况。王玉冰提出有关收藏日期的问题,当藏品持有者采集日期与藏品进入博物馆的日期不一致时,应当以哪一个日期作为收藏日期?对此,王霄冰教授建议在表格中增加采集日期一栏。

5.朱家钰介绍了图画类-外销画的录入情况。朱家钰以法国拉罗谢尔历史与艺术博物馆的一册外销画为例,将外销画纳入图像-外销画两个级别的分类中。在之前的录入工作中,通常按照画面内容拟定三级分类,由于这套画册内容杂乱,因此未填写三级分类,之后也会考虑是否需要根据材质或主题拟定三级分类。朱家钰认为此套画册的认定题名应为外题名+每张画的画面内容。由于博物馆并未对该套画册的每一幅画都进行数字化,只能查阅到3幅画的典藏号,经过大家商议之后决定在典藏号一栏只填写整个画册的典藏号,不再详细地录入每张画的典藏号。最后,朱家钰建议在关联文件一栏填入本套画册中的其他所有画的序号。

6.王艺璇介绍了文本类-契约文书的录入情况。王艺璇根据契约的文本内容、印章内容确认了契约文书的原生区域。有些家族契约文书的数量很多,王艺璇认为这些文书都可作为关联文件列出。王艺璇拓展属性中特别指明了立契人、对应人和中人,若文书中有说明三者的身份也会在表格中注明。针对契约文书所使用的语言与馆藏机构所使用的语言不一致的情况,王霄冰教授认为语言应填写的是资本身所使用的语言,因此建议将语言一栏移动到描述一栏之下。王艺璇进一步给出建议,系统中的语言选项应由单一语言选择变为多语言选择。

三、与会者交流讨论

博物馆专业出身李春晓分享自身在博物馆实习的经验结合大家的介绍给出了诸多建议。她也针对表格中的一些英文译名给出了参考意见李春晓提到博物馆的藏品只是部分对外展示,对于非公开展示的藏品官网上不会提供详细的资料王霄冰教授认为可以根据相关出版物、向博物馆咨询等方式完善数据资料。李春晓还提出不同类型的藏品差异较大,有些藏品可能不适用于数据采集表的一些条目,对此,王霄冰教授鼓励录入者根据自己负责项目的特征摸索新的整理方法,制作专门的数据采集表。李扬教授也做出了补充,认为录入者可以先完成通用数据采集表的信息,对于不适用的部分填入不详,在此基础上录入者可以扩展一些栏目。

此外,李春晓认为可以将录入者在工作过程中的研究成果、心得在数据库中呈现出来,建议在表格中增加录入者备注一栏,既可以给日后的录入者提供参考经验,也可以使数据库更富有学术意义。最后,李春晓提出可以不在表格中将年份细分为收藏日期、发布日期等多栏目,而是只列出年份一栏,再用括号的方式填入所标注的是采集、收藏还是发布日期。

通过与会者的分享交流,数据库数据录入过程中出现的问题得到了有效的归纳,录入者的心得体会对于后续的数据录入工作开展具有重要的参考价值与指导意义。最后,课题组成员汇报了各类别待录入数据的数量,并统一安排了下一阶段工作的分工。

研讨会的尾声,李扬教授做了总结发言,肯定了疫情期间召开此次视频会议的意义,也表示期待疫情结束后与大家在青岛进行面对面的交流