网站首页 > 经济数据> 文章内容

东京审判70周年|全球首个可全文检索的相关文献数据库上线

※发布时间:2019-5-23 13:22:08   ※发布作者:habao   ※出自何处: 

  历史上著名的“东京审判”于1946年5月3日开始进行,历时两年半,共开庭818次,受理在4300件以上,长达1213页。审判结束后,中国代表曾带回两箱档案文件,但这些档案在中国多已散失。

  也因此,有关东京审判的文献资料弥足珍贵。今年5月3日是远东国际军事法庭开庭70周年纪念日。上海交通大学出版社在今年上线了“东京审判文献数据库”,这是全球首个可进行庭审记录全文检索的东京审判文献资源数据库。澎湃新闻了解到,该数据库一期内容资源约6000万字,其中英文版《远东国际军事法庭庭审记录》近5万页;日文版《远东国际军事法庭文献》有3万余页;庭审现场、人物等照片约700幅;视频资料50分钟。

  打开,澎湃新闻发现数据库首页设有人物、年表、庭审记录、、研究做梦梦见掉头发资料、影像资料等子栏目,而人物一块又可以细分为、检察官、战犯、证人、律师五个部分。

  以战犯中的东条英机为例,通过全文检索“东条英机”或者“Tojo Hideki”(东条英文名)后,会出现涉及这一头号战犯的人物信息、庭审记录、图片、音视频资料,以及相关研究论文索引目录等。进入“东条英机”的人物页面后,会显示相关的所有信息。

  值得一提的还有年表部分,数据库将东京审判分为准备、检方主张立证、辩方反驳、审理、判决五个阶段。每个阶段里,凡有庭审记录的日子都有当审的内容摘要。比如在1946年6月4日,“检方主张立证 前提的立证 第一次审理开始,首席检察官季南代表检方进行开场陈述。”

  上海交通大学出版社数字出版事业部介绍说,这样有利于学者按时间查找东京审判文献资料,也利于的知识普及。上述部分所有网民都可浏览。

  如果要详细浏览庭审记录,则需要拥有登录数据库的权限。澎湃新闻登录发现,详细的庭审记录可实现PDF(图片)浏览,也可实现XML(文本)浏览。换言之,该数据库并不仅仅把庭审记录的纸质版扫描到库里,还对每一页的记录进行了文本数字化处理,使得对全部的庭审记录都可进行搜索,复制和添加批注等操作。

  “我们还开发了混合浏览模式,即PDF(图片)和文本对照阅读。后者方便阅读与复制,而前者方便与原件校验。”上海交通大学出版社副社长德宝如是说。

  他告诉澎湃新闻,东京审判文献数据库最强大的功能在于可全文检索,数据库提供了一个统一的检索入口以方便用户查询到全部的相关信息。澎湃新闻发现库中有关“溥仪”的庭审记录有250多条,有关“Nanking”(南京的英文旧译)的庭审记录有200多条,关于“南京大”(“atrocities in Nanking”,“the rape of Nanking”,“Nanking incident”)也屡屡在庭审记录中被提及。

  有意思的是,技术人员还会对庭审记录里出现的“一人多名”进行标识。比如“Emperor”或“Henry”也是指溥仪,“CHIANG Kai-Shek”、“CHIANG Chih-Shih”则都指代蒋介石。

  澎湃新闻发现,数据库目前已经实现了不同语种间的对照阅读系统功能,用户可以在同一界面方便地对照查看不同语言的庭审记录版本。德宝说:“通过呈现庭审记录的不同语言版本,研究者可以开展比较研究,如不同语言描述是否有差异。”

  对于东京审判文献数据库,上海交通大学东京审判研究中心研究员赵玉蕙说:“我要是使用者,就希望数据库能提供几部资料集成的全文检索。”

  目前,全球有关东京审判的文献除美国国家档案馆之外,各自散落藏于美国、英国、法国、、、荷兰、印度及日本等图书馆以及研究机构。很长时间里,国内除了东京审判和中国梅汝璈尚未完成的个人著述,没有其他有关东京审判的正式出版文献。

  直到2014年,国内陆续有“大部头”文献资料诞生:80卷英文版《远东国际军事法庭庭审记录》及《索引、附录》,50卷日文版《远东国际军事法庭文献集成》及《索引、附录》,还有上个月刚举办首发式的12卷《远东国际军事法庭庭审记录·中国部分》。

  在上海交通大学东京审判研究中心主任程兆奇看来,东京审判这样重要的资料不仅要保留在象牙塔里面,而且应该让更多人去了解,让东京审判研究这件事做得更深刻、更扎实。他告诉澎湃新闻:“数据库是一个工具,为人们了解东京审判提供更多方便。”

  德宝也告诉澎湃新闻,出版社下一阶段将对日文版《远东国际军事法庭东京审判庭审记录》、《国际检察局讯问记录》等资料分别进行数字化和标引,《远东国际军事法庭庭审记录·中国部分》也在做标引,约6000分钟东京审判视频已完成档案的查找统计工作,现已委托相关公司从国外采购,未来数据库的内容会更加完善。

  德宝还表示,目前已有南京市图书馆、中国人民大学图书馆等机构在试用数据库,但他也坦言,出版社一直“纠结”如何兼顾数据库的社会效益与经济效益。“目前不是所有内容都免费。但我们希望有足够的资金支持来实现今后的内容添加与,有朝一日可实现完全。”

   文章来源于弘易国际