登陆注册
24583300000055

第55章 以信息反馈促进高校档案收集

周洁纯 王会波

档案收集工作是档案工作流程的重要环节,也是基础性工作,但同时也是最具难度的环节,如何做好高校档案的收集工作,是高校档案工作人员面临的重大课题。

随着《高等学校档案管理办法》(教育部第27号令)的颁布,高校档案工作面临着新的挑战和机遇,高校档案机构应以此为契机,提高和完善档案收集这一基础工作。为此,笔者结合自身工作体会,针对目前高校档案收集工作中存在的问题,提出通过各种技术手段挖掘馆藏数据信息,将信息反馈给数据来源部门,以提高各归档部门移交积极性的设想,欢迎严肃的批评和探讨。

一、面临的现状

《中华人民共和国档案法》明确规定:“……对国家规定的应当立卷归档的材料,必须按照规定,定期向本单位档案机构或者档案工作人员移交,集中管理,任何个人不得据为己有。”《高校档案管理办法》规定:“高等学校中的个人对其从事教学、科研、管理等职务活动中所形成的各种载体形式的档案材料,应当按照规定及时归档,任何个人不得据为己有。”但是,在实际工作中,各部门的兼职档案员,尤其是一些职能部门的工作人员,档案意识比较薄弱,对档案的收集与归档工作不够重视,对档案的移交不及时不完整,重要资料私自留存在各个部门的文件柜中,造成了高校档案收集难的局面,对馆藏的完整性造成了重大影响,也不利于档案机构开发、档案信息资源为学校教学、科研、管理等工作提供服务。

奈斯比特曾说过:“我们淹没在信息之中,但仍处于知识的饥渴中。”所以如何从海量的信息中提取所需要的知识,一直是档案界思考的重点,这在高校档案工作中也同样存在。从笔者所在高校来看,自九十年代末起,已经开始将计算机技术应用到高校档案管理工作之中,每年都有大量案卷级、文件级条目进入计算机管理系统之中,同时也对90年代以前的馆藏档案的案卷级、文件级目录信息进行了补录,由此在后台数据库中已经积累了海量数据信息。但是,这些数据的利用率却比较低,因为真正能够直接利用的、使用价值高的数据信息并不多,而又缺乏从海量的数据信息中对有价值知识进行的深入挖掘。

二、解决思路

以上两种现象在高校档案工作中较为普遍,二者看似并无关联,但在笔者看来这两个问题应该综合看待。档案收集工作之所以难以顺利开展,重要的原因之一便是各立卷部门从馆藏档案中所能直接利用的信息不够丰富和快捷,在他们看来,档案机构单纯是一个档案实体的保管机构,移交给档案部门不如放在身边利用方便。对此,档案部门应当对各部门收集的档案进行二次开发,重新进行资源整合,实现信息资源增值,并将增值信息反馈给数据来源部门,使其获取的资源价值远远大于将资源存放在本部门内部的价值。这样,一方面能使馆藏数据信息得到充分利用,提高档案馆的服务效益,另一方面也能提高各立卷部门移交档案的积极性,从而缓解档案收集难的状况。

三、解决方案

如何对档案信息资源进行发掘,为各立卷部门提供高质量的反馈信息,应当成为档案工作的重点之一。对此,笔者提出以下几条见解。

(一)档案信息整合

在对档案的利用检索过程中,我们发现不同部门的数据库中在拥有个性数据信息的同时,也存在大量的重复信息。信息的分散和冗余不仅不符合馆藏的科学性要求,还极大地影响了检索的效率。笔者认为对这些信息进行整合不失为解决的好办法。举例来说,学生从入学到毕业期间,招生办公室会移交高考录取相关信息数据库,学工处会移交学生的入学基本信息库表,教务处会移交学生在校期间的成绩记录,组织部会移交学生的入党情况记录,学生所在院系会移交其奖惩记载,毕办会移交毕业去向情况,等等,每一个数据表中,都会有类似学号、姓名、性别、院系、专业等相同的字段,我们可以利用学号这个关键码对所有的这些相关数据表进行一次自然联接,去除相同字段,生成一张新的数据库表存储,在该表中包括那些所移交数据的全部信息,即从学生的入学到毕业的完整信息,这样便会大大提高检索效率,为利用工作提供良好的支持。同时,将整合后的数据信息反馈给相应部门,能在部门之间实现信息资源共享。

(二)建立专题数据库

在档案利用过程中,经常会出现这样的现象:有些信息仅通过文件级目录的检索很难查询,有些要同时查阅不同实体大类中多份文件。针对这类情况,可以根据用户需求建立专题数据库。例如从干部任免档案中查询某人任某职的起、止时间,这往往很难通过在正题名字段中输入姓名而查找出,因为同一份文件往往包含了对多位同志的任免信息,文件正题名类似于《关于XX等同志职务任免的通知》,其中既不包含所有人的姓名,也没有对应的任或免的具体职位信息,这样很难通过计算机进行文件级目录检索来查找到相关人员任免情况。鉴于此,档案部门可以对每年所任免的干部进行统计,建立一张数据表,表中设置年度、姓名、所任(免)职务、任(免)时间、任职文件编号等字段,并将文件内容中涉及到的人员信息逐一录入,形成专题数据库,以此提高此类档案的查询效率。诸如此类的专题数据库可以有很多,需要档案工作者在平时工作中根据利用者的需求进行收集、整理。

(三)数据统计

数据统计是对数据进行初步研究,以便更好地理解它的特殊性质,一般包括汇总统计、可视和联机分析处理(OLAP)。汇总统计(如值集合的均值和标准差)和可视化技术(如直方图和散布图)是广泛用于数据探索的标准方法,OLAP是一种新近开发的包含一系列考察多维数组数据的技术。这三种技术中,汇总统计是档案数据管理中最常见的统计形式,它用单个数或数的小集合捕获可能很大的值集的各种特征。比如,根据每年的招生信息,如考生来源地,考生高考成绩,报考专业等信息,可以根据需要统计出每个地区的录取比例,各分数段的情况,各地区报考专业的分布情况等等,还可以结合几年的信息进行纵向和横向统计。这些统计情况表可以是数据表格也可以制作成图表,反馈给党校办或招生部门,可以对此后的招生计划起到一定的指导作用。

(四)数据挖掘

基于人工智能的数据挖掘技术是一种能够从海量的数据中提取有价值知识和信息的技术,它通过对查询内容进行模式的总结和内在规律的搜索,帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为,从而为决策行为提供有利的支持。其功能主要有:1.关联分析。它主要用于发现隐藏在大型数据集中的令人感兴趣的联系。2.聚类。它将数据分成有意义或有用的组(簇),能增强人们对客观现实的认识。3.自动预测趋势和行为。它自动在大型数据中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。

在档案管理系统中应用数据挖掘技术有着较大意义:1.辅助编研选题。利用档案管理系统中的用户日志对借阅数据进行分析统计,了解到档案利用者的兴趣爱好,研究方向,预测用户需求,从而确定档案编研的选题;2.预测用户需求。通过对近几年某段时期内档案利用数量与档案利用者人数数据进行挖掘后发现,某个时期某种档案利用率相当高,可以较准确地预测用户的利用需求;3.节约数字化成本。通过对某类档案进行数据挖掘,发现某些档案几乎只有几种类型的文件经常利用,针对结果可以在安排档案扫描数字化工作时,要求扫描人员只扫描每一卷中的这几份档案而不是将全卷档案都扫描,这样大大减少了扫描人员的工作量,而且也使单位节省了扫描仪、计算机等设备的开销,降低档案数字化成本。此外,还可以在档案安全性、档案馆藏结构等诸多方面进行数据的挖掘和统计分析,对档案的鉴定、保护等有一定的指导作用。通过数据挖掘技术的运用,可以发掘档案所蕴藏的信息资源,进而为领导决策和各部门的工作提供信息支持。

对于高校档案工作来说,应当以利用工作为重点,为学校的各项决策和建设提供支持,这要求档案机构做好各项基础工作,尤其是档案收集工作。面对高校档案收集难的现状,笔者认为,从利用的角度,以信息反馈促进档案收集值得档案工作者去尝试。

参考文献

1.黄静。关于高校档案收集与归档工作的探讨[J]。黑龙江史志,2009(9)

2.秦慧,陈研希。注意挖掘档案用户的潜在需求[J]。兰台世界,2009(3上半月)

3.王立萍。利用数据挖掘技术做好档案编研选题[J]。北京档案,2008(11)

4.宇然。数据挖掘技术与档案管理[J]。兰台世界,2002(8)

5.(美)Pang—Ning Tan,(美)Michael Steinbach,(美)Vipin Kumar著。范明,范宏建等译。数据挖掘导论(Introduction to Data Mining)[M]。北京人民邮电出版社,2006.

6.仇壮丽,李雪莲。知识挖掘在档案管理中的应用[J]。兰台世界,2005(7)

同类推荐
  • 《中华人民共和国史稿》出版后的思考

    《中华人民共和国史稿》出版后的思考

    本书收录了《<中华人民共和国史稿>对推进哲学社会科学创新工程的启示作用》、《更好地用党史国史教育全党和人民》、《二十年风雨写春秋》、《从苏联向资本主义演变的教训看国史研究》等文章。
  • 近代以来日本的中国观第三卷(1840-1895)

    近代以来日本的中国观第三卷(1840-1895)

    从1945年日本战败到1972年中日邦交正常化的27年间,中日两国处于无邦交的敌对状态,随着冷战的开始和两大阵营的对立,分属于两大阵营的中国和日本,长期处于“既近又远”的隔绝对立状态。本书对如何把握这一时期的日本对华观,以及如何客观公正地评价日本的“对华行动选择”,作了系统的梳理。
  • 教师的28个怎么办-教师如何写案例、反思和论文

    教师的28个怎么办-教师如何写案例、反思和论文

    反思,一般是指行为主体。它立足于自我以外批判地考察自己的行为及其情境的能力。何谓“教育反思”?概而言之,教育反思,即教师自觉地以自己的教育实践为思考对象,对自己所做出的行动、决策以及由此产生的结果进行审视、分析和总结
  • 高中生心理健康教育读本

    高中生心理健康教育读本

    由于心理现象极其复杂,每个人的情况又千差万别,所以,我们不能像测量血压或体温那样画出一个心理健康与否的明确界限。
  • 欧美公共广播电视危机与变迁研究

    欧美公共广播电视危机与变迁研究

    公共广播电视制度自80多年前在英国问世以来,深受各国政界、学界和公众的关注。与私营商业广播电视相比,公共广播电视具有抵御不良政治和商业势为侵蚀、维护公民社会和公共领域的制度特点。本书以市场化背景下欧美公共广播电视的危机与变迁为研究命题,揭示了传播制度背后的政治经济思潮和权力影响,探索了公共广播电视与国家、市场和公民社会之间的互动关系,具有明显的创新性。
热门推荐
  • 双君缘

    双君缘

    前世,他负了她。两人的姻缘也终究是黄粱美梦醉一场。今生,她与他再次相认,性子却与前世大不相同。两人是否能解开两世悲剧与情结?
  • 萌妻豪宠1爱你痛入骨髓

    萌妻豪宠1爱你痛入骨髓

    一天,祜凌宸在赶时间的情况下,司机一揉眼的时间,就撞到了醉酒的何诗羽。“少爷,现在怎么办”司机用着慌张的语气。“还能怎么办,送医院”祜凌宸用着不耐烦的语气,摸了摸手上的戒指,眼神暗了暗,没想到的是,从此以后,便为这个女人操碎了心…
  • 我本地上仙

    我本地上仙

    天外天,地上仙,吾愿逍遥人世间凑合字数没啥毛病吧
  • 贪恋红尘三千尺

    贪恋红尘三千尺

    本是青灯不归客,却因浊酒恋红尘。人有生老三千疾,唯有相思不可医。佛曰:缘来缘去,皆是天意;缘深缘浅,皆是宿命。她本是出家女,一心只想着远离凡尘逍遥自在。不曾想有朝一日唯一的一次下山随手救下一人竟是改变自己的一生。而她与他的相识,不过是为了印证,相识只是孽缘一场。
  • 挥墨成画

    挥墨成画

    父母为了墨墨的未来而送她去了京大上学,在哪里她遇到了很多事。她的过往在父母眼中是平淡的,可深知她的“同行”却不这么认为……
  • 把你养大我自己娶之秦少馨

    把你养大我自己娶之秦少馨

    如果你们觉得我跟异类相处,丢了你们的脸,那么从今以后,我就跟你们一刀两断,再无瓜葛,我秦少馨从今后无父无母无亲无故无牵无挂,只陪庆之一人,庆之与我生死由命,他生我随他生,他死我随他死,我与高秦两家恩断义绝,永不相见。
  • 进击的小仙军团

    进击的小仙军团

    一场史无前例的流星雨,竟是天庭万仙陨落,仙劫之后,传说中的三界第一封神榜重现都市,当牧歌得到它的时候,便背负起了重建天庭渡化万仙的重任。只是,让牧歌错愕的是,转世神仙为什么都是小屁孩啊!小土地、小河伯、小山神,三娃聚首,大山中的贫困山村因此腾飞!小二郎神、小托塔外加小哪吒,天庭铁三角,组队刷副本,妖魔鬼怪无压力!类似于这些转世神仙,尽管有时候他们会很坑,但牧歌还是挺喜欢的,然而……颜控小嫦娥、就知道使唤人的小玉帝诸如这类毫无卵用还拽的二八万似得小神仙,牧歌表示很心塞呐。PS;走过路过看过的书友,如果觉得本书还行,还请收藏一下推荐一下,谢谢。PS;群号494246117,欢迎。
  • 魔祖帝君

    魔祖帝君

    两个魔界大陆的少年,一个立志一统天下,一个立志魔道巅峰,当他们同拜一师时会碰撞出怎样的火花呢?
  • 在奈何桥打工的日子

    在奈何桥打工的日子

    可怜的凡人你好!我是你敬爱而又仰慕的孟婆,非常高兴你能够在茫茫宇宙,无穷小千世界之中脱颖而出,让我感受到你磅礴的执念。近年来轮回大世界之中汇聚了无数无法轮回的执灵,这给日理万机的孟婆我带来了极大的苦恼,于是本孟婆决定在凡人之中挑选一些助手。这是一份很有挑战性的工作,如果你接受邀请,孟婆我将派出最为得力的二位助手来迎接你的到来。如果你确认好了,他们将在3600秒之后准时出现。那么,幸运的凡人,期待帮你给我满意的答案?(如果你敢拒绝的话)
  • 朱八戒之开局得到房奴系统

    朱八戒之开局得到房奴系统

    我,朱八戒,先定个一个小目标拥有一万套房子!做房奴,就要做最大的房奴!想抓我,我有“乾坤大挪移”!想炸我,我有“绝对守护”!系统在手,天下我有!系统在手,天下任走!系统出品,必属精品!想强身,有健体丸!想留住青春,有驻颜丸!想恢复最美容颜,有回春丸!寿元耗尽?有延寿丸!缺胳膊少腿、各种不治之症?有生肌补脏丸!怎么卖?不卖!咱就要房子!用房子换!书友QQ群:764794128