文档管理的方法(精选11篇)
1.文档管理的方法 篇一
数学教学中培养学习兴趣的常用方法 甘肃省渭源县第一中学 曹平原
[关键词] 学习兴趣;培养;引发;激发;多媒体
[摘 要]
教育心理学认为,兴趣是学习的催化剂,是学生从事学习活动的内在动力,它能促使学生萌发出强烈的求知欲,从内心产生一种自我追求,推动他们积极探索,努力攀登,向着自己认定的目标奋进。著名的科学家爱因斯坦说:‚我认为,对于一切来说,只有‘热爱’才是最好的老师。‛可见,浓厚的兴趣能有效地诱发学生学习的积极性,促使其主动地探求知识,研究规律,把握方法,从而创造性地运用知识。因此,如何激发学生学习数学的兴趣,提高数学教学质量,从而变‚要我学‛为‚我要学‛,是摆在中学数学教师面前需要不断探索的一个重要课题。
本文通过对中学生进行交谈、沟通和互动的方法,研究了中学生数学学习与培养学习兴趣的关系,总结出以数学史、数学应用、数学语言艺术、数学解题技巧、多媒体辅助教学等方面,培养初中学生数学学习兴趣的主要策略。
学习兴趣是学生对学习内容、学习过程的一种喜爱和渴求情绪,是学生从事学习活动的内在动力。学习兴趣能促使学生从内心产生一种强烈的求知欲,从而推动他们积极探索、努力攀登,向着自己认定的目标奋勇前进。浓厚的学习兴趣能有效地诱发学生的学习积极性,促使其主动地探求知识,研究规律,把握方法,从而创造性地运用知识。对数学教材内容和数学思维方法的兴趣越浓厚,学生学习数学的积极性就保持得越长久。
数学教学实践表明,越是高度抽象苦燥无味的教材,越是需要教师以高超教学的艺术来激发学生的求知欲望,唤起学生的学习兴趣,以提高学习的积极性。学生对教材内容学习兴趣,与教学效果有着直接的影响。
那么,现代中学生对他们的必修课——数学的学习兴趣又如何呢?就这个问题,我们对本校3800多名学生,进行一了次关于中学生数学学习兴趣的抽样调查。调查结果如下表:
010放弃对数学的学习兴趣厌烦不得不学一般很感兴趣203040
选取此项的人占的百分比从表中看出,数学是有一定吸引力的,而且有22%的学生非常喜欢数学,有28%的学生学习兴趣一般。这两类学生学习数学的积极较高,学习数学较为主动,而且学习成绩通常处于中上水平;不得不学的学生占38%,厌学的学生占10%,还有2%厌的学生放弃了数学。不得不学数学、厌烦数学和放弃数学的学生人数占了50%,这些学生对数学不感兴趣,认为数学枯燥无味、难学、没意思。对数学不感兴趣的学生,学习非常被动,学习成绩往往较低。
虽然,学生的数学基础较差的因原是多方面的因素造成的,但是,从上面的调查表中可以看出,学生对数学不感兴趣是一个主要因素。
《数学教学大纲》中明确指出:“学生学习数学的积极性,是学好数学的重要前提。”《教学论》中认为:“调动学生学习积极性是教师的重要责任。作为一名教师,在教学中应该怎样培养学生对数学的学习兴趣呢?我们必须搞清楚那些不良因素影响了学生对数学的学习兴趣?针这一问题,我们也做了相应抽样调查。调查的统计结果如下;
010那些不良因素影响了学习兴趣家庭生活的挫折数学内容抽象教学方法单调老师的讽刺挖苦考试成绩失败203040选取此项的人占的百分比由调查统计表看出,影响学生对数学的学习兴趣的最主要的不良因素,是考试成绩的失败和教学方法的单调;教师的对学生的讽刺挖苦和教学内容的抽象也是不可忽视的不良因素。这个调查结果提醒我们,在教学过程中,教师一定要对学生多鼓励、多表扬,千万不要对学生进行讽刺挖苦,在批评教育学生时,要特别注意学生的思想情绪和接受能力。
培养学生的学习兴趣,对教学来说是非常重要的。学生有了较高的学习兴趣,学习就不再是枯燥的事情,学习效率就会提高。有句话说“兴趣和爱好是最好的老师”,说得也正是这个道理。那么,怎样才能培养学习兴趣呢?要真正培养学生对数学的学习兴趣,调动学生学习数学的积极性,就应该从学生的学习态度和教师的教学方法两个方面入手。因为学生的学习态度是内因,教师的教学方法,外因通过内因而起作用。
一、明确学习目标,坚定学习信念,端正学习态度是培养学生学习兴趣的关键因素。
首先,要让学生明确学习目标,要加强学生对数学学科本身意义的了解和认识。在心理学上称之为“目标动机理论”。也就是让学生明白学习这门学科最终有什么意义。比如说有的同学在学习数学时,认识不到学习数学的意义,就简单地认为,学习数学就是为了计算,那么高中阶段的代数、几何对我们又有什么意义呢?如果老师是能够及时地告诉学生,数学在自然科学中的重要地位。在教学中向学生介绍数学在科学、生产和生活中广泛应用的实例。通过这些实例使学生认识到数学的应用不仅在数学本身理论的发展上,而且广泛地应用于其他自然科学之中,如,物理、化学、生物、医学、计算机、工程、通讯等;甚至在语言、经济、管理、法律、考古等社会科学,以及日常生活、生产的方方面面,也都离不开数学。通过这些介绍,使学生明确数学在社会和现代科学发展中的重要作用,加深对学习数学重要性的认识,从而激发起他们学习数学的兴趣。
还应当直言不讳地对学生讲,数学是现在高考中的“三大主科”之一,通常在高考中占150分,数学学不好,要考上一个好大学是不可能的;而且,如果学不好数学,将来想学好物理、化学、计算机等等,都是不可能的。把学好数学与学生自己将来的发展联系起来,让学生们明白这个道理,充分识到学习数学的重要性,进一步培养和提高学生对数学的学习兴趣。
其次,培养学习兴趣,要真正的进入到学习中去。有的同学学习很浮躁,对学科知识知之皮毛,感觉到学习这些知识很没意思。其实任何学科都有他自己的逻辑结构,如果你真正的去思考了,就会感到它的乐趣。在学习数学时,如果没有深入进去,每天只是机械地记概念、背公式,就肯定会觉得学习数学非常枯燥无味;相反,如果去认真思考了,掌握了每个概念的含义、每个公式的内在规律,并且能运用所学知识解决一些具体的数学问题,那么,学生自然会对这门学科感兴趣。
再次,学习是个循序渐进的过程,对学习既要知难而进,又要做到从易到难。在学习中遇到困难是很正常的现象,有的同学喜欢向困难挑战,在战胜困难时感到其乐无穷。这样也容易形成自己的学习兴趣。有的同学不喜欢困难重重的感觉,这样的话,在学习中可以选择从易到难的方法,不要急于求成,这样在每前进一步中都会有一种成就感,受成就动机的影响,同样可以培养学习的兴趣。当然,任何学科有它的乐趣和意义,可是真正的学起来都有枯燥的一面。学习要有耐心,也要有吃苦精神。如果能做到这些,学习成绩就一定能提高。
二、更新教学理念,改进教学方式,提高教学艺术是培养学生学习兴趣的重要因素
教师应该积主动地更新教学理念,探索和改进教学方式,最大限度提高教学艺术。数学教学是数学活动的教学,是师生交往、互动与共同发展的过程。学生是学习的主人,在教学过程中应该体现“以人为本”的原则,倡导合作式和自主探究式教学方法。具体来说,应该注意以下几点;
1、热爱学生,鼓励成功,确立学生的学习兴趣
培养学生学习兴趣的方法很多,但从根本上讲,每一种方法都离不开教师对学生炽热的爱和对教育事业高度负责精神。就学习数学而言,一般来讲每个班都存在着好、中、差三类的学生,这就需要教师奉献一颗爱心,以正确的态度对待他们。做为为教师,千万不以能伤害学生。
有这样一件事。几前年,我带高三补习班数学。有一个同学,经常利用课余时间,来问数学问题,学习非常踏实。但是,她的数学成绩特别差。我感到很奇怪,就问她:“你的数学为什么这样差?”她说:“我在上小学的时候,数学非常好,上初中时,有一个数学老师,用很难听话批评过我,我实在受不了。从此,我恨所有的数学老师,看见每一个数学老师都生气,到高中时,我把数学放弃了,所以,我的数学很差。”这件事对我影响很深,我感到教师在教学过程中,要特别注意自己的言谈举止,批评教育要讲究方式方法。稍不留神,就会对学生造成极大的伤害,师生之间就会产生隔阂,这对于教学是极为不利的。这种情况下,教师也许还没有感觉到,但是对学生的伤害,却是无法弥补的,还有可能会影响学生的一生。
做为教师,首先要让学生树立正确的学习观。要相信我们的学生能够学好数学。在人格上尊重学生,对每一个学生尤其是差生,均寄以厚望,让他们从教师的期待、信任和关怀中得到鼓励和勇气,以炽热的情感引导他们学习,诱发他们的学习兴趣。其次,还要树立正确的教学观,把教学过程看作是师生平等相待、互相协作、共同探索未知的过程,充分发挥学生在教学中的主体作用。对于优生,教师应创造条件,积极启发他们提出和发现问题,并放手让他们独立处理一些难度较大的题目,让他们从中经受锻炼,体验成功的快乐,增进学习兴趣。对于中差生,教师则应以慈母之心、教师之严,循循善诱,因势利导,让他们从处理简单的问题中增强自信,从陆续出现的成功中培养兴趣。
2、利用教师的语言艺术,激发学生的学习兴趣
教师的语言艺术可以使抽象的概念、判断、定理具体化,深刻的道理通俗化,难懂的理论形象化,易于诱发学生兴趣。在教学中尽量用学生较为熟悉、容易理解,而且具有诱惑力的语言,这对引发学生学习兴趣和积极思维有良好的作用。
苏霍姆林斯基说过:“课上得幽默有趣,学生可以带着一种高涨的、激动的情绪,从事学习和思考,并对前面展示的真理感到惊奇和震惊”。在课堂教学中巧妙地运用幽默语言,可使教师的讲课变得风趣诙谐,幽默睿智,使整个教学过程高潮迭现,并能创造出一种有利于学生学习的轻松愉快的气氛,让学生在这种气氛中去理解、接受和记忆新的知识。
例如讲直线概念时,可以这样描述:“直线可以想象成黑板边线无限延长,穿过高山大海,突破大气层,经过星球,直至九霄云外而无穷无尽。”经过这样一番描述,学生便兴趣盎然,对直线这一概念的理解就显得形象、逼真了。
又例如为了根治学生老犯a2a这类毛病,要求学生在解题时用绝对值过度来保护,即a2a,并告诉学生要化简a2,先让a从“屋子”(根号)时走到“院子”(绝对值││)里,至于如何出“院子”的,这要看a 的“本质”(正、负或零),体质健壮(a≥0)的直接出去;体质虚弱(a≤0),必须戴上“一条围巾”(负号“一”)以防感冒。这样既形象又生动,能够加深学生的影响。
幽默,也是绝大多数学生需要的心理。如果教师能善于运用形象化的语言,就能把本来枯燥乏味的数学变得生动而有趣,从而激发学生学习数学的兴趣。当然,幽默是相对于严肃而言的,两者都要适度。
3、介绍有关的数学史、数学家的生平和有趣的数学故事,提高学生的学习兴趣
通过与学生们的交谈了解到,学生仍有喜欢听故事的习惯。特别是老师在课堂上讲一些与当天学习内容有关的数学小故事,可以令他们对所学习的内容留下更深刻、具体的印象。而且以与当天学习内容有关的数学小故事作为新课的“开场白”,容易引起学生的学习兴趣。事实上,数学课最能吸引其注意是老师讲一些数学的课外知识。因此,教师结合教材,在教学上适时、适当地向学生介绍一些数学史、古今中外数学家故事以及数学趣闻,能激发学生的兴趣和求知欲。诸如讲圆周率时,讲一讲祖冲之的成就;讲黄金分割时,介绍一下华罗庚的故事;在乘方概念引入课上,说一说印度国王想奖励国际象棋发明者,却给不出奖品的故事,等等。通过数学史的学习,不仅可用数学家的勤奋治学精神激励学生努力学习,而且还帮助学生了解数学公式、概念等理论的创始与发展过程,特别是数学思维方法的形成,更有利于今后在学习中借鉴。
4、以数学的广泛应用性来培养学生的学习兴趣
在数学课上,最能吸引学生注意力的是老师提出一些生活上的实际问题,让大家用数学方法解决的时候。刚到高中的学生仍保留一些初中和小学阶段较为直观的思维习惯,他们通过平常接触到的事物去理解记忆所学知识。随着年龄的增长,他们心理上越来越渴望获得别人的认同,又喜欢通过运用所学知识解决一些生活上的实际问题以证明自己的价值。因此引导学生观察和解决实际中的数学问题,是提出兴趣的重要方法,尤其是那些与学生有直接关系的数学问题,更能引起和培养学生的数学兴趣。例如学习“黄金分割”时,把0。618(最佳点)运用踢足球何时进球率比较高;及格分数为什么规定为60分;又如,在学习三角函数时,问学生以什么样的角度发射炮弹,射程最远?在教学过程中应特别注意指导学生,应用所学的数学知识去解决日常生活、学习中的实际问题,努力架设起一座通向数学宫殿的兴趣之桥,使学生在这一实践过程中去发现兴趣的源泉,并在解决问题的同时感受到自己的劳动所取得的成就,体验到战胜困难后的欢乐。这样,学生对数学的学习兴趣就能持续发展并不断开拓。
5、展示数学美,以美吸引学生的学习兴趣
每门学科都有其自身的美和美感。数学也不例外,其中蕴藏着大量美的因素,从概念到结论、从定义到公式、从外表到结构、从形式到内容、从理论到实践,无一不体现出美的特征,展示着美的风貌。正如有些人所说:“哪里有数学,哪里就有数学美。”
数学美是客观存在的,但学生对它的感受与欣赏却不尽相同,这要依靠教师对美的挖掘与展示。教学中,教师若能采取各种方式向学生展现和揭示数学美,就能引发学生追求数学美的心理倾向,使他们感到学习数学简直是一种美的享受,从而带着高涨的热情投入学习与思考。例如,在讲解几何证明时,可向学生揭示逻辑美;在讲解二次函数时又可向学生展示函数式的结构美和图象美;最简单的公式C=2πR,圆的周长与半径之间存在着如此一种简洁绝妙的和谐美;平面几何中的“黄金分割比”是神圣之比例、宇宙之美神;在学习“轴对称和轴对称图形”一节时,通过引导学生观察人体、蝴蝶和各种动物植物的自然之美,让学生找出图形美的奥妙,进而总结出轴对称图形的定义性质,使学生在新知识的学习过程中有一种美的享受,学生一旦被引入美的世界,就会对数学中展现出来的真理感到惊奇,为人类的聪明智慧感到骄傲自豪。这样,其学习兴趣如何也就不言而喻了。
6、融洽师生感情,促进学生的学习兴趣
教学是教师“教”和学生“学”相互作用的过程,也是师生感情交流的过程,两者都有各自的特点和规律,丢掉其中任何一方都无法使教学活动真正走上科学的轨道。据调查发现有相当一部分学生是由于喜欢某个教师,而对他所任学科产生浓厚的兴趣;也有相当一部分学生不喜欢某个教师,而对他所任学科毫无兴趣。美国心理学家认为:“人生最大的需要就是别人的肯定。”尤其是学生这方面的表现特别外现。所以,教师一个亲切和信任的目光,一句热情而富有鼓励的话,一个肯定表扬的手势,都能使学生萌生积极愉快的感觉。相反,教师过分严厉的批评,凶狠的目光,斥责的声调会使学生望而生畏,产生一种压抑,甚至恐惧、害怕的心理。因此,教师应该善于控制自己的消极情绪和不良心境,用积极姿态,满腔热情地进行教学。用自己饱满的精神状态去感染学生,让每个学生都抬起头来,以饱满的热情去学习数学。
7、多媒体辅助教学
多媒体计算机的出现,网络技术的运用,信息时代的到来正在给教育带来深刻的变化。以多媒体计算机为核心的辅助教学的研究正在日益兴起。中学数学教学需要计算机辅助,计算机的运用给中学数学教学增添了新的活力。从我们的抽样调查的结果显示,56%的学生表示支持在数学课运用多媒体教学。实践证明,以多媒体计算机为核心的辅助教学有利于激发学生的学习兴趣。计算机有极强的交互性,使学生有了参与的机会,学生的想象力得到了充分的发挥,也极大地调动了学生的积极性、学习兴趣。但另一方面我们不能夸大计算机的作用,以为计算机能完全代替传统的数学教学。只有适当地运用多媒体教学,也能够激发对数学的学习兴趣。
兴趣是学习活动中重要的动力,是学习获得良好效果的重要条件。因此,数学教师在教学过程中应注意以数学发展的历史、数学的广泛应用培养学生学习数学的兴趣;在课堂上以生动、幽默的语言,灵活多变的教学方法引发学生学习数学的兴趣;平时指导练习时注重探索解题技巧,通过巧题巧解、一题多变、一题多解来培养学生学习数学的兴趣;我们将要培养的是二十一世纪的人才,在教学中应大胆尝试现代科技手段,适当运用多媒体辅助教学引发学生学习数学的兴趣。另外,虽然这些都是培养学生学习数学的兴趣的有效方法,但它们只应适时、适当的出现在教学教程中。倘若不考虑实际情况,乱用、滥用,不但不能有预期的效果,反而会适得其反。
培养学生对数学的学习兴趣的方法和途径很多,今后还需要在数学教学的实践中,根据数学教学内容,学习的心理规律和认知过程进一步探索和总结。
兴趣是一种激烈而持久的动机,是最好的教师。唯有让学生对数学学科产生浓厚的兴趣,才能对数学有持久的热情,才能更进一步地自己去探索、发现问题和解决问题,同时学会自我诘问,善于联想,善于推断,见人之所未见,获人之所未知,并产生积极主动的动力自主探究学习。当然,教无定法,在数学教学中有意识地培养学生学习数学的兴趣,寓教于乐,其意义深远,是教育改革形势发展的需要,内涵十分丰富,除了应注意以上几个问题外,更多的问题还待于实践中解决,有待于我们进一步探索研究。
2.文档管理的方法 篇二
随着Internet和电子商务的飞速发展, 如何实现信息的安全传递成为一个重要的研究课题。传统的信息安全机制普遍基于密码学技术即采用信息加密方式, 这在防止信息泄密的同时, 也暴露了机密信息的存在, 容易引起攻击方的注意, 因此信息隐藏技术作为信息交流中的科学与艺术逐渐成为信息安全领域的一个重要分支。
信息隐藏技术与生物学中动物的保护色机理相似, 将机密信息隐藏于载体中进行传递。根据隐藏载体不同, 信息可以在磁盘、存储卡、网络通信协议、图像、视频、音频及文本等媒体中隐藏。目前基于各类型载体文档信息隐藏技术虽然已有研究, 但大部分偏向于利用影像、音频和视频等文件格式作载体[1,2,3,4,5], 这种方法的优点是载体文件中可以隐藏较多的内容。本文主要研究如何在Microsoft Word文档文件中完成信息隐藏, 这不仅是因为Word文档在日常工作和生活中使用非常普遍, 地位重要, 更重要的是就其物理组成而言不只包含了文字及格式部分, 更可以涵盖影像、声音、超链接、OLE对象等许多内容, 即也可以叠加使用传统的影像、声音的隐藏技术, 应用范围较广。这方面的研究虽然也有, 但非常少, 笔者查到的只有文献[6, 7]。其中文献[6]使用方法并不独立, 其实质上也是使用图像作载体隐藏, 只是插入Word文档后做了第二次隐藏; 本项目从标题上看与文献[7]相似, 但在使用方法上有本质的不同: 文献[7]所采用技术的核心与物理学上的载波相似, 通过被隐藏的信息 ( 要传递的实际内容) 对载体文本格式 ( 文本的行间距、字间距、字体、颜色、下划线等) 做视觉上不易觉察地轻微改变 ( 像无线电传输过程中的调制) 实现信息隐藏。这种技术处理后的文本一旦被有意无意二次修改编辑后, 其被隐藏信息将被破坏, 无法正确恢复提取。本项目基于微软最新公布的复合文档存储规范, 利用载体文档现有物理空间中未使用部分和可选择的加以合理扩充, 设计了一种利用Word文档隐藏秘密信息的解决方案。
1 Word 文档结构分析
1. 1 逻辑结构分析
Word文档属于复合式文件[8]的一种, 由许多虚拟的数据流组成, 如同一个文件系统[9], 结构如图1所示。
图1中stream表示单一的数据存储流, storage是包含有一个或多个stream或storage的存储流 ( 仓库) 。每个复合文档文件都有一个根 ( Root) 仓库Root Entry。
Word文档包含的各类不同形式的信息 ( 除文本本身及相应格式外, 还包括图形、声音、表格以及其他OLE形式的资料 ( 含各自相应的格式控制信息) ) 被通过相应的stream和storage封装起来形成复合文档文件。这些数据流构成一个线性的集合 ( Word文档) , 尽管其在磁盘上的物理存储格式可能会被分割。目前关于复合文档存储方面的现有资料绝大多数以开源的[10]为基础, 推测部分不少。微软公司2008年首次公布了Windows及office复合文档格式规范, 后来又不断多次补充完善[11,12,13]。这里以2013年微软官方资料[14,15,16]为基础介绍。
Word文档没有固定大小, 但至少由五个信息流 ( Stream) 组成: Word Document主数据流、0Table/1Table数据流、Data数据流、Summary Information数据流和Document Summary Informaton数据流。
( 1) Word Document数据流 ( Main Stream)
Word文档中一定存在Word Document流, Word中主要信息在该流中存储。该流主要包含文件信息块FIB ( File InformationBlock) 、文本和来自文件其它部分的引用信息。
FIB没有固定大小, 但一定从Word Document信息流的偏移0x00开始, 它指出了文档中包含的所有数据信息的定位 ( 定位信息包括该信息起始偏移地址和该信息的容量大小两条属性) , 如表1所示。
*注:FIB的具体内容和创建该Word文档时的Microsoft Word主程序版本有关
FIB后是该Word文档中包含的文本信息, 起始位置从FIB中的fc Min ( 微软二进制格式文件中把File Character Position命名为fc) 得到, 长度从FIB. ccp Text得到。
文本信息后是字符 ( Character) 、段落 ( Paragraph) 的格式信息。
Word文档中文本流里拥有相同格式属性的一串连续的字符称为Run of Text, 其属性 ( 字体、字号等) 用CHP ( CharacterProperties) 描述。一个CHP有136位, 采用指令形式 ( 包括操作码和操作对象) 记录和默认 ( Default) CHP的差异 ( 可以减少空间占用) 。段落属性 ( 居中, 居左等) , 用PAP ( Paragraph Proper-ties) 描述, 每个段落有一个PAP , 大小为610位。为减少空间占用, 和字符一样只记录和默认Default PAP的差异。
( 2) Table数据流
Table流主要存储信息流结构, 在Word文档中也一定存在。每个结构的起始位置和大小都记录在FIB中。具体到每个确定的Word文档中Table数据流是采用0 Table还是1 Table由FIB的base. f Which Tbl Stm标志位确定。
( 3) Data数据流
Data数据流没有预定义结构, 其中数据引用FIB或文档其它部分。Word文档的嵌入式对象 ( OLE, 如图片) 就存放在Data数据流中。OLE对象的读取从Word Document数据流中记录文字的部分开始, 如当Word文档中有图片时, Word Document数据流中记录文字资料的字节用ASCII 01表示, 该字节对应的Runof Text的CHP信息结构中f Spec标志位值为1; 其CHP信息结构中的fc Pic标志位值为图片在Data数据流中的开始位置。图片资料数据头称为PICF结构, 占用68字节, 记录有关图片的信息 ( 原始大小、缩放情况等) 。PICF之后是图片文件名称数据区块, 接着是原始图片的全部信息, 参见表2所示。
( 4) Document Summary Informaton数据流和Summary Informa-tion数据流
这两个流主要记录摘要信息, 格式一样, 只是属性编号 ( Property ID) 不同。
1. 2 物理结构分析
Word文件中各个数据流均由多个大小为512字节的页数据块FKP ( Formatted dis K Page, 也称为扇区sectors) 组成, 参见表3所示。
每个Word文档文件开始 ( 偏移地址0) 处是一个大小为512 Bytes的文件头 ( Header) , 然后是按照顺序排列的各种类型的扇区。数据块位置从512 Bytes开始计算起。
( 1) 文件头
文件头主要结构如表4所示。
( 2) 块配置表
Word文档内部控制数据流由块配置表BAT完成。BAT包含所有数据块的Block ID链 ( Chain) 。BAT表中的当前位置表示当前的块, 而该位置存放的块ID值 ( Value) 指向下一个块的ID。BAT可能在任意位置包含当前Word文档未使用的FreeBlock ID ( 0x FFFFFFFF) 。
如果某位置为0x FFFFFFFE, 则表示一 个数据流 的结束 ( End Of Chain Block ID) ; 如果Block用于存放BAT表自身则为BAT Block ID ( 0x FFFFFFD) , 在DIF ( Double-indirect Fat) 中描述 ( DIF专用块 ( 0x FFFFFFC) 里最后4字节给出下一个DIF专用的Block ID, 如果Word文件尺寸小于7M的话没有独立的DIF块区) 。
( 3) 目录
目录 ( 属于内部控制数据流) 由一系列目录入口组成。每一个目录入口代表了文档中的仓库或数据流。仓库下的所有成员 ( 子仓库、数据流) 符合红 ( 用0表示) 黑 ( 用1表示) 树规则。
目录同样使用标准大小块区。目录项大小为128字节, 结构 ( 关键部分) 如表5所示。
2 数据隐藏流程
数据隐藏前根据被隐藏信息的重要性可以首先把需要加密传送的信息用哈夫曼编码或其它密码学技术做预处理, 然后从两种思路入手, 一是利用文档中原有的未使用的空间, 二是适度在文档中创造新空间, 具体执行时可以随机选择。
2. 1 利用载体文档中未使用空间
载体Word文档中未使用空间的定位方法如下:
( 1) 通过文件头信息 ( 参见表4所示) , ( 从偏移地址0x4C开始入手) 找到BAT表使用的扇区链。
( 2) 读取块分配表 ( BAT) 信息
( 3) 找出表项值为 - 1 ( 0x FFFFFFFF) 的项, 该项对应的块即为未使用块, 计算出在文件中的偏移地址。
( 4) 将需要隐藏的信息放在 ( 3) 找到的位置。
被隐藏信息需要取出时可按上述步骤 ( 1) - 步骤 ( 4) 通过文件头信息 找到BAT开始扇区, 找出所有 表项值为 - 1 ( 0x FFFFFFFF) 的项对应的内部扇区块, 记录这些数据块的内容后解码即可。
2. 2 适度在载体文档中扩充空间
存放在载体Word文档中嵌入式对象Data Stream数据流的开始部分是PIC数据结构, 后边开始才是真正嵌入的对象。实验表明, 更改嵌入式对象 ( 文档内部存储) 的名称用户打开后不会感觉到。此外, 由于实际使用中对象名称占用的空间并不大, 因此通过人为增大名称占用空间的相关参数就可容纳更多需要隐藏的信息, 换句话说用需要隐藏的信息替换原始默认名称就可以实现数据隐藏。步骤如下:
( 1) 找一个有多个嵌入式对象的原始Word文档作载体, 选择一个对象着手 ( 最后一个为好) 。从Word Document数据流格式信息中取出此Run of Text对应的Character Properties ( CHP) 数据结构, 找到此对象在Data Stream中的偏移数值。
( 2) 通过目录项结构读出目录中Data数据流目录项 ( 参见表5) 偏移0x74处的入口数据和偏移0x78处数据大小两参数, 得到Data数据流第一个数据块的ID值和尺寸大小。参照块配置表算出Data数据流中最后一个块中的剩余空间。如剩余空间不足以存放被隐藏数据, 可修改Data流目录项中偏移0x78处数值及相关块配置表 ( BAT) 。
( 3) 找到 ( 最后) 那个准备用于隐藏数据的嵌入式对象的起始偏移地址。由PICF找到该对象名称大小和存储对象名称的位置, 根据需要隐藏内容做相应修改。如果需要增加空间, 则将原始内容后移并修改PICF中相应参数。
此外还可以在Data Stream的Hyperlink数据结构中隐藏。
3 验证与分析
测试环境: CPU: Inte I ( R) Core ( TM) i3-2350 CPU@ 2. 3 GHz, 内存: 4 GB; 硬盘: ST9500420AS; 操作系统: Windows 7 SP1; Word版本: Microsoft Word 2010。
3. 1 利用载体文档中未使用空间
这种思路以FIB和Table数据流剩余空间利用为例。
示例载体文档FIB现有未使用空间, 参见表6所示。
读取FIB的方法如下 ( 参见表1所示, 字节顺序: 小端, 下同) :
( 1) 在Word文档流的偏移0处读取文件信息块 ( FIB) :
( 2) 读取Fib Base, 32字节 ( 表6中偏移地址0x0200至0x021F) 。
( 3) 读取Fib. csw, 2字节 ( 表6中偏移地址0x220, 0x221处, 值为0x000E) 。
( 4) 读取Fib. csw×2字节 ( 0x000E×2 = 28) , 获得Fi-bRg W97。
( 5) 读取Fib. cslw, 2字节 ( 表6中偏移地址0x23E, 0x23F处, 值为0x0016) 。
( 6) 读取Fib. cslw×4字节 ( 0x0016×4 = 88) , 获得Fi-bRg Lw97。
( 7) 读取Fib. cbRgF c Lcb, 2字节 ( 表6中偏移地址0x0298, 0x0299处, 值为0x00B7) 。
( 8) 读取Fib. cbRg Fc Lcb×8字节 ( 0x00B7×8 = 1464) , 获得FibRg Fc Lcb。
( 9) 读取Fib. csw New, 2字节 ( 表6中偏移地址0x0852, 0x0853处, 值为0x0005) 。
( 10) 读取Fib. csw New×2字节 ( 0x0005×2 = 10) , 获得Fi-bRg Csw New。
通过以上步骤 ( 1) - 步骤 ( 10) 得到本示例载体Word文档的完整FIB的大小是32 + 2 + 28 + 2 + 88 + 2 + 1464 + 2 + 10 =1630字节, 由于文档内容按512字节的数据块分配使用, 故占用空间是2048字节, 即从偏移地址0x085E至0x09FF共418字节的磁盘空间实际上载体文档的内容并未真正使用, 将被隐藏数据加密后存放于此。
可以验证, 隐藏数据后的载体Word文档可以被MicrosoftWord程序正常识别。
使用FIB中未真正使用空间隐藏信息的特点是使用简单, 文档一旦被再次编辑过的话, 隐藏的内容会立刻被覆盖, 保证了被隐藏数据的安全性。如果不想出现这种情况的话, 可以利用Table数据流的中未使用空间的利用。
0 /1Table流中存储有很多信息流结构, 其中在许多结构中有未完全使用的空间, 以样式表结构为例, 参见表7所示。
定位步骤如下:
( 1) 读出FIB中的Fib. cbRg Fc Lcb, 在第9字节处开始的连续4字节 ( fc Stshf) 代表样式表数据结构在0 /1Table Stream的位置偏移。
( 2) 读出目录中的0 /1Table流目录项偏移0x74处的入口数据, 得到0 /1Table Stream数据流第一个数据块的ID值。
( 3) 根据以上结果, 由fc Stshf + ( First SID + 1) ×512 + ( 已经使用部分) 找到需要隐藏数据的存储空间, 把信息写入到样式表数据结构中。
3. 2 适度在载体文档中扩充空间
这里以利用WORD对内嵌图像的管理方式为例进行。
Data数据流开始为一个68字节的PICF资料结构, 紧接在后面的是一个包含图片文件名的区块空间, 随后才是原始图像文件, 此处利用这一区块来隐藏信息, 参见表8所示。
表8中, 偏移0x1200至0x1243是PICF头, 原始图像从偏移0x12D8开始。
偏移0x126C开始的4个字节表示内嵌图像文件名的大小, 此处为0x0000000A, 单位: 字节。从偏移0x127C开始是具体的文件名, 大小等于上述描述。这里从增加文件名尺寸入手, 将待隐藏信息在文件名处插入。
以增加100字节 ( 换算为16进制为0x64) 为例。
( 1) 将偏移0x126C开始处4个字节的“0x0000000A”现值改为加上“0x64”后的“0x0000006E”;
( 2) 将偏移0x1200处开始处4个字节的lcb ( 参见表2) 的“0x0000F113”现值改为加上“0x64”后的“0x0000F177”;
( 3) 将偏移0x1248处开始处4个字节的“0x00000046”现值改为加上“0x64”后的“0x0000AAAA”;
( 4) 将目录表中 ( 参见表5) “Data”项的偏移0x78处4个字节“0x0000F113”现值改为加上“0x64”后的“0x0000F177”;
( 5) 从偏移0x127C开始插入100字节待隐藏数据 ( “X”为例, 16进制为“0x58”) 。
修改后的内容如表9所示。
藏入被隐藏信息后的Word文档文件使用者打开后看不出有什么改变, 再次编辑后所藏的资料也不会消失。
使用FAT和NTFS两种分区方式, 均通过验证。
实验表明:
( 1) 选择大小为1 MB左右且其中包括多个图片或超级链接的Word文档作载体文档一般不会被用户怀疑。
( 2) 本方案虽然没有限制被隐藏信息的大小, 但不要超过载体文件太多, 否则容易被怀疑。如果需要被隐藏的数据容量特别大, 可用位图、声音或视频使用传统密码学技术加密后再插入Word文档, 密码从本文方案中随机选择一种传送。
( 3) 和同类技术相比, 采用第二种思路其鲁棒性要好, 当载体文档被修改编辑时其隐藏内容可以保留下来。
( 4) 使用第一种方式即利用Word文档未使用空间存放加密信息时, 只要Word主程序版本不同, 使用文件菜单下另存为命令保存为“Word97-2003”格式生成的Word文档中可使用的空间也不同, 可根据所传送被隐藏信息确定使用不同结构进行。要注意的是这种方法操作简单但鲁棒性不好, 如果文件被重新编辑的话被隐藏的信息将有可能遭到破坏。
4 结 语
基于Word文档为载体的数据隐藏方法与基于密码学技术的方法相比不容易引起人们注意, 和单纯基于图像、视频的信息隐藏方法相比更方便, 对网络传输的带宽要求很低, 具有较高的安全性和实用价值。
3.文档管理的方法 篇三
方法一:利用预览窗格
如果是Windows Vista或更高的版本,可以打开“文件夹选项”对话框激活预览窗格,如果是Windows 8/8.1只需要在“查看”选项卡直接点击“预览窗格”按钮,此时可以在文件资源管理器的预览窗格预览到相关内容,虽然文件名还是数字格式,但最起码已经可以在预览窗格查看到具体内容。
不过,如果你的Windows并未提供预览功能,那么可以利用列标题解决这一问题:首先请将查看模式设置为“详细信息”,右击列标题任意位置,打开“选择详细信息”对话框,在这里勾选“标题”复选框,确认之后关闭对话框,现在就可以在文件夹窗口看到这些数字文档的标题,效果如图2所示。
方法二:利用TC官方插件实现
如果你希望将数字文档的文件名与标题名统一起来,但又不希望使用手工重命名或VBA代码的方式,那么可以利用著名的TC(Total Commander)提供的官方插件实现:
4.word文档编码问题的修复方法 篇四
1.这个rar文件在加压或者传输过程中受损,而且被人修复过,但是其中一个文档没有修复成功!
2.出现编码错误文档在作者写的时候就出现了错误,文件就被损坏!
3.由于该文档是属于工程专业文档,有很多特殊字符,可能会由于字体的原因无法显示,这样也会出现乱码的问题。
4.可能是由于个人office的问题,当然这是很不可能的,但是也得注意。出现乱码可以在word“工具中”选择"选项”——“常规”中选择打开时转换,或者用wps试一下。-
下面就介绍一下word的一些修复工作。
word修复和其他文件修复一样,首选要这样的工具。
1.easyrecover。修复工具,个人认为是最好用的修复工具,它不仅可以修复word等文件修复,还有强大的数据恢复功能。在数据恢复上可以与superrecover相媲美!
修复国产很简单,只要在操作界面上选择文件修复然后选择word修复即可。
另外几款word修复工具也跟easyrecover差不多,只是没有起强大。但是作为专业的word修复,也很不错!
2.Advanced_Word_Repair,一款专业的word文档修复工具。英文版的功能较全。
5.文档管理的方法 篇五
如果出现这种状况,请先在 PowerPoint 的“开始”菜单下检查一下字体间距的度量值,
检查一下设置是不是选择为“常规”呢?
有的同学可能要问,如果设置在常规的情况下,仍然出现这个问题,该怎么解决呢?
这个时候,如果您是 Windows 7 的用户,让我们来检查一下 C:Users您的用户名AppDataRoamingMicrosoftTemplates 文件夹下是否存在 blank.pptm 或是 blank.ppt 文档?
如果您是 Windows XP 的用户,请检查:C:Documents and Settings您的用户名Application DataMicrosoftTemplates
假如您找不到此路径,请点击“开始菜单”,然后点击“计算机”,之后再点击左上方“组织”->“文件夹和搜索选项”->“查看”->勾选“显示隐藏的文件,文件夹和驱动器”,最后按一下"确定“,
6.损坏Word文档的几种修复方法 篇六
1 采用专用修复功能
①在“文件”菜单上,单击“打开”。
②在“查找范围”列表中,单击包含要打开的文件的驱动器、文件夹或Internet 位置。
③在文件夹列表中,定位并打开包含文件的文件夹。
④选择要恢复的文件。
⑤单击“打开”按钮旁边的箭头,然后单击“打开并修复”(如图)。
“打开并修复”是Word 2002/2003 才具有的功能,如果该方法仍不能打开受损文档,或者您使用的是Word 97/2000,可以试试以下方法。
2 提取文字法
①在“工具”菜单上,单击“选项”*“常规”选项卡。
②确认选中“打开时确认转换”复选框,然后单击“确定”。
③单击常用工具栏上的“打开”按钮。
④在“文件类型”框中,单击“从任意文件中恢复文本”。
⑤像通常一样打开文档。
在使用上述方法打开受损Word 文档后,如果文档内容显示混乱,请继续以下工作。
3 转换文档格式
将Word文档转换为另一种格式,然后再将其转换回Word 文档格式。这是最简单和最彻底的文档恢复方法,请始终先尝试这种方法。
①在Word 中打开损坏的文档。
②在“文件”菜单上,单击“另存为”。
③在“保存类型”列表中,单击“RTF 格式(*.rtf)”,然后单击“保存”。
点击阅读更多学院相关文章>>
分享到 4 粘贴为新文档
Word 用文档中的最后一个段落标记关联各种格式设置信息,特别是节与样式的格式设置,
如果将最后一个段落标记之外的所有内容复制到新文档,就有可能将损坏的内容留在原始文档中。在新文档中,重新应用所有丢失的节或样式的格式设置。选定最后一个段落标记之外的所有内容的方法是:在“工具”菜单上,单击“选项”*“编辑”,清除“使用智能段落选择范围”复选框,单击“确定”按钮,然后按“Ctrl+End”组合键,再按“Ctrl+Shift+Home”组合键。
5 重命名模板
Word在Normal.dot模板文件中存储默认信息。如果该文件被损坏,则Word文档中也许会出现奇怪的内容。
①关闭Word。
②单击“开始”*“搜索”*“所有文件和文件夹”。
③在“全部或部分文件夹名”框中,键入“normal.dot”。
④在“在这里寻找”列表中,单击安装Word 的硬盘盘符,然后单击“搜索”。
⑤右键单击结果列表中的“Normal”或“Normal.dot”,然后单击“重命名”(如图)。
⑥为该文件键入新的名称,例如“Normal.old”,然后按回车键。
之后,启动Word,由于Word 无法识别重命名的Normal 文件,Word将创建一个新的Normal 模板。创建新的Normal模板后,请尝试打开您的文档。如果可以正确打开,则旧的Normal模板可能已损坏。如果您的文档还用到了Normal.dot 之外的其他模板,该模板也可能已损坏。请尝试重新创建模板或使用它的较早版本。
上一页 1 2
点击阅读更多学院相关文章>>
分享到
★ 商务英语实战学习精选
★ 商务英语实战精选篇
★ 实战化军事训练体会
★ 中学校园网建设实战
★ 老师实战演练心得体会
★ 个人简历word范文
★ 策划书word模板
★ 求职信范文word
★ 自荐信模板下载word格式
7.文档管理的方法 篇七
关键词:图结构XML,关键字检索,层次连接
目前基于关键字的XML信息检索研究大都采用将XML文档建模成树结构, 返回结果采用LCA的思想。当XML文档中出现引用关系时 (包括文档内引用IDREF和文档外引用XLink) , 将引用关系当作一般属性来对待会忽略元素节点之间的隐含关系, 采用LCA的思想得到的结果将有所遗漏。研究表明, 将带有引用关系的XML文档建模成图结构是可取的, 能够改善检索质量。本文的主要贡献可以归纳为如下4点:
(1) 提出从关键字及其类型来分析和预测用户查询语义的模型;
(2) 提出了基于语义的图结构XML文档的返回结果模型———层次连接实体 (HJE) ;
(3) 提出图结构XML文档下高效的双层索引结构;
(4) 设计了基于层次连接实体语义的HJ算法。
1问题描述和相关工作
1.1预备知识
在图结构XML信息检索中, XML文档被定义成有标签的有向图, Q={V, E}, 其中, V是文档的结点集, E是文档的边集。
结点集V是文档的信息存储单位, V={Element, Attribute, AttributeValue, Text}, 其中Element是元素结点集, Attribute是属性结点集, Attribute Value是属性值结点集, Text是文本结点集。元素结点可以嵌套元素结点、属性结点和文本结点, 属性结点可以嵌套属性值结点。
边集E是结点之间联系的桥梁, E={CE, RE}, 其中C是包含边集, R是引用边集。C (u, v) ∈CE, 表示u是v的祖先结点;R (u, v) ∈RE, 表示结点u有一条引用边指向结点v。
为了方便表述, V (n) 表示结点n本身, T (n) 表示以结点n为根节点的子树, Descendant (n) 表示T (n) 的结点集 (包括n本身) , CR (k, V (n) ) 关键字包含在结点n中, RE (n, m) 表示在T (n) 和T (m) 中存在一条引用边, 且引用边从T (n) 指向T (m) 。
1.2相关工作
基于图结构的XML文档信息检索研究包括XRank[1], EASE[2], XKeyword[3]等。XRank提出了ElemRank[1]概念, 对XML文档区别对待引用和属性, 在检索过程采用查找LCA (LowestCommonAncestor) [1]的思想, 以LCA为根节点的子树包含所有关键字为返回结果, 当关键字在两个距离较远的不同片段中, 由于不考虑引用, 其公共的LCA往往返回根结点或高层结点, 这将是冗余的或者无意义的。EASE构造了一个半径为R的Steiner[2]图 (rradiusSteinergraph) , 并认为Steiner图越紧凑, 相关度越大。这种方法采用TF-IDF[2]模型, 而这一模型相对在传统文本检索中比较有效, 处理图结构的XML文档, 引用关系会打乱原有层次结构, 导致最优的结果的相关性反而较低。XKeyword是一种可以在大型XML图数据库上进行关键字近似查询的方法, 但其对子图的划分运用到了文档的schema, 而很多XML是缺失schema的, 因此应用并不广泛
2 关键字的查询语义模型
基于关键字的信息检索中, 用户只输入了若干关键字K= (k1, k2, ..., km) , 因此如何从关键字中推断用户的检索目标将是一个首先要解决的难点。
目前的研究都是在寻找LCA时不区分关键字类型, 而在结果的权重中考虑关键字类型, 本文提出从检索结果之前就加入关键字类型的考虑, 来作为检索时的语义判断, 提出了“关键字语义唯一性”和“关键字语义选择”的理论。
推理依据1 (关键字语义唯一性) 在一个返回结果中, 每个关键字只会在一种类型上有语义。
结合用户输入的关键字与返回的正确结果进行分析发现, 用户输入的每个关键字都是对检索目标的直接体现, 不会存在模糊指向, 因此每个关键字在一个结果中仅会在一种类型上有指导意义;如果一个结果上某个关键字存在多层语义, 那么必然能将此结果拆分为两个独立结果。例如图1中输入检索关键字“open_auciton, Jack”, 那么检索结果将有两个, 第一个是以{T (person (0.1.1) ) }, 语义表示名字叫“Jack”的人感兴趣的“open_auction”列表;第二个结果是T (open_auction (0.0.0) ) ∪T (person (0.1.1) ) ∪R (V (0.0.0) , V (0.1.1) ) , 语义表示有“jack”参与的“open_auction”。第二个中虽然“open_auction”出现了两次, 但仅有{T (person (0.1.1) ) }中的“open_auction”具有语义, 其引用边是联系两个子树的桥梁。
推理依据2 (关键字语义选择) 当一个关键字在一个结果中存在于多个类型中, 关键字的语义在哪个类型上是个“语义选择”问题, 以下进行理论分析。
通过对相关结果的分析发现, 关键字出现在Attribute上时, 往往代表了用户需要查找这个属性上的属性值, 因此作为Attribute的关键字往往语义信息是最明确的。例如图1中, 输入检索关键字“mike, city”, “city”出现在属性上, 那么可以推断用户的信息需求是:名字叫“mike”的所在“city”的值;Element上关键字是对信息的高度凝缩, 拥有很高的信息量, 所以关键字出现在Element上时, 这个元素所代表的主题结点往往是与结果直接相关, 例如“open_auction”、“buyer”、“person”这些关键字出现时, 其结点往往就是检索目标的一部分。关键字出现在属性值, 其代表了用户查找的是属性值对应的属性所在的结点, 例如图1中用户输入“person, jack”, 可以推断用户的检索目标是找到“name”是“jack”的“person”结点的信息;文本结点一般作为其所在的主题结点的描述性信息, 重要性相对较低。
针对以上分析, 本文给出关键字语义选择:Q (Attribute) > Q (Element) > Q (Attribute Value) > Q (Text) , 这里的”>”代表了语义选择顺序。语义选择顺序将作为关键字在一个结果中的类型判断规则。
以上的两个推理依据可对输入的关键字进行语义判断, 从而推断用户需求。
3 查询结果的语义模型及排序方案
3.1 查询结果的语义模型
图结构XML文档中的引用边的出现使得检索过程与检索结果的语义分析都与传统的树结构检索方法有了根本性的改变。如果按照树结构的返回LCA方法来检索, 返回的往往是根结点或高层结点, 冗余度较高, 需要用户在“大”的结果中寻找自己感兴趣的部分, 这样的结果显然是不合理或缺少意义的。本文提出了以下几个语义, 来定义无冗余的、语义正确的结果模型。
定义1 (主题结点 Subject ) 一个可以区别于其他事物的独立信息单元。
主题结点为可返回结果的最小信息单位, S (E) 表示以结点E为根节点的主题结点。
S (root) ={T (root) |∃V (n) ∈Descendant (root) ∧∃k∈K, CR (k, V (n) ) }。
s∈S表示s为一个主题结点, S (k) 表示关键字k所在的主题结点。
例如图1中, T (person (0.1.0) ) 可以作为一个主题结点, 但T (watch (0.1.0.2) ) 不可以;T (watch (0.1.0.2) ) 附属于T (person (0.1.0) ) , 不能独立存在。主题结点可以嵌套, 同时主题结点只可能是元素结点。
下面给出是否为主题结点的判别条件:
判别条件1:如果一个结点的子结点包含元素结点, 那么以下几种情况可以判断此结点可以作为主题结点: (1) 子结点中仅有一个元素结点时, 还包含其他结点 (属性结点或者文本结点) ; (2) 子结点包含两个或两个以上元素结点时, 所有元素结点的标签名不完全相同。
判别条件2:如果子结点中不包括元素结点, 那么以下几种情况可以判断此结点可以作为主题结点: (1) 子结点仅有一个属性结点时, 还包含至少一个文本结点; (2) 子结点包含两个或两个以上属性结点。
定义2 (纽扣 Fastener) 连接主题结点的结点集合。F (s, t) ={m|m∈ (path (LCA (p, q) , p) ∪path (LCA (p, q) , q) ) ∧ (∀s∈S, ∀t∈S, ∃RE (s, p) ∧RE (t, q) ) }, 其中LCA (p, q) 为V (p) 和V (q) 的最小公共前缀[3], path (s, t) 表示s到t的路径上的所有结点, 包括s、t本身, f∈F表示f为一个纽扣。
纽扣是主题结点之间的关系的桥梁, 形式上不同于主题结点, 为分散的结点集合。
定义3 (层次连接实体 Hierarchical Joined Entity, HJE) 。 一个有完整语义信息的返回结果。层次连接实体HJE是图结构XML文档的检索返回结果模型, 包含一个或多个主题结点, 零个或多个纽扣, 每个关键字至少存在于某一个主题结点中, 如果把纽扣当成一个边的话, HJE是个DAG[2]子图。
HJE (K) ={S, F| (∀k∈K, ∃s∈S, CR (k, s) ) ∧ (∀f∈F, ∃s∈S, ∃s∈S, f=F (s, t) ) } (1)
w∈HJE表示w为一个层次连接实体, S (w) 表示层次连接实体w的主题结点集, F (w) 表示层次连接实体w的纽扣集合。
定义4 查询结果给定查询关键字K= (k1, k2, …, km) 以及一个XML文档D, 查询结果定义“无冗余的HJE”, Result (K) ={w∈HJE (K) |∀z∈HJE (K) , S (w) ⊄S (z) }。
查询结果Result (K) 包含了一系列的主题结点和纽扣, 主题结点集包含了所有的关键字, 并且不存在主题结点集的真子集包含所有关键字。
主题结点作为结果的主要信息载体, 包含了用户感兴趣的信息单元, 纽扣作为连接这些信息单元的“桥梁”, 这样查询结果语义信息完整, 且无冗余。
3.2 基于语义的排序方案
3.2.1 相关度影响因素
结合以上给出的关键字的查询语义分析和查询结果的模型定义, 已经可以对所有的相关结果进行语义描述, 本文接下来将对影响返回结果的相关度因素进行阐述。
(1) 层次嵌套
关键字之间的层次嵌套关系对结果相关度影响最大。
多关键字的“层次嵌套”关系是指“关键字之间的直接嵌套或者间接嵌套”。直接嵌套是两个关键字之间的关系, 指的是在同一个主题结点内两个关键字所在的层次是祖先-子孙关系。间接嵌套是主题结点之间的关系, 关键字所在的主题结点被另一个主题结点引用。
下面给出层次嵌套对一个结果的Rank值计算公式:
式 (2) 中ki, kj是关键字, D代表直接嵌套, I代表间接嵌套, d () 函数是关键字所在层次之间的距离, f () 函数是关键字引用的最短距离。h1, h2是参数。
(2) 层次方向
关键字存在层次嵌套时, 层次之间的方向对结果的相关度有影响。
下面给出层次方向对一个结果Rank值的计算公式:
式 (2) 中u为一个查询结果, O (s) 表示主题结点s的出度, I (s) 表示主题结点s的入度。p1, p2为参数。
3.2.2 相关度模型
通过以上分析, 我们给出返回结果的相关度的计算公式
式 (3) 中u为一个查询结果, R (u) 为相关度。α, β为参数。
4 基于语义的双层索引结构
XML文档的关键字检索方法不同于在原文档上进行查询的结构检索方法, 采用将文档解析后存入数据库中, 检索时从数据库中查询关键字, 来构造结果。目前主流的检索方法的索引结构使用Dewey[4]编码进行构建, 每个关键字有唯一的Dewey码, 另外还包括层次、类型或者其他信息。
本文针对图结构XML文档的独特结构, 不仅构建了基于主题结点的Dewey索引表 (主表) , 还构建了用于记录引用关系的Refer索引表 (副表) , 形成了双层索引结构。
在主表Dewey索引表中, 记录了必要的Dewey码、关键字、类型、所属主题结点Dewey码;在Refer索引表中, 记录了引用主题结点Dewey码、被引用主题结点Dewey码。例如图1中, “mike (0.1.1.1.0) ”结点在Dewey表中存储形式为{0.1.1.1.0, mike, 4, 0.1.1}, 其中第4项为关键字所在的主题结点S (person (0.1.1) ) 的根节点Dewey码。主题结点open_auction (0.0.0) 的子结点seller引用了主题结点person (0.1.1) , 在Refer表中记录为{0.0.0, 0.1.1}。
双层索引结构完整记录了图结构XML文档的信息, 在检索过程中通过调用主表找到关键字的信息, 通过调用副表找到关键字所在主题结点的引用信息及被引用信息, 来为检索提供足够的语义信息。
5 算法实现与实验分析
5.1 层次连接 (HJ) 算法
HJ算法的实现, 是基于用户提供N个检索关键字, 找到所有的相关结果片段, 并按照相关度进行排序。
算法1描述了HJ算法的查询过程, keyword [m]表示用户输入的m个关键字 (Line 1—2) 。invert[m]存储了经预处理的m个关键字对应的主题结点列表 (Line 3—4) 。每一个主题结点列表的组合都可能产生一个结果, 根据关键字的查询语义对一个组合进行语义选择, 产生候选主题结点列表singleList[n] (Line 5—8) 。遍历组合中的任意两个主题结点, 进行层次连接, 寻找产生的DAG子图 (Line 9—14) 。对结果进行清理和筛选是边计算边处理的 (Line 15—20) 。最后根据3.2节的排序方案进行排序输出 (Line 21—25) 。
5.2 实验环境
实验数据:华盛顿大学的XML数据仓库中XMARK以及IMDB数据集, 数据集大小分别为10 MB, 121 MB。手动选择8组Query进行测试。
实验硬件环境:CPU:AMD双核2.8 MHz;内存:2 G;操作系统:Windows 7;数据库:MYSQL 5.2。所有的算法用java语言实现。
5.3 查询质量
图3显示出Top-20的XRank[1]和HJ算法的检索质量比较。由于某类关键字组合涉及较多引用关系, 如QX6、QX7, 在XRank上的结果返回为空。
6 总结与研究展望
基于关键字的图结构XML文档上的检索带来了新的挑战, 本文试图通过对关键字的语义分析, 构建基于语义的结果模型进行探索, 从层次结构上分析结果的相关性。实验表明:与主流模型相比, 本模型在查询质量上有明显的优势。
参考文献
[1] Lin G, Feng S, Chavdar B, et al.XRank:ranked keyword search overXML documents.SIGMOD, 2003:16—27
[2] Guoliang L, Beng C O, Jianhua F, et al.EASE:an effective 3-in-1keyword search method for unstructured, semi-structured and struc-tured data.SIGMOD, 2008:903—914
[3] Vagelis H, Yannis P, Andrey B, et al.Keyword proximity search onXML graphs.ICDE Conference, 2003:367—378
8.文档管理系统入门 篇八
文档管理系统可以将制作的文档转换成电子格式,并加以组织管理,让需要这些文档的人更容易获取它们,从而减少文档数量。虽然早期文档管理系统被认为是只有大企业才享用得了的“奢侈品”,但如今有所降低的软硬件价格让几乎所有企业都能够获得文档管理系统的好处。
实际上,文档管理系统是由许多不同部分组成的网络;虽然起初看起来可能很复杂,但实际用起来其实很容易。
数据分两种类型:结构化数据(如数据库信息)和非结构化数据(如纸质文档)。文档管理系统让企业能够安全地捕获、转送、存储、管理和归档非结构化数据。虽然纸质文档是一种最常见的非结构化数据,但文档管理系统还可以存储和组织各种电子内容,如微软Office文件、传真、照片、音频、视频、PDF文档和网上内容。
文档管理系统可以进而让企业能够管理非结构化数据:把非结构化数据存储在单一存储库中,并按照“关键号”(如客户号码或员工ID)把这类数据联系起来。这对制作大量文档的企业来说特别重要,比如律师事务所或房地产公司。然后,只有授权用户直接通过文档管理系统,或通过企业的一个或多个应用软件,才可以访问文档。
文档管理系统不仅有助于安全地管理文件,还可以大幅降低运营成本,提高纸张文档和电子内容管理的效率。
由于以下诸多好处,文档管理系统还让企业能够迅速获得投资回报:
·降低了存储和检索纸质文档和电子内容方面的成本。
·减小了物理和数字存储空间。
·提高了整个企业的运营效率。
·增强了电子内容和纸质文档的安全性。
·增强了万一遇到灾难时的业务连续性(BC)能力。
·改进了法规遵从。
下面是文档管理系统的最基本的组成部分,通常通过企业的数据网络联系起来。请记住:仅仅根据纸质文档生成数字文件还不够;支持文档的存储、组织、安全、访问和及时处置也必不可少:
1、文档扫描仪是将纸质文件转换成数字格式的入口点,可以借助独立扫描仪、数字发送扫描仪或多功能打印机(MFP)来完成这种转换工作。市面上有大小、形状和速度不一的扫描仪,甚至还有专门针对特定应用环境(如支票处理)的扫描仪,所以与供应商一起确保:你选择的扫描方案最合适自己的需要。
2、文档捕获和索引软件与你的扫描和计算机系统协同运行,以简化捕获过程,并且确保存储的文档可以轻松找到。主要有三种捕获方式可供考虑:
设备捕获(Device Capture)要求用户在扫描文档期间对文档进行分类和命名,并且在企业内部执行文件命名标准,以此简化管理过程。
Zonal光学字符识别(OCR)让用户能够为他们最常用的表格和发票创建模板。通过简化数据的存储位置,ZonalOCR能够自动提取数据,识别文件,并将该信息发送到文档管理系统,从而减少手动工作量和错误。然后,用户可以搜索自己所需的具体文档,确信系统会返回正确的信息。
分布式捕获(Distributed Capture)把扫描和捕获设备放在纸张和数据进入企业的不同点。通过使用廉价的台式扫描仪、网络连接扫描仪和多功能打印机将文档馈送到系统文件,你就可以最大限度地提高投资回报,并且实现“无纸”办公环境。
3、文档管理软件又叫作企业内容管理软件,它是任何文档管理解决方案的核心部分。通过该软件,你就能减少电子文档的重复,实现高效检索,管理对系统中所存储的任何文档或内容的安全访问,从而确保只有授权用户才可以访问任何文件。由于每个文档都进行了存储和索引,现在对用户来说,企业的数据触手可及。此外,可以从企业内外安全地访问这些数据——为远程办公或经常去别的地方出差的那些人提供了灵活性。
4、当然,数据存储设备是存放文档的地方。贵企业的存储策略应该取决于贵企业的规模和性质;由于如今有众多存储系统可以使用,应该与供应商一起选择最适合自己需要的存储系统。另外别忘了备份系统,保护贵企业远离灾难性故障或主存储系统丢失。
你在为文档管理系统的这每一个组成部分考虑选择方案时。要注意适合、整合和兼容性等问题。购买的软件在硬件上可以很顺畅地运行吗?是否有专门的软件或硬件可能特别适合贵企业的特定业务?贵企业采用的索引策略在今后几年会不会很好地满足贵企业的需要,还是很快就跟不上贵企业的发展势态?在投入成本之前,务必要确信整个系统能够很好地协同运行。
9.文档管理的方法 篇九
下面以两栏的设置方法为例,即一页中有两部分的内容,分别为它们添加上页码。
(1)单击“视图”菜单下的“页眉和页脚”切换至第一页的页脚。
(2)在与左栏对应的合适位置连续按两下“Ctrl+F9”键,出现两个大括号“{{}}”。
(3)然后在“{}”中输入字符,形成这个样子:{={page}*2-1} (注意用英文状态,输的时候“{{}}”不用再输,用原有的)。
如果只要显示页码,左栏就输成:{={page}*2-1}右栏:{={page}*2};如果要显示成:第x页或- * -,左栏就输成:第{{}}页 –{{}}-
(4)完成后选中“{={page}*2-1}”单击鼠标右键选择快捷菜单中的“更新域”。
(5)在与右栏对应的合适位置输入“第页”将光标插在两字中间,连续按两下Ctrl+F9键,出现两个大括号“{{}}”,
然后在大括号“{}”中输入如下字符“{={page}*2}”。
(6)完成后选中“{={page}*2}”,单击鼠标右键选择快捷菜单中的“更新域”(图1)。
如果你的文档分为三栏,并要在每栏下显示页码,可以将“第页”之间的域代码修改为“{={page}*3-2}、{={page}*3-1}”和“{={page}*3}”(更多分栏时同理)。
再按上面介绍的方法更新域,即可显示各栏的正确页码。若要在更新域后修改域代码,可以将其选中,单击鼠标右键,选择快捷菜单中的“切换域代码”ming令,即可显示出域代码。
如果一页分三栏,则公式分别是:{={page}*3-2}{={page}*3-1} {={page}*3},对应的值分别是: 1 2 3
小技巧:页码设置到合适位置
10.屋面涤纶卷材防水施工方法文档 篇十
工程使用材料为“高分子复合涤纶卷材”厚度0.8㎜,该材料由聚乙烯脂防水膜添加抗老化涂层,纤维层组成,在胶粉粘接胶料与水泥化合下形成聚合粘接液体,经固化后形成整体防水层。该材料有抗撕裂强度高(20N/㎝),抗穿制能力强,透气等作用,是目前应用较为广泛的绿色环保防水材料。
一、屋面防水的工艺流程:清理基平修补裂缝 结点处理 大面施工 成品保护 报 检
二、屋面防水施工方法说明
1、清理基面 在防水施工开始时,对施工面进行有效清理,使之无尘无渍、无污,对基面凹凸不平,用聚合促凝腻子补修,修补的平层需要湿水养护。
2、结点处理
在大面施工之前,做好二个结点处理:
1.转角部位 2.平转立
A、壁面的处理 在新旧混凝土交接面浇筑新混凝土时,旧混凝土表面要吸收新混凝土的水分而产生膨胀,新混凝土在接触面处产生失水收缩,两者产生同方向的运动,在旧混凝土吸收水分释放后,会产生收缩,这样混凝土的冷缝就出现了。
解决的方法和选择界面剂的必要条件
首先要使界面处旧混凝土不吸收水分膨胀,新混凝土表面不失大量的水分,减少产生不同方向的运动,新混凝土就会亲和,形成整体不出现冷缝。
选用的界面剂必须为渗透无机结晶型材料,材料渗透到混凝土内部产生无机结晶体并充填细小空隙与混凝土形成永久整体,使接触面不吸收水分,但又能呼吸的界面,就可提供一个可靠的界面使新旧混凝土亲和。
B、水平面的处理 由于该材料与砼体的亲和粘接强度的纤维与砼体整体的粘连,形成了很高的粘接力,固砼体应力变化可以造成材料的伸缩变化,为了保证大面积的稳定性,中间部位折叠10公分不粘,使之形成可能发生锈变后的密封保护。3.穿墙管
穿墙管很容易形成过水栽道,无论什么穿墙管,必须做好防水处理,直径大于5㎝的要设刚性中埋垫板,然后设一道遇水膨胀上水圈,之后沿壁涂刷SBS
4.密封涂料,周围涂刷大于直径5倍的面积,同时用片材再作一层附加层。
5.转角部位
转角部位有裙楼的立面方向转角,有水平面阳面往下的转角。对于裙楼的方向转角,由于受压钝角受力,故必须做一道附加层,900两侧方方向不少于30㎝,转角的附加于平面粘接不少于20㎝,对于水平往下的转角要求附加阳角20㎝往下20㎝,根据现场状况的了解很多地方填土只剩几公分,那也就只转下几公分,不要转到填方的水平上,在立面上,预留密封部位,防止非密封后的渗水。
6.平转立的处理 在屋面的立面转角处,要求形成R=5㎝的弧园,防止受压后破坏,在批弧时,基平要求较高,必须钢刷清理,使之无残渣,在批弧的砂浆中最好掺加9-15%的防水粉,使之内外层的防水隔离。在转角立面的防水层高度要求不少于填土层面的50㎝。
三、大面积的施工
节点和大面的施工,本着先节点,后大面的原则,在施工时有时是同时进行的,方案中的表述,是层次的说明,在大面施工时,应首先配好粘接材料,胶粉与水泥,水的比例8-9;100;20-25充分电动搅拌,时间10分钟后,使之有极好的塑性,调制好后,用刮板和排刷涂于基平,要求均匀,然后铺贴卷材,铺好后滚扫排气,在卷材铺贴时,短边搭接6-8㎝,长边搭接8-10㎝,一个工作面完成后,进行封口处理,封口采用聚乙烯胶与水泥和水的复合的粘胶剂,配比提高到20:100:20和宽度不少于5㎝,沟缝密实。大面积施工的质量主要是沿边封口,为了确保防水施工创优,沿边采用金属压条的方式封口。在底涂未固化时,用金属押条,沿边铺成直线,之后用射钉加固,射钉间距300㎜,封钉压好之后,采用SBS密封涂料密封,密封宽度不少于5㎝。
四、成品保护
大面完工之后,注意成品保养,在施工后24小时未固化前,进行空鼓检查,对于有空鼓的部位,用刀片划在十字用封口配比的胶底涂,然后面层在铺一层防水卷材,同时,不得人为穿制破坏,固化后,如温度超过20oC则每天需要2-3次的雾水保养。
五、自检合格后报验。
六、施工组织机构和施工进度计划
1、施工组织设计
为了使工程快而不乱,管理有条,设立由公司有关部门以及项目经理等组成的现场管理机构,设立技术负责人、质安员、各专业及材料试验等专职人员,全面负责该工程的施工、加强技术交底、认真计划进度、确保安全、严格材料的合格进场审核、彰扬文明施工工作,由项目经理负责具体实施,落实到现场具体人员,并定期召开技术、施工进度会议,提高工程质量,加快工程进度,按期完工交付甲方使用。本工程质量目标是保证取得优良工程。
11.通用企业文档管理检索系统研究 篇十一
摘 要:用于沟通和记录的文档对于企业是非常重要的,但是企业在进行文档管理的过程中,经常会碰到以下的问题:文档数量多管理困难、分布零散查找缓慢、文档安全无法保障、文档无法有效协作共享。如何有效的管理和高效的利用已有的文档已经成为一个亟待解决的问题。文章动手打造一套企业内部的文档全文检索系统,来解决以上问题。
关键词:企业内部;全文检索
中图分类号:TP315 文献标识码:A 文章编号:1006-8937(2016)15-0078-02
通用企业文档管理检索系统其核心是对文档的管理和检索,将零散大量的文档像构建图书馆一样分门别类的整合到管理系统中,通过对文档建立的索引来快速高效的查找文档。以此打破传统文档在协作与分享时存在的壁垒,让文档间的沟通和记录更加自由、实时、安全和高效。
1 系统功能描述
文档的有效管理是实现文档高效检索的前提,一个功能完善的文档管理系统在企业内部就相当于一个小型的文档云服务。
文档管理系统的基本功能的就是文档的存储、下载和预览,企业内部通过文档管理系统的唯一入口将零散的文档传递到文档存储服务器来存储,在用户需要时为用户提供文档预览和副本的下载功能。
出于安全考虑,在文档上传到文档存储服务器时,系统会对每个文档做MD5的校验并为用户提供原始校验值以便用户在下载文档后确定文档的完整性。同时MD5信息也会用于文档管理系统判定用户上传的文档在管理系统中是否重复,防止大量存储重复的文档。
在多部门多层级的企业内部,文档权限管理功能确保用户在使用文档管理系统时只能检索、预览和下载与当前用户所具有权限匹配的文档,这样能够有效保证文档内容的安全,防止机密信息的泄露。不同角色和用户也成为了文档的一个重要属性,在检索过程中能够根据不同角色或用户来筛选文档。
文档在不断的使用过程中会持续的进行迭代,传统的文档版本管理仅仅局限于在文档内容中添加文档版本管理表来进行管理,但文档前后做出的修改难以详实记录。在通用企业文档管理检索系统中通过对文档的版本管理让文档的迭代操作更具有实用性。
那么如何进行文档的检索呢?文档属于非结构化数据(全文数据),不能像结构化数据那样简单的存储在数据库中进行查询,一般的检索系统只是根据文档的标题和一些属性来搜索与结果相关的文档,而真正高效的检索文档就要求不能只根据文档标题进行检索,而是需要得到文档的内部信息通过全文检索(Full-text Search)技术来检索文档。
全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文档中出现的次数和位置,当用户检索时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。
通俗的考虑,通过字典的偏旁部首表查找一个生字总会比盲目的翻看整本字典要快。
为了更快的实现文档检索系统我们选用成熟的开源全文检索引擎——Lucene全文检索引擎。Lucene是Apache软件基金会的一个子项目,是一个开放源代码的全文检索引擎工具包,它是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。
也就是说,Lucene只是一个发动机,而要让文档检索系统“跑起来”还需要我们为其打造其他部件。
在建立索引的过程中首先要将源文档转换为文本信息,然后对文本信息进行具有语义化的分词后提供给Lucene存储为能够进行文本查找的全文检索库。
这样我们再通过Lucene进行检索时,Lucene就能根据词出现的频率以及相关度来提供给我们与结果最匹配的文档信息。这里就不在详细描述Lucene检索信息的原理。
2 系统架构设计
文档管理检索系统的功能设计的体现,如图1所示。图中包含了一些提高用户体验的模块,比如文档评分、评论模块用来收集用户对文档的满意度,文档操作日志模块用于记录文档发生任何变化的相关信息。
这个产品架构功能简洁,业务划分明确,方便后续的产品迭代。
在系统的架构设计方面,为达到用户灵活多变的检索需求,系统要充分考虑数据的合理组织,各类数据方便、有效的输入,相关信息的链接和处理,检索功能的设计,以及信息的提供类型和方式。
我们根据系统要实现的功能和最终目标,设计出全文检索系统结构,整个系统分为五部分:检索/管理系统、业务接口、索引服务、文档服务和文档预览服务。
在系统设计上为了提高系统的可重用性和降低系统耦合度,系统整体采用面向服务的体系结构,完全独立的开发部署文档服务接口、索引接口并遵循Restful设计原则以便兼容其他系统。如图2所示。
3 系统展示
前期功能很简单,但随着需求的增加我们可以将文档服务打造成一个独立的“文档云服务”—能够对接企业其他系统并提供相应的文档管理服务。
文档检索方面我们需要在系统的使用中不断优化Lucene全文检索引擎的分词与检索功能,增加文档的相关属性以便缩小检索范围检索结果更精确。如图3所示。
4 结 语
本文研究的重点是如何有效的管理和高效的利用已有的文档,通过构建通用企业文档管理检索系统使企业内部成员可以轻松地打破文档交流的壁垒。在全文检索技术的帮助下更加精准的锁定所需的文档让企业内部的文档在分享中更具有价值。
参考文献:
[1] 张俭恭,陈定权.汉字全文检索系统的关键技术与实现[J].现代图书情 报技术,2001,(2).
[2] 严威,赵政.开发中文搜索引擎汉语处理的关键技术[J].计算机工程,
【文档管理的方法】推荐阅读:
后勤管理文档06-27
科室管理文档08-01
项目管理总结 - 2003 文档09-14
职业卫生管理制度文档11-10
企业工资管理系统文档11-20
酒店管理中处理投诉的技巧 Microsoft Word 文档09-17
2024年度仓库管理评审报告文档06-08
网络管理软件技术文档09-12
市场部电子文档管理计划09-23
设计公司管理制度文档11-21