CET-6 词汇总结和记忆方法(共4篇)(共4篇)
1.CET-6 词汇总结和记忆方法 篇一
CET-6词汇语法模拟题集(1)
CET-6词汇语法模拟题集(1)
thateveryoneunderstandswhatisrequiredandhowto____theprocedures.
[A]impose [B]implement
[C]reinforce [D]rectify
1.Iwasinthe____ofwashingwhenshecametovisitmeandbroughtmeacoupleofbooks.
[A]amid [B]center
[C]course [D]midst
2.The____deathoftherevolutionary,athistwenties,isagreatlosstoourparty.
[A]premature [B]forthcoming
[C]advanced [D]hasty
3.Hetookthe____byaskingthefirstquestiontothevisitingscholarathislecture.
[A]injection [B]rejection
[C]orientation [D]initiative
4.She’svery____--shespendsallhermoneyonclothes.
[A]generous [B]extravagant
[C]extreme [D]unreasonable
5.A____ofinterestinthemattercameintohereyesbutsoonextinguished.
[A]glitter [B]drizzle
[C]dazzle [D]gleam
6.Thesewhocan____difficultiesontheirwaytosuccessmaykeepcalmwhentheyreallyappear.
[A]anticipate [B]expect
[C]promise [D]foresee
7.Theconstant____betweentheyoungcouplefinallycauseddivorce.
[A]conflict [B]collapse
[C]resistance [D]friction
8.Wehaveseveraldifficultiesinforeigntradetransactions.Nowtheexcessofimportsoverexportsbecameanother____.
[A]compliment [B]intricacy
[C]complication [D]compensation
9.Mohammedisthe____oftheMuslims,whoestablishedhisteachings,whichformedthebasisforKoran.
[A]infant [B]genius
[C]puppet [D]prophet
10.Withnopicturesathand,thepoliceartistmadea____pictureofthemurderer.
[A]composite [B]sophisticated
[C]competitive [D]mechanical
11.Whatcausesemotionalproblemsforchildrenofdivorceisgenerallytheeventsthat____thebreakup.
[A]prevailed [B]presided
[C]proceeded [D]preceded
12.Foundinallpartsofthecountry,pinesarethemost____treesinthiscountry.
[A]ordinary [B]average
[C]usual [D]common
13.Swarmsofantsarealwaysinvadingmykitchen.Theyareathorough____.
[A]nuisance [B]disturbance
[C]trouble [D]annoyance
14.Theheadofficeofthecompanyhasbeen____fromHongKongtoNe
wYorkforthesakeofbusinessexpansion.
[A]transported [B]transplanted
[C]transferred [D]transmitted
15.Youshouldmakecertainthateveryoneunderstandswhatisrequiredandhowto____theprocedures.
[A]impose [B]implement
[C]reinforce [D]rectify
16.____circumstancescompelledhimtoclosehisbusiness.Nowhehadtofindotherwaysforaliving.
[A]Opposite [B]Adverse
[C]Opposed [D]Favorable
17.Heworksasa____forthiscommunity,deliveringlettersandnewspaperseveryday.
[A]messenger [B]passerby
[C]preacher [D]burglar
18.Ournewdirectorismuchyoungerthanhis____,whoisalready50yearsold.
[A]successor [B]precedent
[C]predecessor [D]&
19.Sheisso____--shewon’tletanyonehelpherwhensheisinsuchadilemma.
[A]willful [B]abnormal
[C]obstinate [D]ardent
20,Thewomanisinasorry____,unemployedandwithnoonetosupporther.
[A]surrounding [B]environment
[C]plight [D]embarrassment
21.Theyworklonghoursbutdonotearnenoughtoensurea____livingforthemselvesandtheirfamilies.
[A]reticent [B]decent
[C]innocent [D]descent
22.Therearefewareasofourlivesinwhichtoolsdonotplayan____part.
[A]indispensable [B]independent
[C]indistinguishable [D]indiscriminate
23.Britain’sChannelFourtelevisionsenthimtoNewYorktodoa____interviewforits“TheWord”programme.
[A]lively [B]live
[C]living [D]alive
24.Inoneofthemosthigh-techcountriesintheworld,theprocessappliedbyananimatorissurprisingly____.
[A]physical [B]manual
[C]mental [D]sensual
25.Itmightbe____notingthatwhilewordslastalongtime,sensitivitiesdochange.
[A]deserved [B]worthwhile
[C]worth [D]worthy
26.Myshoeshavebeenwornout.I’llhavetobuy____.
[A]somenewpair [B]anewone
[C]somenewones [D]anewpair
27.If____letterarrivesforme,canyousendittothisaddress?
[A]no [B]some
[C]any [D]somemore
28.Taxesanddeathmaycometo____,buttheynevercomewithimpartiality.
>[A]allmen [B]allofman
[C]allmen [D]allofmen
29.MissGreencontributedfiftydollars,butshewishedshecouldcontribute____.
[A]oneotherfiftydollars[B]thesameamountalso
[C]morefiftydollars [D]anotherfifty
30.Ourmonitorisalwaysreadytodogoodto____.
[A]theother [B]theothers
[C]other [D]others&
2.CET-6 词汇总结和记忆方法 篇二
文本聚类[1]是一种无指导的文档分类,它把一个文本集分成若干称为集簇(Cluster)的子集,每个集簇的成员之间具有较大的相似性,而集簇之间的文本具有较小的相似性。文本聚类也是一种有效的Web文本挖掘方法,能从大量文本数据中发现潜在的知识和规律,它既是一个知识获取技术,也是一种文本处理过程。在海量Internet信息检索中,文本聚类的有效标识不但为使用者提供了方便,有利于信息资源的合理存储,而且可以改善检索性能,提供导航、浏览机制,发现相似文档等。因此,文本聚类研究已成为数据挖掘的一个非常重要的课题。
2文本聚类的语义问题
传统的文本聚类挖掘主要采用基于关键词集的向量空间模型(VSM)[2],没有考虑文本中的深层语义信息和丰富的语义关联,也即不考虑异名同义问题。例如“盐”和“氯化钠”,“电脑”和“计算机”等这些同义词或者等义词在数据库中会分别进行记录,挖掘处理时则看成不同的信息。这不仅会造成大量的数据冗余,而且可能会掩盖数据库中所隐藏的有用信息[3]。因此,会出现数据维数过高﹑聚簇难以描述的问题,使得同一类别文档的聚合能力﹑聚类的准确率﹑召回率都有所降低,影响了聚类的效果。目前已有研究将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法[4]。该方法将词频特征与深层语义特征相结合,较好地将包含语义相关,相同主题词条的文本聚集到一起。但这只考虑了文本的语义信息,而对互联网的用户而言,由于网上信息增长快,信息量巨大,大部分用户往往只对某一领域的信息感兴趣,面对如此巨大的信息量,仅从语义方面去考察就无法满足用户的需求,从而影响了聚类的性能。此时,就首先需要对某领域的相似信息进行聚类。
石油工业词汇丰富,专业术语和俗称的概念形式差别很大,但语义却相同。如:“乙醇”和“酒精”,“小苏打”和“碳酸氢钠”,“笑气”和“一氧化二氮”等词都表达了相同的含义。为提高聚类的效果,我们设想,如果可以在此领域中对词的语义信息进行分析,将语义相同的词汇映射到同一概念,即用一个词来替换所有含义相同的词,就可以大大降低文档向量空间的维数,减少计算量。
知网具有较为完备的知识和概念表达体系以及良好的概念层次结构,领域词典可以对具体的某领域的文本特征进行研究,处理该领域的信息。因此,本文将HowNet作为背景知识,尝试结合石油化工产品领域,引入领域概念词典,利用聚类挖掘算法对相关文档进行领域聚类。这不但有利于挖掘、较好地浓缩数据库中的记录,还能在某一领域中实现基于语义的挖掘和预测,从而可以把特定领域的文本进行进一步地细化,大大提高信息获取的效率。
3HowNet与领域词典介绍
3.1知网简介
《知网》(HowNet)是最为著名的采用汉语描述的本体论,它以汉语和英语的词语所代表的概念为描述对象,以揭示概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。HowNet通过义原的组合来标注各种各样的单纯或复杂的概念,以及各个概念之间、概念的属性和属性之间的关系。
例如,下面是从知网的知识词典中抽取的对“汽油”这个词的语义描述:
NO.=066875
W_C=汽油
G_C=N
W_E=gas
G_E=N
DEF=material|材料,liquid|液,burn|焚烧
其中DEF项的等号右边就是“汽油”的概念,表示“汽油是一种材料,是一种液体,有焚烧的作用”。其中“材料”﹑“液”、“焚烧”是HowNet所规定的特征,它们一起形成了对该概念的属性描述。另外 “”代表了“汽油”与“焚烧”间的一种受事—事件关系。
3.2领域词典的构造方法
本文实现领域词典[5]构造的基本思路是:根据《中国图书馆分类法》,对石油领域的主题词汇进行展开,构成有层次的石油学科的主题词汇的系统排列,可以作为石油主题的初始关键词集合。利用综合性搜索引擎对各类石油主题词进行查询,得到与石油主题相关的页面,再利用基于DOM树的词共现模型对页面进行分析,生成词共现信息[5]。然后找出与原始主题词相关联的词语,对主题词进行扩展。最后对扩展后的主题词进行筛选,形成比较完善的石油领域词典。
4基于语义和领域相关的聚类挖掘——SDTC模型
基于SDTC模型的聚类算法的主要思想是:针对某一领域,通过引入知网来处理同义异形的问题:先引入一个领域概念词典模型,附以某领域关键词权重,将权重大的关键词进行知网的特征提取,然后将关键词映射到概念空间中,构造概念向量空间模型,最后使用聚类算法对文本进行聚类。
对文档进行聚类的算法如下:
输入:石油领域的文档。
输出:文档聚类后的类别。
(1)对输入文档进行分词,去掉代词,连词,介词等,抽取关键词;
(2)引入领域概念词典,并调整关键词的权重,一旦发现某个词语出现在领域概念词典中,就加大它的权重;
(3)对关键词进行排序,选择权重最大的前N个关键词;
(4)引入知网,将关键词映射到义原;
其中,概念映射[6]Φ(P,λ):P→Q
文本的项集特征向量pi = (t1,d1...;ti,di;…;tm,dm),P为项集特征向量,Q为概念集特征向量
Q =(
(5)构造概念VSM,形成义原[3]加关键词的特征向量,即V(Di)=(w(di,a1),…,w(di,am),tfidf(di,t1),tfidf(di,t2),…,tfidf(di,tk));
(6)在义原空间中,利用余弦相似度计算特征向量的相关性;
(7)利用K-MEANS算法聚类。
5实验结果与讨论
为了测试基于SDTC模型的中文文本聚类算法的有效性,本文分别用传统的基于关键词的中文文本聚类算法,基于《知网》的中文文本聚类算法和基于SDTC模型的中文文本聚类算法做了对比实验。具体实验环境为:CPU:3.00GHz,内存:512M,操作系统:Windows XP,编程语言:C#.net。其中,中文分词系统采用中科院ICTCLAS分词系统,所用《知网》为2000版。
具体实验时选取了100篇文档作为训练测试集,分别是汽油,柴油,煤油,添加剂,润滑脂[7]5个类别,从每个类别中选择了20篇文档进行验证。实验采用F-measure值作为聚类结果的一个质量指标,即F-measure=undefined(P为准确率,R为召回率)。
实验设定聚类簇数目k=15,分别重复执行聚类过程以获得平均性能指标。实验中基于关键词集的文本聚类最终获得1500个关键词,从而形成1500维向量空间;基于《知网》的中文文本聚类算法中最终获得800个关键词,形成了800维向量空间;而基于SDTC模型的中文文本聚类算法中最终获得500个关键词,从而形成了500维向量空间。
从实验结果可以看出,基于SDTC模型的中文文本聚类算法要优于基于关键词的聚类和基于《知网》的聚类。实验结果显示:由于在聚类之前引入了领域概念词典调整其权重,将权重大的词语进行知网的特征提取,在一定程度上减少了关键词数目,解决了同义词替换的问题,更加准确的表示了关键词的语义特征,同时也大大降低了向量维数,从而获得更高的聚类质量。
6结束语
本文针对石油化工领域,通过引入知网来处理同义异形的问题,从而实现文本聚类中基于语义的挖掘,进而解决传统的文本聚类挖掘缺乏处理深层语义信息的问题。在处理同义异形的问题上,是以领域特征明显的词或者短语作为聚类对象,最后利用文本聚类的特征提取方法进行词语的领域聚类。与传统的聚类挖掘相比,基于语义和领域相关的聚类挖掘更能挖掘出有意义的模式,而且可以应用于石油领域的文本之中,增强了此领域的特征表示能力。当然,由于领域的复杂性,领域概念词典存在覆盖度不足的问题,有待进一步解决。
除本文基于语义的聚类挖掘方法外,还可以考虑通过建立领域本体[8]模型来实现概念之间的语义,进而进行基于语义的挖掘,提高算法的准确性和健壮性。
随着语义技术研究的深入,结合语义的数据挖掘算法将会是传统数据挖掘算法发展的一大趋势。
参考文献
[1]Song Shaoxu,Li Chunping.TCUAP:a novel approach of text clustering using asymmetric proximity.ProceeDings of the2nD InDian International Conference on Artificial Intelligence.InDia:IICAI,2005.604~613
[2]马国俊.基于潜在语义索引的中文文本聚类的研究.计算机应用,2005,28(10):58~59
[3]时念云,禇希,张金明.基于语义的决策树挖掘方法研究.微计算机应用,2007,28(12):1288~1291
[4]赵鹏,蔡庆生.一种基于《知网》的中文文本聚类算法的研究.计算机工程与应用,2007,43(12):162~163
[5]李晗.面向石油的主题搜索引擎研究.中国石油大学硕士学位论文,2008.
[6]庄世芳.一种改进的基于概念的中文WEB文本聚类算法的研究.福州大学硕士学位论文,2005.
[7]时念云,杨晨.基于领域本体的语义标注方法研究.计算机工程与设计,2007,28(24):5985~5987
3.高中英语词汇教学记忆和检测方法 篇三
关键词 英语词汇 单词记忆 检测方法
0 前言
单词是英语学习的基础,记忆单词对英语学习尤为重要。学生进入高中后,英语词汇猛增,记忆单词将占去学生很大一部分时间。如果方法不当,不仅记忆效果差,还会极大地打击学生学习英语的兴趣和自信心。①因此有一套良好的记忆和检测英语单词的方法尤为重要。为了解决这个难题,在几年的教学探索和实践中,作者摸索出了一套高效的单词记忆和检测的方法,总结如下。
1 单词记忆法
1.1 朗读、识记、拼写法
英语单词是由26个字母组成,如同汉语拼音,大多数的单词是可以听音写出来的,不规则的单词很少,只要会准确地读出英语字母和音标,很多陌生的单词也可以照着读音写出来。所以在记单词时,只要你记住了单词的发音,就可以拼出80%的单词,这样既背会了单词,又练会了单词的发音,记单词的同时,也为练一口流利而纯正的英语打下了良好的基础。在学习的过程中,练习正确的发音尤为重要。首先,要熟练掌握二十六个字母及其字母组合的正确发音。其次,弄清他们元音和辅音的区别,具体做法如让学生知道a﹑e﹑i﹑o﹑u在开音节和闭音节中的不同发音;在平时的课堂上渗透辅音字母b﹑d﹑f﹑m﹑h﹑k等的发音和一些常见字母组合如:ea﹑oo﹑al﹑ay的发音。例如cape/ cap/said/say/ loud /lord /shout/short等。教师可以先让学生自己比较和探究上述单词的拼写与发音之间的关系,然后引导学生简单归纳,帮助学生理解、掌握和运用英语发音的规律。为自主学习单词和扩展词汇打下良好的基础。我每次教完词汇后,总是让学生大声地把它们朗读出来,在朗读的同时,用手指在空中把所读的字母划出来,如果不是按照读音规则拼写的部分,再停下来,特别地关注一下那些特殊的部分。
1.2 举一反三法
在语言交流中,最基本的语言单位是句子而不是单词。只有学以致用,真正将所学单词用于日常生活、学习、工作环境中,才能算真正掌握了单词。记住了单词在某一语境中的用法,不但可以在遇到此情况时可熟练地运用此单词,还可以举一反三。比如你在阅读中看到这样的句子:The interest on the load is 16% per year,贷款年利息为16%。该句中interest为利息,由此再联想我们学过的单词interest的其他用法:如The older ones soon lost interest(兴趣)in the game。那些年纪大的很快对这游戏失去了兴趣; it will interest you将会让你感兴趣;places of interest(名胜); be in your interest(对你有利); be interested in(对什么感兴趣)等。通过归纳,举一反三,学生就会很快掌握同义词汇在不同语境中的用法,达到灵活运用的效果。
1.3 词根、前缀、后缀记忆法
很多单词是有规律可循的,动词+er/ or/ ant/ ent/ ist构成名词如:teacher, actor, assistant, typist; 名词或形容+ist/ ian 变成名词如:musician, specialist, photographer,electrician;形容词加前缀ir/im/ dis等变成相应的反义词如: irregular, impossible, disable等等,通过归纳总结,找到规律,就能轻而易举地获得很多词汇。其次,争取一串串地背单词,看见一个,就能想起一串。比如,同义的、反义的、形似的、同类的、同根的单词放在一块儿记。如表示“喜爱”的动词like, love, enjoy, care for, care about ,be fond of, be keen to 等放在一起,看它们在意义和用法上有什么区别,这样就不至于把它们混淆。再比如在书面表达中常用来表示上下文逻辑关系的词语大家不妨采取归类记忆法。表示并列关系的有:and, as well, as well as, besides等;表示转折关系的:but, however, yet等;表示递进关系的:especially, what's more, worse still, to make matters more等。
1.4 活学活用记忆法
阅读就是通过增加阅读量,提高阅读速度,掌握一定的阅读技巧。即在地道的语言材料和真实的语言情景中记忆、感知词汇,做到词不离句,句不离文,把词汇的记忆和运用巧妙地融为一体。②开始的时候,太难的文章肯定不适合基础差的同学,所以先可以看一些“书虫”(高中水平)一类的改编小说,练练感觉。当单词量积累到一定程度以后,就可以正式开始提高阅读水平了。大家都知道:读书破万卷,下笔如有神。 如果你阅读了很多文章,作文不会低分的。在背作文的同时,可以用一个小本子,把一些很精彩的词和句子抄下来,经常看看,并举一反三。同样一个词和句子,用在不同的地方,会有不同的效果,同时要对自己有信心,相信自己,付诸努力,坚持下来,你一定能行。
2 单词记忆检测方法
掌握了以上方法,加上勤于用功,平时做到多读、多听、多写,记忆英语单词就会变得轻松有趣,就会在有限的时间内,提高学习效率,减轻学习英语的负担,达到事半功倍的效果。只要灵活运用, 有信心,能坚持,就可以化难为易记好英语单词。
当我们有了良好的记忆单词的方法和手段,那么最有效的检验方式应该是什么呢?大多数教师以听写英语单词作为最常用的检验方式,他们读出汉语意思,让学生写出相应的英语,这样的检验效果明显、直接,但是误导了学生记单词的目的,使学生花大量的时间在记忆单词拼写上,而忽略了它的意思和用法。其实按照高考考纲的要求,高中阶段需要学生熟记书写出来的单词并不是很多,只有3500词需要认识和使用,要学生写出来的只是作文所需要的词汇,所以大部分的单词只需要学生认识就可以了。我们对词汇的检验,完全可以多样性,以认知为主,尽可能大地扩大学生的认知量。
我们可以从听力、认知、拼写三个方面同时检验学生记忆单词的情况。每次教完词汇后,我总是让学生大声地把它们朗读出来,在朗读的同时,用手指在空中把所读的字母划出来, 只停下来去特别地关注一下那些特殊的部分。所以一个单元的单词学生只需要读上两三遍就可以记住90%以上了。然后,在检测他们记忆效果时,以英文的形式呈现给他们,我读出正确的单词,学生听音,然后拼写,再写上单词的意思。简单的听写,达到了听、写、认的三重效果。让学生在简单的训练中,收获成功的喜悦,让单词记忆和拼写不再枯燥无味。
3 结语
4.CET-6 词汇总结和记忆方法 篇四
在现实生活中特别是在企业里面,报表无处不在,报表生成工具在管理信息系统中有着举足轻重的地位。通过对生产活动中的各种数据进行汇总、统计和分析,可以多层次,多角度、全面而详细地了解企业生产运作状态,是管理高层进行决策规划的数据基础。然而,由于我国企业报表的设计规划很不规范,样式规格纷繁复杂,对于每一个信息管理系统来说,报表部分都是极其耗时费力的工作,而且还常不能满足用户灵活变动的要求。设计一个报表样式可以由用户灵活设计,通用的报表系统是一个非常实际意义的研究课题。
2 报表系统研究现状
Excel是专业的制表工具,内置丰富的公式函数,具有强大的数据统计分析功能。目前在企业当中,Excel的应用非常的普遍,几乎所有的计划统计部门都采用Excel作为日常最主要的报表工具。因此,在动态通用报表的设计方面,以Excel组件为操作对象进行报表系统的开发很受软件开发者的欢迎。目前这方面的研究已经取得了很大的成果[1],但是由于以Excel文件作为文件对象访问方式要求对每一种样式的Excel文件都要单独编程,工作量大且灵活性差,以Excel文件作为数据库访问方式对于规范的二维顺序表样式的报表没有问题,但是对于不规则的交叉表、混合统计汇总表等就无能为力,而实际当中这类不规范的占的比重还非常大。因此在实际应用当中还有很多问题需要解决。
XML是一种可扩展性标记语言,其自描述性使其非常适用于不同应用间的数据交换,而且这种交换是不以预先规定一组数据结构定义为前提。XML最大的优点是它对数据描述和数据传送的能力,因此具备很强的开放性。如果用XML来描述报表数据,则报表的设计就会具有很大的灵活性,因此利用XML实现动态通用报表的研究也开始受到人们的重视,并取得了一定的成果。但是也都存在一些问题,如参考文献[2]中提出的方法仅限于对已有数据的查询结果进行格式调整,只是在最后报表的生成阶段实现了灵活设置,参考文献[3]所提出的方法需要构建知识表达和知识库,实际操作性较差。参考文件[4]采用模板技术,模板与数据相分离,采用数据库方式存储报表模板和系统各种数据,实现报表的权限管理、分类管理和网络化管理,但是在实现上采用FastReport这个商用软件实现,无法由程序开发人员自由控制。参考文件[5]采用固定格式的文本文件作为报表文件的载体,经过解析程序实现动态报表,利用这种方法设计的报表系统灵活性较好,但是由于所有工作围绕文本文件进行,所以操控性较差,解析工作比较麻烦。
本文在对XML和Excel的进行深入研究后,提出一种新的动态通用报表系统的设计方法。采用模板技术,数据与表现分离,以XML为载体经过解析进行数据统计分析并动态生成报表。具体操作时,以企业中普遍采用的Excel文件作为报表模板和数据采集对象,对Excel文件进行XML分解,使报表的数据和表现相分离,以XML的形式存入数据库,使用XQuery语言对数据库中的XML数据进行统计和分析,通过对XML数据的组装最后以Excel文件的形式输出报表。
3 系统结构设计
整个报表系统的系统结构如图1所示,由报表模板生成、统计模板生成、报表数据采集、报表组装4大子系统及数据库组成。
报表模板生成子系统将Excel文件格式的报表模板进行XML分解,将报表的结构信息以XML格式存入数据库。统计模板生成子系统负责生成描述报表中各数据组成元素间逻辑关系的信息,同样以XML格式存入数据。报表数据采集子系统负责采集具体报表文件中的数据,根据某种报表模板的XML描述信息将其具体的数据以XML格式存入数据库。报表组装子系统则根据报表模板的结构信息、数据逻辑关系和具体数据进行统计计算并组装,以Excel文件的格式输出报表。其中报表模板生成子系统是整个系统的基础和核心,下面也将以报表模板生成为重点对各个子系统进行详细介绍。
3.1 报表模板生成
报表模板生成子系统的系统结构如图2所示,将Excel文件格式的报表模板进行XML分解,生成与其对应的模板信息、架构信息、映射信息的XML描述。这3种信息的XML描述存放在数据库(如MS SQL Server2005)中,在后面的统计分析、数据采集以及报表组装时都会用到。
模板信息描述报表的基本信息,包括模板标识、模板定制人、模板定制时间、报表类型、表头信息、数据信息等内容。报表类型主要分为顺序型、交叉型和混杂型3类。顺序型报表最为常见,也是惟一可以直接转化为数据库形式的报表,即表头为上面若干行,下面为数据。交叉型报表的特点是上面若干行和左面若干列为表头,中间部分为数据。混杂型报表的表头和数据相互交错,很不规范,一般都可以通过一定的手段转化为交叉表。表头信息和数据信息主要说明表头和数据区域的范围。具体就是在工作表中的起始行号、列号以及行数、列数。
架构信息描述报表所包含信息的结构状况,即Excel模板样式的树型结构。Excel模板样式都可以用树型结构表示。报表有效区域的单元格可以分为2大类:一类是表头,表示的是框架信息,在结构树中是枝干;另一类是数据,是具体的值,在结构树中是叶子结点。架构信息就是Excel模板样式结构树对应的XML描述。如图3所示的报表模板对应的模板结构树如图4所示,经处理后得到的架构信息如图5所示。
映射信息描述报表中每一个数据单元格与模板样式结构树中的每一个叶子节点的一一对应关系。图3所示的报表模板经处理后得到的映射信息如图6所示。通过映射信息,就可以知道Excel报表文件中的每一个有效的数据单元格所表示的具体的含义(即叶子节点在结构树中的位置),也可以知道每一个叶子节点的值(Excel报表文件中对应的单元格中的数值)。如图3所示报表模板中的“D6”单元格(第6行第4列)所表示的就是“/洗煤名称/洗煤/本季度总产量/目标”,同样,“/洗煤名称/合计/本季度总产量/计划”的值就是单元格“C4”(第4行第3列)的值。
图5和图6中前面带“+”号的数据项没有展开,因其结构和上面已经展开数据项的相似,为了完成的显示整体内容故处于折叠状态。
3.2 统计模板生成
报表中的数据来源主要有2种:直接获取的和统计计算的结果。统计模板生成的主要任务就是描述统计计算的方式方法。Excel强大的统计功能依赖于其丰富的公式和函数,而公式和函数可以将Excel文件中的指定单元格作为操作对象又是其充分发挥作用的基础。同理,报表统计必然要求系统能够方便快捷的获取现有的报表数据,而报表数据是以XML文档的格式存在数据库中的,因此如何从XML文档中获取数据是关键问题。
XPath是一门在 XML 文档中查找信息的语言。XPath可用来在XML文档中对元素和属性进行遍历。XPath是 W3C XSLT 标准的主要元素,并且XQuery和XPointer同时被构建于XPath表达之上。
XQuery是一种可以查询结构化或半结构化XML 数据的语言。XQuery 基于现有的 XPath 查询语言,并支持更好的迭代、更好的排序结果以及构造必须的XML的功能。若要查询XML类型的变量或列中存储的XML实例,可以使用XML数据类型方法。例如,可以声明一个XML类型的变量,然后使用 XML 数据类型的 query() 方法来查询此变量。
前面的模板生成将Excel模板分解成模板信息、架构信息和映射信息,特别是映射信息的生成,使得仅以行号和列号标识的单元格具备了实际的现实意义。使用XQuery语言对数据库中的XML数据进行自动提取[6],并将提取的数据进行一些运算,按照Excel公式和函数的功能设计理念,同一报表内部的数据逻辑关系可以非常容易的进行设置。仍以图3中的报表为例,合计的入洗煤量等于洗煤的入洗煤量加上块煤的入洗煤量,即:“/洗煤名称/合计/入洗煤量”=“/洗煤名称/洗煤/入洗煤量”+“/洗煤名称/块煤/入洗煤量”。如果加上模板的其他信息,则不同报表之间的数据逻辑关系也可以设置。如计划“/洗煤名称/合计/本季度总产量/计划”=“洗煤产品产量计划表/{本季度}/总产量/计划”。统计模板生成系统结构如图7所示。
3.3 报表数据采集
将XML架构与工作簿相关联,能够更为简单和可靠地在Excel中导入和导出数据。当XML 架构添加到工作簿时,Excel 会创建一个称为XML 映射的对象。这些 XML 映射可以将单元格或范围映射到XML 架构中的元素。在导入或导出XML 数据时,Excel 使用这些映射将映射范围的内容与架构中的元素联系在一起。
数据采集的系统结构如图8所示。在前面,已经根据报表模板生成了架构信息、映射信息等XML描述并存入数据库;上报数据的时候,根据这些信息和上报的Excel报表文件结合,就可以将Excel报表文件中的数据信息提取出来,将其以XML数据的形式存入数据库,同时记录上报人、上报时间等报表信息。
3.4 报表统计输出
报表组装输出的系统结构如图9所示。首先根据报表信息和统计分析信息对报表数据进行统计、汇总计算,生成最终报表的报表数据,最后根据架构信息和映射信息组装成Excel报表文件输出给用户。
4 结 语
本文通过对XML和Excel的研究,提出一种利用XML和Excel设计动态通用报表系统的新方法,并在山东兖矿集团煤业公司煤矿的报表管理系统中进行实际应用。采用这种方法设计的报表系统可以方便灵活地设置报表模板,完成数据上报以及统计、汇总和分析,并且适用于各行各业,通用性强。
摘要:提出一种利用XML和Excel设计动态通用报表系统的新方法。首先对Excel报表模板进行分解,生成报表模板的报表信息、架构信息和映射信息,再根据统计模板生成统计分析信息,这些信息均以XML文档的形式存入数据库。在系统运行时,将用户上报的Excel文件中的报表数据提取出来,以XML文档的形式存入数据库。然后结合XPath和XQuery对报表数据进行统计分析,得到统计报表数据。最后将统计报表数据组装为Excel文件输出给用户。采用这种方法设计的报表系统动态灵活、通用性强。
关键词:XML,Excel,XPath,XQuery
参考文献
[1]文静华,张梅.基于Excel的企业通用动态报表生成工具的设计[J].计算机工程,2005,31(4):221-223.
[2]艾永亮,王保保.一种新的通用报表模型的研究与实现[J].现代电子技术,2007,30(4):172-173.
[3]潘福成,张士杰.基于XML的智能报表生成工具的研究[J].小型微型计算机系统,2005,26(1):134-138.
[4]周一,王世耕,黄忠全,等.基于FastReport的通用报表系统的设计与实现[J].计算机应用与软件,2008(2):284-285.
[5]张亚平,贺占庄.B/S架构下动态报表的一种实现方式[J].计算机技术与发展,2007(4):93-95.
【CET-6 词汇总结和记忆方法】推荐阅读:
英语词汇记忆方法漫谈09-10
托福词汇四种记忆方法10-05
GRE提升词汇量保证深度记忆效果方法10-20
托福词汇:词根联想记忆07-13
初中英语词汇记忆教学01-24
新gre词汇记忆大法07-13
考研英语 重点记忆核心词汇01-08
考研英语易混淆词汇比较记忆10-08
2016考研英语词汇音节记忆法12-04
职称英语高频词汇记忆技巧全解03-18