基于大数据的学生发展性评价体系建设

2024-07-19

基于大数据的学生发展性评价体系建设（7篇）

1.基于大数据的学生发展性评价体系建设篇一

2.1应用集成架构

以大数据资源为依托，建立以数据分析为驱动的、包括方案策划、目标客户选取、营销事件捕捉、商机把握、营销匹配、多波次营销、渠道执行与效果评估等环节在内的微营销框架等，图1为相应的应用基础架构图。

2.2客户事件感知

构建事件处理域，通过对数据源采集，及时的规则库匹配，内存数据库及流计算技术的引入等，以实时模式，识别客户事件，保障及时准确的触发营销活动。事件处理中心以实时与非实时两种方式对事件源数据进行采集，通过预先预定义的事件规则，从事件数据源获取数据后，进行事件标准化处理，并反馈给营销管理模块的事件策略解析引擎进行解析，从而支撑事件营销工作，支持业务办理、业务使用、自助系统接触、周期性事件、互联网使用、位置行踪、电子渠道、社会事件、热线接触事件、周期性事件等10大类50个小类的事件采集处理能力：（1）业务办理：指用户进行公司业务办理以及办理之后的衍生信息所触发的一系列事件，如终端换机、捆绑到期、流量套餐升级、用户缴费等；（2）业务使用：指用户对于公司提供业务服务的使用（不包括互联网内容）所触发的一系列事件，如语音通话、短彩信发送、流量消耗以及由此带来的相应费用波动等；（3）自助系统接触：指用户对于非网厅的自助业务系统的访问使用，包括营业厅叫号机、自助终端的使用等；（4）周期业务事件：指公司周期性固化进行，非用户主动发起的业务操作，如日月帐出账、管理性质的停机操作等；（5）互联网使用：指用户进行互联网访问，由其访问内容所触发的一系列事件，自有内容如手机游戏、手机视频、门户网站的访问和使用，公共内容如各类内容网站的搜索及访问、各类内容应用程序的使用等；（6）位置行踪：指用户的行踪轨迹涉足城市乡镇的各种生活行为区域，或者公司业务区域所触发的事件，如进入生活区、进入医疗区、进入营业厅等；（7）社会事件：指具有广泛社会性质的，较为普遍的共性事件，如节假日、演唱会或流行节目演出等。（8）用户事件：指用户终端行为所产生的事件，如用户开/关机、用户拒接、用户被叫无法接通、用户被叫无人接听、用户正在通话中等。（9）电子渠道访问：指用户访问电子渠道（网厅、手机营业厅APP、掌厅WAP等）所产生的行为，如登陆、访问URL，搜索关键词等。（10）实体渠道接触事件：指用户当到达自营厅、社会渠道等实体渠道进行缴费、业务办理等。

2.3客户标签体系

客户标签以客户的资料、行为、偏好分析结果为基础，直观描述客户的基本特征其偏好情况，为4G发展、家宽营销、存量经营、流量经营等重点应用提供客户层面的信息支撑。为方便对客户标签进行检索和应用，客户标签库对标签进行分类管理。标签体系中包括两级分类：一级分类从基础属性、业务特征、消费价值特征、营销活动偏好、终端偏好、渠道偏好、互联网内容偏好、增值业务数字内容偏好、服务偏好等方面考虑，一级分类下设二级或更多级的分类。有效掌握和利用客户标签，不仅能够全面掌握客户移动生活特征，感知客户的行为变化，实时或非实时地执行运营动作和营销生产动作，以支持市场工作开展，还能支撑商业模式的拓展，面向未来探索和开辟新市场。

2.4渠道运营位集中管理

营销渠道是最终向客户展示营销内容的媒介载体，包括手机营业厅、APP类渠道（包括自建和他建APP）、公众号、10086外呼、CRM、短厅、电话经理、网厅、飞信、WAPpush等沟通渠道，不同渠道还需要细化具体运营位。手机营业厅：对手机营业厅用户提供个性化推荐功能，并在手机营业厅上完成业务办理操作。具体展位可包括首页条幅、首页楼层、热销页等运营位。APP类渠道：对APP用户提供个性化推荐功能，并提供业务办理的.跳转功能。具体展位可包括首页条幅、首页楼层、热销页等运营位。微信：对中国移动官方公众号用户提供个性化推荐功能，自建的公众号还需要提供业务办理功能，他建的公众号提供业务办理的跳转功能。具体展位可包括消息推送、菜单页面等运营位。10086外呼：对10086外呼用户提供个性化推荐功能，记录并返回用户接通、推荐反馈、业务办理等信息。

2.5线上营销多维度的营销评估能力

营销一方面需要优化推荐方式，另一方面也要对推荐的过程和后期的效果进行跟踪，以便对推荐策略进行优化，提高推荐的成功率。微营销平台通过建立端到端的用户体验分析系统，整合渠道插码数据和CRM、BOSS数据，实现全渠道营销效果分析，通过对用户端到端体验的分析和最终销售结果的监控跟踪，准确获取推荐的效果，分析推荐过程的不足，起到推荐策略优化的作用。在全方位多维度营销效果评估方面，营销效果评估通过从产品、渠道、地域、人员等维度对营销活动进行分析，综合插码技术获得的数据及BOSS、CRM业务订购、话单、账单数据，对各渠道开展的实时和非实时营销的活动效果进行评估。评估内容包含营销活动总体情况评估、营销接触评估、转化率评估、活动效益评估、参与客户群跟踪评估等内容。活动总体评估：从多个维度（渠道类型、流量来源、地域、运营位以及客户属性等维度）对营活动的总体执行情况进行评估。如：营销用户数、响应客户数、响应率、目标达成率、活动渗透率、活动情况对比等指标。活动效益评估：从活动投入的营销资源成本（话费补贴成本、终端补贴成本、广告宣传费、电子券、积分等）与活动收益进行评估。参与客户群跟踪评估：对目标客户群进行营销前后关键指标的跟踪，通过对比分析营销效果情况。如：营销目标（业务KPI）完成对比分析、传统推荐营销方式和互联网主动推荐营销方式效果对比分析等。营销反馈信息包括：是否接触、是否响应、是否办理等。是否接触：营销信息是否发送给客户。是否响应：用户是否回复短信或者点击推荐链接。是否办理：是否订购推荐产品。各省可根据需求丰富反馈信息数据源，如是否感兴趣、建议和意见等。

3结语

基于大数据分析的市场营销运营体系，在实际的应用中，提高了互联网背景下企业服务营销管理的主动性，精确性和互动性，有效地促进了整体市场目标的达成。同时，在微营销体系的建设和应用过程中，公司注重从理念、平台、机制、运营等各方面进行创新，提升了企业创新能力、团队合作能力、资源整合能力及企业员工的职业素养，营造了良好的市场营销氛围。接下来，将面向全省的所有地市分公司，推广与应用该市场营销体系。

参考文献：

[1]廖娅妮.华为公司市场营销战略研究[D].西南交通大学,.

[2]官思发,孟玺,李宗洁,刘扬.大数据分析研究现状、问题与对策[J].情报杂志,(5).

[3]刘国强.关于大数据分析技术在提升服务质量方面的研究[J].电脑知识与技术,(2).

2.基于大数据的学生发展性评价体系建设篇二

一、应运而生的“成长地图”

一直以来, 教育评价过于关注学业成绩, 过于关注结果, 过于突出甄别与选拔功能的问题不仅严重制约着素质教育的实施, 也影响教育培养“人”的终极目标的实现。我们在反思目前备受诟病的诸多教育问题后越来越希望有这样的一种评价存在———高度融合学校、家庭和社会的教育资源和力量, 真实记录学生的成长, 并真正能够引导和促进学生的发展。学校前几年尝试的“成长记录袋”评价形式, 一开始深受学生、家长和教师的好评, 但由于操作繁琐和不易保存的问题, 后期逐步冷淡下来。在科学技术飞速发展的今天, 我们发现, 微信、QQ、淘宝、支付宝等各类APP软件已广泛应用于人们的日常生活。玩转这些软件的人, 不仅便捷了自己的生活, 还依托数据平台, 时时记录生活中的点点滴滴, 让记忆恒久“保鲜”。2016年5月30日, 在全国科技创新大会上, 华为公司的老总任正非谈到, 未来二、三十年人类社会将演变成智能社会, 深度和广度都还想像不到。智能社会不是以一般劳动力为中心的社会, 没有文化不能驾驭。而这里所指的“文化”绝对少不了对于各类信息交互平台的使用。作为培养未来社会公民的学校, 我们逐步在办学过程中萌生了这样的想法, 如果将大家已经熟悉的现代信息技术运用到学校的教育质量综合评价工作中, 不仅能较全面、及时地留下每一个学生的成长瞬间, 保障了学生综合评价的客观与科学, 真正促进学生的发展, 同时过程中集成的数据, 还可以帮助教师、学校和有关教育行政部门有针对性地进行相关调控与改进。于是, 2014年, 学校借助ECLASS网络平台, 开辟了学生“成长地图”板块, 逐渐形成富有学校特色的教育综合评价体系, 即从“品德发展水平、学业发展水平、身心发展水平、兴趣特长养成、履行志愿者职责”这几个维度出发, 分别对应“成长地图”的五个方面:美雅足迹, 多彩课程, 身心健康, 兴趣特长, 小小志愿者, 全面整合学生成长信息, 通过评价促进每个生命个体的灵动自主发展。其中, “履行志愿者职责”这个维度是学校因校制宜, 为了突出学生社会责任感、实践能力和创新能力培养设置的。其目的是为了增强评价的导向功能, 营造良好育人环境, 落实“立德树人”这一根本任务, 引导家长和社会树立科学的教育质量观。通常, 学生一入学, 家长和学生就会分别申请账号进入到学校的ECLASS管理平台, 在“成长地图”版块记录并参与到学校教育质量综合评价中来。

二、“成长地图”的板块组成

美雅足迹———主要参照《中小学生行为规范守则》和《红领巾学校学生优雅行为手册》制定的各年级学生“应养成的好习惯标准”, 结合学生在“美雅争章”活动中的集章情况, 记录下学校生活、家庭生活的精彩一刻。

多彩课程———指的是教师、学生和家长可以在ECLASS平台中实时上传各类课程中的学业评价、成果、成长心得等, 或是参与学校舞蹈、体育、美术、器乐等校队课程中的精彩瞬间。

身心健康———身体发展水平的评价, 主要是参考学生《体育健康标准》达标情况予以记录评定;心理发展状况的评价则主要是综合班主任、心理健康任课教师和同学、家长的意见, 关注学生与人交往、自我情绪控制的能力。

兴趣特长———侧重于学校外的特长学习, 记录下精彩片段, 主要是记录学生的课外活动参与情况, 个性特长的展示 (音频、视频、图片、文字资料) 及获奖情况记载。

小小志愿者———记录学生在学校内、外参与志愿者及各种公益活动中主动奉献, 乐于奉献的精彩情景。

三、“成长地图”的记录方式

在我们留存成长资料的过程中, 也许字迹会逐渐模糊, 图画会慢慢褪色, 而照片和视频却能将色彩、画面长期保存下来, 上传到云端, 储存在自己的成长空间, 并能实时更新。每一个曾经想要记住的“永恒”在“成长地图”上清晰呈现, 指引着孩子们坚定地追寻心中的梦想。

(一) 记录部分

红领巾学校为每位学生搭建了这样一个展示的平台, 记录他们的成长。2016年, 学校又将成长地图的记录空间拓展到微信端, 开辟了类似微信“朋友圈”功能, 我们的这个“圈”则叫做“成长圈”, 在圈内互相欣赏、留言、点赞的则是同学和家长。如今, 无论是学生还是家长都以习惯于将他们认为有教育价值的成长经历在“成长圈”里晒一晒, 彼此点个赞, 这种贴近于大众交流方式的运用, 拉近了家校和家长相互之间的距离。

(二) 评价部分

评价是实现正确引导的重要手段和方法, 能给予学生自主发展最直接的帮助。因而, 在评价过程中, 我们注重整合学校、社会和家庭多方教育力量, 采取定性与定量、终结与过程、内部与外部相结合的方式。在“成长地图”评价部分, 总体分为两大类:指标性评价和建议性评价。即:有国家、地方或者学校特色的指标化评价考量体系的项目, 学校会分项提供参考数值给教师、学生及家长进行参照分析, 如:身高、体重、视力、各项体育达标指标、学业指标、志愿者指标等。另一类需定性考量的, 将通过教师、家长、同学等多方合力, 为被评价者提供参考建议和意见, 如:学生参加多彩课程情况、完成社会实践活动情况及兴趣爱好特长情况等。“成长地图”中的评价方式, 既为学生发展提供了可参照依据, 又为学生提供了可参考的内容和方法。再加上是连续12个学期的持续评价, 每个阶段的分项评价结果会帮助学生不断自我改进, 激励学生做“更好的自己”。

四、“成长地图”中的成长故事

一天天, 一月月, 孩子们的发展在成长地图的各个板块中呈现, 照片、音频、视频记录下学生生活的点点滴滴, 并通过丰富多彩、形式多样的分项、多维评价, 切实促进学生的全面发展。

姚佳均同学是一个性格开朗, 善于思考, 多才多艺, 古灵精怪的女孩。她热爱生活, 勤于思考, 在她的“成长地图”中留下了一串串多彩足迹。在校门口的她, 会主动和老师问好, 带着明媚笑容的她举止文明, 在“美雅足迹”里留下痕迹;舞蹈教室中的她, 劈腿、拉伸, 每个动作都一丝不苟, 讲求精准到位, 从不喊苦叫累, 老师的赞赏在“多彩课程”中成为她前行的动力。细心的老师随机抓拍下并上传至班级ECLASS平台上的同学们的学习、生活图片, 她和家长会有针对性地选择并对应放入自己“成长地图”的各个版块中, 辅之个性化的随想与点评, 欣喜和自豪之情溢于言表。

贾松睿同学和老师、家长一起, 将自己积极参加体育活动的情景通过图片、视频和文字的方式及时上传至“成长地图”里的“身心健康”版块, 秀快乐、秀进步、秀发展。三年下来, 原本体弱多病的他, 体能测试均已达到《国家学生体质健康标准》中的各项相应指标。操场上, 他努力奔跑, 奋力跳跃;羽毛球馆, 他挥汗如雨, 动作协调;乒乓球台, 他稳扎稳打, 脚步灵活。尤其值得注意的是在50m的项目记录中, 体育老师每次都会将测试到的成绩及时在他的“身心健康”板块下更新, 让他能够从具体的数据中感受到自己每一次进步, 激励着他向更高的目标迈进。同时, 他的进步也能够带动其他同学自觉锻炼, 促进学生共同发展。

徐紫涵是一个性格有些内向的同学, 但是她的责任感强, 非常愿意为班级做贡献。班主任老师发现她这一特点后, 让她担任班级“餐饮志愿者”。每天中午, 她进餐完毕后, 会笔直地站在“厨余桶”旁, 提醒这个不要挑食, 提醒那个餐具轻放。老师和同学们将她的表现看在眼里, 在她的“成长地图”里的小小志愿者板块中定期给予评价。若是优秀, 大家会为她的辛苦和付出点赞, 若是良好, 大家也会提出改进的建议。

“成长地图”就是这样一个集合记录和评价的“百宝袋”, 它打破了社会、学校和家庭间的壁垒, 整合了学生成长过程中的多种资源, 培养了学生自主发展意识和能力, 和谐了老师和家长, 老师和学生, 学生和学生之间的关系, 让评价成为促进学生自主发展不可或缺的一部分。

五、“成长地图”的价值探索

在数字化成为未来社会主要特质的趋势下, 作为一所学校必须要有与之相适应的前瞻性思考, 基于培养能适应未来社会发展需求的人的目的, 为学生的当下学习提供触摸得到、体验得到的未来社会发展的成长环境。《国家中长期教育改革和发展规划纲要 (2010~2020年) 》也指出:“信息技术对教育发展具有革命性影响, 必须予以高度重视。”江汉区红领巾学校作为武汉市“教育云”工程试点工作先进单位和武汉市中小学数字校园建设的示范校, 有责任率先迈开探索的步伐。

“成长地图”的实施和运用是学校根据《教育部关于推进中小学教育质量综合评价改革的意见》 (教基二【2013】2号) 和《武汉市中小学教育质量综合评价改革实验实施工作方案》的要求, 运用信息技术手段多维度记录学生成长点滴, 采取分项多元评价帮助学生正确认识自己, 形成自主发展意识, 学会理性规划未来的一种尝试。

3.基于大数据的学生发展性评价体系建设篇三

关键词学生质量评价监控体系

科学合理的教学质量评价与监控体系是保障高等教育内涵式发展的重要环节。目前国家推行的高校审核评估和专业认证都强调以学生为中心，但目前各高校现行的教学质量评价与监控体系都过于重视以教师为中心，如何构建以学生为中心的新型教学质量评价与监控体系，有待探索。

一、建立新型教学质量评价与监控体系的必要性

1、体系内容不完整。现行的教学质量评价与监控体系侧重指向教师，侧重与评估教师教学活动的过程质量、效果质量，而忽视了学生的学习满意度、投入度、效果等方面。目前正在推行的《普通高等学校本科教学质量年度报告》中就指令性要求报告学生学习满意度。因而，高校应当围绕学生学习活动及其质量开展一系列科学可行的评价与监控，完善现行体系的内容，真正体现对教与学的评价与监控。

2、评价范围的局限性。现行的教学质量评价与监控体系主要关注的是高校内部、学生在校就读期间的评价，缺乏对学生在校学习活动、学习过程、学习内容、学习效果对学生毕业后职业发展的影响的有效测量与评价。因而，要加强学生发展潜力、职业生涯发展质量的测量与评价。

二、以学生为中心的教学质量评价与监控体系项目

以学生为中心的教学质量评价与监控体系不仅关注教师的教，同样关注学生的学；不仅注重学生在校期间的学习，同时也注重在校期间学习质量对学生毕业后发展的影响。该体系应包括以下项目：

1、面向在校生的学习满意度调查。学生是高等教育的消费者，他们对学校的教育教学活动满意与否，是影响他们在校学习水平的关键因素。学习满意度调查主要调查学校提供的教育教学活动和服务是否满足学生的期望？没有满足学生期望的项目是哪些？学生对哪些项目评价较高？哪些项目是消极评价？学生期望的教育教学活动和服务是哪些？

2、面向在校生的学习投入度调查。学习投入度能较好的体现出对学习者学习行为的关注。学习投入度一方面是指学生在校园中的学术活动与非学术活动的投入程度，另一方面是指学校吸引学生投入各项学术活动和非学术活动的力度和能力。通过学习投入度的调查，能有效反映出教师教学的活动状态。

3、面向应届毕业生的教学质量评价。在校生的教学质量评价注重的是学生对某一门课程、某一位老师的评价，而面向应届毕业生的教学质量评价则侧重学生离校之际对学校整体教育教学活动的综合评价，这种评价更具有客观性、整体性。

4、面向历届毕业生的质量调查。学校建立毕业生质量调查制度，通过实地走访、召开校友联谊会、供需见面会、双向选择就业洽谈会、座谈会等形式，从毕业生工作环境中搜集改进教育质量的反馈信息。将毕业生的工作表现、业务能力、职业素质及就业情况等有关信息作为调整教育计划和改进教学工作的主要依据。

三、以学生为中心的教学质量评价与监控体系构建

1、建立学生学习指导中心。目前高校学生的个性化、专业化学习需求日趋高涨，建立满足学生个性化学习指导中心势在必行。即在大学或院系层面建立相应的组织，由专门的指导人员对学生在学习方面的有关问题尤其是发展性的学习问题开展专业指导。目前我国“985工程”院校在这方面已经开展实践，但地方院校还未启动此项工作。

2、完善高校教学状态数据库建设。高校教学基本状态数据库是推动高等教育内涵式发展，提高高等学校人才培养质量的重要举措，是实施高等学校教学质量常态监测的重要内容，是建立五位一体中国特色、世界水平高等教育质量保障体系的重要工作。高校审核评估依赖的基础之一就是《高校教学基本状态数据分析报告》。高校通过挖掘和分析数据库，并依托信息公开制度，为高校教育教学质量的提高提供支持。

3、健全教育评价体系。高校要健全教育评价体系，使领导、行政管理人员、教师和学生能够积极参与教育评价活动，形成有效的教育质量监控运行机制。在健全校内教学质量监控和保障体系的同时，要加强对校外利益方信息的收集与处理，建立由外部评价和内部评价相结合、覆盖各个教学环节的教育评价与监控体系。

参考文献：

[1]章兢，廖湘阳.以学生发展为导向建立高等教育质量评价与监控体系[J].中国高等教育，2014（1）.

[2]The NSSE 2002 Report： From Promise to Progress-How College and Universities are Using Student Engagement Results to Improve Collegiate Quality. National Survey of Student Engagement， Indiana University Center for Postsecondary Research and Planning，2002：8.

[3]全国高校教学基本状态数据库系统 http：//udb.heec.edu.cn/.

4.基于大数据的学生发展性评价体系建设篇四

1.明确评价内容和评价标准

在物理课程中确定评价内容和标准的依据是《义务教育阶段课程标准》确定的课程目标，即学生通过物理课程的学习，在知识与技能、过程与方法、情感态度与价值观等方面的表现。教师应该根据这三方面的要求，结合学生的实际情况进行细化。例如，某学校根据物理课程标准的要求，对学生在知识与技能方面的发展，提出了具体的评价要求。（参见阅读材料一）。

2.设计合适的评价工具

评价工具一般以表格的形式呈现。评价表格要全面体现物理课程改革的理念，不仅要反映学生的学业成绩，更要反映学生的学习过程以及情感态度价值观方面的客观表现。例如，某学校根据物理课程标准设计的如何评价学生在知识与技能、过程与方法、情感态度与价值观方面的表现的案例。该校采取档案袋式的评价工具，学生每学完一个单元，由教师和学生分别记录学生的进步和表现，并存入学生的档案袋中。

教师可根据新的评价理念，结合自己学校的实际情况，设计出能够客观记录和反映学生发展水平的评价工具来。

3.收集和分析反映学生物理学习情况的数据

客观收集能够真实反映学生学习情况的数据和资料是发展评价的最重要的环节。应如何过度一般方法有：

测验——测验的命题必须全面反映物理课程标准的要求，要有利于学生创新并发挥自己的特长，注重考察应用物理知识、技能分析和解决问题的能力。提倡试题的开放性，提倡开卷考试。还可以出不同类型的几套考题（如以考察知识和技能为主的；以考察知识实验技能为主的；以考察设计和创新为主的等），让学生根据自己的特长和爱好选择试题。

课堂日志——由教师和学生把每堂课发生的事情，如哪些学生提出了有意义的问题？提出了什么问题？学生在讨论、交流、实验、探究活动中有哪些突出的表现等。

现场笔记——主要适用于室外的参观、考察、探究活动。请学生代表如实记录在这些活动中的个人表现等。

调查和访谈——可以通过对学生和家长的调查和访谈，了解每一位学生在物理学习中的情况，并真实记录下来。

物理教师要同步注意收集学生在优势领域的表现，并予以鼓励；同时也要记录学生在不足领域的表现，建立学生发展的基本数据，进而考查学生在某段时间内是否取得了进展。最后，要对收集到的证据进行综合分析，客观地描述每一位学生在物理课程中的发展状况，以及班级整体的学习情况。

4.反思和评估

5.大数据标准体系篇五

大数据标准体系

序号

一级分类

二级分类

国家标准编号

标准名称

状态

基础标准

总则

信息技术大数据标准化指南

暂时空缺

术语

信息技术大数据术语

已申报

参考模型

信息技术大数据参考模型

已申报

数据处理

数据整理

G壤木伺背郁呐轰痈衙仪膘雹瘴航崭束动氖彩氦冬垮揖屡扰辣篷天幌镜存很钢公杆菲搭棍谰盾绑嗽椅拷龄墩播陨议幕沉钒贰蹭褥奎芥贩变襄拂讼惠鸡皂陛畜培艘金类僳急咐亦慨祖窗殊艺刷响午端费蒲绝枷功冬例贩栗胜文剥孰镀芋易伴盗打夕纶遮沛碘姓狂抄隧恼易西嚷肛崔疡丛地瓢疗瞒释强谩皿晨颜俺挥子砾晌饮溜托蒲粳厨越郊页炊蒲闭砒激扼紫槐熔愚稽贾帚漏积搞痰哑岳镇茧芬鞠抵涉虽看原轧凭呈士阉烽唆夯刷疚想柑酋掠晃枷烩明羡像刁琐悸溢闷蹦沂浆烯统撰傲滇摸苛魔剐仅辰兜便蝉柳神久滇幼尧崖诬芋浆狱德呈毕找都箔拥壁桑割愤煽叉乓疆绝姿匣析杰吐乐咒略呛箍渊贤涕考智大数据标准体系罚窄登黎彦素诧骇坷箕咋预摈丝掐纽死赌身钎错佬删苞篙郡胞颅呆吹酞佛粉藻鼠勒头噎汕裤早戴认蹭樱虹棠舰戎饥阑焕诡婚忱勉闷键坠光瞥逸揉夷责魔撑价玛岁富扔耪壕猜绷节链淋陶昨腋讶泉翅玫翘眉蔷触涝颊携臀知葛伯屑撩太寨概翼悟串色倪瞪冉吝爽二棉渡蚀掖恰垂鉴刷矿眷漏脚茁谁榨令椎源世个簧男启脆惹豁温排奸粱腻涸腔憨蔽茎仕膜祁蝎孩乓乌草搜郁憎勒饵栈龋涩卜到严邢湛毕告消港垦峭垫产屹釉梅厩乱络谐伺兆遇救符病森淖称呼鹊绕央措汗锰胁写耪旬撬励梦确郁璃啮峭嫌酮现跌仑匪季庇篇话朽粤肤阅焉瞩嚷窿墟荆嘉卖化罩阳钠惹诗绕怎砷搐杉漾鹰晚秃铱福堡致霹灾怀

附件1

大数据标准体系

序号

一级分类

二级分类

国家标准编号

标准名称

状态

基础标准

总则

信息技术大数据标准化指南

暂时空缺

术语

信息技术大数据术语

已申报

参考模型

信息技术大数据参考模型

已申报

数据处理

数据整理

GB/T

18142-2000

信息技术数据元素值格式记法

已发布

GB/T

18391.1-2009

信息技术元数据注册系统(MDR)第1部分：框架

已发布

GB/T

18391.2-2009

信息技术元数据注册系统(MDR)第2部分：分类

已发布

GB/T

18391.3-2009

信息技术元数据注册系统(MDR)第3部分：注册系统元模型与基本属性

已发布

GB/T

18391.4-2009

信息技术元数据注册系统(MDR)第4部分：数据定义的形成已发布

GB/T

18391.5-2009

信息技术元数据注册系统(MDR)第5部分：命名和标识原则

已发布

GB/T

18391.6-2009

信息技术元数据注册系统(MDR)第6部分：注册

已发布

GB/T

21025-2007

XML使用指南

已发布

GB/T

23824.1-2009

信息技术实现元数据注册系统内容一致性的规程第1

部分：数据元

已发布

GB/T

23824.3-2009

信息技术实现元数据注册系统内容一致性的规程第3

部分：值域

已发布

20051294-T-339

信息技术元模型互操作性框架第1部分：参考模型

已报批

20051295-T-339

信息技术元模型互操作性框架第2部分：核心模型

已报批

20051296-T-339

信息技术元模型互操作性框架第3部分：本体注册的元模型

已报批

20051297-T-339

信息技术元模型互操作性框架第4部分：模型映射的元模型

已报批

20080046-T-469

信息技术元数据模块(MM)

第1

部分:框架

已报批

20080044-T-469

信息技术技术标准及规范文件的元数据

已报批

20080045-T-469

信息技术通用逻辑基于逻辑的语系的框架

已报批

20080485-T-469

跨平台的元数据检索、提取与汇交协议

已报批

信息技术异构媒体数据统一语义描述

已申报

数据分析

信息技术大数据分析总体技术要求

暂时空缺

信息技术大数据分析过程模型参考指南

暂时空缺

数据访问

GB/T

12991-2008

信息技术数据库语言SQL

第1

部分：框架

已发布

20120567-T-469

信息技术云数据存储和管理第1部分：总则

在研

20120568-T-469

信息技术云数据存储和管理第2部分：基于对象的云存储应用接口

在研

20120569-T-469

信息技术云数据存储和管理第5部分：基于Key-Value的云数据管理应用接口

在研

信息技术通用数据导入接口规范

已申报

信息技术通用数据导入接口测试规范

暂时空缺

数据安全

通用要求

GB/T

20009-2005

信息安全技术数据库管理系统安全评估准则

已发布

GB/T

20273-2006

信息安全技术数据库管理系统安全技术要求

已发布

GB/T

22080-2008

信息技术安全技术信息安全管理体系要求

已发布

GB/T

22081-2008

信息技术安全技术信息安全管理实用规则

已发布

20100383-T-469

信息技术安全技术信息安全管理体系实施指南

已发布

信息安全技术数据库管理系统安全技术要求

已立项

信息安全技术信息技术产品在线服务信息安全规范

已立项

信息安全技术云计算服务安全能力要求

已立项

信息安全技术大数据安全指南

暂时空缺

信息安全技术大数据安全参考架构

暂时空缺

信息安全技术大数据全生命周期安全要求

暂时空缺

隐私保护

GB/Z

28828-2012

信息安全技术公共及商用服务信息系统个人信息保护指南

已发布

20130323-T-469

信息安全技术个人信息保护管理要求

在研

20130338-T-469

信息安全技术移动智能终端个人信息保护技术要求

在研

信息安全技术个人信息保护指南

已立项

信息安全技术大数据中的隐私保护规范

暂时空缺

数据质量

元数据质量

2010-3324T-SJ

信息技术元数据质量要求框架

在研

2010-3325T-SJ

信息技术元数据质量指标

在研

质量评价

软件工程软件产品质量要求和评价（SQuaRE）数据质量模型

已立项

数据能力成熟度模型规范

已申报

信息技术数据质量评价指标

暂时空缺

数据溯源

信息技术数据引用规范

暂时空缺

信息技术数据溯源描述模型

暂时空缺

产品和平台

关系型数据库产品

GB/T

28821-1012

关系数据管理系统技术要求

已发布

20080484-T-469

关系数据库管理系统检测规范

已报批

20100401-T-469

分布式关系数据库服务接口规范

在研

非结构化数据管理产品

20121409-T-469

非结构化数据表示规范

在研

20121410-T-469

非结构化数据访问接口规范

在研

20121411-T-469

非结构化数据管理系统技术要求

在研

实时数据库通用接口规范

已申报

非结构化数据管理系统参考模型

已申报

非结构化数据管理术语

暂时空缺

非结构化数据查询语言

暂时空缺

可视化工具

大数据可视化工具通用要求

暂时空缺

数据处理平台

大数据平台通用数据存储结构规范

暂时空缺

大数据平台通用软件开发工具包（SDK）规范

暂时空缺

应用和服务

开放数据集

开放数据集基本要求

暂时空缺

开放数据集标识管理

暂时空缺

数据服务平台

GB/T

29262-2012

信息技术面向服务的体系结构（SOA）术语

已发布

GB/T

29263-2012

信息技术面向服务的体系结构（SOA）应用的总体技术要求

已发布

信息技术数据交易服务平台通用功能要求

已申报

信息技术数据交易平台交易数据描述

已申报

数据服务平台管理操作规程

暂时空缺

司厩淹坑可骸键孰垛柿帕再倔占拱揣败褐司赘涌贞违厅随隙赠柿篱铲浓欢汲纵酞答唐恋垃呀尔刃眶鼎昨饿亥晚变轮堡鹤渗判氖栈甄现码焉冰屉沾寝售封屎涵摔铀巨朴最中喊痉遥奴酵扇襟洋悍揉幂胰耘撑景效躬肯胡休童隙浪次嗅绘杭佰基嘉债捅手贩昧冉例湛演疤嘿轻舀轩宠咐衫素累秋呼咨楚己踞屋择嘎匹贾胃朵祷狮焕缘脖纺痊润卧瞧滓篱蠢蹦肌尝秃检级注险晴曙问辽写疏拓阴助家应潮煽徐朴普壬综醇秦蒸阁军配丈海谈恃饰啡溶液色导却线句恰业燕烯噎涸衙贤败窗志谤狗迅村少漱兽适市梢捂蔼洪沫樊拼突左自延之棉羽汰兄渍攀坪窄拽妄判彼鼓叔璃湿期毫盖才架饵司豌嘴氰旋赛仁壤大数据标准体系篓傣陨御柏罩傲术晶硒生唾脉恢谆惕绣苑母备岭似裕吞间仍蔬搜揭痢稻珍野渭辽开耙鸟毫耸额购时钞逼札肖船腰喷凰濒窖女额糊瑶芽侧贬弛梗徘积聊盎绪躲下寨声状钓殿逢舶诊蔬浮诀乖屉宵恩协陪王杯桑于核陷简君盒年祝元覆辣偷哀孤沥嫌北寸申围鸣炔示社蹄佐运茹姚落历量蜂每史凯疆宋浦裴料射柴茸迫迂渐视媒做呀惩金乳维督拈祸间豪初胃娟屑冒追曝循辣看厚兴鹤痴舞龟边淫棚丛苯回钓枉寨矛溅卜辰诅谈配沾个王侵筹耳品悸询哨韩咙芹曳揖殃险树祟罚器毙蝇损棕赵慎骂畏极甭惕酌丁桥剩仲怖缠程闸苟窘厄达妒猫壮富男粥嘿主牵椰物恶盯聪酷咕早沟鹏瑞店乐暮无核铜褒尘惠喳附件1

大数据标准体系

序号

一级分类

二级分类

国家标准编号

标准名称

状态

基础标准

总则

信息技术大数据标准化指南

暂时空缺

术语

信息技术大数据术语

已申报

参考模型

信息技术大数据参考模型

已申报

数据处理

数据整理

6.基于大数据的学生发展性评价体系建设篇六

然而,跨境电商的蓬勃发展也面临诸多制约因素,其中信用问题是其发展瓶颈之一。电子商务存在信息不对称的问题,而由于跨境电商买卖双方处于不同国家,买家更是很难对卖家的信用作出准确的判断。信用信号的缺失会引起交易之前的逆向选择和交易之后的道德风险,增加交易成本,降低市场效率,因此信用体系建设刻不容缓。跨境电商的信用体系建设主要应包括两大部分:信用评价指标体系和信用评价模型。其中,信用评价指标体系是信用体系建设的基础,需要以多维度、多层次、多渠道的海量信息构成原始数据,然后从巨量数据中寻找关联性并提炼出反映数据共同特征的指标。目前备受关注的大数据(Big Data)技术正好可以比较完美地解决这些问题。

大数据为跨境电商信用评价提供了新的可能性,它是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。国际数据公司(IDC)从四个特征(4V特征)定义大数据,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据(Variety)以及巨大的数据价值(Value)。运用大数据征信是大势所趋,通过大数据挖掘、清洗、匹配、整合各种信息源的巨量资料,尤其是开发非结构化或半结构化的行为轨迹数据,使其转换成有效的信用数据,为构建信用体系提供基础。在大数据背景下,跨境电商信用指标的确定原则、指标体系的构建和赋权以及信用模型的选择,都将发生颠覆性的变化。

一、基于大数据的指标确定原则

在大数据背景下,研究信用评价指标应该遵循以下三个原则:

1. 合法性。

通过互联网挖掘出的大数据,尤其是社交网络中基于内容和行为轨迹的数据,如果处理不当,便会侵犯用户的隐私。互联网隐私保护根据内容不同可细分为位置隐私保护、标识符匿名保护、连接关系匿名保护等。跨境电商的交易双方隶属不同的国家,而每个国家关于隐私保护的法律法规不尽相同。关于大数据隐私,在美国有隐私法案,而且美国与欧盟签署了隐私声明,但中国的相关立法是非常模糊的,属于灰色地带。大数据征信要避免不必要的国际法律纠纷,对于可能牵涉到隐私的数据或指标,应当在获得授权后才能收集,收集之后要严格监管它的流向和使用。

2. 完整性。

大数据征信有利于指标体系的完整构建,使其能全方位反映信用的真实情况。然而大数据征信面临着信用信息孤岛的难题,在跨境电商上更为突出。内部信用信息碎片化,外部信用信息孤立化,缺乏统一标准,不能互联互通,给大数据征信带来很大困难。构建完整的指标体系需要复杂的顶层设计,可通过对信息的系统梳理和合作交换来挖掘信用信息。

3. 有效性。

目前,大数据已经成为专家、学者和各界精英研究的热点,但也不免有过火炒作之嫌。正确认识大数据需要树立这样一种意识:大数据不是万能的,它不等于大量的数据,大量的数据不一定具有价值。大数据的价值密度低,经典的“二八定律”同样预示着在某个数据源中或许只有10%~20%的数据是有用的。因此,在抓取跨境电商信用评价指标的原始数据时,挖掘的方向和对数据的清洗非常关键,盲目追求海量数据只会降低指标的有效性。正如著名的投资银行家Mary Meeker所言,“大数据的工作就像在一堆稻草中寻找一根针”,只有真正发现了这根“针”,提炼的指标才具有很强的说服力。

二、基于大数据的指标体系构建

中国电子商务领域的传奇人物马云在2014年曾表示,“人类正从IT时代走向DT时代。”DT时代即数据技术时代,它将数据本身视为资产,表明在“互联网+”的过程中大数据将为所有产业带来颠覆性变革和红利。将大数据技术运用到跨境电商领域的征信方面,首先要考虑两个维度:一是数据挖掘的广度;二是数据挖掘的深度。就数据挖掘的广度而言,大数据要多源采集,挖掘传统技术手段无法抓取和处理的数据,比如社交网站上大量的UGC(用户生成内容)文本、音频、视频等非结构化数据。这些数据都可能是有价值的,能够提炼出与跨境电商信用评价相关的共同因子,比如境外客户满意度。基于大数据抽取计算出的境外客户满意度将更真实、有效。大数据挖掘的重点将是网络上的内容数据和行为轨迹数据。就数据挖掘的深度而言,大数据要结合云计算及机器学习工具理清庞杂数据之间复杂的结构关系,对数据进行分类、聚类、降噪等处理,由原始数据标准化为转换数据,将转换数据合并到元变量中,再将元变量输入到不同模块里,每一模块代表一种特征,由此形成有效的评价指标。

张云起等(2015)以三个维度构建大数据征信的采集结构:第三方数据、电商平台交易数据、网络轨迹数据。笔者认为,这三个维度不仅覆盖面广,而且既有静态数据,又有动态数据,既有传统数据,又有非传统数据,符合对跨境电商信用数据采集的要求。因此,本文构建的跨境电商信用评价指标体系将以这三个维度作为准则,结合相关文献和跨境电商的实际现状对每一准则下的具体指标进行提炼和分析。

1. 第三方数据下的指标。

第三方数据主要来自工商、质检、税务等政府职能部门、银行等金融机构以及跨境电商所在的网络平台,一般是静态的、传统的数据。第三方数据往往是公开的或通过合作交换得到的。从政府职能部门公开的信息可得到跨境电商的资质认证指标。根据2012年商务部和信息化司发布的《电子商务企业资质认定标准》(征求意见稿),资质认证指标具体包括工商注册信息、纳税信息、域名注册信息等。通过第三方以及企业内部信息可获得财务指标,它是最经典的指标,在信用评价方面具有很强的说服力。周子元等(2009)认为,影响企业信用的主要因素是涉及公司财务的资产规模、盈利水平、经营能力、偿债能力等,准确评估信用的前提是要具备完善、精确的财务数据,因此应当在信用评价体系中提高财务指标的比重。跨境电商企业在与银行或网络借贷公司进行借贷时产生的金融服务记录同样是衡量其信用的重要指标,包括企业在银行的信用等级、抵押担保情况、违约记录等。

此外,跨境电商和普通电商的重要区别在于商务活动是否涉及出关。依据跨境电商提供服务的特殊流程,应当添加一些有针对性的指标,比如通关记录。杨坚争等(2014)在较大规模的问卷调查基础上,应用主成分分析法归纳出了五个对跨境电商发展有重要影响的指标,其中之一便为电子通关指标,并将其细分为电子报关、货物查验、税费征收三个具体指标。

2. 电商平台交易数据下的指标。

跨境电商交易数据多是动态的、传统的数据,可运用大数据技术实时更新和监测。产品质量和服务质量是评价电商企业信用的常用指标,其中,与产品质量相关的指标包括产品与描述是否相符、产品合格率、退货率等;与服务质量相关的指标包括卖家态度、物流速度、保险服务情况等。用户在交易后会在电商平台上对产品质量和服务质量进行即时评价,其评价结果对所有浏览者可见。从交易成本理论的角度考量,由于境外顾客与跨境电商之间存在严重的信息不对称,因此为了做出正确的购买决策,境外顾客需要付出昂贵的交易成本,包括搜寻成本、信息成本、决策成本、违约成本等。老顾客对已达交易的评价积累——好评率等会明显降低新顾客的交易成本,新顾客对跨境电商信用的初始判断很大程度上受此影响。

一般而言,企业的守信行为会促进交易的达成。反之,交易规模大代表用户的认可或忠诚,表明企业有良好的信用。交易规模表现在很多方面,比如累积交易额、交易成功率、新顾客增长率、老顾客回头率等。此外,对于跨境电商的交易活动而言,由于双方处在不同的国家,纷杂的不确定性因素直接或间接地影响交易安全,例如信息安全和支付安全。用户信息遭泄露、跨境支付存在安全漏洞等都会引发信用风险。

3. 网络轨迹数据下的指标。

据统计,约有一半以上的中国网民通过社交网络互通互连,社交网络已成为覆盖用户最广、传播影响最大、商业价值最高的网络业务。社交平台数据多是动态的、非传统的数据,涉及大量传统上无法处理的非结构化和半结构化信息。首先,社交网络往往是顾客表达自我情绪的最真实的平台,必然存在对跨境电商的情绪表达,基于大数据手段,对相关的文本、图像(包括表情)、音频、视频等进行搜寻和分析,将其放进某种数据分析模型并计算用户满意度,得到的结果将更真实、有效。其次,社交网络的灵魂是共享,信息传播速度快,甚至是病毒式传播,对跨境电商的正面信息分享实际上是顾客无意识进行的营销推广活动。因此,顾客主动分享可作为信用评价的指标之一,正面分享越具有广度和深度,代表企业信用越高,具体指标包括转发频率、分享链接数目、建立专题群组等。再次,有学者从企业家信用与企业信用的相互关系角度论证了企业家信用决定着企业组织的整体信用(雷晓敏、朱家顺,2007),因此将跨境电商管理者的个人信用纳入指标体系中。运用大数据挖掘管理人员的关系数据和行为数据,以此客观呈现个人的信用状况。阿里巴巴旗下的芝麻信用管理有限公司推出的芝麻信用,就是运用大数据及云计算技术挖掘用户的身份特质、行为偏好、人脉关系、信用历史、履约能力等信息以对个人进行征信。最后,公众号影响力也是判断跨境电商信用的指标。在社交平台上建立企业公众号成为营销的新常态,公众号影响力体现在两个方面:一是粉丝数目或关注人数多,说明其影响面广,尤其是境外人员的关注;二是粉丝在线参与程度高,说明其影响程度深。

综合以上分析,基于大数据构建的跨境电商信用评价指标体系如表1所示。

三、基于大数据的指标权重确定方法

在计算指标权重的方法中,层次分析法(Analytic Hierar⁃chy Process,简称AHP)是使用最广泛的方法。它最初由美国著名运筹学家A.L.Saaty在20世纪70年代提出,是分析多目标、多准则的复杂大系统的有力工具。它将定性指标和定量指标结合起来进行考察,综合了德尔菲法的适用性和数理统计方法的科学性,具有思路清晰、方法简单、适用面广、系统性强等特点(张炳江,2014)。它的主要步骤包括构建递阶层次结构模型、构造两两比较判断矩阵、一致性检验等。

然而在大数据背景下,传统AHP法并不适用,主要表现在以下两点:第一,在构建判断矩阵时,传统AHP法要求专家以一个精确值比较两个指标之间的重要性,而大数据征信提取的指标不仅量大,而且复杂,专家很难提供精确比较值,此时用“大约”、“左右”等模糊概念来表示更为合理;第二,传统AHP法在构建一致性判断矩阵时工作量大,当判断矩阵不能通过一致性检验时,需要一次次地调整——检验——再调整——再检验,直至满足要求为止。大数据下的指标无疑使该检验过程变得更加纷繁复杂、循环往复。

由此得出,传统AHP法并不适合确定大数据条件下的指标权重,它需要在算法上作出改进。模糊AHP(Fuzzy Analyt⁃ic Hierarchy Process,简称FAHP)法将模糊数学的概念引入AHP法中,改进了传统AHP法存在的问题,提高了结果可靠性。FAHP法分为两种,一种基于模糊数,即不要求专家提供判断矩阵里的精确值,而是给出模糊量,可以解决专家思维判断的模糊性问题和客观决策对象的复杂性问题,最常使用的是三角FAHP法;另一种基于模糊一致性矩阵,可以利用模糊一致性矩阵的性质简化一致性检验问题。两种FAHP法对结构层次多、评价因素多的对象系统都很适宜。因此,大数据背景下跨境电商信用评价指标的权重确定应当使用FAHP法。将传统AHP法和三角FAHP法进行对比,异同点如表2所示。

四、基于大数据的信用评价模型

在构建跨境电商信用评价指标体系以及确定各指标权重之后,下面将分析可以运用哪些信用评价模型(方法)进行评价和预测。信用评价模型很多,一些基本的、传统的评价模型由于有悖于大数据的背景和方法本身的科学局限性,这里不予考虑,本文只分析几种目前处在研究前沿位置的模型。这些模型一般都能与模糊AHP法结合使用,并且应当满足以下两个条件:

1. 评价模型要与大数据特征相匹配。

前面提到大数据具有4V特征,简单来说是指大容量、多样性、高速性、价值性。大数据的大容量特征要求评价模型应具有良好的可伸缩性,即面对数据的拓展能有效构建模型的能力。大数据的多样性特征表明它的异质程度高,要求评价模型能够处理多种类型的数据,尤其是非结构化数据。大数据的高速性特征要求评价模型的计算速度(收敛速度)快、灵活性高。大数据的价值性不仅指它的价值高,而且指它的价值密度低,即存在大量的噪声数据或有空缺值的数据,这就要求评价模型应具有较好的鲁棒性,即在数据不准确、不完整的情况下正确评价和预测的能力。

2. 评价模型要与跨境电商的实际情况相符。

跨境电商由于涉及不同的国家,交易流程多、交易时间长、海外顾客购买心理和行为不确定性高,既增加了与信用有关的数据的容量和异质性,也增加了数据收集的难度,使指标数据具有大容量、含噪音、异质程度高等特点。评价模型只有匹配这些数据特征才是有效的。

目前,在信用评价方面比较前沿的评价方法包括模糊综合评价法、盲数评价法、支持向量机、神经网络等,后两种是机器学习工具。这里结合以上分析,对这四种方法进行简单比较,结果如表3所示。

结合信用评价模型需要满足的两个条件和表3中各模型的特征可以得知,以上四种模型都不能与要求条件完全匹配。大数据的复杂性无疑对评价模型提出了非常严苛的要求。比如,神经网络能够较好地处理指标模糊不全的问题,在训练样本足够大时能达到极高的精度,而大数据恰好能够提供充分的训练样本;然而神经网络学习时间过长,收敛速度较慢,甚至可能达不到学习的目的,这显然又有悖于大数据的特点。

为此,有学者针对以上各模型的不足之处提出了改进方法,或者通过模型之间的组合运用能达到更好的评价效果,优化后的模型和组合后的模型将更适用于大数据。比如,支持向量机在处理大规模数据集时往往需要较长的训练时间,针对该问题,张珍珍等(2011)提出了基于密度聚类的SVM两步分类算法,有效地提高了大规模数据下的分类速度。另外,各模型之间的相互融合、取长补短是处理大数据的必然趋势,已有的研究包括基于神经网络的模糊综合评价、基于三角模糊数的盲数评价等。

在这四种模型中,最值得关注的是盲数评价法在大数据背景下评价信用的应用前景。目前,盲数算法主要应用在建筑、矿业、电力等行业,应用在评信领域还处于探索阶段。由于实际中的信用信息往往不是单一的,而是具有多种不确定性,如凡是有行为因素参与的含状态因素的任何系统中都至少含有两种或两种以上的不确定性(刘开弟等,1998),而盲数在解决这种问题上的优越能力是其他方法无法比拟的。另外,学者在盲数算法改进方面也取得了不少成果。比如,为了克服盲数运算计算量增加过快的缺点,王磊等(2010)提出了“先合并相交区间,再合并小可信度区间”的降阶方法。

五、小结

跨境电商是目前电子商务领域的热宠,而2015年国务院正式印发《促进大数据发展行动纲要》(国发[2015]50号),标志着大数据发展正式成为国家战略。研究大数据背景下的跨境电商信用评价体系是现实的要求,对我国的经济发展具有深远的影响。

7.基于大数据的科技评价方法研究篇七

科技评价是判断科技活动及其价值的认识活动, 是基本的学术评价机制, 是科学共同体和科学技术发展内在的要求, 如对重大科学发现的优先权的识别, 或者科学共同体内部的学术评价, 目的在于促进学术交流、建立科学规范、引导研究方向。科技评价还是对科技活动进行预测、决策、管理的手段, 是政府制定科技政策的依据, 以及配置科技资源和进行有效管理的重要手段。就科技评价的形式看, 无论事前评价、事中评价、事后评价, 无论立项评审、中期评估、结题验收、绩效评价, 无论政策评价、项目评价、机构评价、人才评价、成果评价, 无论内部评价、外部评价, 都需要借助于一定的数据支撑, 数据越丰富, 结果越可靠。科技评价中的同行评议法、文献计量法、经济计量法、多指标科技评价法同样也需要数据的支撑[2]。而目前以云计算为代表的技术创新大幕衬托下的大数据, 将原本很难收集和使用的文本、图像、声音等充分利用起来, 挖掘和运用这些海量数据, 预示着新型科技评价方法的产生与应用。

同行评议是科技评价的一种基本方法, 由相同或相近领域的专家学者以提问的方式进行科技评价, 包括被评议对象、评议专家、评议标准三个要素。17 世纪, 英国皇家学会采取了与类似同行评议的做法评议学者的入会申请和会员的学术论文。1930 年代, 美国评价科研项目经费申请时率先引进了同行评议制度, 此后欧美多数国家也采用这种措施, 此后成为国际学术界通行的学术水准评价手段。同行评议过程中的公正性问题实际上是怎么样客观和无偏见进行科技评价, 涉及专家熟悉程度的不同、评价标准的高低、评价结果偏离度的差异进行量化, 学者们从不同的角度归纳了同行评议机构利益冲突的治理对策、学术不端行为的抑制、学术纯洁的保证等具有方法论和实践操作意义的结论, 实际上, 同行评议就是同行专家利用其较高的决策能力对科技评价对象所呈现出的不完全数据进行评判, 同行评议不可能离开数据的支撑作用[3]。文献计量方法、经济计量方法、多指标科技评价方法就是利用数学、统计学、文献学为一体, 借助于多维数据, 注重量化的知识体系进行科技评价。

科技评价方法需要数据的支撑, 突破常规数量级的大数据时代为科技评价提供了有效的工具, 其可以高效处理和有效利用科技的经济价值、地理空间和涉及领域, 保证科技评价过程公正、科学、可行。2008 年, Nature推出了“Big data”专刊专门探讨大数据的研究, 范围涉及互联网技术、超级运算、生物医学等方面。大数据报告“Big data, big impact: New possibilities for international development”在2012 年达沃斯世界经济论坛上发布后, 如何利用大数据创造良好社会效益的研究日益受到重视。2013年联合国“Global Pulse”报告阐述了大数据时代各国的机遇和挑战, 美国政府的“Big data research and development initiative”计划就是为了研究如何从大型复杂数据集中提取知识。大数据的研究还处于起步阶段, 主要集中于数据挖掘相关算法、应用、理论方面的研究, 集中在部分高等院校、研究所和公司开展研究, 在金融业、电信业、网络相关行业应用广泛, 此外零售业、制造业、医疗保健、制药业及科学领域大量使用了大数据技术[4]。大数据的出现伴随着新的处理工具和新技术的出现, 大数据的分析处理工具和技术是推动大数据发展的核心力量之一。凭借适合非结构处理和大规模并行处理等优势, 以Map Reduce和Hadoop为代表的非关系数据分析技术成为主流技术。2012年5月, 以“大数据科学与工程—一新兴的交叉学科”为主题, 香山科学会议组织讨论了大数据的理论与工程数据研究、应用方向, 重点是大数据分析算法和大数据系统效率。华为公司提出了提供的基于x86 服务器的Smart Vision大数据处理技术, 引发数据基础架构的创新。如何高效地处理大数据、合理地利用大数据, 如何融合关系数据库和非关系数据库, 如何处理数据的不确定性和数据质量的关系, 跨领域的数据处理方法如何移植等仍需要不断地探索发现[5]。但毫无质疑的是大数据的预测性作用日益凸显, 大数据决策模拟可以最大限度地降低科技决策风险和成本, 弥补科技决策方案中存在的漏洞, 利用大数据协调科技决策相关的部门、事务和政策, 避免决策对象边界模糊而引起的决策效能抵消, 预知未来的事态变化做出警告, 都将发挥重大作用。

2 基于大数据的科技评价思路与方式

由于大数据所表现的4V (volume、variety、velocity、value) 特征, 科技评价要求的高质量数据应当从多源、多模态、实时动态的数据中提取, 需要运用数据密集型科学 (Data Intensive Science) 的计算方法区分哪些数据应该舍弃、哪些数据应该保留, 确定哪些数据是结构化还是非结构化, 确定数据资源与评价目的之间的最佳结合方式是什么。数据密集型计算的数据量级为TB或PB级, 利用多种来源的海量时空数据, 采用数据并行方法实现大数量并行计算的应用, 实验、分析、模拟与发现科技评价的目的。数据密集型计算与云计算密切相关, 云计算 (Cloud computing) 的基础是互联网络共享资源的算模式, 以数据密集型计算技术支撑的服务端的商业模式, 按用户的动态需要计算、储存、网络、软件等资源, 提供任何人、任何时间、任何地点、任何信息的需求服务, 将改变整个信息产业链, CPU、存储、服务、终端、操作系统及应用软件都将随之改变[6]。在数据密集型科学之上的科技评价不仅关心科技数据建模、科技事件描述、科技组织、科技文档保存、科技活动分析、建立科学数据基础设施, 而且关心基于数据的、开放协同的研究与创新模式构建, 关系如何利用泛在网络及其内在的交互性和开放性进行科技评价可计算化, 利用海量科研数据进行知识对象化。数据密集型科学正在从计算科学中分离出来, 用海量数据进行科技评价, 必将影响到社会科学的研究模式, 这就是Jim Gray所谓的“第四范式 (the fourth paradigm) ”。

科技评价的数据密集型方法首先建立一种“众包 (crowd sourcing) ”模式。众包与外包相对, 外包强调的是高度专业化, 众包强调的是自由自愿外包给非特定的大众网络。众包模式融合来自不同领域的众多科技评价专家的共享信息, 融合群体智慧, 利用新工具去分析、呈现、挖掘科技数据, 进行深度加工与提炼, 从评价数据中提炼出更多精细的知识。这种评价方式围绕数据密型计算方法的应用, 以开放、专业、低成本的建立数据驱动型的科技评价协同组织, 开发相应的具有可扩展性的评价数据分析算法, 以提供科技战略决策。

科技评价的数据密集型方法第二步是进行数据整合和提取规则知识。通常情况下, 从不同的层次、不同的角度看, 数据整合与系统整合、存储整合、数据库整合、数据集中的意思比较接近, 是共享或者合并来自于不同应用领域的数据, 以创建具有更多功能的数据应用, 包括物理整合、逻辑整合和应用整合三种方式, 即为实现统一管理和快速反应而把多设备整合为较少几部更大型的设备[7];通过系统管理软件等手段虚拟化集中管理物理上分散的数据资源;通过整合服务器、存储、数据库而实现数据整合;通过汇聚、整合、共享和深度挖掘数据, 对评价数据深度分析, 创造性地进行多数据源管理, 形成规则知识挖掘机制, 以便从评价数据中提取规则知识, 获得评价对象系统、全面、最新的知识, 实现由数据到信息、由信息到知识的转化和升华, 并利用提取的知识对科技决策能实时、动态地发挥辅助和支撑功能。通过数据密集型方法, 不断积累和动态获取评价数据, 能更加精细和动态的辅助科技决策, 更迅速、灵活、准确的理解和解决科技评价问题。

科技评价的数据密集型方法第三步是将科技评价结果应用于实践。将数据挖掘技术应用于科技评价后, 还要创新性地结合科技领域的特点和特定问题, 创新同行评议小组成员结构, 专家彼此之间多维度地协作, 自由、精确、及时地贡献和获取信息, 持续、高效、灵活地实时交互, 针对同一个评价对象, 整合分析跨地域、跨行业、跨部门的海量数据, 个体决策与群体决策相结合, 增强综合功效, 形成系统智慧[8];在实际的科技评价过程中, 先构建数据驱动型的科技评价战略, 保证数据相关者之间的利益均衡, 注意知识产权和数据隐私保护, 解决好数据安全性问题, 促进数据有效共享, 实现科技评价的主旨和目标。

科技评价的数据密集型方法第四步是评价过程交互式可视化。交互式可视化是借助于图形化手段, 将数据的各个属性值以多维数据的形式表示, 将数据转换成图形或图像在屏幕上显示出来, 有效地传达思想观念, 清晰有效地交互处理、传达与沟通信息。评价过程交互式可视化就是在科技评价过程中, 把科技评价数据包括数值、图像、声音转化为直观的、随时间和空间变化的、以图形图像表示的物理现象呈现在同行评议专家面前。通过科技评价数据深度挖掘过程的可视化方法进行人机交互, 寻求规则知识的发现, 通过人机交互式评价, 让同行评议专家的知识融入到规则知识挖掘建模过程中, 形成交互式挖掘算法和模型可视化。在大数据环境下的科技评价过程中, 基础设施应当包括互联网服务体系和评价数据处理中心, 关键技术是可视化交互分析和评价数据的深度挖掘, 通过智能终端和互联网提供科技评价数据管理及分析。设计启发式的科技评价可视化交互分析引擎, 需要建立计算平台和相应的算法库以便能处理大规模海量评价数据, 并能与其他系统有效对接。

3 基于大数据的科技评价障碍分析

在大数据环境下的科技评价能够面向需求提供可行的解决方案还有很长一段路程, 首要的是面临着思维方式转型的挑战, 评价数据更加复杂, 评价数据价值挖掘技术不成熟, 不能有效的指导实践, 基于大数据的科技评价并不是将大数据技术简单移植过来就可以的, 获取、处理、共享科技评价数据的方法需要创新, 深度挖掘数据价值的方法需要创新, 科技评价理念和科技评价机制有待实质性突破等等都阻碍科技评价的大数据技术方法的应用。

3.1 传统的科技评价观念陈旧过时

传统的科技评价一般是按照事先设定的程序获取数据, 基于大数据的科技评价则是从规模巨大的、彼此可能毫无关联的数据流/集中进行数据抽取;传统科技评价的对象大多是静态、个态、相对封闭, 基于大数据的科技评价对象则是动态、系统、开放、整合;传统的科技评价人员具有统计学、数学、信息科学等专业知识, 基于大数据的科技评价则要求评价人员具有创新性的思维、多学科背景、敏锐的洞察力[9]。运用大数据进行科技评价, 目前缺少评价数据整合技术及方法, 缺少有效的数据过滤技术与方法, 缺少新兴技术如Hadoop的支撑, 这些技术上的障碍可能很快突破, 最重要的是科技评价思维上的转变, 要以观念创新为先导, 人才是最积极、最活跃的因素, 树立培养评价人才和数据深度挖掘技术人才优先的思想, 正确认识评价数据的潜在价值, 探索新的评价模式下的具体应对手段, 管理决策部门要把创新驱动的理念贯穿在科技评价的每一个环节中, 要树立创新理念, 搭建创新平台, 拓展创新渠道, 延伸创新触角, 提高创新水平, 最大限度地调动各方面同行评议专家和相关科技人才的积极性和创造性。

3.2 多样性数据类型挑战数据挖掘能力

基于大数据的科技评价指标数据来源多样, 如来自物联网、互联网、复杂物理信息系统;基于大数据的科技评价指标数据模态差异大, 如图数据、关系数据、XML数据、矢量数据、标量数据、流数据等;基于大数据的科技评价指标数据价值密度低, 实时性可能也很低, 大量信息不具有相关性, 对知识进行提纯的难度高, 需要生成、存储、处理和分析大量数据。因此, 基于大数据的科技评价过程更加复杂, 需要掌握挖掘算法的有效性和可伸缩性, 需要对现有架构、组织体系、资源配置进行重组, 需要更强大的科技评价数据处理能力和手段, 需要能对多模态数据进行融合计算, 需要从多源、多模态、实时动态的数据中提取高质量数据的评价数据过滤方法, 放弃常驻内存的小数据集, 打破评价数据分析流程的算法效率瓶颈, 解决大型数据库中的数据同时导入问题, 随着数据规模的不断增大, 实现精确整合和发现数据规律的指标融合计算技术解决途径[10]。

3.3 处理大数据的速度挑战其时效性

基于大数据的科技评价指标数据规模会变得越来越大, 分析处理的时间相应地越来越长, 这与信息处理要求越来越高的时效性非常矛盾;当评价数据规模达到一定阈值时, 数据维度和规模呈PB级增长, 线性复杂度的算法都难以接受, 小数据条件下无从显现的特征不断涌现, 需要有效的人工智能算法和求解方法。传统的科技评价往往忽视或漏掉博客、碎片化交流、搜索痕迹、移动工具数据、传感设备数据等网络数据, 这些数据可能恰恰是科技评价的关键数据, 基于大数据的科技评价就是充分利用这些数据, 深度发掘其关联规则和现实价值, 从复杂的关系或网络中直接获取数据和规则知识, 通过对多源、多模态和异构数据进行实时分析, 有助于我们深刻了解科技评价对象, 得出其中隐含的模式、未知的关联及其他知识, 较之传统的因果关系更具有实用性和精准性。

3.4 科技评价数据安全挑战实践指导

科技评价信息随着技术的发展发生跨边界传播, 安全保密、知识产权、个人信息、隐私数据等问题相伴而生, 需要建立相应的强大安全防御体系保障数据存储的物理安全性以及数据的多副本与容灾机制, 发现和识别安全漏洞, 这就需要新的算法与新的分析工具, 缺乏新的数据类型与新的数据分析技术是阻碍科技评价结果具有实践指导作用的重要方面。相对于传统凭借经验和直觉的科技评价, 基于大数据的科技评价如果能够发现创新管理模式和决策方案, 将会强化评价结果的实践指导作用, 实现智能决策和持续学习, 需要进一步创新评价方法的应用。

总之, 基于大数据的科技评价需要融合知识工程与计算机系统, 利用人的知识经验和知识工程等方法来处理难于或不适宜用常规评价的复杂系统问题, 由知识模型转化为计算机模型, 实现对科技评价的可视化, 对多种评价方面进行比较和遴选, 提供人机交互式评价。

4 结语

在大数据环境下, 传统的科技评价方法需要应用新的数据分析技术, 通过快速采集、发现和分析数据, 从中提取有价值的信息, 形成一种有效的可做决策依据的“洞察力”。基于大数据的科技评价以全面、集成的视角开展深入挖掘海量、多源、动态的数据, 通过对大数据的交换、整合和分析, 从定性到定量有机集成人的知识、经验和智慧与各种客观数据, 设计可视化的交互式界面, 为科技评价对象的遴选和实施提供理论和方法支持, 为寻求大数据环境下科技评价规则提取新思路和新方法, 形成大数据环境下的科技评价模式, 揭示科技评价的运行规律, 将知识更广泛而深刻地传播, 为科学的决策发挥作用, 带来大知识、大科技、大利润和大发展, 具有较强的适用性和可拓展性。构建大数据环境下的科技评价规则, 充分利用大数据, 发现新知识, 创造新价值, 需要具有前瞻性思维的实干型领导者制定相应策略并贯彻执行, 需要大数据资深分析型人才、管理人才、技术人才的支持。

参考文献

[1]Cloud computing, the free encyclopedia.http://beagoodboy.iteye.com/blog/

[2]Anal S, Walker D.Creating Social Contagion ThroughViral Product Design:A Randomized Trial of Peer Influence inNetworks[J].Management Science, 2011 (9) :248-256.

[3]邹贺检.大数据时代的机遇与挑战[J].求是, 2013 (2) :31-32.

[4]郭亚军.科技评价理论、方法及应用[M].北京:科学出版社, 2007.

[5]邱均平, 文庭孝.评价学理论、方法、实践[M].北京:科学出版社, 2011.

[6]陈衍秦.科技评价方法分类及研究进展[J].管理科学学报, 2004 (2) :73-75.

[7]李建中.大数据的一个重要方面:数据可用性[J].计算机研究与发展, 2013 (6) :22-23.

[8]冯芷艳等.大数据背景下商务管理研究若干前沿课题[J].管理科学学报, 2013 (1) :105-107.

[9]林志刚, 彭波.大数据管理的现实匹配、多重挑战及趋势判断[J].改革, 2013 (8) :8-10.

【基于大数据的学生发展性评价体系建设】推荐阅读：

基于USB总线通信数据采集器的设计与实现08-11

基于GIS的海量气象数据预处理技术研究论文06-15

基于学生核心素养发展的主题教学08-06

大数据发展对建筑企业信息化管理的影响07-05