大数据助力智库建设(精选9篇)
1.大数据助力智库建设 篇一
数据(data),一般而言是指通过科学实验、检验、统计等方式所获得的,用于科学研究、技术设计、查证、决策等目的的数值。通过全面、准确、系统 地测量、收集、记录、分类、存储这些数据,再经过严格地统计、分析、检验这些数据,就能得出一些很有说服力的结论。大规模、长期地测量、记录、存储、统 计、分析这些数据,所获得的海量数据就是大数据(big data)。在制作大数据时,需要严格的方案设计、变量控制和统计检验等,不然所获得的大数据就是不全面、不准确、无价值或价值不大的。
在教育特别是在学校教育中,数据成为教学改进最为显著的指标。通常,这些数据主要是指考试成绩。当然,也可以包括入学率、出勤率、辍学率、升学率等。对于具体的课堂教学来说,数据应该是能说明教学效果的,比如学生识字的准确率、作业的正确率、多方面发展的表现率——积极参与课堂科学的举手次数,回答问 题的次数、时长与正确率,师生互动的频率与时长。进一步具体来说,例如每个学生回答一个问题所用的时间是多长,不同学生在同一问题上所用时长的区别有多 大,整体回答的正确率是多少,这些具体的数据经过专门的收集、分类、整理、统计、分析就成为大数据。
分析大数据助力教学改革
近年来,随着大数据成为互联网信息技术行业的流行词汇,教育逐渐被认为是大数据可以大有作为的一个重要应用领域,有人大胆地预测大数据将给教育带来革命性的变化。
大数据技术允许中小学和大学分析从学生的学习行为、考试分数到职业规划等所有重要的信息。许多这样的数据已经被诸如美国国家教育统计中心之类的政府机构储存起来用于统计和分析。
而近年来越来越多的网络在线教育和大规模开放式网络课程横空出世,也使教育领域中的大数据获得了更为广阔的应用空间。专家指出,大数据将掀起新的教育革命,比如革新学生的学习、教师的教学、教育政策制定的方式与方法。
教育领域中的大数据分析最终目的是为了改善学生的学习成绩。成绩优异的学生对学校、对社会、以及对国家来说都是好事。学生的作业和考试中有一系列重要 的信息往往被我们常规的研究所忽视。而通过分析大数据,我们就能发现这些重要信息,并利用它们为改善学生的成绩提供个性化的服务。与此同时,它还能改善学 生期末考试的成绩、平时的出勤率、辍学率、升学率等。
现在,大数据分析已经被应用到美国的公共教育中,成为教学改革的重要力量。为了顺应并推动这一趋势,美国联邦政府教育部2012年参与了一项耗资2亿 美元的公共教育中的大数据计划。这一计划旨在通过运用大数据分析来改善教育。联邦教育部从财政预算中支出2500万美元,用于理解学生在个性化层面是怎样 学习的。部分综述了该计划的数据和案例已经在美国教育部教育技术办公室2012年4月10日发布的《通过教育数据挖掘和学习分析增进教与学(公共评论草 案)》中披露出来。
美国教育部门对大数据的运用主要是创造了“学习分析系统”——一个数据挖掘、模化和案例运用的联合框架。这些“学习分析系统”旨在向教育工作者提供了 解学生到底是在“怎样”学习的更多、更好、更精确的信息。举例来说,一个学生成绩不好是由于他因为周围环境而分心了吗?期末考试不及格是否意味着该学生并 没有完全掌握这一学期的学习内容,还是因为他请了很多病假的缘故?利用大数据的学习分析能够向教育工作者提供有用的信息,从而帮助其回答这些不太好回答的 现实问题。
许多人因此会问,大数据能拯救美国的公立教育吗?全球最大的电脑软件提供商微软公司(Microsoft)的创始人、前首席执行官比尔·盖茨(Bill Gates)今年3月7日在得克萨斯州首府奥斯汀举行的一个教育会议上打赌说,利用数据分析的教育大数据能够提高学生的学习成绩,拯救美国的公立学校系 统。他称过去十几年里教育领域的技术发展陷入了停滞,研发投入远远不够。盖茨充满信心地认为,教育技术未来发展的关键在于数据。在这次大会上,5000多 名参会者讨论了教育数据应用的前景。教育大数据市场前景广阔
美国高中生和大学生的糟糕表现——高中生退学率高达30%(平均每 26秒就有一个高中生退学),33%的大学生需要重修,46%的大学生无法正常毕业——在让教育部门忧心忡忡的同时,也让教育科技公司找到了淘金的机会。近些年来,许多教育科技公司纷纷开始抢滩大数据学习分析的市场,竞争极为激烈。
美国的一些企业已经成功地商业化运作教育中的大数据。全球最大的信息技术与业务解决方案公司IBM就与亚拉巴马州的莫白儿县公共学区进行大数据合作。结果显示,大数据对学校的工作具有重要作用。当IBM刚刚开始与这一学区合作时,除了学生成绩不好之外,该县还面临着辍学率已增加到48%的严峻情况。根 据联邦政府的《不让一个孩子掉队法》(No Child Lift Behind,NCLB),学生成绩糟糕的地方政府将受到惩罚。为了应对这一巨大的挑战,该县此前已经在学生数据的基础上建立了一个辍学指示工具,并将其 用于全县层面的决策。但IBM认为这仍不足以改善莫白儿县窘迫的现状,需要借助IBM的技术支持重新建立大数据,进而利用大数据分析来改善学区内所有学生 的整体成绩。
在美国的教育大数据领域,除了处于领先地位的IBM,还有像“希维塔斯学习”(Civitas Learning)这样的新兴企业。“希维塔斯学习”是一家专门聚焦于运用预测性分析、机器学习从而提高学生成绩的年轻公司。该公司在高等教育领域建立起 最大的跨校学习数据库。通过这些海量数据,能够看到学生的分数、出勤率、辍学率和保留率的主要趋势。通过使用100多万名学生的相关记录和700万个课程 记录,这家公司的软件能够让用户探测性地知道导致辍学和学习成绩表现不良的警告性信号。此外,还允许用户发现那些导致无谓消耗的特定课程,并且看出哪些资 源和干预是最成功的。
在加拿大,总部位于安大略省沃特卢的教育科技公司“渴望学习”(Desire 2 Learn)已经面向高等教育领域的学生,推出了基于他们自己过去的学习成绩数据预测并改善其未来学习成绩的大数据服务项目。这家公司的新产品名为“学生
成功系统”(Student Success System)。“渴望学习”声称加拿大和美国的1000多万名高校学生正在使用其学习管理系统技术。“渴望学习”的产品通过监控学生阅读电子化的课程材 料、提交电子版的作业、通过在线与同学交流、完成考试与测验,就能让其计算程序持续、系统地分析每个学生的教育数据。老师得到的不再是过去那种只展示学生 分数与作业的结果,而是像阅读材料的时间长短等这样更为详细的重要信息,这样老师就能及时诊断问题的所在,提出改进的建议,并预测学生的期末考试成绩。
像美国的“梦盒学习”(DreamBox Learning)公司和“纽顿”(Knewton)公司这类领先性的开发者们,已经成功创造并发布了各自版本的利用大数据的适应性学习(adaptive learning)系统。在2012年国际消费电子展的高等教育技术峰会上,世界最大的教育出版公司培生集团(Pearson)与适应性学习领域里的先行 者纽顿公司共同发布了主要由培生集团开发的适应性学习产品——“我的实验室/高手掌握”(MyLab/Mastering)。这款产品在将全球范围内向数 百万名学生提供个性化的学习服务,向他们提供真实可信的学习数据,让学校通过这些数据提高学生的学习效果并降低教学成本。首款产品将在美国的数十万名学生 中使用,包括数学、英语,以及写作等技能开发课。
纽顿的创办人、首席执行官何塞·费雷拉和培生高等教育分公司的总裁格雷格·托宾共同出席了“我的实验室/高手掌握”的发布会并介绍了合作的细节,讨论 了高等教育的未来。托宾说:“个性化学习是未来教育的一个关键点。我们把纽顿的技术整合到‘我的实验室/高手掌握’这个产品中,是整个行业进入个性化教育 新时代的引领风气之举”。费雷拉说:“从今年秋季起,培生的课程材料将在纽顿技术的支持下,开始适应性地满足每个学生独特的学习需求。学生能够生成大量有 价值的数据,纽顿可以分析这些数据,以此确保学生以最有效、最高效的方式学习。这是教育的一个新的前沿领域”。按照已经达成的协议,这两家公司2013年 将进一步扩大合作,把大学数学、大学统计学、大学一年级作文、经济学以及科学等领域纳入其产品中去。
此外,由总部设在美国纽约的麦格劳·希尔公司(McGraw-Hill)、总部设在英国伦敦的培生集团和其他出版公司共同开发的“课程精灵”系统
(CourseSmart),也允许教授们通过让学生使用电子教科书来跟踪他们的学业进展,并向助教们显示学生的学习参与度和学习成绩等大量的数据信息,只是这一系统尚不具备预测的功能。大数据让考试变得更科学
教育中的数据挖掘是迈向大数据分析的一项主要工作。教育中最近的趋势是允许研究者积累大量尚未结构化的数据(unstructured data)。结构化的数据(structured data)是从教育部门多年的数据——特别考试成绩和出勤记录——那里收集而来。互动性学习的新方法已经通过智力辅导系统、刺激与激励机制、教育性的游戏产生了越来越多的尚未结构化的数据。这就使得更丰富的数据能给研究者创造出比过去更多的探究学生学习环境的新机会。
教育数据与其他领域中的数据比较起来,有一些独特的特征。总结起来就是教育数据是分层的(hierarchical)。美国教育部教育技术办公室在 《通过教育数据挖掘和学习分析增进教与学(公共评论草案)》的第18页中写道:“教育数据是„„分层的。有键击层(keystroke level)、回答层(answer level)、学期层(session level)、学生层(student level)、教室层(classroom level)、教师层(teacher level)和学校层(school level),数据就寓居在这些不同的层之中。”
当某个学生回答一个问题时,一些变量就需要一起分析了。例如,学生回答正确率低的问题就是好问题吗?此外,时间也是重要的因素。比如,一个学生在考试 的第一部分耗时太多,是否意味着其接下来就会飞速、凌乱地答题。一道问题的答题顺序、结果、具体情况,都给研究者提供了许多前所未有的大量数据。运用这些 数据,研究者就能揭示学生的学习模式。研究者利用所有这些数据就能获悉到底是什么因素对学生构成了最好的学习环境。理解这些重要的问题有助于教育工作者给 学生创造一个个性化的学习模式。
监测学生是“如何”考试的能让研究者有效定型学生的学习行为。大数据要求教育工作者必须超越传统,不能只追求正确的答案,学生是如何朝着正确答案努力 的过程也同样重要。在一次考试中,学生个人和整体在每道题上花费了多少时间?最长的是多少?最短的是多少?平均又是多少?哪些此前已经出现过的问题学生答 对或答错了?哪些问题的线索让学生获益了?通过监测这些信息,形成数据档案,能够帮助教育工作者理解学生为了掌握学习内容而进行学习的全过程,并有助于向 他们提供个性化的学习模式。
监控学生的每一个学习行为是可能的。为了改进学生的学习成绩,我们需要知道他们回答一个问题用了多少时间,回答这个问题使用了哪些资源,哪些问题被跳 过了,为了回答这个问题做了哪些研究工作,这个问题与其他已经回答了的问题之间存在什么关系。此外,老师对每个学生提供什么样的建议才是最佳的?学生写作 业和答题的信息能立即被自动地监测到,老师还能在第一时间将这些信息反馈给学生。
用这些学生学习的行为档案创造适应性的学习系统能够提高学生的学习效果。利用学生是“如何”学习的这样重要的信息,考试的出题者们就能为学生量身定制 出适合学生的个性化问题,并设计出能够促进记忆力的线索。通过分析大数据,研究者发现从教育的效果上来看,当被问到一系列难度逐渐增加且互相关联的问题 时,学生的表现要好于围绕一个共同的知识点而随机挑选出的问题。美国标准化的研究生入学考试(GRE)中的这种适应性考试已经显示出朝这一方向努力的趋 势。
五大技术利用教育大数据
需要特别注意的是,如何收集数据对于它们未来的使用性非常重要。接收数据汇入背后的挑战是从一开始就要标准化,以便今后对数据进行仔细分析。这样做并不是意味着将未结构化的数据转化为结构化的数据,而是要用直观的方法对接收的数据进行分类。
应该说,获得相关数据并不是一件容易的事。对于大学阶段的学生而言,数据的收集并不是主要问题。然而,对于中小学阶段的学生而言,挑战却很大,因为有些数据的收集存在法律问题,有的则存在伦理道德的问题。
数据收集者的人数和技能也是一个问题。对于公司而言,通常通过网络上的小型文本文件(cookies)来收集用户的相关信息。但是对于美国联邦政府教育部而言,则需要依赖于全国众多学区和研究者的网络来提炼和确认数据。
教育工作者和研究者已经开发出从大数据中提取价值的5种主要的技术。
1.预测(Prediction)——觉知预料中的事实的可能性。例如,要具备知道一个学生在什么情况下尽管事实上有能力但却有意回答错误的能力。
2.聚类(Clustering)——发现自然集中起来的数据点。这对于把有相同学习兴趣的学生分在一组很有用。
3.相关性挖掘(Relationship Mining)——发现各种变量之间的关系,并对其进行解码以便今后使用它们。这对探知学生在寻求帮助后是否能够正确回答问题的可靠性很有帮助。
4.升华人的判断(Distillation for human judgment)——建立可视的机器学习的模式。
5.用模式进行发现(Discovery with models)——使用通过大数据分析开发出的模式进行“元学习”(meta-study)。
实施这些技术就能够通过大数据来创建为提高学生成绩提供支持的学习分析系统。研究者们相信这些技术将帮助教育工作者更加有效地指导学生朝着更加个性化的学习进程迈进。
总而言之,通过大数据进行学习分析能够为每一位学生都创设一个量身定做的学习环境和个性化的课程,还能创建一个早期预警系统以便发现开除和辍学等潜在 的风险,为学生的多年学习提供一个富有挑战性而非逐渐厌倦的学习计划。因此,有识之士经预言未来的学习将是大数据驱动的新时代。我们应该积极迎接这个新时 代,通过大数据来分析学习,进一步改善教学的方式与方法,进一步促进学生学习成绩的提高。
2.大数据助力智库建设 篇二
建设“中蒙俄经济走廊”是中蒙俄三国人民的美好愿景
“中蒙俄经济走廊”建设是古丝路精神发扬光大的重要载体, 是“一带一路”战略的重要组成部分, 是推进“一带一路”战略实施的重要举措, 是有效对接三国发展战略的重要平台, 是互尊互信、合作共赢、文明互鉴的伟大构想, 是惠及三国人民长远利益的美好愿景。
从古代草原丝绸之路的历史文化和地缘看, 中蒙俄是古代草原丝绸之路的重要国家和通道, 是古代草原丝路文化的重要发祥地、承载地。三国山水相连, 睦领友好, 交往频繁, 亚欧人民堪称三国经贸文化交流的典范, 知识交流、相互学习的先行者。比如, 中蒙共同享有相同族源和丰富的文化资源, 这些资源渗透在两国的历史文化中, 也存续在两国现实社会生活中, 是中蒙两国游牧文明的真谛和草原文化的胸怀在经济全球化的现代进程中发扬光大, 是建设“中蒙俄经济走廊”的文化瑰宝和文化力量。再比如, 从18 世纪中叶到20 世纪初, 中国北方草原有一条通向蒙古高原和西伯利亚腹地的“茶叶之路”。这条茶路由二连浩特出境, 途经乌兰巴托、恰克图等地, 终点为俄罗斯贝加尔湖一带, 横跨亚、欧大陆, 绵延万里, 创造了辉煌的商业奇迹。中俄“万里茶路”, 带动了沿途城镇、商业、加工业、服务业的发展和文化交流, 展现了民间社会密切交往的共同需求, 也是一条商贸之路、文化之路, 友谊之路。这些历史记忆是留给现代中国、蒙古国、俄罗斯的一份重要文化遗产, 以这条“万里茶路”为主题, 三国联合签署了申报世界文化遗产的宣言, 开启了尊重历史、传承文化、开拓未来的重要合作新篇章, 是有利于建设“中蒙俄经济走廊”的底蕴深厚的共享资源, 是一种崭新的历史观, 也是中国倡导“一带一路”战略构想和“中蒙俄经济走廊”建设的出发点, 是再现“茶叶之路”辉煌的创新之举。
从现实的政治、地理和经济地缘上看, “中蒙俄经济走廊”建设是一个符合三国发展愿景的巨大合作平台。是“丝绸之路经济带”向北在陆地上的延伸、向南与“21 世纪海上丝绸之路”对接的一种新跨境合作战略构想, 既缩小了俄罗斯和蒙古国与亚太地区的时空距离, 又体现了俄罗斯和蒙古国的国家利益和经济发展要求。中蒙俄经济走廊”战略构想是实现中国“丝绸之路经济带”、蒙古国“草原之路”和俄罗斯“亚欧大铁路” 的有效对接。编制《中俄蒙经济走廊合作规划纲要》, 根据公布的中期路线图可以看到, 三方正在将发展战略对接落实到具体合作领域和项目上来。 在经贸合作方面, 为进一步提升三方贸易便利化水平, 包括在相互贸易中扩大使用本币结算, 三方将探讨建立经贸主管部门合作机制。完善三国工商会合作机制, 推动定期举办洽谈会和经贸论坛, 加强三方间贸易、投资和商务伙伴关系。开展三方海关合作, 举行三国海关署级会晤。继续定期举行三方交通运输部门和机构工作组会晤。中蒙俄三国落实发展战略对接, 打造经济走廊, 将进一步拓展三方合作空间, 更将带动整个欧亚地区的发展。古老的“茶叶之路”重新焕发生机与活力的前景可期, 将为该地区国家和人民带来实实在在的福祉。中蒙俄三国加强沟通与合作, 不仅巩固了中蒙俄三国双边关系, 同时还可强化以中俄为主的多边合作机制。在地理地缘上, 目前复杂的国家关系和地区格局中, 只有中蒙俄三国的双边、三边关系最为稳定, 且处在历史最好时期。中蒙俄三国关系未来走向对东北亚, 乃至中亚、东亚发展举足轻重。在经济地缘上, 虽然东北亚六个国家的地上、地下资源各有千秋, 但是更多的能源性、战略性资源还是集中在中蒙俄三个陆地国家。中蒙俄经贸合作成为东北亚经济复苏发展的助推器。“中俄蒙经济走廊”战略构想一方面加强了中俄与蒙古国各经贸领域的全方位合作。特别会使蒙古国经济从简单的双边合作向多边合作转移;从单一内陆经贸合作向陆海并重转移;从单纯的资源原料运输向多元化经济合作转移;从粗放型运营向环境保护型转移。另一方面, 中俄蒙三国首脑会晤首先开启了东北亚区域内新的多边对话模式, 还可以进一步提高三国的地区影响力以及对地区局势的掌控能力。“中蒙俄经济走廊”建设旨在开展更大范围、更高水平、更深层次的区域合作, 共同打造开放、包容、均衡、普惠的区域经济合作架构, 为我们描绘出了和平发展的美好蓝图, 符合三国人民的共同利益, 是三国人民的共同美好愿景。
智库是推动“中蒙俄经济走廊”建设的重要引擎
智库为影响政策而生, 是一个国家文化软实力的重要组成部分。从智库 (thinktank) 的叫法起源和美国有一个集聚美国“最强大脑”的别号叫智库街的影响, 以及智库在世界历史上的独特作用反复证明, 智库已成为国家外交的重要主体, 智库在谋划发展蓝图, 推动合作共赢、促进国家间友好交往中的作用日益凸显, 智库间的合作已成为影响世界政治、经济、文化和社会进步的重要因素。实现“中蒙俄经济走廊”建设这一宏大愿景, 是复杂的系统工作, 涉及多元合作伙伴、多个区域板块、多类实施主体、多项重点任务, 更加离不开各方智库的影响和推动。当务之急迫切需要集中了各类高端人才的三国智库的积极参与、服务和务实合作, 搭建三国人文交流的文化走廊, 发挥智库的重要引擎作用。
智库的引擎作用还表现在智库相当于芯片, 即智库= 芯片的“智库+ 模式”。“中蒙俄经济走廊”战略构想是一项系统工程, 要坚持共商、共建、共享原则, 实现三国战略对接和一系列的具体规划及项目对接, 这客观上迫切需要智库进行前瞻性、战略性和可操作性的务实研究, 有效发挥智库的党委政府的“外脑”、社会舆论的“向导”、经济社会发展的“助推器”及外交的润滑器作用, 以加大理解和共识, 加强政策引导和阐释, 提供智力咨询和服务, 破除各种难题和困境。具体讲“中蒙俄经济走廊”建设以政策沟通、道路联通、贸易畅通、货币流通、民心相通“五通”为主要内容。政策沟通是“中蒙俄经济走廊”建设的重要保障, 民心沟通是中蒙俄经济走廊”建设的社会根本。作为咨政建言和人文交流的重要力量, 智库不仅是本国政策与学术研究之间的桥梁、政府与公众之间的桥梁, 也是各国之间深化交流合作、实现互利共赢的政策沟通的桥梁。充分发挥智库的专业研究能力及对政府和公众的影响力, 对促进三国政策沟通、民心相通, 为共建“中蒙俄经济走廊”奠定坚实的民意基础, 具有独特而重要的意义。此外, 除了从宏观视角的政策沟通、民心相通外, 其余的“道路联通”、“贸易畅通”、“货币流通”等微观的内容同样需要强有力的智库智力支持和服务, 发挥智库的智力芯片作用, 每一通都有智库服务的相关要素支撑的一系列的“智库+ 模式”, 如智库+ 贸易畅通, 即可以分解为智库+ 政府决策 (影响) 、+ 高端智库人才、+ 高端产业 (聚集) 、+ 金融创新服务、+ 智库专业咨询, 由此形成以政府政策开放带动、参政议政的高端人才聚集推动、高端产业集聚拉动、金融服务融合互动、专业咨询创新驱动为核心的全智能智库服务链条。以上智库= 芯片的“智库+ 模式”和具体每一项的衍生的智库要素的组合服务模式使智库智力服务的架构和体系更加清晰完善, 五通的内容植入智力的芯片, 插上芯片的翅膀, 动力更强, 飞得更远, 增添强有力的智力内生动力, 有力推动“五通”的顺利实施, 有力提升智库话语权、影响力, 使智库成为“中蒙俄经济走廊”不可或缺的重要新引擎。
智库合作交流是助推“中蒙俄经济走廊”的重要路径
为了实现“中蒙俄经济走廊”的命运共同体、利益共同体, 我们必须构建打造智库联盟, 加大智库间合作交流。三国学术界应抓住有利时机, 增强使命意识, 把握时代特性, 积极探索智库对话新模式, 全面拓展务实合作新途径, 不断完善智库合作新机制, 进一步推进智库间的广泛交流合作。我们应秉持共商共建、互利共赢、突出重点、稳步推进的原则构建国际开放智库平台, 特别是要实现三国智库有效对接, 有效整合三国的智库资源, 最大限度发挥智库的集聚效应, 携手共同打造三国智库共同体, 有效发挥三国智库的优势, 共同关注和致力于“中蒙俄经济走廊”建设的研究, 使三国智库成为实现三国命运共同体、利益共同体的有效平台和重要支撑。
促进中蒙俄国家智库交流合作, 为“中蒙俄经济走廊”建设增信释疑, 凝聚共识, 提供政策支持。通过三国智库开展全方位的合作和交流, 充分调查、反映三国困难、问题、关切与疑虑, 就经济发展战略和对策进行充分交流对接, 增强信息交流, 促进政策沟通, 共同制定推进区域合作的规划和措施, 协商解决合作中的问题, 促进“中蒙俄经济走廊”建设的思路创新、决策咨询、磋商沟通与方案设计, 进而实现国家间政治互信、政策协调。
3.大数据助力松原公安信息化建设 篇三
讲座由松原市公安局松江分局政委王晓平主持,副局长张生、高翔,副政委李嗣绵及所属各派出所、刑侦骨干人员等参加讲座。戴汝为院士率领教授、副研究员、博士生等团队成员分别就相关内容进行讲授。
王晓平政委首先代表分局全体民警对戴院士及其团队的到来表示欢迎。他在致辞中表示,希望大家珍惜这次难得的机会,认真听讲,深刻领会,努力提升松江分局的信息化建设能力。
讲座开始之前,举行了戴院士赠书仪式。随后,讲座正式开始。戴院士学术秘书高思宇、博士研究生胡文鹏、副研究员郑楠博士先后作主题报告。
高思宇在《大数据的发展与应用》的报告中指出:大数据环境下,科学研究更加注重片段数据、海量数据、非结构化数据的采集、清洗、挖掘与分析,通过碎片化重组,深度揭示难以处理或无法预知的科学问题。起初对大数据技术的推动力主要源于国家安全方面,最终推动了金融、医疗、公安等多方面开始实施大数据的广泛应用。
“云计算是技术的创新,云计算的出现开辟了人类社会全面使用高性能计算的新径。它为大数据的处理、复杂系统的求解提供了基本的工具。现在,互联网、交通、通信等社会生活和军事、气象、公安等行业中产生了海量数据。”胡文鹏从云计算的产生、概念、原理及应用四个方面对云计算进行了介绍。
郑楠在题为《智能科学技术在公安系统上的应用》的报告中表示:以搭建“大数据”处理和分析平台为突破口,寻求公安信息化应用新的效益增长点,已经成为公安机关信息化应用的热点问题。采用先进通信技术,跟踪嫌疑人至多目的地,搜索重叠手机号码以确定嫌疑人手机号,利用统计分析,确定嫌疑人的同伙信息,提高公安办案效率。对交通视频数据进行大数据分析,可以很容易发现套牌车、超速车。利用模式识别技术,对夜间视频数据进行人脸识别、车牌识别,提高公安办案效率。利用社会大数据进行城市人员的构成、人口的流动等可视化分析,可以为公安、政府的相关部门提供有力的决策支持。
三位报告人结合云计算、大数据及模式识别技术在公安系统上具体应用的案例,对公安信息化建设的战略意义和现实紧迫性进行了分析与探讨。
“通过今天的授课,中科院专家团队给我们带来了新理念、新思路、新方法,更有助于我们更新警务理念、整合警务资源、优化警务机制,全面提升公安工作整体水平。”王晓平在讲座总结讲话中这样概括。
链接:
4.大数据助力智库建设 篇四
现代化
大国治理需要大智慧。在信息化时代,大智慧往往源于大数据。大数据作为信息时代的基础资源,能有效集成国家经济、政治、文化、社会、生态等方面的信息资源,为国家治理现代化提供基础数据和决策支撑。
助力国家治理顶层设计。国家治理现代化是一个开放而复杂的巨系统,需要动员全社会力量参与。如果依靠单一主体、单一力量,既难负其重,又会导致治理体系结构失衡,甚至偏离国家治理现代化的科学轨道。只有统筹国家治理现代化的目标、主体、客体、过程,系统谋划、整体推进、综合施策,才能达到系统集成的效 果。这就要求建立统一、共享的大数据平台,通过对海量数据的采集、挖掘、加工、汇总、整合、存储和分享,为党和政府进行国家治理顶层设计提供坚实的数据支撑,助力党和政府找到国家治理现代化的最优路径。
助力合理规划与实施国家治理。国家治理现代化是国家治理全面、系统的改革和改进,这就需要运用大数据技术,对国家治理进行科学规划与实施。把中国特色社会主义的制度优势转化为国家治理现代化的效能,涉及价值取向、主体、制度、技术等要素。同时,中国特色社会主义经济建设、政治建设、文化建设、社会建设 和生态文明建设任务繁重、内容复杂。充分运用大数据分析提供的规律性结论,有利于形成系统完备、科学规范、运行有效的制度体系,使各方面制度更加成熟更加定型,保障国家治理现代化遵循科学性、战略性、长远性、系统性和有效性的原则,在系统治理、依法治理、综合治理、源头治理的轨道上顺利推进,保证国家治理 现代化过程规范、运作高效。
助力党和政府科学决策。科学决策是国家治理现代化的核心。信息化时代,科学决策越来越依赖大数据的采集与分析。随着信息技术的发展,每个社会成员均可利用信息化手段表达自己的意愿和看法,形成海量的“微数据”和“微事件”。决策者往往要对海量的实时数据进行掌握和挖掘,将分散的小概率事件有序关联起来,突破“信息孤岛”限制,排除各种垃圾信息的误导和干扰,把握数据中蕴含的规律性、倾向性问题,提高公共决策的民主化、科学化水平,更好地回应公众关切,满足公众需求和期待。
助力提升国家治理效能。国家治理现代化水平的一个重要体现,是国家治理效能的提升。就我国实际而言,国家治理效能包括促进经济社会发展、满足公共服务需求、处理社会治理危机、维护公共安全等的能力与效果。大数据的开放和流动、使用和共享,能帮助治理主体准确预测经济社会发展趋势、社会公共服务需求、引 发社会治理危机和公共安全事件的因素,有效实施事前控制,进一步降低治理成本、提高治理效率,从而进一步提升国家治理的整体效能。
助力优化信息反馈机制。国家治理现代化是“持久战”,需要对发展的每一个阶段进行事中评估,及时了解进展情况,发现问题、纠正偏差,避免出现方向性错 误。充分运用大数据的理念、技中公教育,给人改变未来的力量
术和资源,及时、有效地对国家治理现代化进程进行监管,将海量碎片化且无序排列的信息变成有用、有序的数据,可以使监管更有针对性、更加透明。通过大数据对国家治理现代化进程进行精准分析,为决策者提供国家治理现代化推进的真实信息,有助于决策者以目标变量为参照系,及时、准 确地掌握国家治理现代化的进程、成效以及存在的问题,并针对评估结果及时进行调整和修正。
助力塑造健康社会心理。国家治理现代化包括社会结构转型。当代社会,人们认识世界和自身的参照系在快速变化。这在一定程度上会导致社会心理稳定性缺失,致使一些人心态浮躁、焦虑感上升。因此,推进国家治理现代化,要注重塑造与之相适应的健康社会心理,为各项改革和实践营造良好社会氛围,提升国家治理 现代化“硬件”与“软件”的契合度。在信息时代,大数据打破了单一主体对信息传播流向和内容的垄断,拓宽了信息来源和流通渠道,提高了“信息能见度”,为 民众参与国家治理提供了有效技术支撑。对大数据进行分析与集成,可以找到在国家治理现代化的大变革中社会心理浮躁、焦虑的症结所在,有的放矢地采取措施,引导和调整社会预期;引导人们保持战略定力,弘扬一张蓝图绘到底的精神;激发广大人民群众干事创业的活力,为国家治理现代化营造改革创新、和谐稳定的社会氛围。
5.大数据如何助力媒体 篇五
大数据 (Big Data) 并不是一个全新的概念, 这个词汇诞生前, 我们通常将类似技术称为数据仓库 (Data Warehouse) 或商业智能 (BI) , 那么为什么大数据会在最近一两年成为和云计算齐名的新名词呢, 关键在于大数据所蕴含的商业价值, 坦率的说挖掘出这些商业价值并非易事, 它需要一套完整的方法论及配套的IT工具。目前大数据在互联网行业特别是电商应用比较深入, 也产生了可观的价值, 媒体本身是数据制造者, 但并未顺理成章的成为大数据驾驭者, 究其原因主要是因为媒体的数据尚未形成完备的价值链分析体系, 所以这些数据没有产生增值效应, 伴随全媒体时代的到来, 媒体需要将全价值链的数据整合, 应用相关的IT技术实施挖掘, 把媒体大数据的价值提炼出来, 为指导媒体从信息采集、加入、生产、投放的全流程提供有价值的决策信息。
大数据目前没有准确概念, 我们通过分析大数据的特点, 尝试给出一个概念轮廓:业界通常用Volume (容量) 、Variety (种类) 、Value (价值) 、Velocity (速度) 这4个V来概括大数据。大数据的特点包括:第一, 数据体量巨大, 从TB级别跃升到PB乃至EB级。第二, 数据类型繁多, 按照组织类型分为结构化、非结构化和半结构化数据, 按照使用类型分为文本、图片、音频、视频、网页、表格、日志等无限多类型的数据。第三, 价值数据挖掘难度大, 即价值密度的高低与数据总量的大小成反比。以视频为例, 一部一小时的视频, 在数据挖掘过程中有用的数据可能仅仅只有几分钟, 如何通过云计算更迅速地完成大数据的价值“提纯”是目前大数据价值体现的关键。第四, 大数据的价值生成速度, 我们常说效率就是金钱, 在大数据领域同样适用, 同样的大数据你先分析出价值点, 就会领先竞争对手生产适销对路的产品, 对于媒体更是如此, 同样的报道, 如何组织更适合受众欢迎的内容, 大数据的分析工具会给你一些启示, 这些启示可能就是领先对手的价值点。
二、大数据的价值
大数据的价值是怎样体现的呢?我们不妨分析两个成功案例, 第一是e Bay, 互联网行业的代表, 第二是沃尔玛, 传统行业的代表。
“e Bay在5年前就建立了大数据分析平台。在这个平台上, 可以将结构化数据和非结构化数据结合在一起, 通过分析促进e Bay的业务创新和利润增长。”e Bay分析平台高级总监Oliver Ratzesberger如是说。现在, e Bay的分析平台每天处理的数据量高达100PB, 超过了纳斯达克交易所每天的数据处理量。为了准确分析用户的购物行为, e Bay定义了超过500种类型的数据, 对顾客的行为进行跟踪分析, 最显著的变化反应在广告费上。e Bay对互联网广告的投入一直很大, 通过购买一些网页搜索的关键字, 将潜在客户引入e Bay网站, 为了对这些关键字的广告投入、产出进行衡量, e Bay建立了一个数据分析系统。通过这个系统, 可以精确计算出每一个关键字为e Bay带来的投资回报, 通过对广告投放的优化, 自2007年以来, e Bay产品销售的广告费降低了99%, 顶级卖家占总销售额的百分比却上升至32%。
传统零售商巨头沃尔玛, 早在1969年就开始使用计算机来跟踪存货, 1974年就将其分销中心与各家商场销售情况运用计算机进行库存控制;1983年, 沃尔玛所有门店都开始采用条形码扫描系统;1987年, 沃尔玛完成了公司内部的卫星系统安装, 该系统使得总部、分销中心和各个商场之间可以实现实时、双向的数据传输。采用这些在当时还是超前的信息技术来搜集运营数据为沃尔玛最近20年的崛起打下了坚实基础。如今, 沃尔玛拥有着全世界最大的数据仓库, 在数据仓库中存储着沃尔玛数千家连锁店在65周内每一笔销售的详细记录, 这使得业务人员可以通过分析购买行为精确了解他们的客户。
从上面的案例我们可以看到对于现代企业而言, 大数据已经不是可选项, 而是必选项, 谁的数据越多, 分析结果越好, 谁就越有可能立于不败之地。IDC在其关于大数据的报告中指出, 领军企业与其他企业之间最大底差别在于新数据类型的引入, 那些没有引入新的分析技术和新的数据类型的企业, 不太可能成为其行业的领军者。
数据资产正在当仁不让地成为现代商业社会的核心竞争力。与其他行业相比, 互联网行业已提早感受到大数据对商业价值带来的深刻变化, 当很多企业还在因为大数据对本行业的变革无所适从时, 一些互联网企业已经完成了核心竞争力的重新定义, 这种核心竞争力的体现意味着大数据时代的来临。
媒体无一例外都握有大量数据, 但这些数据通常只是媒体的生产内容, 并没有把从生产者到消费者的全价值链数据整合起来, 比如媒体的营销数据是否已和生产数据实现精确关联, 所有类型的数据是否已实现精确地元数据描述, 这些都是进行大数据分析的关键。
三、如何使用大数据
1、媒体中大数据的产生及应用方式
要驾驭大数据首先要清楚它产生的过程, 我们看一下典型媒体大数据的产生流程 (见图1) 。
通过图1可以看出, 媒体的全流程生产都会产生数据, 这些数据该怎样获取呢, 笔者提出如下建议:
(1) 传统环节的数据整合, 这主要涵盖信息的采集、加工和投放, 这些数据可以直接获取, 并可按照行业标准的XML格式进行描述, 这些数据的整合很多媒体都已完成 (通常称为媒资系统) , 优化的方向是逐渐提升元数据描述精度和广度。
(2) 传统方式用户行为数据, 因为很多数据没有电子化, 这部分数据的采集比较困难, 需要涉及人工或第三方途径获取行为数据, 但数据本身仍然很有价值。
(3) 新媒体方式用户行为数据, 数据完全电子化, 采集比较容易, 核心点在于采集的数据颗粒度要足够细致, 如受众对于某信息的获取方式是直接浏览还是搜索链接、使用的什么关键词找到、浏览过程页面停留时间等多维度数据信息。
在获取了相当数量的大数据后就要对它进行分析了, 这里同样提出一些基本原则:
(1) 大数据的价值就像散列在沙子中的金粒, 不可能一下全部提取出来, 也很难全部提取出来, 它是遵循人们对知识的认知过程来逐渐体现价值的。按照循序渐进的原则, 先找出一些最基本的规律进行分析, 比如信息、受众及获取方式的分布规律, 不同信息内容与受众群体的分布等等。
(2) 逐步开始培养数据分析师。大数据的价值体现关键还在人, 因为大数据的分析模型是人设计的, 其他类似云计算、数据仓库、BI等技术只是不可或缺的工具。伴随着大数据的发展, 一类被称为数据分析师的高端人才也应运而生, 所以媒体若想用好大数据是需要一支数据分析师队伍。
(3) 大数据的分析结果可以指导媒体设计产品类型及增值方式。通过分析信息产品的受众分布可以帮助设计更多产品类型及计算人员分布合理性, 通过分析产品的组合获取方式可以设计更加合理的增值产品。
(4) 大数据辅助高层决策。大数据的分析结果是建立在数据基础上的科学分析, 换句话说它的计算结果是完全量化的, 所以当媒体高层需要对企业战略发展作出决定时, 合理的大数据分析结果可以提供非常有价值的决策支撑。
前面对媒体如何使用大数据在业务层面进行了简单分析, 在技术层面我们同样需要分析目前的技术是否已经为大数据做好准备?
2、构架面向未来的大数据系统
传统应对大数据的IT技术通常是数据仓库或BI, 通过应用大型关系数据库、多维分析引擎、小型机、SAN存储可实现对一定规模结构化数据的分析, 可以看出, 传统IT技术的计算能力及存储能力以纵向扩展为主, 横向扩展一般, 这对于一般规模的数据挖掘问题不大, 但是当面对大数据的4V特性时, 传统IT技术就显得力不从心了, 伴随着云计算时代的到来, 完全的分布式计算和分布式存储是解决大数据分析的最佳利器。
分布式计算和分布式存储在互联网等超海量数据处理领域已经得到了大量成功应用, 实践证明这种体系架构是一种高度伸缩的, 计算能力及存储能力趋于无限扩展的高性价比数据处理平台, 这个平台的典型代表就是Hadoop或者基于此架构的延伸产品, 它可以在一个平台很好解决大数据的两个关键问题, 即数据的存储和数据的分析计算, 所以基于此平台建设的大数据系统有如下特点:
(1) 本身就是云计算平台。处理好大数据一定需要一个强大的计算平台, 很多企业都已开始尝试建设自有的云计算平台, 这些平台达到一定规模后就直接可以用于部署大数据, 而大数据又可以充分利用云计算平台的计算能力, 所以从这个意义上讲, 大数据和云计算是珠联璧合, 云计算是基础, 大数据是应用。
(2) 大数据系统和原有数据平台是融合关系。这种融合体现在两方面, 首先是原有数据平台是数据源, 经过ETL过程后数据进入大数据系统, 但并不是所有数据都进入, 这主要取决于需要分析的内容和分析的方式;第二并非所有分析都在大数据平台上完成, 原有数据平台已经具备了一定的分析能力, 这些分析功能不应浪费, 而应该集成, 即大数据分析系统是所有数据平台分析结果的总集合, 每个数据平台仍然承担一定的分析任务, 只有最适合或是计算任务最复杂的分析直接在大数据系统上完成。
(3) 大数据系统是一个整合的分析平台。基于Hadoop架构建设的大数据系统并不是万能的, 它的Map/Reduce模式更适合于海量半结构化数据的并行处理, 传统RDBMS、BI仍然在结构化数据处理方面拥有不可替代的优势, 所以大数据分析系统应该是一个整合的分析平台, 即每种分析过程都有最适合的技术, Hadoop本身的分析工具目前也不够完善, 还远未达到类似RDBMS、BI商品化软件的完成度, 所以如果计划使用Hadoop架构, 是需要一只能力较强的软件开发队伍。
(4) 分布式数据存储。大数据系统要同时面对超海量数据存储及超多类型数据处理两个挑战, 要实现解决这两个挑战的和谐统一, 首先需要选择一个强大的分布式数据存储平台, 也称集群存储系统。它要实现随着数据量的提升性能可线性增长, 同时要处理好各种类型数据进行分析时整体系统的负载是基本均衡的, 这是一个比较复杂的课题, 它和数据的分布方式及分析过程都密切相关, 所以在构建大数据系统时要考虑这些问题, 也许只有相对最优方案, 因为谁都不知道大数据到底能找到多少价值。
(5) 建立中间层数据接口标准。由于大数据分析是多个子系统协同计算的过程, 所以各子系统的结果数据及子系统之间数据交互是需要一套标准的, 这个标准要实现可以追踪任何颗粒度的数据在大数据系统全流程是如何变化的, 这样任何数据及任何系统间的分析都是可以互相继承的, 这个标准程序化后将演进为虚拟层, 即分析师不用关心数据源在什么地方, 而只需设计某分析系统需要使用哪些数据得到什么结果。
(6) 重要的是先做起来。前面的描述可以看到构建一个完整的大数据系统并不简单, 但这并不妨碍我们把事情先做起来, 在大数据应用最纯熟的互联网行业, 他们通常遵从简单、直接的原则, 即并不对数据进行大量的重新整合, 原有数据能直接利用就直接利用, 目的就是通过尽量简单的方式得到分析结果, 所以借鉴这个原则, 媒体应该首先对目前已有的数据进行分析, 找到一些规律, 即明白自己需要什么, 目前的系统提供不了什么, 这样才能为构建成熟的大数据系统打下基础。
四、总结
通过上面分析我们不难看出大数据基本遵循着“数据收集-知识形成-智慧行动” (引自驾驭大数据一书) 的过程, 同时应该看到“数据只是源, 思想才是分析之父, 有价值有影响力的分析才是优质分析”。大数据的分析结果是区别于报表或固定数据呈现模式的, 它是媒体把握现状、预测趋势的一种利器, 充分利用好大数据可以更好地驾驭未来。
6.大数据助力网贷风控 篇六
不得不说,互联网缔造了一个信息时代,那些靠信息不对称获利的传统行业备感危机,而完全依赖信息流生存的金融行业更是如此。“P2P无疑是其中最炙手可热的互联网金融概念”,91金融联合创始人吴文雄在接受《中国经济信息》记者采访时指出,P2P网贷平台正是通过收集和分析数据信息,让出借人与借款人之间信息互通,从而实现盈利。
尽管当前P2P的平台模式看似无懈可击,但近三年内,P2P呈现出疯狂裂变,从寥寥几家猛增至1500多家,随之而来的便是跑路事件不断,以及行业投资遭遇阵痛。对此,北京玖富时代投资顾问有限公司总裁孙雷告诉《中国经济信息》记者,“在搭建P2P网贷平台的过程中,不懂得风控的企业会死;不懂得利用移动互联网大数据进行风控的企业更是没把钱烧在点子上。”
跑路——风控之痛
如今,对于P2P行业从业者而言,“又有几家P2P公司跑路了”这样的新闻已经屡见不鲜,尤其在最近一段时间,P2P行业里一些不规范的公司跑路及倒闭现象此起彼伏。
为何一些公司会跑路,或者还有哪些P2P肯定会跑路。提及这一问题,吴文雄认为,除了一开始就打着骗钱主意的庞氏骗局、披着P2P外衣的自融平台外,目前P2P平台跑路或者倒闭的主要原因是各类风险。他还提纲挈领的指出,“对于P2P平台来说,比较常见的四大类风险包括信用风险、操作风险、流动性风险以及市场风险。”
换句话来说,就是借款人是否有能力还钱,借款人提交的信息和资料是否真实会带给P2P平台风险。而包括挤兑在内的P2P交易中可能会产生的流动性风险以及因某些行业的巨幅震荡导致的平台出现问题等等原因也都会导致P2P公司陷入难以言表的困境。
而根据玖富多年对风险运营的管理经验,孙雷认为,如果是合规的P2P,困扰其的最大风险是信息不对称风险。也就是说,如何准确获取借款人的全面数据进行准确判断。
另外,“当P2P平台开始发展壮大之后,运营的重要性将开始超过销售。”孙雷指出,有部分企业寄希望于在现阶段最大程度的提升交易规模、用户数量等直观数据,而运营能力却远远落后于交易规模。在他看来,运营是一套体系,“企业的运营能力不一定关乎合规性问题,但如何在合规这一起点上做好,运营能力则是十分重要的指标”。
大数据——风控求解
从P2P在国内的诞生到现在,因风控失败导致的P2P死亡案例数不胜数。而出借人最关心的依然莫过于安全和平台的服务。如何避免风险,保证出借人的利益呢?孙雷讲到,“其实,如果你对借款人足够了解,只要知道这个借款人真实有效的信息就能够有效控制风险。”简而言之,避免风险就需要获取更多真实有效的信息,而移动互联网的出现则成为最优解决方案之一。
P2P平台是通过收集和分析大量的数据信息,帮助出借人了解借款人,让他们之间的信息能够互通,但吴文雄也指出,同时,P2P平台也利用大量的数据和信息做风控。“毫不夸张的说,移动互联网正在改变P2P”。
无疑,当前通过移动互联网采集的数据信息样本比原来大的多,“如果一个P2P平台,它能够收集到量足够大足够准确的信息和数据的话,他的风险控制水平一定是相当高的。”孙雷说。
所以,一旦有了移动互联网和大数据,P2P平台就能更好的对于风险进行管理。另外,记者了解到,如今采样的数据信息样本尽管多,但完全通过线上获取,流程的自动化促使效果和效率得到提升,既降低了人工成本,又大大降低了P2P网贷平台的投入消耗,一举两得。
据孙雷讲,过去基于P2P网站申请借款时,需要输入几十项信息,征信中心排长队打报告,全部提交还需再等待两轮左右的电话审核。“这个流程根本不能给用户带来较好的体验。”
以玖富微金融为例,如今基于移动互联网开发的新借款流程,授信只需要得到用户的授权,系统在几分钟内就可以告诉用户授信结果——“可以借多少钱,费率是多少,还款周期有多长”,然后,用户马上就可以判断,是否继续申请。
“91金融也为用户提供了更为便捷的申请流程,用户通过授信后若觉得额度以及费率等都合适,短短几分钟就可以完成借款申请。”吴文雄告诉《中国经济信息》记者。
记者了解到,如此短的操作时间内,P2P平台的后台通过用户授权分析了上千条各种相关数据,再加上P2P平台独有的风控技术,对用户进行风险识别,从而实现了这一高效的过程。
重度垂直——当下要务
在采访过程中,吴文雄多次建议各P2P平台企业急需意识到移动互联网时代已经到来这一事实,除却给行业带来冲击的同时,更促使相关企业谋求创新,研发出更为贴近市场、真实可靠的风控模型,并在大数据当前不断加以验证自身的服务模式以及风控能力。
孙雷也指出,与传统PC互联网时代不同,移动互联网的另一个特点是C2B 模式,“希望借某一应用获得海量用户的运营模式已经行不通了。”他认为,移动互联网基本是一个有限用户的互联网,所以,P2P平台企业在移动互联网时代致胜的方式就是进行重度垂直方向的运营。“这就要求P2P平台对用户理解要深入,根据细分用户去设计产品,再根据使用场景,建立其风控体系。”
但在吴文雄看来,目前的P2P市场正呈现出分化的状态。对此,全行业更应联动起来打造垂直化、专业化、精细化的平台形态,“单纯依靠建个网站就做P2P网贷平台的时代,一去不复返了。”如何在目前这个浑沌市场中打造自己的一片蓝海,成为平台企业务必抓紧求解的关键。
7.大数据助力智库建设 篇七
实现精准化营销的关键是准确识别目标客户, 并清晰了解客户的需求、购买行为特点及消费者自身特点等影响消费者购买决策的因素。 在传统的市场营销中消费者就像飞机的黑匣子难以破解, 要想准确知道消费者的偏好、个性、态度等影响消费者购买行为的个人因素是十分困难的。 而和这个相比, 更困难的是消费者的偏好、习惯和态度等影响其购买行为的各种因素还处于不断的变化过程中, 消费者今天的需求偏好很可能和明天的不一样, 因此, 在传统的市场营销中, 虽然企业做了很多的努力, 但要想真正做到精准化营销是非常困难的。 企业每年都会有大量营销资源的浪费。
一、大数据为企业实现精准化营销提供了可能
随着互联网技术的发展, 大数据时代的到来, 具有大量化 (Volume) 、快速化 (Velocity) 、 价值密度低 (Value) 特点的大数据为精准化营销的实现提供了可能。通过海量数据和多维数据的综合分析, 企业可以准确的找到目标消费者, 并能够清晰的了解消费者, 从而帮助企业实施精准化营销。 例如在电子商务领域, 企业可以借助大数据了解客户购买行为、购买意向、 客户满意度以及购买商品预测, 借助数据分析得出哪类广告营销策略能够实现利润的最大化, 从而为企业节省广告营销成本; 如在移动互联网领域, 智能手机正在为移动互联网创造大量的用户数据, 对智能手机终端用户行为的研究将帮助移动行业发现未来商机, 如哪款游戏人们更喜欢玩? 哪类套餐既能实现盈利最大化又能留住客户等;在交通领域, 随着摄像头和传感器在交通领域的应用, 通过大数据技术对所采集的视频信号、 图像信号等进行实时分析, 可以实现数据可视化, 通过了解人们的出行规律来安排公交线路等, 满足人们的出行需求。
二、用户画像技术能准确识别和描绘目标客户
在众多的大数据工具中用户画像技术是帮助企业准确识别和分析目标客户的最有效工具之一。 所谓用户画像又称用户角色 (Persona) 是针对产品/服务目标群体真实特征的勾勒, 是真实客户的综合原型, 是一种勾画目标客户、联系客户诉求与设计方向的有效工具。用户画像往往能帮助企业以最为浅显和贴近生活的话语将客户的属性、行为与期待联结起来。 作为实际客户的虚拟代表, 用户画像所形成的用户角色是基于产品和市场构建出来的, 形成的用户角色能够准确代表产品的主要受众和目标群体。
通过在海量数据基础下的多维度数据采集和数据分析, 用户画像技术将不同客户的需求进行群分, 并形成便签, 使客户的特征一目了然的呈现在市场人员的面前。 区别于传统的市场调查, 用户画像技术更多的是通过行为数据进行用户研究, 市场研究, 极大地避免了主观因素的干扰, 并通过大数据提高了调查的准确度。 如果说传统的客户分析是认识了客户, 那么用户画像技术就是与客户成为了朋友, 通过用户画像技术, 市场定位的精准度、对市场的反应速度都提升了一个层次。
不仅如此, 通过用户画像技术企业还可以准确的对企业客户进行分级管理, 对核心客户、忠实客户、普通客户、潜在客户等各个结构的客户生成一个直观的分层。比如我们的客户金字塔顶层的客户形象是A, 中坚阶层是B, 底层是C可以根据不同阶层的客户进行取舍, 或者利用价格歧视制定不同的定价策略, 从而实现利益的最大化。解决传统营销中难以解决的客户组相互重叠问题, 使企业不仅知道某类客户的存在, 而且能够清晰的知道他们在哪里, 帮助企业实现精准营销。
三、用户画像技术帮助企业准备把握消费者异动
传统的营销手段通常也会做客户分析, 但是客户分析的结果往往只是静态的, 然而在产品生命周期的不同阶段以及变动的市场需求中, 客户的年龄结构、需求层次甚至产品的内涵都必然会产生改变。 产品往往就是在这些改变中错失了扩大市场占有率或者保有市场地位的先机, 导致产品失去竞争力加快衰亡。 面对市场异动, 用户画像将帮助营销工作者从事后补救升级为事前预警和即时反馈。
由于用户画像技术是通过大数据来对客户进行分析, 因此具备了即时性和数据维度多样性等特征, 使得产品经理或者企业的决策者能够时时发现客户需求的变化, 并且在产品生命周期中的各个阶段因地制宜的使用营销手段来促进产品进行升级或者调整。比如在产品生命周期的初期, 也就是产品最初投放市场时, 目标客户可能会与产品设计之初的定位有所区别, 在产品购买者或使用者之间可能会对产品产生不同认知, 这时将不必重新进行市场调查, 而是在发现数据异动的同时对产品的品牌战略等进行改进和调整。而在产品生命周期的末端, 也可以使用用户画像技术对客户进行敏锐的观察, 从而决定何时进行产品迭代, 或者尽早的放弃一部分产品控制投入产出比。
另外, 在通过用户画像技术对客户进行分类时也可以间接的发现客户结构的变动和消费水平等其他指标的变动, 从而达到异动智能分析的效果。 比说如, 当一个服装品牌的主要客户的形象从运动青年转向到时尚人群时, 就可以重新审视这个品牌下服装的设计风格是不是出现了异动, 或者时尚风向发生了改变, 由此我们就可以针对性对品牌战略重新作出调整。
四、借助用户画像实现精准化推送
通过对用户画像技术的应用, 客户群体将不再是一个整体, 而是会被切分成不同的特征人群。 随着网络的普及, 每个人都有一个独立的IP地址或者QQ号、电子邮箱等第三方账号, 当掌握了不同用户的客户特征, 偏好和需求后, 我们就可以针对这些要素进行个性化的推荐, 这样做不仅能降低营销成本、提高转化率, 更能够避免骚扰用户, 产生更好的客户体验和品牌形象。
随着互联网广告技术 (比如RTB、DMP等) 不断发展, 从技术上已经可以实现快速精准的投放广告, 而在这些技术中, 精准的用户画像功能是广告投放准确度的重要依据。 当用户画像技术、移动互联网和新媒体广告协同发展, 个性化推荐将越来越普及。 微信广告就是一个典型的案例, 虽然现在的投放效率并不太高, 但是通过机器智能学习和模型优化, 最终将成为社交媒体广告中的一个重要力量。
摘要:文章在对用户画像技术进行基本介绍的基础上, 从目标客户识别、目标客户描绘、消费异动准确把握和精准化推送四个方面阐明了用户画像技术的作用, 帮助企业更好的认识大数据相关工具尤其是用户画像技术对助力企业实现精准化营销的意义, 使企业能够尽快掌握相关技术, 实现精准化营销, 提升企业营销效率和市场竞争力。
8.大数据助力智库建设 篇八
近期, IBM年度会议IMPACT 2012在美国拉斯维加斯举行。作为IBM年度最具影响力且规模最大的会议, IMPACT每年都吸引众多来自全球科技、商界等领域的专家人员出席, 今年参会人员更是多达9000人次。在历时一周的大会中, IBM对当今的行业变革趋势进行了分析, 并向与会者重点展示了IBM的最新产品与解决方案, 以帮助企业实现智慧的创新、转型以及成长。
助力企业实现“苹果式”创新
当美国知名传记作家Walter Isaacson作为开场嘉宾站立于会场时, 场下观众都曾感到十分惊喜, 源于这位曾出版过富兰克林、爱因斯坦等畅销人物传记作家的最新代表作——《斯蒂夫·乔布斯传》。虽然苹果与IBM在曾经的PC大战中互为竞争对手, 但以乔布斯为灵魂人物的苹果公司, 在数年内改变了音乐、个人电脑、手机等行业, 正是源于其不断的产品创新, 而创新作为本次大会的主题之一, 以苹果公司为例便是十分恰当的了。并且将创新转变为确切的行动, 离不开技术的实现, 而IBM则扮演着这样的关键角色, 即帮助企业实现创新。
在IBM看来, 移动互联网、物联网的快速发展, 使得信息社会正在发生深刻的变革, 而软件已在企业的信息化发展中扮演着日益重要的角色。在前不久的IBM中国软件策略发布会上, IBM从客户需求出发, 提
出了企业对于洞察力、协作力、移动力、敏捷力、优化力、创新力、安全力等业务的需求。作为IBM的软件品牌, Web Sphere则整合了IBM最新科技远见与技术, 来帮助企业增强其“软”实力建设。同时, IBM还在大会中向企业展示了业务管理流程 (BPM) 、业务分析洞察 (SOA) 、移动和云计算技术、专家集成系统、PureSystems等一系列最新技术与解决方案, 以期帮助企业在实现其业务需求的同时, 增强企业的优势竞争力, 从而实现企业的智慧成长。
跨平台移动整合能力
信息社会正处于变革期, IBM认为移动、社交、云计算、大数据正是促进产业演进的主要驱动力, 同时移动、社交、云计算、大数据也将成为IBM在未来主攻的新市场。
来自IBM的一份调研显示, 预计在2020年, 平均每用户将拥有6台个人设备, 这将导致爆炸性的互动。而手机早已成为人们生活中的必备, 同时随着BYOD (bring your own device) 的逐渐普及, 也将逐渐成为企业中的必备。与此同时, IBM另一份研究报告表明, 全球超过70%的CIO都希望能增加企业的移动能力, 以提高员工的工作效率。但值得注意的是, 企业对移动性的支持, 将带来平台异构、安全等问题。为帮助企业应对移动性所带来的挑战, IBM通过最近对Worklight公司的收购, 为客户提供了一个可实现跨平台的应用开发、集成、安全和管理的移动平台解决方案。
这些趋势的变化, 将对企业实际的交易产生影响, 并对企业交易的可靠性、可预见性、安全性等需求提出了新要求。IBM全球高级副总裁兼软件与系统科技集团总经理Steven A.Mills表示, 企业正处于蓬勃发展、无处不在交易的时期, 而在大数据时代如何实现有效的事务处理, 如何能真正掌控大量的工作运营, 将是企业面临的巨大挑战。
以中国移动为例, 作为全球网络规模与用户基础最大的运营商, 其拥有的6亿客户每天将产生1.48亿的交易量。通过SOA的实施, IBM帮助中国移动将新应用的市场交付时间减少了50%。
专家集成系统简化IT
在企业业务不断发展、企业规模不断壮大的同时, IT设施的日益臃肿已成为困扰企业的头痛症。IBM发现全球有多达70%的IT预算花费在了维护自身IT设施上。而对于客户而言, 若能实现IT的简化, 客户将有更多的时间和预算专注在业务开展及应用创新领域。
作为本次大会中的明星产品, 专家集成系统 (PureSystems) 的推出将有效应对以上问题。PureSystems研发耗时四年, 斥资近20亿美元, 于今年4月正式面向世界展示。专家集成系统通过对网络、存储、服务器、虚拟化的整体调配, 实现整合能力的输出, 帮助企业减少了IT成本和复杂性, 使其可以将更多资源放在企业创新和成长上。
“Pure Systems的引入, 将彻底改变应用开发和管理的传统模式, 简化了耗时长达数月的应用调试、部署流程, 使企业能将更多精力集中到创新。”IBM软件集团应用和集成中间件总经理Marie Wieck表示。
9.大数据助力智库建设 篇九
当前, 随着教育体制的改革与深化, 江苏省联合职业技术学院, 苏州旅游与财经分院, 在信息化建设方面取得了显著成效为培养人才提供了有力的技术支持。校信息化管理系统, 实现了全校学生及教师的学籍、成绩、实训、教务、档案等方面的管理。系统的重要性等级定级为三级, 7×24小时不间断运行, 是服务等级、业务连续性、数据重要性最高的系统。
自2004年高校一卡通系统上线后, 校信息化管理系统同时又承担起了分校区的信息实时处理功能, 系统重要性进一步提升系统完善与升级迫在眉睫。专家经过了充分的评估和分析, 结合“云”概念, 提出了建立“云数据中心”的建设方案。
2 建设方案选择
由于校信息化管理系统服务的人数多, 范围广, 实时性要求高, 因此需要将系统的容错容灾级别定级为应用级, 希望能够实现数据零丢失, 业务零中断。
为确保在意外情况发生时, 其业务连续性不受影响, 势必要求数据中心的应用数据库处于“双活”状态 (主力和备用都在活动状态) , 同时双活架构也避免了主-备模式在闲置时造成的巨大资源浪费, 因此数据库的建设采用了多台主机构建的数据中心Oracle RAC。
为了实现数据库和存储的双数据中心自动负载功能, 信息中心对各种技术进行了评估分析, 并组织专家进行严密论证, 最终采用了以联想高端机架式服务器为核心, 并应用卷镜像技术来实现。卷镜像技术对分校区的跨数据中心 (要求相距80km以内) 的多节点RAC性能影响几乎为零, 可以忽略不计。
3“云数据中心”的建设与探索
总体来说, 江苏省联合职业技术学院苏州旅游与财经分院的信息化“云数据中心”建设分为四层建设, 分别是存储云、数据库云、应用云和网络云建设, 其中数据库云和存储云的建设是整个信息系统建设的核心。
(1) 存储云, 采用联想主机层存储虚拟化管理系统, 建立存储管理虚拟层, 可以在异构或同构存储之间进行镜像和建立统一存储资源池, 实现存储无关性。在硬件平台的选择中, 采用联想2台高配置的四路机架式服务器R630 G7, 组成双节点的集群系统, 每个节点的服务器满配4颗Intel Xeon四核CPU 74XX系列的处理器, 配置64GB的内存, 硬盘容量为12TB, 采用卷镜像技术配置。
(2) 数据库云, 采用Oracle RAC数据库, 运行于一套两个节点的NS并行数据库集群之上, 由2台企业级四路服务器构成一个并行数据库集群, 两台服务器相互备份, 共同执行同一服务, 当1台出现故障时, 可由另1台服务器承担服务任务, 实现负载和均衡的高可用性。在硬件平台的选择中, 采用联想2台高配置的双路机架式服务器R520G7, 组成双节点的集群系统, 每个节点的服务器满配4颗Intel Xeon四核CPU 74XX系列的处理器, 配置32GB的内存, 安装Linux操作系统和Oracle数据库管理系统。
(3) 应用云, 信息化管理系统中的每个子系统均包含Web应用和Oracle数据库系统, 通过负载均衡技术将所有服务器进行虚拟化, 以“云数据中心”为核心, 将应用服务器分别部署在各数据中心, 通过负载均衡设备将应用服务器的对外服务IP地址虚拟成一个IP, 形成应用服务虚拟群。
(4) 网络云, 租用中国电信的裸光纤链路, 通过CWMD设备链路复用技术, 实现IP和SAN互联, 构建大二层网络。在每台联想R630服务器之上, 均配置4个千兆以太网络接口, 并划分为两组, 每组两个千兆以太网络接口, 其中一组作为公用网络的连接端口, 连接客户端及PC终端。另一组作为内部通讯网络端口, 监听Oracle RAC集群中另1台服务器的运行状态。两组端口采用双通道技术, 避免相互干扰。校内各个部门及新校区通过多条广域网链路接入云数据中心, 通过动态路由协议实现网络云的建设。
4“云数据中心”使用效果
江苏省联合职业技术学院, 苏州旅游与财经分院, 此次云数据中心建设, 取得了良好的效果, 主要体现在以下几点。
(1) 提高资源利用率, 节省投资。在集群卷和集群文件系统的基础上, 可以构建双中心三节点以上的RAC, 多台服务器同时对外提供服务, 大大提升了系统的服务能力。
(2) 架构可以灵活扩展。随着人员数量的增加, 系统可以在数据库服务器层和应用服务器层进行横向扩展, 增加节点的数量, 提升系统服务能力。
(3) 减少计划内和计划外停机。通过多节点集群, 实现主机、存储、应用、站点故障不造成应用中断, 同时系统维护、软件升级、硬件更换都不需要停机, 可以平滑升级。
(4) 提供了多种快照技术。运行文件系统快照、跨阵列快照, 能够快速恢复文件及逻辑错误。
(5) 实现了存储虚拟化, 通过虚拟卷镜像技术, 实现存储数据的镜像, 保证了数据不会丢失, 应用服务不会中断, 避免了由于数据不一致可能造成数据库服务器无法启动的现象。
5 结语
“云数据中心”的建设, 打破了以往传统的数据中心的概念, 使用了云的特性进行高校信息化数据中心的建设, 大幅度提升了数据中心的服务能力和业务水平能力, 保证了系统资源的最大化利用。
摘要:通过云数据中心的建设, 以深化高校信息化系统顶层设计的推广与应用, 重点推动跨学科、跨部门的应用模式, 促进信息资源交换和集成工作, 营造共享共建、互通互联、综合应用的高校信息化建设模式。
关键词:信息,云,数据中心,服务
参考文献
[1]徐志发.中国云数据中心的优化布局与科学发展[J].中兴通讯技术, 2011 (6) :38~42.
[2]吴晨, 朱志祥, 胡清俊.一种云数据中心虚拟交换的解决方案[J].西安邮电学院学报, 2011 (5) :54~58.
[3]刘志荣.探析云计算在高校教育信息化中的应用[J].广东技术师范学院学报, 2011 (9) :64~67.
【大数据助力智库建设】推荐阅读:
助力智库建设08-20
大数据中心建设可研06-16
基于大数据的学生发展性评价体系建设07-19
读《大数据时代》有感:大数据与小生活08-01
大数据挖掘与数据分析07-13
大数据征文10-11
大数据职业规划06-15
金融监管大数据平台07-17
大数据基本知识07-18
联通大数据公司案例08-27