大数据的思维方式(共14篇)
1.大数据的思维方式 篇一
(一)相关关系
思维方式的变革,应在实践经验、理论知识的指导下完成,即从了解世界和改变世界两个角度入手,对大数据时代下思维方式变革工作进行全面分析。在早期关于思维方式哲学意蕴的研究工作中,主要针对因果关系对其进行分析,利用对事物的客观评价,阐述其内部存在的制约关系与对应关系。虽然从因果关系对思维方式进行探讨,可至思维方式变革在世界中所具有的作用,但该种探讨方法,却难以针对特定事物进行分析,相关关系探讨模式可有效地改善因果关系下思维方式探讨工作中存在的不足,受到社会各个企业的高度重视,如图书推荐系统或汽车修理预测系统的产生,从而更好地实现大数据时代背景下思维方式的变革。
(二)以大见小
相关关系是将世界整体关系、内在关系的整合,在小数据时代背景下,人们通过最小代价运算的方式,对成果进行预测或推算,这不仅是彰显人类智慧的方式,还是人类思维方式变革的关键阶段。在此基础上,人们在推算数据成本时,会受到推算成本与推算时间的限制,加之缺乏大量数据的参与,使人们无法在数据推算中发现相关关系,若数据因果关系也随之消失的情况下,将难以完成数据推算工作,对此,人们在进行数据样本分析与推算的过程中,需将思维方式进行适当转变,即将以小见大模式转化为以大见小模式。
(三)对混杂数据的整理
大数据时代的来临,是人们对于数据储存和传输、处理与分析的过程,更是时代发展的必经路线。其中针对数据处理问题,仅存在的5%的结构数据能够用于传统数据库数据处理和分析工作中,余下95%非结构数据,则无法利用传统数据库对其进行分析,加之传统数据库主要以数据精确的优势得以生存,但却因处理与非处理数据量的差距,难以符合大时代发展的标准。基于此,对于大时代而言,其在针对数据处理工作中,不应只针对数据的精确度,还应注重数据多样化与多元化特点,采用混杂整理的方式,完成多种数据处理工作,最终实现人类思维方式的变革。
(四)学会遗忘
马克思主义理论在思维方式变革工作中指导作用的展现,传统意义上,人们通过多种方式强化自身记忆,随着大数据时代的到来,可利用计算机软件,对相关数据进行永久性记忆,解决人类传统记忆中存在的不足,如1884年,制表机的出现(赫尔曼・赫勒里特);1930年,模拟电子计算机(范内瓦・布什);1946年,电子计算机(美国军方定制版)。如今,经过百年的发展,关于数据记忆的方式,逐渐由人脑转化为文字和声音、图片与视频等多种方式,即人类已经熟练掌握记忆的多种奥秘。
2.大数据的思维方式 篇二
一、传统美术编辑思维的不足
首先,只注重版面形式的编排而忽略了对新闻的理解。美术编辑大体都不是新闻专业毕业的人员,在工作中更多是从版面的设计结构入手,只注重版式的条块组合和版面的设计主次感,而忽略了新闻的重要性和时效性。这就导致版面与内容严重脱节,影响了报刊的整体效果与质量。
其次,欠缺对繁杂数据的统筹整合思维。传统的美术编辑思维多停留在二维空间和简单的三维空间设计,图书装帧画面的构建一般比较单调,并且受一定尺寸的限制。[1]在这种思维设计下的报刊常常呈现出形式单一、色彩单调的特点。这也使得美术编辑无法对繁杂的数据信息进行处理,传统的美术编辑思维无法在数字出版物中得到良好的应用。
再次,信息载体单一,表现形式简单。传统的美术编辑设计的信息载体较为缺乏,呈现出元素单一的不足。当然,这样的特点是由传统报刊本身的特点决定的,但是元素的单一无法使繁杂的数据信息得到处理。我们知道,画面元素的丰富并不是几种元素的简单叠加,而是需要有一个整体的规划。因此,传统美术编辑思维方式在多元素的构建上还需要加强。
此外,传统报刊美术编辑思维还表现出应用数据单一的特点,这一特点自然和上面说的受出版物本身影响一样,但是应用数据的单一还是美术编辑没能够应用非线性思维的一种表现。一般来说,传统的美术编辑的画面设计更多是脱离用户、脱离市场的设计,对于用户的感受和动向以及产品的商业价值都把握不清。
最后,思维封闭,未能了解大数据时代下读者的需求。传统的报刊美术编辑思维比较呆板、封闭,这样的思维就缺乏对新闻的认识和对读者需求的考虑,再加上一些美术编辑缺乏经验,导致设计出来的画面与读者的需求相差太大,使得其使用价值和商业价值大大降低。
二、“大数据”时代美术编辑思维的探讨
面对上面说到的传统美术编辑思维的不足和“大数据”时代数据信息复杂繁多的现实,我们应该以客观的态度去看待。对于“大数据”时代美术编辑思维的探讨,我们应立足“大数据”时代本身的特点,依托于各种新型的技术进行改进,以下主要针对报纸美术编辑进行探讨:
首先,构建多维空间的美术编辑思维。由于信息技术的发展,纸媒要适应时代的发展,向多种载体方向转化,积极结合电子报刊和自媒体的发展。我们知道,“大数据”时代的画面更多呈现出多维空间的特点,所以美术编辑在设计报刊时,要多方位考虑,在纸媒上未能体现的效果,可结合多维空间,在电子报刊和自媒体上穿插一些动态画面。这样的组合能够搭建出更有立体感的画面,可以提高读者的阅读兴趣。
其次,要进行多种元素的组合。我们知道,“大数据”时代的信息不仅数量巨大,而且种类繁多。把种类繁多的信息数据表现到画面中去,就需要进行多种元素的组合。[2]“大数据”时代下,大部分新闻报道已趋于用直观的图表来表现,且还可以结合电子报刊和自媒体,加入音频和视频的元素,这样做出来的报道更深入、更生动。这种多元素的组合将大量的信息和多种元素更有创意地展现给读者。
再次,注重创意与“大数据”时代报纸版式的结合。在版面设计上,要与文字相配合,做有内涵、有深度的报刊。例如,我们知道现在二维码已经广泛应用,那在做文字报道时,可以在旁边附上二维码,读者只要拿起手机扫一扫二维码,就可以在手机上看到相关的报道。如此一来,纸报刊与自媒体之间有力结合,可以使纸报刊在信息技术应用广泛的今天不至于被淘汰。
最后,版式设计要以读者的需求为中心。纸报刊美术编辑工作要想在竞争中立于不败之地,除发展电子报刊外,还应该加强自身的改革。美术设计要以读者的需求为中心。美术编辑工作中很重要的一项工作,就是与读者产生共鸣,它使报纸图文并茂,使文字、图片与版面的设计有机结合在一起。
三、“大数据”时代探讨美术编辑思维的意义
在“大数据”时代进行美术编辑思维的探讨,改变了原来报刊美术编辑思维中空间单一、元素单一、应用数据单一以及缺乏用户体验功能的各种不足,使得美术编辑能够很好地把握用户的感受和市场的动向,从而提高美术编辑工作的效率。因此,在“大数据”时代进行美术编辑思维的探讨具有十分重要的实用意义。
我们知道,任何一项工作、任何一项事业都需要相应的理论研究,同时这些理论研究也成了这项工作的一部分。
四、结语
“大数据”时代的来临给美术编辑工作带来了巨大的挑战,使得传统的美术编辑工作无法跟上时代的步伐,其根本原因在于美术编辑的思维方式已经落伍。美术编辑工作要在新时代有效发展就应该立足于转变思维方式。
“大数据”时代,美术编辑的思维方式应该呈现出多维空间的构建和多种元素的整合以及对多种数据进行处理,力图展现出一种非线性的思维,更多地考虑用户的感受。新思维方式的应用推动了美术编辑工作的开展,具有十分重要的意义。
摘要:随着各项技术的快速发展,我们迎来了“大数据”时代。“大数据”时代的信息特点一般表现为数据量大、种类复杂多样、信息传播处理速度快和商业价值较高。这样的形势给美术编辑带来了新的挑战,美术编辑需要在工作目标和工作思路上有新的改变,需要依靠新的思维方式来工作。本文以报刊美术编辑为例,就“大数据”时代背景下应该以怎样的美术编辑思维方式进行工作展开探讨。
关键词:“大数据”,美术编辑,思维方式
参考文献
[1]王岽.“大数据”时代美术编辑思维方式初探[J].科技与出版,2014(03):82-85.
[2]满都拉.创意是美术编辑专业高度的标尺[J].军事记者,2012(12):34-35.
3.大数据的正确打开方式 篇三
近日,一朋友刚拿到驾照,想买一辆车,打算先在网上了解一下。细心的她发现,在浏览了汽车页面后,在与汽车无关的页面上,也同样出现了相关的汽车广告。这并不是巧合,而是在她使用的电脑上,一个被称为Cookies的文件记录了她的浏览热点。
大数据成为热门趋势,越来越多的品牌厂商和广告营销机构都在发力以大数据为基础的网络营销模式。
大数据未来的发展是大家有目共睹,人们总是振臂高呼,“大数据时代已经到来”。是不是從线上发现客户线索,转至线下成交,大数据的使命就结束了?NO!
当然,收集数据只是大数据应用的第一步,如何分析并应用才是重要环节。采集到的数据并不是每一个都有用,汽车品牌主需要将多渠道、标准不一的客户数据进行整合,建立汽车大数据库。
在完成汽车销售这第一个环节后,后期才是汽车厂商和经销商们所看重的。例如,当大数据显示用户对于安全座椅、胎压知识的搜索行为后,就可以直接对这些精准客户进行锁定,从而再推销相关产品。再例如汽车信息中的行驶里程,维修保养情况,通过智能盒子OBD获取到的它行驶途中的胎压异常等等数据,那么就可以知道车主的行车路线和路况信息等,经过深度挖掘和分析这些数据,得知用户需求背后的需求。而不是简单的车辆型号,年限和号牌,车主联系方式等低级数据叠加起来的冗余数据,这样的数据再大也不会直接产生价值,是需要深度挖掘才会有价值,也是汽车电商平台在数据整合和收集方面所应该运营的方向。
4.大数据下的精准营销方式 篇四
大数据将是继云计算、物联网之后IT产业又一次颠覆性的技术变革。电影《天下无贼》里有这样一句经典对白:“21世纪什么最贵?人才!”如今,选项可能还要加上一个:数据。
而这数据,已不是传统意义的一般数据,而是超大数据、海量数据,就是现在所谓的“大数据(Big Data)”。
如今大数据可谓是风起云涌,红红火火,俨然成为信息技术领域最时髦的词汇。IBM、微软、Oracle、SAP等IT巨鳄,像是寻找到了新的金矿,开始全力挖掘大数据,多方位推广大数据理念,而众多中小IT厂商也跟着蜂拥而至,以分得大数据市场一杯羹。
数据爆炸的冲击波
“大”字不仅意味着数据的数量庞大,还代表着数据种类繁多、结构复杂,变化的速度也极快。研究表明,大数据呈现三种特性:Volume(极多的数据量)、Velocity(极快的处理速度)、Variety(极繁的数据种类)。如今有许多企业已面临单日数据量以数
十、数百TB(万亿字节)的速度增加,而近几年累加的总数据量也达到了PB(1000个TB)甚至EB(一百万个TB)等级,这样的数据量已让传统的数据库难以处理;而且企业数据增加的速度也越来越快,诸如移动化、社交网络的广泛应用,使得数据增加的速度比传统的企业应用程式来得快很多,一旦数据增生速度越快,数据处理、分析的速度也就得跟上;此外,数据更是呈现出多样性、复杂性的特征,一方面互联网不但产生文字资讯,同时也不断在产出与以往不同的数据:照片、视频、微博等,另一方面,IT遍及工作生活中的每个角落,各种各样的传感器、监控器也不断产生,各种机器资讯数据的形式日趋复杂、多样了,从结构化数据到非结构化数据不断转化。这就催生了大数据技术的强烈需求。今天,从搜索引擎、社交网络的普及到人手一机的智能移动设备,全球互联网上的信息总量正以每年30%-50% 的增速不断暴涨,包括每天Facebook上分享的几亿条内容,每日15 TB的Twitter信息,每天淘宝上数十亿条店铺、商品浏览记录及上亿的成交、收藏记录以及3000多万条传感器资讯,等等。市场研究机构IDC的研究结果显示,去年全球创造的信息数量达到1800EB,并且还以每年50%的速度高速增长,到2020年,全球每年产生的数字信息将达到35ZB(1ZB=1024EB)。据IDC统计,2011年全球所产生的数据总量是1.8ZB,如果把这些数据刻录到CD碟片中,这些碟片可环绕地球30圈。
可以说,目前大部分企业经营决策面临的最大挑战不是缺少数据,而是数据太多,面对这些只是静态、孤立、无多大参考意义的“初级品”的信息数据,企业信息部门如何通过系统功能来有效利用和整合,发掘有价值的数据,给公司营销管理提供决策支持,已成为摆在企业信息部门及其他管理部门面前的难题。
而浩如烟海的客户及市场、销售和服务信息,如果没有一个具有高度商业智能的数据分析和处理系统是不可想像的。而用户想要从庞大海量的数据库中提取对自己有用的信息,就离不开大数据分析技术和工具。事实证明,传统基于过往事实的商业管理系统如BI(智能分析系统)、CRM(客户管理系统)也能够为企业带来价值,但是今天一个优秀的大数据系统更能将数据挖掘技术与现有技术很好地结合起来,将特殊领域的商业逻辑与数据仓库技术集成起来,找出对未来企业战略具有影响的因素,使数据挖掘的分析效果和效益尽可能达到峰值,让企业营销管理能“运筹帷幄,决胜千里”。
像Facebook、Twitter这样面临数据量大爆炸的国际社交网络公司,已开始用分布式程序系统基础架构、非关系型的数据库等新兴大数据技术来解决海量市场信息问题,并取得了成效。国内最大电子商务公司阿里巴巴也在利用大数据技术提供具体服务,如阿里信用贷款与淘宝数据魔方。以淘宝数据魔方为例,利用淘宝平台上的大数据应用方案,商家可以了解淘宝平台上的行业宏观情况、自己品牌的销售情况、市场排名、消费者行为情况等,并可以据此作出经营决策。
重构精确营销模式
大数据时代之前,企业多从哪些平台提取数据、利用哪些营销数据?一般是CRM或BI系统中的顾客信息、市场促销、广告活动、展览等结构化数据以及企业官网一些数据。但这些信息只能达到企业正常营销管理需求的10%的量能,并不足够给出一个重要洞察和发现规律。
而其他85%的数据,诸如社交媒体数据、邮件数据、地理位置、音视频等这类不断增加的信息数据等等,更多以图片、视频等方式存在,几年前可能被置之度外,不会被运用,而今大数据能进一步提高算法和机器分析的作用,这类数据在竞争激烈的市场日显宝贵、作用突出。
包括沃尔玛、家乐福、麦当劳等知名企业的一些主要门店均安装了搜集运营数据的装置,用于跟踪客户互动、店内客流和预订情况,研究人员可以对菜单变化、餐厅设计以及顾客意见等是如何对物流和销售额的影响进行建模。这些企业可将这些数据与交易记录结合起来,并利用大数据工具展开分析,从而在销售哪些商品、如何摆放货品以及何时调整售价上给出意见,此类方法已经帮助这些领先零售企业减少了17%的存货,同时增加了高利润率自有品牌商品的比例。
如果说以前的一些CRM系统,只能促使分析报告回答“发生了什么事”,现在一个优秀的大数据系统已可以被用来回答“为什么会发生这种事”,而且一些关联数据库还可以预言“将要发生什么事”,最终发展为非常活跃的数据仓库,从而能判断“用户想要什么事发生”。
比如当一个顾客进入店铺后,一个零售商利用大数据技术搜索他们的数据库,发现这位顾客是其希望留住的有价值顾客,之后他们通过将其过去的购物历史和Facebook主页获得的这位顾客的信息综合起来,来了解需要花多少钱来留住他,从而确定所售卖物品的合适价格和零售商可以退让的利润空间,并最终针对这位顾客给出最佳的优惠策略和个性化的沟通方式。
如今在美国的沃尔玛大卖场,当收银员扫描完顾客所选购的商品后,POS机上会显示出一些附加信息,然后售货员会友好提醒顾客:“我们商场刚进两三种配酒佳料,并正在促销,位于D5货架上,您要购买吗?”这时,顾客也许会惊讶地说:“啊,谢谢你,我正想要,刚才一直没找到,那我现在再去买。”
这就是沃尔玛在大数据系统支持下实现的“顾问式营销”的一个实例。因为计算机系统早就算计好了,如果顾客的购物车中有不少啤酒、红酒和沙拉,则有80%的可能需要买配酒小菜、作料了。而提供这一决策分析支持的就是其位于美国一个庞大的、通过卫星与全球所有卖场实时连通的企业级数据仓库。企业要为营销准备什么
虽然大数据展示了非凡的前景和巨大作用,不过,大数据营销仍面临不少问题与挑战。首先面临的是技术难题,毕竟大数据技术尚处于活跃前期,各方面技术并不太扎实,各项工具需要进一步完善。但实际情况是,真正启动大数据营销,企业面临的不仅仅是技术和工具问题,更重要的是要转变经营思维和组织架构,来真正地挖掘那座数据金矿。
大数据的资源极大繁杂丰富,如果企业没有明确的目标,就算没有走入迷途至少也会觉得非常迷茫。因此,首先要确定企业运用大数据的短中期目标,定义企业的价值数据标准,之后再使用那些能够解决特定领域问题的工具。逐步推广,步步为营,不要把理想定得太高,否则失望会越大。当然,企业运用大数据为营销管理服务之前,技术团队要到位是基础。企业的营销团队要能够非常自如地玩转数据。
企业启动大数据营销一个最重要的挑战,是数据的碎片化,各自为政。许多企业中,数据都散落在互不连通的数据库中,而且相应的数据技术也都存在于不同部门中,如何将这些孤立错位的数据库打通、互联,并且实现技术共享,才是能够最大化大数据价值的关键。营销者当留意的是,数据策略要成功提升网络营销成效,要诀在于无缝对接网络营销的每一步骤, 从数据收集、到数据挖掘、应用、提取洞悉、报表等。
5.借鉴大数据思维改进干部考核评价 篇五
2014-04-22 09:22 来源: 学习时报 作者: 肖兆权
大数据被认为是一个正在到来的观念革命。干部工作也应当运用大数据的思维,从干部多重身份的角色表现、不同时期的成长轨迹和多元评价主体的考核意见等大量信息中,运用科学的分析工具,提升考核评价工作的科学化水平。当前正处于信息化时代,大数据被认为是一个正在到来的观念革命。干部工作也应当运用大数据的思维,从干部多重身份的角色表现、不同时期的成长轨迹和多元评价主体的考核意见等大量信息中,运用科学的分析工具,提升考核评价工作的科学化水平。考核评价有三重境界。第一境界“源于事”,考察的是所为之事和行为表现;第二境界“识于人”,聚焦的是个性特质和德才素质;第三境界“归于势”,关注的是职业生涯和发展趋势。这三重境界反映了评价干部由低级走向成熟的三个必由阶段。
源于事——“横看成岭侧成峰,远近高低各不同”
第一境界关注的是“事”,面对的是具体的、生动的、复杂的工作和事件,聚集的是干了什么、干成了什么,考察的是在具体事件中的行为方式和工作表现。它更多的是感性认识,是整个评价的基础和源头。面对全方位、多视角、广维度的评价信息,既要甄别各类信息真伪,辨析信息价值大小、关联度和有效期限,又要防止有效信息、关键信息被大量的表象信息、雷同信息所淹没和稀释。考核领导干部要在查阅工作计划、述职报告、纪检监察和巡视组评价意见等资料基础上,运用民主测评、实绩分析和个别谈话等方法,重点考察在突发事件、重点工作、关键时刻等过程中的表现,全面、准确地考察人的行为表现,深入了解其理想信念、政治纪律、坚持原则、敢于担当、行为操守。
第一境界的核心是信息的效度,它的主要分析工具是评价项目梯形权重体系。由于不同评价主体所处地位和关注焦点不同,他们对不同项目所掌握的信息数量和有效性也不一样,因此,相关权重也应有所不同,形成梯形权重体系。评价完成任务和能力水平,最重要的是上级,其次是同级,权重最小的则是下级和社会。这是因为上级站位比较高,布置工作任务、调配相关资源运用的是全局战略和整体思维,同时对下级的能力水平有着不同的比较,因此对该项目的评价上级就比较客观、准确。相反,由于同级干部之间存在竞争和嫉妒的心理,下级对上级存在仰视的角度差,因此,对该项目的判断,同级和下级的全面性和精准度就要低得多。同理,评价工作作风和行为操守,最重要的是下级和社会,其次是同级,再次是上级。这是因为下级和公众对领导干部的工作作风和行为操守有着经常的接触和切身的体会,同时领导干部在他们面前表现得也更为真实。相反,在上级面前人们会不自觉地隐藏傲慢和锋芒,谨慎地选择言辞,因此,对该项目的判断上级的权重显然要低得多。评价领导干部沟通协调和关系处理情况,最重要的则是同级,其次是上级和下级。
识于人——“千淘万漉虽辛苦,吹尽狂沙始到金”
第二境界关注的是“人”,透过形形色色的工作表现、纷繁复杂的评价信息,运用概括综合、判断推理的方法,由表及里地揭开信息的面纱,勾勒出考察对象显著的素质特征和内在的个性特质。这里更多的是理性分析,是第一境界的升华,也是识人的深化。根据素质模型的冰山理论,个体素质被形象地描述为漂浮在洋面上的冰山,第一境界则是观测水上具体的、可见的行为事件,第二境界则是探寻水下潜在的、深层的个性特质。为了深入把握考察对象内在素质,需要在信息综合分析的基础上,去除一般性、表象性的笼统判断,提炼出具有特征性、指向性的素质评价,既要分析其优势,又要分析其劣势,从优势与劣势的相互转化趋势中寻求内在的逻辑性、一致性,从而把握其主流和本质。
第二境界的核心是识人的深度,它的主要分析工具是素质评价公式模型。素质评价公式模型,从定性的概念出发,运用定量的分析方法,最终回到定性的判断,定性与定量的两次结合,为准确、客观、公正地评价领导干部提供了有力支撑。它包括以下几个方面:评价效度,衡量人们有效参与表达意见的程度。在考核评价中经常会收回一定数量的对所有领导干部、所有项目都作同一评价的测评表,如全部表项都填“好”或“较好”。从信息量的价值角度来分析,这类评价表的效度显然非常低。如果这类评价表过多,就会大大降低考核工作的评价效度。总体评价,衡量领导干部履行岗位职责的总体评价情况。争议度,衡量不同评价主体对领导干部评价的差异程度。特征素质,指示评价项目中最显著的要素,包括突出的长处和短处。
归于势——“见微足以知著,见端固以知萌”
第三境界把握的是“势”,根据干部成长规律,在对素质特征进行判断的基础上,分析其发展潜力,演绎其职业生涯发展趋势。识人的根本目的是用人,最高境界是对人的发展趋势的把握。将识人的成果回归到用人的实践中,预测其将来职业发展和工作表现。这既吻合了自然科学中理论预测、实验证明的思维方法,又实现了认识论中由认识再到实践的飞跃过程。对人的考核评价只有回到实践中才能得以检验、补充和发展,才能准确地把握其成长趋势,合理地规划其未来发展。
第三境界的核心是评价的信度,它的主要分析工具是领导干部德才绩效矩阵。该矩阵突破了传统的“德、能、勤、绩、廉”单线条考核方法,将领导干部区分为普通型、潜力型、成熟型、极限型四种类型。普通型,多数干部属于此类,在本职岗位上默默耕耘,既普通,又平凡。潜力型,对应于德才素质较高、工作绩效还未彰显的领导干部。成熟型,对应于德才素质较高、又取得较高绩效的领导干部。极限型,对应于工作绩效远高于德才素质的领导干部。成熟型是培养选拔上一级职位的理想人选,极限型可以作为上一级职位非领导职务人选,潜力型要深入分析,属于德才素质与现职岗位不匹配的,可优化其工作环境。
6.大数据的思维方式 篇六
阅 读Post on 13-05-03 17:20
如今,企业通过智能手机、平板电脑等移动设备收集用户数据,再通过大数据技术加以分析,导致传统市场调研方式面临颠覆。即便看似一成不变的零售业和广播电台等行业,位置数据和音频识别技术也可以帮助它们更加了解用户的真实需求。美国科技博客GigaOM今天发表评论文章称,如今,企业通过智能手机、平板电脑等移动设备收集用户数据,再通过大数据技术加以分析,导致传统市场调研方式面临颠覆。即便看似一成不变的零售业和广播电台等行业,位置数据和音频识别技术也可以帮助它们更加了解用户的真实需求。
以下为原文主要内容:
如果厌烦了晚上8点对顾客进行电话调查,或者拿着Arbitron(收听率调查公司)传感器统计收听率,无处不在的智能手机或平板电脑可能会成为你的救星,而你只需放弃一点隐私。
移动设备非常便于收集现实生活中的地理位置、温度、运动、声音等数据。但如果不对这些数据加以利用,它们只能白白浪费。
地理位置是重中之重
零售商对顾客购买的商品乃至在商店内的走动都了如指掌,但一旦顾客离开,零售商便不清楚他们要去哪里。而这种信息非常实用:如果要改进商店或探究营销方式,了解顾客的其他一举一动会大有帮助。西雅图创业公司Placed率先尝试了这种数据的利用。
Placed推出的首款产品针对想要了解用户在何处使用其应用程序和移动网站的开发者。之后,该公司推出了Panels服务,可让企业全天追踪应用用户的地理位置(通常以小额赏金作交换)。
本周,该公司发布了第一季度的研究报告,其中包括哪些百货商店最受那些人欢迎,哪些类型的商家流量增加最多,哪些商家之间的关联性最强或最弱(例如,访问某家店的人也会访问另一家店)。
Placed CEO大卫·西姆(David Shim)表示,Placed几乎可以提供按地理位置、商业类型、人口统计等细分的一切营销数据。他举例称,某高端零售商发现进店的年轻女性很多,但很少购买东西。相反,她们去的下一家店通常是Burlington Coat Factory和Ross等折扣零售店。结论很明确:这些顾客想要了解哪些衣服正流行,然后以较低的价格购买不错的仿制品。
他还注意到,拉斯维加斯一些赌场用Placed研究玩家们离开赌场后去哪些餐馆吃饭,这样当它们要自己开设餐厅和商店时就能做出最佳选择。在这两种情形下,如何才能从顾客身上赚到更多钱,答案可能是降价。如果降价10%可使销量上升14%,就可实现双赢。
反思电台
如果结合声音等其他数据,位置数据的价值会更高。例如,收听率调查公司Arbitron只能了解听众在听什么电台,却不知道他们实际在听什么歌曲。这就好比你在餐厅就餐时听一小时的拉丁电台或在健身馆收听Top 40电台,这并不表明你真的在听或喜欢听它们。
然而,在车内听的歌曲很可能反映你的真实喜好。音乐数据公司Gracenote便拥有这种技术。它采用智能手机和平板电脑内置的麦克风识别用户电视或音响中播放的歌曲,并可检测掌声或嘘声等反应,甚至还能检测用户是否调高了音量。
这样,Gracenote可以研究用户真正喜欢的歌曲,听歌的时间和地点。广播电台可能永远无法像Pandora那样个性化,但通过这种技术,他们可以更好地了解听众需求,而数字电台则可提供比Pandora更好的体验。
数据质量
这些方法听起来都不错,但它们的实现要归功于大数据的出现。Placed拥有确定用户实际位置的特殊算法并且不断改进模型,因而才能提供如此准确的分析数据。西姆表示,公司会询问用户定位是否正确,这项调查每天可收到1.5万条回应。数据库里的130亿个位置中,该公司已验证350万个。
Gracenote拥有数百万首歌曲的音频和元数据,因而可以快速识别歌曲信息,并按音乐风格、歌手、地理位置等分类。该公司希望开发一款根据行车状况自动更换歌曲的车载系统。
有人可能会担心这些应用存在隐私问题,但如果提供一点数据能换来足够的价值回报,这也未尝不可接受。数据收集这只精灵已经逃出瓶子,变成魔鬼还是仆人就看人们如何掌控。
消息源:新浪科技
7.大数据思维下的档案资源数据挖掘 篇七
一、基础:从海量档案到大数据的转换
1. 档案具有大数据特征。
现有的档案资源显示出大数据的特点。据统计,早在2008年,我国各级国家档案馆共保存档案1.93亿卷,2011年各级国家档案馆馆藏达3.3亿卷,预计2020年各级国家档案馆馆藏将达到6亿多卷。海量是大数据的必要条件,如此海量的档案资源里蕴含着重大的价值,可谓手里握着金库。那么如何实现对海量档案进行大数据分析呢?首要的第一步就是实现档案的数据化。这里有一个重要的概念:数据化,与我们以前所说的数字化有本质的不同。
2. 数字化与数据化的辨析。
数字化与数据化的差异是什么?从2004年开始,谷歌一直在实施一个计划,最初谷歌做的是数字化文本,即把所有版权条例允许的书本内容进行数字化,为此,谷歌与全球最著名的图书馆合作,并发明了一个能自动翻页的扫描仪,每一页被扫描然后保存为高分辨率的数字图像。当纸质的内容变成数字图像,任何人都可以通过网络方便地进行阅读。这种数字化文本存在两个缺陷,第一是数字化文本需要用户知道自己要找的内容在哪本书上,即检索存在问题。第二是谷歌获取的图像只能依靠人的阅读才能转化为有用的信息。为克服上述缺陷,谷歌使用能识别数字图像的光学字符识别软件来识别文本的字、词、句和段落,这样书本的数字化图像就转化成了数据化文本,这个改进带来的具体好处体现在,不仅人类可以使用这些数据化文本,计算机也可以分析和处理这些数据文本。数字化带来的价值是无法与数据化的价值相比拟的,可以想象,如果把中国所有档案馆里的档案都转变为计算机可以分析的数据文本,再通过数据分析,我们将从档案大数据中得到很多未知的知识和价值。
数据化和数字化的概念。“数字化”和“数据化”目前仍没有统一的定义,比较权威的被广泛认可的定义分别是由尼葛洛庞帝(Negroponte)提出的数字化的概念和维克托迈尔—舍恩伯格(Vktor Mayer-Schonberger)关于数据化的表述。尼葛洛庞帝在《数字化生存》(Being Digital)一书认为数字化是从原子到比特的转变,具体来说就是指将模拟信息转换成电脑可以处理的用0和1表示的二进制代码[4]22。大数据权威专家维克托迈尔—舍恩伯格认为量化是数据化的核心,数据化是指把“现象转变为可制表分析的量化形式的过程”[1]104。数据化后的信息既可以被人类所阅读,又可以被计算机进行分析。
数据化和数字化之间的关系。“数据化”是近两年随着大数据的发展才逐渐被人们从“数字化”概念中逐渐分离并提出来。最初“数字化”和“数据化”是混为一谈的,数据化的提出不是对数字化的否定,而是在对数字世界认识逐步深化的基础上,对数字化理论的拓展与推进[5]346。可以说数字化带来了数据化,但是无法取代数据化。之所以提出并明确数据化的概念,并强调数据化的意义,是因为单纯讨论数字化,我们已经无法回答一些重要问题。
3. 从数字化档案转变为数据化档案。
我国档案界探讨最多的是档案的数字化,在理论和实践方面都取得很多成果。国家在档案数字化方面出台了《电子文件归档与管理规范》和《纸质档案数字化技术规范》两个重要的标准规范。在实践中,我国档案数字化主要做了两方面工作:一是档案目录信息的数字化,即建立档案目录数据库,严格规范档案信息的著录标引,科学选定档案目录的数据库结构;二是档案全文信息的数字化,即采用扫描录入的方式将档案全文按照原貌逐页存储为图像文件并为其编制目录索引,或是经OCR(光学字符技术)识别后采用文本格式存储档案内容,辅之以全文检索数据库[6]55。可见,我国在档案数字化过程里已经无意识地进行了部分档案的数据化,尽管所占的比例很小。为了从数字化档案转变为数据化档案,我们下一步要做的就是在数字化档案的基础上,使用数据识别技术进一步把数字化档案识别为数据化档案。把纸质的和电子图像等非数据化档案资源通过数字识别软件转变为数据化档案是构成档案大数据的重要数据来源之一,这将是一个庞大工程,也是档案工作者在大数据时代的重要使命。另外,电子文件和电子档案的归档和收集,也是档案大数据的另一个重要数据来源之一。综上所述,对非数据化的档案进行数据识别和电子文件与电子档案的收集归档是形成档案大数据的两个重要方面,见图1所示。
二、档案资源数据挖掘:从数据到新知识的蜕变
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程[7]2。对数据化的档案资源进行数据挖掘,从而找到蕴藏在档案中的价值,这一过程可以说是从数据到新知识的蜕变。管理大师彼得·德鲁克(Peter Drucker)在对计算机系统的描述中写道:“迄今为止,我们的系统产生的还仅仅是数据,而不是信息,更不是知识。”从数据到知识的跨越,人类走了半个世纪,而这个跨越依靠的就是数据挖掘。档案资源里蕴含着很多宝贵的知识和经验,通过档案资源的数据挖掘,可以为我们的政府、企业、公共服务提供运作和决策方面所需的重要信息。
数据挖掘技术在商业方面应用较早也最广泛,现在已逐步推广到保险、制造业和电信等行业。在档案学领域,关于大数据的研究也逐渐展开,档案学领域对于大数据主体的研究正处于初始阶段。目前的研究从研究对象上可分为两类,一是对档案使用者进行数据挖掘的研究,二是对档案本身进行数据挖掘的研究。档案用户分析近几年研究较多,例如在《构建档案用户数据分析引擎研究》一文中提出了大数据时代档案馆建立用户数据分析引擎的基本架构,指出了当前档案馆部署用户数据分析引擎需要进行的主要工作。对档案本身进行数据挖掘主要集中在医疗档案领域,例如《利用健康档案数据筛选糖尿病高危人群的决策树模型建立》论述了利用居民健康档案,建立糖尿病预测模型,建立社区新型糖尿病高危人群筛选模式。用户分析的目的在于提高档案服务的水平,而档案资源数据挖掘目的在于从档案中获取知识和规律,这才是档案数据挖掘的重点,档案数据挖掘应该针对档案资源进行重点研究分析。
在研究档案资源数据挖掘中,档案工作者应该做什么呢?有些档案工作者会觉得无从下手。首先,我们需要了解,一个数据挖掘过程,一个从数据到知识的过程,需要哪些步骤,见图2。
从数据到知识的数据挖掘过程,有两个关键步骤。第一,要么有明确的目标想从这些数据中获取到什么样的知识,要么需要有大数据思维。所谓大数据思维,是指一种意识,认为数据一旦处理得当,能为千百万人急需解决的问题提供答案,目标或大数据思维是数据到知识的关键。第二,有了目标或大数据思维后,接下来就是采取什么数据挖掘技术实现目标。数据挖掘技术有很多,通常可分为两大类,一类是统计型,主要方法有相关分析、聚类分析、判别分析和概率分析等;另一类是人工智能,通过学习大量的样本集训练出需要的模式或参数[8]45。
在上述数据挖掘过程中有三个关键因素,分别是数据、思维和技术。这三者被一些大数据专家称为大数据价值链。档案工作者手里拥有大量数据,但却不一定有创新思想或大数据思维可以从数据中催生出知识,而有了创新思维或大数据思维,如果不懂得数据挖掘技术也是徒劳的,所以档案资源的数据挖掘需要创新型的人才和技术型人才,也要有数据的处理和组织人才,这是一个复杂的综合各个学科知识的过程。
身处大数据时代的今天,档案管理必须与时俱进,如果依旧保持原来的工作方法,势必会被拥有新的档案观的行业取代。滴滴打车软件和传统出租车行业的冲突就是鲜活的例证。档案工作者必须拥有数据思维,树立档案就是数据的意识,进一步转变工作的方式方法,将档案管理推入更辉煌的发展阶段。
摘要:大数据是档案管理未来发展的重要机遇,研究如何将大数据引入实现档案管理领域有重要意义。通过数据化与数字化的辨析,提出通过数据化而不是数字化可实现档案资源的大数据转变,提出数据到知识的转变过程和大数据价值链为档案资源的数据挖掘提供有益参考。
关键词:大数据,数据挖掘,档案资源,数据化
参考文献
[1]维克托迈尔-舍恩伯格肯尼思·库克.大数据时代—生活、工作与思维的大变革[M].盛杨燕,周涛译.杭州:浙江人民出版社,2013.
[2]李小晨.大数据时代背景下的档案管理探讨[J].云南档案,2013(6).
[3]兰祝刚,等.大数据时代下的档案工作[J].中国档案,2013(9).
[4]尼古拉·尼葛洛庞蒂(Nicholas Negroponte).数字化生存[M].胡泳,范海燕译.海口:海南出版社,1997-2.
[5]王荔.新媒体·新观念·新生活:2008全国新媒体艺术系主任(院长)论坛[M].上海:同济大学出版社,2008.
[6]王学平.浅议我国档案数字化建设实践与发展策略[J].档案学通讯,2011(6).
[7]邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利水电出版社,2003.
8.大数据呼唤数据集成新思维 篇八
大数据意味着包括交易和交互数据集在内的所有数据集,其规模或复杂程度超出了常用技术按照合理的成本和时限捕捉、管理及处理这些数据集的能力。不管是大交互数据,还是大交易数据,处理分析非结构化数据一直以来都是数据处理的难点。数据集成作为挖掘数据价值的重要一步在整个数据分析中具有重要的作用。
对于绝大多数企业而言,信息系统建设通常具有阶段性和分布性的特点,该特点不可避免的导致了“信息孤岛”现象的存在。“信息孤岛”就是指不同软件间,尤其是不同部门间的数据信息不能共享,造成系统中存在大量冗余数据、垃圾数据,无法保证数据的一致性,严重地阻碍了企业信息化建设的整体进程。为解决这一问题,人们开始关注数据集成研究。
数据集成就是将若干个分散数据源中的数据,逻辑地或者物理地集成到一个统一的数据集合中。其核心任务是将相互关联的分布式异构数据源集成到一起,让用户以透明的方式访问这些数据源,以便消除信息孤岛现象。
数据集成市场正处于黄金时代
著名信息技术研究咨询公司Gartner在其发布的“2013年数据集成工具魔力象限报告”中表示,对集成选项功能完整性的需求在快速上涨。随着数据碎片化程度的不断加剧,企业希望能够有一款灵活的产品,能够快速融入到现有的数据管理投资中,并提供更多的功能。
数据集成可以满足人们不断增长的信息需求,使更多的人更充分地使用已有数据资源,减少资料收集、数据采集等重复劳动和相应费用,实现数据源的凝聚放大效应,形成以业务为驱动的动态数据价值链。
大数据技术的发展为数据管理开辟了一条新的道路,这也为数据集成创造了新的机会。在这种情况下,数据集成就从传统的数据提取、转换和加载过程(ETL)变成了更加灵活的数据提取、加载和转换的方法(ELT)。在过去,ETL形式中的数据集成通常是“一个自包含过程”,它只是简单的专注于将干净、合并的数据从源系统迁移至目标数据仓库。但是,现在情况变得不同了,现在数据可以存在于任何地方,如果用户需要在另一个系统上使用,只要在需要的时候调用就可以了。
Gartner认为,市场上对集数据集成、数据质量以及主数据管理于一体的工具需求在不断的增长。高质量的数据对于数据集成项目的成功具有关键的作用,而不关心数据质量的数据集成注定将会失败。除了与数据质量和主数据管理更好的集成以外,用户还希望工具能够支持更加广泛的数据集成风格与功能。
包括Hadoop等大数据技术,以及NoSQL数据库技术在内的技术对数据集成工具的开发都产生了重大影响。未来数据集成工具发展的重要方向就是支持分布式架构的集成。包括低成本,基于订阅模式的收费方法以及基于云在内的交付模式,也是未来数据集成市场的一个发展方向。
多方挑战考验数据集成
单纯地看,数据集成在现实应用中是一个非常简单的问题,也就是对多源数据进行清理和转换,然后将数据加载到适当的数据存储区中以便进行下一步的分析和处理。但是,事实却不是这么简单。数据集成面临着多方挑战。
首先是技术方面的挑战。最具针对性的挑战包括:多种源和多种不同的格式;结构化、半结构化和非结构化数据;在不同时间从源系统获得的数据信息;庞大的数据量。即使在理想的情况下,也必须以某种方式在一个位置获得所需的所有数据。同时,对实时性的要求增加了数据集成的困难。
其次来自组织的挑战。在大型组织中进行数据集成还会存在来自权力的压力。数据是信息,代表着一种权力,但是让人们相信数据是企业有价值的资产是一件颇具挑战的事情。要实现企业数据集成的成功,就需要所有数据源的使用者能够了解项目的用途和方向。这需要所有的组织成员能够通力合作。
最后就是经济压力。数据集成成本的增加主要是因为数据集成的过程可能会因为权力而变得缓慢而曲折,清理数据以及从多种源数据映射也会变得更加困难。当需要解决这些问题的时候,数据集成引起的额外费用都将会被记入整个数据集成体系结构。另外,随着组织发展过程中对数据入库和商业智能需求的增加,有缺陷的数据集成体系结构将变得越来越难以维护,这样总体拥有成本会增加。
虚拟化提高数据集成效率
虚拟化意味着可以不受物理条件的限制,能够迅速构建物理环境,以便支持用户在特定时刻对特定业务的需求。现在已经可以实现对服务器、存储以及网络实现虚拟化。
面对海量数据的处理需求,我们需要摆脱结构化的数据仓库。低成本的存储在业务数据存储方面可以节省成本。高昂的存储成本限制了系统处理数据的质量。对于海量数据的处理需要做到弹性存储,弹性存储意味着企业不会在期望操作的数据规模或类型上受到限制,从而可以降低使用数据仓库无法获得最佳结果的风险。
数据虚拟化可以将不同的数据连接起来,让业务运营与数据集成流程变得更加灵敏。大多数情况下,企业主要运用传统数据集成技术,从交易系统中获取数据,将其移植到数据仓库中以作商务智能和数据分析等用途。然后,对于需要实时决策的应用程序,这种方式就会面临挑战。
数据虚拟化拥有一个可置于企业应用程序、数据仓库、交易数据库、门户网站及其他数据源之上的提取层,能使企业在无需创建存储信息备份的环境下,对来自不同系统中的数据进行整合。这样一来就省去了从源系统中复制数据或移除数据的麻烦,减少了IT人员的工作量,也降低了数据出错的几率。
数据虚拟化还支持在源系统中交易数据更新的写入,这也是拥护者们看中这项技术的优势之一。正因为如此,数据虚拟化才会从数据联合与企业信息集成(EII)技术中脱颖而出。后两项为更早推出的类似技术,同样为了简化不同源阵列的数据分析流程。尽管三种技术在性能方面都有相似之处,甚至有“换汤不换药”之嫌,但是EII技术提供的是一种数据阵列与报表的只读处理方法。
其实,早在十年前就有数据联合了,其产生的用意本在于取代ETL工具和数据暂存区,不用再建立新的数据市场。可惜评论家认为数据联合从一开始就带有重大缺陷,它只能与巨型数据套件匹配,且其运行环境需要极为复杂的数据转换。更有甚者,很多人都认为数据联合与面向服务架构(SOA)的粘附性很强。
但是随着企业不再将大数据分析作为一项孤立的应用来看待,并注意使用分析结果来驱动他们的主流业务流程,数据质量和无缝上游整合就变得更为重要。并且大数据架构灵活性的提升也带来了更高级别的发展和管理复杂性,这可能需要新的流程和技巧,甚至是在IT部门中的一场文化变革。
9.大数据思维与共享经济 篇九
为什么会发生这样的改变?我认为是数据化,数据化在驱动共享经济的发展。数据化就是我们今天一切的商务过程、一切的生活都在被数据记录下来,都在变成数据。我对大數据有个定义,数据不仅仅是测量,还是记录。传统的数据是测量,比如测量气温把它变成数据;今天的数据是记录,消费一次酒店、吃一顿饭都会被记录下来。今天的数据爆炸不是测量数据的爆炸,是记录数据的爆炸。记录的手段变得越来越廉价,越来越普及,导致了现在的爆炸。
数据化怎么驱动共享经济?把供方和需方数据化,然后放在一个平台上。平台可以把正确的数据、用正确的方式、传递给正确的人,完成快速匹配的过程。但前提是要把“供”和“需”数据化。
10.大数据的思维方式 篇十
伴随随着DW系统的持续运行,业务数据量不断的增长。其中大表数据以亿数据量级别为存储,并且每天以百万的速度增长,历史数据随之也不断的积压。随着数据的不断增长,数据量不断增多的同时导致了DW抽取、查询、分析等应用性能下降。
1.1 对数据抽取的影响
在ETL抽取过程中,基本绝大多数情况我们都会使用时间戳增量抽取的方式,通过update/insert的方式对目标数据进行加载。但这个过程中如果目标数据不断地增多时会严重的影响效率。随着单次执行时间的提高,对数据抽取的频率也会发生影响。数据的整合效率和时效性的降低,对最终DW中数据的时效性产生严重的影响。
1.2 对数据使用的影响
如果目标数据在抽取过程中,随着数据库中锁的产生和内存的消耗,对查询的效率也存在影响。随着数据量的增多,对数据的全表扫描时也会产生效率的降低和时间的增长。
2 方案设计
2.1 需求分析
根据以上对数据抽取和数据使用的分析,我们要从两方面着手,一方面解决数据加载时目标表过大的问题。另一方面解决数据使用时全表扫描的问题。
1)数据加载
在数据加载时,通过二次抽取的方式来减小数据目标表汇集的过程,来实现增量数据业务的实时性要求。
2)全表扫描
通过数据的生命周期确认,将数据按照生命周期方式进行存储。将生命周期内的数据存放在快捷的存储中,使其的使用效率得到大幅的提升,其实我们发现业务操作中的80%都只会用到生命周期内的数据。
经过数据的有效分析,根据数据生命周期理论,很多数据都不在数据生命周期范围内,这些数据通过灵活的处理完全可达到全覆盖和对性能影响最小的程度。我们结合数据生命周期的理论、数据抽取技术和分区技术的整合将数据生命周期以外的数据对性能的影响降到最低。
2.2处理流程
2.2.1 存储架构
基于业务需求,将通过当日数据表、近三个月热点表、历史数据表共计12张表来存放生命周期内的业务数据。具体设计如图1。数据在DW中的存储流向主要分为以下几个步骤:
1)增量抽取的时候使用两张实体表交替存储当天数据
2)每天结束后根据不同的业务时间将日表数据分别插入到相应的分区表中。当插入结束后,清除上一日保存记录的数据表
3)每月初根据业务时间范围将三个月前热点表数据记录迁移至历史记录表中,同时删除三个月前的分区表。
2.2.2分区规则
为了快速的定位到数据的存储,不同的分区表按照不同的分区标准。分别如下:
1)历史表:按照业务发生时间的年月(YYYYMM)列表分区。
2)热点表:按照业务发生时间的日期(DD)列表分区。
3)日表:仅存当日数据不做分区处理。
4)全局视图:存放所有数据的全局视图,将所有数据通过视图的方式将其串联在一起。
3 总结
11.大数据思维与新媒体演进 篇十一
李希光等认为:“数据新闻学 (data journalism) 或称数据驱动的新闻学 (data driven journalism) , 被认为是计算传播学的一个具体应用。通过挖掘和展示数据背后的关联与模式和丰富的、具有互动性的可视化, 数据新闻学已成为新闻学的新疆域和应用范例, 并作为一门新的新闻分支进入主流媒体。”由此可见, 大数据对于新闻业的影响已经不可忽略, 而这种影响也不仅仅停留在业务层面上, 还应该引起新闻界和新闻媒介组织更深层次的思考。
大数据的兴起及其对新闻业影响的日益深刻的根源何在?笔者认为, 大数据的兴起, 一是和具有数字化传播特征、日益开放的互联网传播平台有关, 二是和互联网开放平台上的海量自媒体以及各种主动、被动形成的海量非结构化或互不关联的内容相关。也就是说, 大数据环境的形成, 是互联网社会化、社会互联网化 (包括物联网技术) 发展的一个必然结果, 大数据本身已经成为包括传统媒体和互联网媒体在内的所有媒体生存发展环境的重要构成要素之一。如果仅仅拿大数据和全媒体两个概念相比较的话, 可以发现, 大数据作为媒介组织发展的新型环境要素而言更为真实, 而全媒体则更多是媒介组织的一种臆想, 全媒体的概念更多是在用户层面或业务层面, 一般情况下还到不了媒介组织战略的层面。但是大数据对新闻业的影响则可以在业务层面之外, 进一步涉及到媒介组织的战略和运营管理层面。在此背景之下, 媒介组织应对大数据的兴起和发展趋势有更为深刻的认识, 才有利于其自身的创新发展和自我调适。笔者认为, 就大数据传播对于专业化媒介组织发展的影响而言, 大数据应有三个核心特点需要引起专业化媒介组织的特别注意。
一、在组织层面, 大数据将推动新闻业新型开放环境的生成。
大数据传播的核心之一是开放, 既包含具有开放特征的数据, 也包含具有开放特征的环境。而具有开放特征的互联网环境正是大数据传播形成的根本要素。在这个层面上, 大数据传播的开放精神和互联网新媒体的开放精神在实质上又是一致的。各种类型的专业化媒介组织如何顺应大数据和互联网开放的方向, 并获得新的发展, 这是一个值得思考的问题。专业化媒介组织所处的开放环境所带来的一个直接结果就是公开和透明。一个社会的政治、经济、文化、历史等各方面的信息经过不断数据化的过程, 即可使得人们通过对这些数据的分析不断获得对于社会环境更为真实的理解和认识, 这本身是人类社会发展的一种进步。与此同时, 这种开放的传播环境自然也导致媒介组织同样也处于这样开放的传播环境之中。这将使得社会公众对于媒介组织内容传播及其组织运行的评价更加公开、即时、全面, 而这种评价又将影响到市场环境和政治环境对于专业化媒介组织的关注程度和评价取向。彭兰的观点值得引起注意, 她认为:“大数据技术是检验专业媒体质量的另一个参照物, 在大数据技术面前, 无论是在反映全局性事实还是趋势性规律方面, 媒体现有报道方式与报道成果的缺陷都日渐暴露。但大数据技术既是参照物, 又可以成为专业媒体未来的方法与工具, 利用大数据技术, 专业媒体的报道水准将得到有效的提升。”因此, 对于专业化媒介组织而言, 更加趋于开放的传播环境一方面意味着大数据传播已成为需要媒介组织密切关注的重要趋势, 另外一方面也意味着更加开放、透明的环境将对专业化媒介组织的运营管理提出更高的要求。
二、在业务层面, 大数据将警醒新闻业发展不能偏离人本核心。
大数据传播的核心是人。对于大数据而言, 人是直接和间接形成大数据的核心来源。即使是各种类似基于物联网以及机器与机器通信所形成的各种信息或者是由于互联网用户自身行为在互联网系统中形成的各种显示其互联网生活轨迹的各类数据, 其最终的逻辑指向和服务目标也同样是人。因此, 在大数据传播环境下, 阅读内容的人, 创造内容的人, 留下互联网生活轨迹的人, 都应该成为媒介组织关注的重点, 而且应该是不可偏离的核心。彭兰认为:“个体的数据又有‘内容型’数据与‘活动型’数据之分。内容型数据对应的情形是, 用户行动的目的就是生产出直接在网络中发布的内容;而活动型数据 (如人们在电子商务活动中的购买行为记录) , 本身并不是用户有意识生产的内容, 而是用户活动的附属产物, 但它同样是用户行为的重要记录, 甚至是研究用户个性的重要依据。随着越来越多的人开始习惯于网络化生存, 活动型数据也成为个体人生中的重要痕迹。”因此, 可以看到, 大数据传播的总体来源是人, 大数据传播的基本核心也是人。而只有能够真正为人这个主体提供有价值或者高附加值内容服务的大数据才是真正有价值的技术形态。所以, 如何关心处于移动互联网大数据时代核心节点的人并为之提供不可或缺的内容服务, 应成为专业化媒介组织所关注的一个非常重要的问题。
即使在大数据传播环境之下, 人依旧是各种信息消费的主体, 这一点并没有发生变化。即使新技术可以使新闻业务类型发生新的裂变和分化, 但是这种裂变和分化依旧不能使机器化的应用完全替代人在专业化新闻内容生产中的核心地位, 而这种裂变和分化所解放出的新闻生产力正可以应用到更高层次的为人这个核心主体服务的层面上来。与此同时, 作为移动互联网时代独立传播自媒体的人, 也自然而然成为互联网传播平台乃至社会化传播进程中的传播主体。对于既是信息消费主体, 又是信息传播主体的独立传播自媒体群落来说, 其和专业化媒介组织的关系将发生新的变化。自媒体主体群落在接受各种专业化和社会化信息的同时, 也提供关于事实的社会化信息和关于所接受信息的社会化评价, 这使得媒介组织的传播环境在互动性层面发生了重要变化。在这个意义上, 自媒体传播主体群落既需要专业化媒介组织的即时信息和专业评论, 也会通过自身的社会化评价对专业化媒介组织的管理运营造成一定程度的影响。在新兴传播技术赋权的前提下, 专业化媒介组织和自媒体传播主体群落都得到了新兴传播技术的赋权, 但是以上两大主体在赋权之后的传播格局中所发生的变化方向却有所不同:独立自媒体传播主体群落的传播权大幅提高, 而作为传统大众传播时代的专业化媒介组织的传播权却相对降低。在互联网化和社会化传播环境之下, 传统专业化媒介组织和独立自媒体传播主体群落之间的关系将发展成为更加相互关联、相互依托、相互作用的重要传播关系。
三、在战略层面, 大数据将推动新闻业进一步重视客观规律的探寻和把握。
大数据传播的最为重要的核心之就是数据背后所隐藏的规律。海量的非结构化数据的出现, 使得人们在认识世界发展规律的时候多了一个重要的探寻维度, 即人们可以通过对大数据的分析揭示以前没有显现的社会发展的内在规律, 而这种大数据传播所呈现的内在规律则可以显示人在新型传播环境中的需求类型和传播逻辑。因此, 在大数据传播的基础之上, 进行专业化的趋势分析和深度报道将有可能成为媒介组织发展的应有的趋势性方向。从这个角度来说, 专业化媒介组织可以在大数据传播环境下更为准确地把握社会公众的需求和情绪的变化, 从而更为即时、准确地为社会公众提供专业化的信息内容服务。不过从另外一个角度来看, 专业化媒介组织在准确把握社会公众的信息需求的变化的同时, 也不能单纯迎合社会公众的信息需求, 而要在更高的层面上将真相和真实的信息呈现给社会公众。也就是说, 并非所有来自社会公众的信息需求都应该成为媒介组织所关注和满足的内容。虽然伴随着独立自媒体传播主体群落的兴起, 但是专业化媒介组织不应该成为社会公众在大数据传播环境下所呈现的各种内容需求的奴隶, 而应该成为大数据传播中的智者——开放的合作者、专业的超越者和人性的守护者, 既能满足大数据时代社会公众的信息需求, 又能为社会公众提供超越其固有需求的更具有人性的信息服务。
在扩散传播过程中, 新兴传播技术本身存在着各种不确定性, 但是总的演进趋势又是清晰的, 因此专业化媒介组织对于大数据传播的理解, 应该敏感地洞察各种不确定性的根源, 并真正把握大数据传播环境的实质, 而这应该是一个去伪存真、辩证调适的过程。总而言之, 在新媒体传播领域, 在新的概念、思维方式、运营模式出现的时候, 专业化媒介组织只有仔细辨析, 判明实质, 明确自我方位, 选择调整策略, 才能一直保持自身具有活力的创新发展态势。在移动互联网时代, 在大数据运营环境之中, 这就要求所有专业化媒介组织具有开放的组织特征, 能够根据外在环境的不断变化作出有效调整, 并持续保持自身整体向好的发展趋势;同时也要求专业化媒介组织能够在各种新兴传播技术层出不穷的环境下, 将内容生产和运营管理的焦点持续聚在人这个核心主体上。如果片面关注技术, 而忽略了技术背后所应关注的人的因素, 专业化媒介组织迟早会遭到背离所应坚持的客观规律的惩罚。而只有明确大数据环境下专业化媒介组织的运营规律和传播规律, 才不会使自身的实际运营与其具体环境和战略目标相脱离。
12.大数据的思维方式 篇十二
未来20年的大数据战场
台达电子执行长郑平表示,“发展到今天技术早已不是什么大问题,怎么样让技术与应用实质有效的结合,从理想变成实际还需要一个过程,我相信5年后应该会看到一些产业已经初步导入大数据可视化。”可见,5- 10年后,将是传统制造业借助大数据蓬勃发展的重要时刻,而10年后我们将看到一个完全不一样的制造形态,革命不是瞬间改变的,在这个渐进式的时间轴里,未来20年里的工业转型期都将是大数据的战场。
劳动力成本的持续上升正在为中国制造业带来巨大的成本压力,据统计,沿海传统工业区劳动力工资正在以每年10- 20%的速度递增,且劳动力缺口依然高达近3成。最终导致一部分高度依赖劳动密集生产的外资企业甚至本土企业,转战至劳动力成本更低的东南亚国家。中国正处于经济结构调整、制造业升级的十字路口,郑平告诉笔者,“中国的市场需求和欧美很不一样,有很多小的机会容易被错过掉,但往往这些小机会会在不经意间变成蓬勃发展的投资新领域。所以这庞大的市场蛋糕并不是像欧美百年大厂或其组成的行业联盟就可以轻易吞掉,且不说能不能适应这个新兴市场的需求,仅仅更改、调整产品就需要一定的成本,所以综合上来考量,虽然西方大财团具有先天优势,但对于投入这一领域的企业而言基本是相对公平的,各取所需。”
台达视讯事业部总经理傅洁说:“行业竞争虽然很大,但这个行业肯定是大家一起捧起来的,且经过多年的积累,每家公司基本都有它最擅长的领域。所以,要想快速的将大数据可视化推进到实际应用,制定相关的标准必不可少,而在标准的制定过程中,基本会走向两个方向,一个是有国家进行主导,如老牌工业大国德国;另一个则是处在同一领域的行业参与者组成行业联盟,由联盟来制定更为公平的标准,而联盟的存在则可以让市场更利于企业的良性竞争。每个企业都可以根据自身的需要尽可能的参与到这个标准制定的过程中去,以维护在自己所擅长领域的核心利益。”
从IOP到IOT要一步步走
从英国提出物联网,到德国的工业4.0,每一步都直指人心,在工业发展畅想未来的同时,大数据可视化在工业领域的推进究竟进展到了哪一步呢?那么先让我们了解一下什么是真正的大数据时代,从大家最为熟悉的互联网移动端讲起,人们在日常工作生活中,有这样一部能够记载你个人喜好、习惯的手机,当你进入到一个陌生的房子中时,这部手机会快速连接到这个新环境的数据端口,通过导入记载了你生活规律的数据,通过控制光线、温度、气味等,最大限度将这个新环境调整到符合你喜好的状态。
工业大数据可视化同样是这个道理,郑平认为,“现在我们所谈的大数据和IOT(Internet Of Things)都还没有怎么发生,真正应用发生的比较好的其实是IOP(Internet Of People),在人工管理及生产阶段,我们先要做合理化、自动化,然后才能进行到智能化IOT阶段。比照人工管理模式、以往的经验,由专家制定一层层管理方法去建立分析模型,逐渐促使计算机学会变化式的回应。从机器到机器之前还需要人将各种生产数据传输上来,最后解决存储数据、分析数据、处理数据的阶段,将每套设备独立的控制系统通过网络连接起来,再由一台大型计算机进行统筹安排、调整,这也才仅仅算是入门阶段。”
傅洁表示,“以台达正在开展的设备连接为例,第一种是直接调用图形,并将这一图形放置在任意位置,缺点是只能形成单一图形,等到数据图多起来以后很难整合在一起;其次是智能设备已经产生了智能模型,这样就可以直接生成控制端所需的整合数据;第三个就是在具有监控系统的企业中,直接进行数据库与数据库的沟通。大数据可视化在工业领域的应用就和当年ERP系统的开发是一样的,必须针对每家企业进行独立的设计、改造,像我们最近所做的新疆油田‘一体化运行指挥中心’项目中,完美解决了海量异构数据的融合、系统的整合。而面对实现大规模数据可视化的关键,在于将抽象数据转换为便于人类有效理解的图像展示。台达iPEMS智慧监控与可视化管理系统,从客户的需求出发,通过实时数据采集、子系统数据集成、广域系统监控、智能数据分析,矢量数据可视化和超高分辨率显示等一整套技术,为用户提供完整的一体化运行管理和应急指挥平台,以大数据可视化手段辅助用户做出最佳决策方案。”
13.大数据的思维方式 篇十三
一、人才引培管理模式的现状
“信息时代技术应用的爆炸性增长使得网络生活成为社会主体日常活动的重要组成部分” (2) , 全球经济发展从传统的自然资源和物质资本竞争转变为人才和知识竞争。人才是科技进步和经济社会发展的重要资源, 具有基础性、战略性和决定性作用, 人才争夺也日趋激烈。随着我国科教兴国和人才强国战略地推进, 人才引培管理机制建设越来越受到重视。许多地区相继制定了符合本地情况的人才引培管理政策, 在诸多环节中采取一系列强有力措施, 取得了显著成效。主要包括:制订优惠政策, 典型代表有北京市建立引进国内外人才绿色通道, 上海市出台人才居住证政策等;搭建创业平台, 典型代表有各地高新技术开发区的建设和重大科研项目的开发;提供优厚待遇, 典型代表有陕西省规定引进院士或国家重点学科带头人一次性提供50万元科研启动费。上述人才引培管理政策均对人才战略实施起到了巨大推动作用, 却不能从根本上解决传统人才引培管理模式缺乏全面性、科学性、准确性和指向性等问题。
二、大数据带来的社会变革
21世纪以来, 全球逐步迈入数据存储的“泽他 (zetta) 时代”, “基于规模宏大、结构复杂、类型众多到无法通过人工操作在合理时间内筛选、处理并整合的海量信息管理技术的大数据产业促成梦想照进现实” (3) 。数据成为新型科技服务和科学研究的基石, 大数据处理技术的蓬勃发展预示着又一次信息技术革命的到来。 (4) 基于多元终端与云计算技术的大数据智能堆栈推动万物互联到协同物联网的飞速演进。以Hadoop为代表的技术革新正在建构“超出传统的获取、存储、管理与分析能力的数据集成”, 推动从数据到知识再到行为的发展。百度、脸书、亚马逊等通过持续挖掘服务对象的巨量信息, 揭示用户购买意向的影响因素, 实现科学的个性化定制并推进供应链管理, 大幅降低应用企业的生产成本, 增加边缘效益, 提升商业角逐的综合能力;科研院所通过广域挖掘巨量关联资讯, 披露潜藏受试真相, 提高研究结论的可信度;教育机构通过远程聚合教学信息, 追踪每个学生的阅记内容、在线辅导次数和社交状况, 实现个性化知识传递;公权机关通过挖掘自有或自第三方获取的巨量数据, 提高社会医疗服务水平、改善居民社交识别能力、提升电网传输效率、实现交通有序调配并最优化应对自然灾害等等。“完美的数位文化使得现实与虚拟的联系愈加紧密”, 大量原始数据成为“巨大的经济与社会价值的新来源”。“立足体量巨大、类型繁多的数据载体与云计算、感知方案和分布式处理技术的大数据预测”带来的信息风暴像曾经的互联网一样不断变革生活、工作和思维, 赋予整个社会以全新的生命力和想象力, 将给各行各业带来新的思维和管理革新。社会管理各层面都在呼唤大数据, 人才引培管理机制也不例外。
三、大数据推动人才引培管理模式变革
现阶段人才需求和人才信息量大、构成多维、动态变化频繁等特点使得传统的分析模式遇到瓶颈。大数据凭借日益增强的分析能力, 可以帮助人才需求单位提升整体评价水平, 解决人才评价面向未来的问题, 使得人才需求单位凭借充分的信息支持和准确的市场判断在竞争中取得胜利。 (7) 人才的引进、培养和管理是人才强省建设的重要组成部分, 直接关系到各省份的经济社会发展水平。江苏要实现率先崛起, 就必须在新一轮人才争夺战中赢得主动, 成为全国人才“高地”。而大数据挖掘技术具备从海量资料中发掘所需人才特征的能力, 应当成为本地区低成本、高效率、全信息引进人才的重要手段;大数据技术挖掘能够尽快发现省内人才的潜力和学习软肋, 应当成为本省高效培养人才的有效工具;大数据挖掘技术注重关联分析, 应当成为本省精准配置人才, 做到才尽其用的重要方法;大数据挖掘技术重在挖掘分析, 以寻求事物发展的趋势, 应当成为本省提高人才管理水平的重要途径。有必要结合地理位置、教育水平、产业结构等合理因素, 制订出相符合的具有科学性、协调性、可操控性的人才引培管理模式的基本框架和具体措施。例如, 通过对人才基本情况、学历、专业知识、工作经历、个人绩效、工作态度、价值观等各项数据的关联分析, (8) 把人才引进到最适宜的岗位上;又如, 为了发挥每位人才的作用, 可以通过大数据挖掘技术根据人才的学科背景和工作经历, 有针对性地进行跨专业、跨领域的培养, 构建多领域的复合型人才。无锡市的“530计划”申报系统和管理系统是基于大数据理念的创新, 重在收集、分析和运用人才数据。通过对数据库每时每刻产生的数据进行及时地分析处理, 利用大数据挖掘分析技术的预见性来指引政府部门的明智决策和准确行动, 实现对人才精准高效地引进、培育和管理。这种大数据思维下的人才引培管理模式的创新使本地区在人才强省的建设道路上不断前进, 推动了江苏省的社会经济发展。 (9)
14.大数据的思维方式 篇十四
关键词:大数据;图书馆信息服务;影响
在如今的时代中,大数据已经渗透到了我们生活的每个角落。各个领域都有它的身影,它在人们的生活中占有重要位置,甚至图书馆行业也在引进大数据的信息技术,可见它对人们的生活产生了多大的轰动。大数据思维将图书馆的数据整合方式运用的很好,将人们带入了一个全新的历程当中。
一、大数据思维的特点
1.大数据思维的规律性
大数据技术的规律性是其重要特征之一,这也是最能体现大技术特点的地方。我们许多人都会认为大数据系统是杂乱无章的,但其实不然,在它的背后是对整体知识的记录与分析。它将相对混乱的系统捋顺,并且根据不同数据的不同特征加以分类,最终达到分析的目的。
2.大数据思维的无偏性
传统的数据记载中绝大多数都是用抽样选择的方式,但是大数据的出现则避免了这一问题。它将各部分、各区域之间的数据进行集合,把全部作为整体分析因素,用于数据之间的的统计。所以大数据思维是整体性的,不是片面的。
3.大数据思维的关联性
大数据之所以能够为人们提供深刻的技术形式,就在于它的关联性。它不是内部结构的独立支撑,它是由各组织数据库的不断累加。简单来说,就是不同数集构成一个完整的系统,形成数据库,数据库作为组织的核心部分将其联系起来。这样就构建了数据集约化,数据越多我们获取的信息也就越多,自然收获也就越大。
4.数据思维的开放性
所谓开放性,不是将所有的数据都公布于众,而是通过预算、设想的方式获得专业性的科学方法。换句话说,就是我们要知道收集数据的原因、用途等等,从问题的根源抓起,才能得到最佳的答案。
二、大数据思维对图书信息服务工作的影响
1.创建大数据信息下的服务体系
大数据信息发展下,使图书馆的服务体系更加健全,服务形式更加多样化。就信息的收集而言,大数据思维为其提供了便利。比如,在当今许多高校中,图书馆都是必不可少的。传统的图书馆工作人员要把各类书籍进行分类,分类后归置到不同的地方,这样的管理模式很容易出现错误。但是大数据信息将这一矛盾完全避免。现在的图书馆只需要工作人员将书放在传感仪器中进行扫描,电脑中就会显示出该本图书的性质,包括它的文献、年代、作者等等。图书管理人员只要按照其类型在制定位置上放置就可以完成全部的工作。另外,如今在线的校园服务都是具有位置跟踪功能的。比如:它可以对学生的进出加以统计。学生都有专门的一卡通,只有刷卡才能够进入,在进入时数据系统会总动的显示现有人数,走出图书馆时它则会进行自动撤销。这规范了图书馆的阅读秩序,也节省了大量的人力,跳出人为监管的圈子,为健全图书馆服务体系带来了好处。
2.完善图书馆的借阅功能
大数据思维下,图书馆的借阅工作也变的更加的简单。传统的借阅需要工作人员进行管理,对读者和管理人员都不是非常的方便。试想一下,如果管理人员不在,那么就影响了读者的阅读。而大数据思维下,读者如果想要借阅书籍只需要在专用的数据统计电脑上将书名输入进去,再点击检索,就可以进行寻找。电脑上会自动显示出书籍的所在区域,这样就借阅了读者的寻找时间。由于大数据可以对信息自动录入、记忆,所以就方便了读者的阅读,为我们提供了多样化的读取方式。同样在借书时,我们只需要将图书放在扫描的相应位置上,数据服务就会将信息自动录入进去,相应的电脑上就会显示借书的日期和还书的最低期限。而在还书时,读者只需要将书在电脑控制仪器上进行感应,电脑上的数据库就会按照相应的流程执行归还口令,这样就实现了还书的整个步骤。我们可以看出,大数据思维发展之下,使得图书馆的借阅功能更加的健全,科学手段更加的信息化、规范化。另一方面,它还为图书馆工作节省了大量的成本,节约了许多人力管理费用。图书馆的服务质量也得到了一定程度的提高,数据化管理模式按照读者的不同需求进行细分,为图书馆资源的整合以及建设创造了有利条件,达到更好的为读者服务的目的。
三、结语
综上所述,大数据思维是适合当前图书馆发展的先进技术,对于读者和图书管理工作都是有利的。首先,它可以将片面的数据进行集约化整理,在数据库中寻找我们所需要的模式。其次,它可以实现图书馆书籍的注册、注销等功能。所以,大数据的实现将信息化社会进行延续,健全了图书馆的服务质量,为读者的阅读带来了很大的方便,更为我国社会的高速发展奠定了基础。
参考文献:
[1]仵淮林. 大数据环境下数字图书馆面向用户的服务组织研究[D].华中师范大学,2015.
[2]伍晓星. 用户自我服务模式对图书馆信息服务工作的影响[J]. 情报理论与实践,2003,05:441-443.
【大数据的思维方式】推荐阅读:
转变思维方式的途径12-31
现代生态思维方式的哲学价值07-29
创作优秀作文的思维方式12-05
经济学的思维方式课程感想10-07
“枫桥经验”中的法治思维和法治方式10-14
思维方式论文08-10
员工思维方式08-19
思维方式决定人生格局06-28
思维方式与方法答案07-25
思想汇报:培养自己的科研能力和思维方式11-29