太原国际机场有限责任公司 山西省太原市 030801
摘要:随着信息化的不断发展,各行各业的数据资源采集、应用能力不断提升,导致更多更快的数据积累。信息管理系统经历了人工、单机和网络的发展历程,正在进入以数据的深度挖掘和融合应用为主要特征的智能化阶段。数据资源的获取及累积已在单机阶段得到了实现,网络化阶段构建平台则进一步推动了它的扩散与传输,智能化阶段通过多源数据的融合和分析呈现出数据资源的类人智能,将信息管理系统从经济发展的辅助工具转变为推动经济发展的引擎。而大数据是一种高度智能化、统一的信息管理方式,是信息管理系统走向智能化阶段的奠基石。
关键词:大数据;信息管理系统;应用
引言
随着科技高速发展的信息时代的到来,计算机信息传输方式也随之发生改变,如今网络信息已处于一个移动信息传输的世界,其中大数据既为人类的生活带来了便利,同时也带来了信息的安全隐患。我国社会已经大步迈入了信息化时代,随着信息技术的不断提升,大数据技术的运用和发展正在推动世界发生巨大改变。
1大数据应用意义
对于大数据技术的应用,其中的战略意义并不只是对庞大的数据信息进行掌控,而是针对这些含有意义的数据信息实施系统化、专业化的处理。如果将大数据比作产业,那么该产业对于盈利进行实现的关键一步便是将数据的加工能力进行提升,以便利用加工的形式,将数据的存在增值价值给予实现。从技术角度进行分析,大数据和云计算之间存在的关系犹如硬币的正面和反面,两者不可分割。大数据,并不能使用单台计算机进行处理工作,需要对分布式架构进行应用,其突出之处在于,可针对海量数据实施分布式数据挖掘,但大数据的应用需要依赖于云计算的分布式处理、数据库以及云存储和虚拟化技术。现在,随着云时代的到来,大数据的应用受到了广泛的关注,在信息管理系统当中的应用起到了非常关键的作用。很多学者认为大数据通常是对创造出大量非结构化数据和半结构化数据的一种形容,这些数据在下载到关系型数据库进行分析时,会对大量的时间和金钱进行花费。大数据的分析与云计算通常会有密切的联系,所以实施大型数据集分析需要犹如MapReduce一样的框架,向数十、数百、数千的电脑进行工作分配。
2大数据关键技术
2.1获取大数据技术
信息管理系统主要是处理和分析数据,处理数据之前首先必须能够准确地从大量复杂的数据信息中获取到对自身有价值的信息。传统的信息管理系统大多采用关系型数据库和并行数据仓库。大数据具有海量性和实时性的新特征,数据规模呈几何级数高速增长,导致传统的信息管理系统无法或者来不及处理。研究显示超过90%的数据信息都处于未被使用或者价值不明的状态。因此,如何获取有用的数据信息已经是大数据发展的关键因素之一,只有不断拓宽信息的获取范围,充分丰富信息采集内容,才能使经济社会日益增长的数据信息需求得到满足。目前主要采用的获取数据的技术包括系统日志采集法和网络数据采集法。
(1)系统日志采集主要是用于处理由公司平台产生的日志(一般为流式数据)的日志系统。Hadoop的Chukwa、Cloudera的Flume,Facebook的Scribe等,都是目前在用于系统日志采集领域中使用最广泛的、采用分布式架构的海量数据采集工具,可实现每秒数百MB的数据采集和传输需求。
(2)网络数据采集获取数据信息的方式则是利用网络爬虫或网站公开API等方式。它能从网页中抽取非结构化数据,将其以结构化的方式转存为统一的本地数据文件。它不仅可以采集图片、音频、视频等文件或附件,更可以实现附件与正文的自动关联。处理网络流量的采集则可使用DPI或DFI等带宽管理技术。
2.2存储大数据技术
数据在经过分析提取后再存储到数据库,这便是传统信息系统数据的特征,数量级较小,需要时再被调出来使用,而大数据都是随时随地动态地产生的,规模巨大,类型多样,传统的数据库的存储能力和存储模式都无法满足大数据的要求。大数据技术一般采用分布式文件系统和分布式数据库系统存储和管理数据信息,比如采用SharedNothing架构和基于Hadoop的技术扩展和封装。结合SharedNothing架构与MPP架构,引入列存储等多项大数据处理技术,具备成本低廉、性能高效、扩展性好的巨大优势,在当今的企业分析类应用领域有较高的利用率。建立在Hadoop基础上的技术扩展和封装,则是利用Hadoop的开源优势及特性、发展出相关大数据技术的过程,这使得原本在传统关系型数据库中难以处理的数据和场景得到了针对性解决。
3大数据在信息管理系统中的应用
(1)数据增长快速,整合困难。传统的信息管理系统一般都是单独存在的,可以看作是信息孤岛,难以实现跨系统的数据整合,导致数据资源利用程度不高,价值和作用远远没有发挥出来。基于大数据的信息管理系统,需要利用大数据技术有效地将处于不同信息管理系统的数据信息整合起来,再经过统一处理及检索实现信息孤岛的消除、数据资源利用率不断提高的目标。
(2)处理和分析能力欠缺。信息管理系统的关键是数据的处理和分析。首先,传统的信息管理系统无法有效地处理和分析快速增长的新型半结构化和非结构化数据。其次,实时数据处理和分析是基于大数据的信息管理系统的一个基本要求,而现在的关系型数据库系统无法处理和分析实时数据。此外,不管是对数据进行处理还是分析,无论处理和分析的人是专家还是普通用户,数据可视化都是数据分析的基本要求。
(3)系统架构需要改变。首先,当前的信息管理系统部署的数据库不能处理海量级别的数据,快速增长的数据量远远超越了传统数据库的存储和处理能力。因此,构建分布式的数据仓库是十分必要的,体系结构对存储和处理大数据也必须具备可扩展性。其次,传统体系结构中都存储和处理结构化的数据信息,大数据需要兼容处理多样的新型数据类型。此外,传统信息管理系统体系结构对数据处理的时间要求不高,缺乏实时处理数据的能力。但是大数据需要处理大量实时数据,时间要求也在秒级。
(4)数据安全难以保障。如何保障数据的安全性是基于大数据的信息管理系统的关键之一。一方面,大数据平台一般采用分布式系统存储和管理数据信息,其自身的安全性问题成为数据安全的制约因素。另一方面,大数据在传输和流通的过程中采用了共享和开放的模式,因为传统的数据传输模式无法解决跨系统的数据整合问题,导致需要使用动态的方式来保障数据的安全性。此外,大数据还需要解决如何保证个人隐私的问题,随着基于大数据的信息管理系统运用于各行各业,用户几乎难以控制个人信息被收集和应用的情景,这将直接威胁到个人的隐私安全。
结语
大数据是信息管理系统进入智能化新阶段的基础,大数据背景下的信息管理系统价值的体现需要多种技术的协同。推动大数据技术的创新发展,构建基于大数据的信息管理系统实现数据的快速处理和快速传递,提高数据资源的利用率,扩大数据资源的使用范围,提高数据资源的共享程度,改变数据资源的处理方式,是未来信息化的必然趋势。
参考文献:
[1]洪成朋.大数据经济时代下计算机网络信息安全问题研究[J].现代营销:经营版,2018(11):40.
[2]欧静敏.大数据技术在网络安全管理中的应用分析[J].无线互联科技,2018,15(12):139-140.
[3]朱俊波.大数据时代的信息安全管理[J].中国新通信,2018,20(9):131-132.