在计算中,数据是 已被转换为对移动或处理有效的形式的信息。相对于今天的 计算机和传输媒体,数据是转换成 二进制 数字 形式的信息。数据可以用作单个主题或复数主题。原始数据是用于描述其最基本数字格式的数据的术语。
计算环境中的数据概念源于Claude Shannon的工作,Claude Shannon是一位被称为信息理论之父的美国数学家。他在基于将双值布尔逻辑应用于电子电路的基础上引入了二进制数字概念。二进制数字格式是CPU,半导体存储器和磁盘驱动器以及当今计算中常见的许多外围设备的基础。控制和数据的早期计算机输入采用穿孔卡的形式,然后是磁带和硬盘。
早期,数据在商业计算中的重要性因“数据处理”和“ 电子数据处理”这两个术语的流行而变得明显,这一术语在一段时间内已经涵盖了现在所谓的信息技术的全部范围。在企业计算的历史中,专业化发生了,随着企业数据处理的发展,出现了独特的数据行业。
如何存储数据
计算机将数据(包括视频,图像,声音和文本)表示为二进制值,使用仅两个数字的模式:1和0. 位是最小的数据单位,仅表示单个值。一个字节长度为八位二进制数。存储和内存以兆字节和千兆字节为单位。
随着收集和存储的数据量的增长,数据测量单位继续增长。例如,相对较新的术语“ brontobyte ”是数据存储 ,其等于10到27的字节功率 。
数据可以以文件格式存储,如使用ISAM和VSAM的大型机系统。用于数据存储,转换和处理的其他文件格式包括逗号分隔值。这些格式继续在各种机器类型中使用,即使更多结构化数据导向的方法在企业计算中占据了一席之地。
随着数据库,数据库管理系统和关系数据库技术的发展,出现了更大的专业化,以组织信息。
数据类型
在过去十年中,网络和智能手机的增长导致了数字数据创建的激增。数据现在包括文本,音频和视频信息,以及日志和Web活动记录。其中大部分是非结构化数据。
术语大数据已用于描述PB级或更大范围内的数据。简写描述了3V的大数据- 体积,种类和速度。随着基于网络的电子商务的普及,大数据驱动的商业模式已经发展,将数据本身视为一种资产。这种趋势也引发了对数据和数据隐私的社会使用的更大关注。
数据具有超出其在面向数据处理的计算应用中的意义。例如,在电子组件互连和网络通信中,术语数据通常与“控制信息”,“控制位 ”和类似术语区分开以识别传输单元的主要内容。此外,在科学中,术语数据用于描述聚集的事实。在金融,营销,人口统计和健康等领域也是如此。
数据管理和使用
随着组织中数据的激增,通过减少重复和保证使用最准确的当前记录,更加强调确保数据质量。现代数据管理涉及的许多步骤包括数据清理,以及用于集成数据的提取,转换和加载(ETL)过程。用于处理的数据已经被元数据补充,有时被称为“关于数据的数据”,其帮助管理员和用户理解数据库和其他数据。
结合结构化和非结构化数据的分析已经变得有用,因为组织正在寻求利用这些信息。用于此类分析的系统越来越追求实时性能,因此它们可以处理以高摄取率消耗的传入数据,并处理数据流以便在操作中立即使用。
随着时间的推移,操作和事务数据库的概念已扩展到数据库以进行报告和预测数据分析。一个主要的例子是数据仓库,它经过优化,可以处理业务分析师和业务负责人的操作问题。越来越重视发现模式和预测业务成果,这导致了数据挖掘技术的发展。
数据专家
该数据库管理员的职业是IT的一个分支。这些数据库专家致力于设计,调整和维护数据库。
从20世纪80年代开始,随着关系数据库管理系统(RDBMS)在企业中得到广泛应用,数据专业扎根。关系数据库的增长部分由结构化查询语言(SQL)启用。后来,非SQL数据库(称为NoSQL数据库)成为已建立的RDBMS的替代方案。
目前,公司聘请的数据管理专业人士或指定人员的角色数据管理,简列如其中包括进行数据的使用和安全策略的数据管理措施。
一个独特的标题 - 数据科学家 - 似乎描述了专注于数据挖掘和分析的专业人士。以令人回味的方式呈现数据科学的好处甚至引起了数据艺术家的兴趣 ; 也就是说,一个擅长以创造性方式绘制和可视化数据的人。
947
201
上一篇:数据存储
下一篇:输入/输出(I / O)