布条百科 - 专业百科知识分享的网站 手机版
首页 > 生活 >

数据集是什么? 信息集成平台之数据集

50次浏览     发布时间:2024-02-04 11:41:11    

摘 要

数据集是信息集成平台标准化管理中重要的一个组成部分,它是信息集成平台交换标准形成的基础、是数据中心物理模型的构建基础、是数据中心自动化数据存储的基础、是数据共享的基础。本文从数据集的生成方法、数据集校验机制、数据集在交换和存储及共享使用方面进行全面的论述,让大家对数据集有更加清楚的认识,同时希望本文有价值内容可以服务于工程实践。

关键词集成平台;数据集;过程集

正文

1、 引 言

数据集(Data set)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。

上面是数据集的通用定义,本文中数据集是指某一类业务所涉及的数据集合,它包括两个方面的内容:数据集结构定义、数据集携带内容。这里以表结构来对数据集进行解释,数据集结构定义可以理解了表结构定义;数据集携带内容可以理解了表中的数据。但数据集结构定义与表结构定义有区别:

1、 一个数据集可以包括多个子集:如果检验报告至少会涉及到检验报告基本信息数据

集与检查报告明细项目结果信息数据集;

2、 多个子集之间有一种约束关系对其进行关联:检验报告基本信息数据集与检查报告

明细项目结果信息数据集是通过检验报告单号进行关系;

2、数据集有过程集的概念:如检验申请单医师开出来后,护士校对、采集标准、送检验等过程是检验申请单真正生效前的一些过程信息,是对检验申请单的补充与完善信息,这种业务环节中用到的数据集在本文中定义过程集。

2、 数据集定义

战略数据规划假设如下:任何一个组织都有10几个以上的业务域、任何一个业务域中都会涉及10几个以上业务流程、任何一个业务流程都涉及到10几个以上的流程节点。每个业务节点(除首尾结点)都是承上启下的环节,上一节点输出就是下一节点输入,这种输入输出所涉及到的内容实际上是我们要定义的数据集。通过业务场景下表现为一个申请单、一个报告单或一个采购计划。

根据对于业务节点输入输出的数据项进行梳理,能得到各种数据项的分类及相关属性信息:数据项的分类为数据集的子集定义形成基础;数据项属性信息为数据集中数据元定义奠定基础。

一个完整的数据集(除过程集、主数据集外)应该满足以下的四个要素:

以检验报告为例:时间有申请时间、上机时间、报告时间、审核时间、打印时间;地点:病人住院科室、病人住院病区、检验科室;人物:病人、开立医师、医嘱审核护士、标本采集人员、送检人员、接收人员、上机人员、报告人员、审核人员;事件起因开立开立单信息,结果为检验明细项目结果信息等。

3、 数据集在交换与共享体系中作用

信息集成平台以数据集为基础,可以形成第三方系统接入平台的接入规范,根据实际的

接入场景可以分:

1、发布规范:第三方系统调用此规范实现消息发布给平台;

2、订阅规范(拉模式):第三方系统采用此规范通过定时拉取的方式获取平台给出的消息;

3、订阅规范(推模式):第三方系统通过实现此规范,把获取数据的服务接口注册到平台中,当平台有此系统的订阅消息,通过实时推送的方式把消息给到此系统。

4、共享数据规范:第三方系统实现此规范,可以获取一个时期内的某类数据;

5、同步消息规范:第三方系统实现此规范,可实现两个不同的系统同步的获取消息。

4、 数据集在数据中心构建中作用

信息集成平台以数据集为基础,可以生成相应的物理存储模型。数据集有数据项,每个数据项都定义了数据类型、长度、精度;同时数据集上有业务主键的定义,数据集中子集之间定义了约束,这个可以理解为数据结构中的概念模型,通过与实际的数据库结合就可以生成数据库的物理模型。

通过数据集形成的系统交换规范,第三方系统采用这个规范通过XML、JSON的格式发布给信息集成平台时,平台可以理解发布出来的数据的结构与含义,平台接收到这类数据后,这些数据进行解析、转换,进行数据的自动化存储形成动态的数据中心。

5、 过程集

过程集是一种特殊的数据集,是以数据集为基础的虚拟的数据集,普通的数据集可以生成物理模型,并且在交换过程中能自动化进行业务数据的存储;过程集没有这个特性,他依附于某个数据集,只对某个过程所产生的信息感兴趣,如检验标准采集这个过程,它只关心某个检验申请单的标本采集时间、申请单状态、采集人员,所以过程集不会产生新的一份数据,只会影响它所依附的数据集的状态信息及过程信息。

过程集完善的是已有数据集的过程与状态信息,不会产生一份新数据,在业务流程分析时,以下业务流程节点:如审批环节、取样环节、报告环节、审批环节所产生的信息都可以定义为过程集。

6、 主数据集

主数据集是一类特殊的数据集,主数据是指支撑业务系统核心的基础数据,如科室、人员、药品、ICD等,这些数据集在定义时要充分、完整,考虑到这种业务系统的需要。

主数据管理采用以下原则进行:

1、 有信息系统支撑的主数据:采用主数据管理科室作为主数据进行定义、管理、分发;

2、 没有信息系统支撑主数据:有相对完善的系统对主数据进行管理的,选取这类系统

作为主数据定义、管理、分发的系统;没有相对完善的系统对主数据管理的,由平台对这些主数据进行定义、管理、分发。

相关文章

什么是银行黑户(这八种用卡行为将被列入银行黑名单!)

一、恶意透支非法占有信用卡信用额度,恶意刷卡不还,相当于犯罪。二、信用卡TX所谓的TX是指利用非正常手段制造虚假交易将信用卡额度内资金以现金方式套取。信用卡TX也是违法行为,会影响个人信用记录。三、逾期还款还款超过银行规定最后还款期限,导致不良信用记录。逾期还款6次就无法向银行申请贷款、信用卡。四、

2025-06-07 01:21:35

什么是生钱资产和耗钱资产(学会准确区分生钱资产和耗钱资产)

世界上那些中了彩票巨奖的人,大多数最后的生活都变得穷困潦倒,甚至不如从前。爸爸是亿万富翁,传到儿子、孙子基本就败光了,富不过三代。为什么会这样?到底是什么决定人生穷富?人生穷富的关键是什么?为什么穷人越来越穷,富人越来越富?是因为穷人和富人拥有的资产类型不同。资产的内涵是现金流,资产产生现金流的不同

2025-06-06 23:59:13

融资有什么要求吗(融资需要具备什么条件?)

没有这三点,就无法成为资本价值思维的开创者。如果这三点不完善,又怎么能获得融资呢?融资的基本条件是什么?我认为,融资的基本条件包括以下三点:·第一,人。一切都是人做的,创始人不行,一切都不行。什么样的人才真正具有价值呢?→首先,他们必须有超前的思维方式,能够想到别人想不到的东西,因为只有这样,才能从

2025-06-06 22:38:30

小额贷款要注意什么(申请小额信用贷款注意事项)

所谓小额信用贷款是以个人或家庭为核心的经营类贷款,其主要的服务对象为广大工商个体户、小作坊、小业主。贷款的金额一般为10万元以下,1000元以上。小额信用贷款是微小贷款在技术和实际应用上的延伸。借款人不需要提供担保。目前,不少家庭或是个人都喜欢选择小额信用贷款。那么申请小额信用贷款需要注意哪些事项呢

2025-06-06 21:58:35

p2p什么理财产品(P2P理财产品众多,哪一种网贷产品安全)

P2P网贷行业火爆,也衍生出了不同类型、不同风险系数的P2P理财产品,让网贷投资者目不暇接,甚至有点丈二和尚摸不着后脑,不知道该如何选择,笔者根据投资标的的内容和性质做了一下分类,让投资人从更清晰的角度选择安全,适合自己的网贷理财产品。网贷理财产品分类:目前市场上,P2P理财产品主要分成五类产品:票

2025-06-06 20:58:30

配资炒股什么意思(专业的股票配资炒股需要注意什么?)

专业的股票配资是指由具备相关证券从业资格、拥有专业投资管理经验、风险意识强、遵守法律法规等一系列条件的机构或个人,为投资者提供的股票杠杆交易服务。这种通常包括提供资金、交易平台、风险控制、交易指导等方面的支持和服务。专业的股票配资通常会提供较高的杠杆比例,使得投资者可以通过较少的资金参与更大的市场交

2025-06-06 20:05:31