首页 理论教育 数据生产:电子病历系统的病历档案信息管理优化方案

数据生产:电子病历系统的病历档案信息管理优化方案

时间:2023-07-04 理论教育 版权反馈
【摘要】:以电子病历系统为主要内容的病历档案信息管理,数据库技术是一个重要的工具,但是在大数据背景下,病历档案的数据来源、处理方式和思维理念等将产生革命性的变化。病历档案数据类型较为丰富,利用数据库对其进行加工处理时,需要根据不同的数据项确定不同的数据类型,病历档案数据可包括文本型数据、图像型数据、数值型数据等。通过病历档案文本数据分类与聚类可将一类病历档案聚集在一起,可以更好地挖掘病历档案数据之间的关系。

数据生产:电子病历系统的病历档案信息管理优化方案

病历档案数据管理并不是一蹴而就的。以电子病历系统为主病历档案信息管理模式下实际上已经是初步进入了数据运营式系统阶段,在此阶段病历档案的数据量已经经历了第一次管理大飞跃。笔者认为数据经历了被动、主动和自动三个阶段。综观病历档案管理,其管理对象由被动地接受病历档案实体,到主动地全程管理并提供病历档案信息,现正向自动地收集、整理和分析转变。以电子病历系统为主要内容的病历档案信息管理,数据库技术是一个重要的工具,但是在大数据背景下,病历档案的数据来源、处理方式和思维理念等将产生革命性的变化。

病历档案数据类型较为丰富,利用数据库对其进行加工处理时,需要根据不同的数据项确定不同的数据类型,病历档案数据可包括文本型数据、图像型数据、数值型数据等。从已有的研究成果中,可以借鉴的主要来自图书、网络以及企业信息资源的知识组织研究。

(一)主题标识

通过词频法,将病程记录、手术记录、检验检查报告或者医嘱内容等进行自动标引,即给出病历档案信息内容所涉及的主题词或关键词。在数字图书馆研究中,构建交叉学科集成数据集,经过关联处理,挖掘了潜在主题及其构成,揭示学科研究主题。在病历档案知识发现时,对病历档案数据库中相同主题或关键词的病历档案进行数据集预处理、主题模型训练和主题标签标注等关联处理,可以发现不同病历档案之间的关系,从而发现病历档案数据之间的关联性

(二)分类与聚类

结构化、半结构化文本数据的分类与聚类研究成果较多,病历档案文本的分类与聚类可以借鉴现有的研究成果。病历档案文本分类、聚类针对的是具体的病程记录、手术记录、检验检查报告或者医嘱内容,而不是单个的一份电子病历。这里需要说明的是由于一个病人,尤其是复杂病情的病人可能会涉及多个疾病主题或关键词,因此,这样的病人的病程记录可能会被分为两个或两个以上的分类之中。通过病历档案文本数据分类与聚类可将一类病历档案聚集在一起,可以更好地挖掘病历档案数据之间的关系。

(三)摘要

数据管理的摘要技术已经有较多学者进行了研究,利用计算机可以将病历档案数据库中的一份电子病历档案的内容生成一篇浓缩的摘要。病历档案摘要主要通过抽取病历档案的出院记录中的入院诊断、入院日期、手术名称、手术日期、出院诊断、入院时情况、诊疗经过、出院时情况和出院医嘱等内容。可以自动摘录,通过词频或词组频率统计选取句子,高频关键词出现多的句子选为摘要候选句。也可以基于理解的自动摘要,借助自然语言理解的研究成果,采用语法分析、语义分析、语用分析等方法。病历档案摘要作为病历档案知识发现的一种技术,可以实现将病历档案中的主要内容用简洁的文字表现展示出来,对于海量的病历档案可以做到快速筛选,节省阅读时间的作用。

(四)构建本体知识库

20世纪90年代知识管理过程中,为解决信息、知识的提取、表示和组织等方面出现的问题,知识管理领域引入本体概念,随之本体构建方法研究得以展开。根据时间顺序,出现的本体构建方法包括:IDEF5法(KBSI公司,1994)、骨架法(Uschold、King,1995)、TOVE法(Gruninger、Fox,1995)、METHONTOLOGY法(Fernandez,1996)、KACTUS工程法(Berneras,1996)、SENSUS法(University of Southern California/Information Sciences Institute,1997)、七步法(Noy,2000)、循环获取法(Jorg NoyUwe Kietz、Raphael Volz、Alexander Maedche,2000)和五步循环法(Maedche、Staab,2000)九种主要的方法。

企业领域构建知识本体主要使用IDEF5法、骨架法和TOVE法。IDEF5法是用图表语言和细化说明来获取企业领域的本体,通过图表语言和细节说明语言,描述和获取企业知识本体的概念、属性和概念间的关系,并将之形式化,作为知识本体的主要框架。骨架法通过明确的流程和导向构建本体。TOVE法通过逻辑模型构建综合商业与企业应用的知识本体。METHONTOLOGY法、KACTUS法、SENSUS法、七步法、循环获取法和五步循环法,是用于构建领域知识本体的方法。METHONTOLOGY法专用于构建化学本体。KACTUS法通过抽象法构建知识本体,主要应用于语义网,是对已有本体的提炼、扩充,并且可以对知识本体复用。SENSUS法是采用自顶向下构建方法,通过该方法可以从同一原始本体库获得多个领域的专用领域本体库,利于共享知识。七步法是基于本体斯坦福大学开发的Protégé知识本体构建工具构建知识本体,该方法得到知识管理领域的广泛实用;循环获取法和五步循环法,强调从文本中经过循环迭代,获取知识本体,支持知识本体演进与复用。不同的方法应用的场景与领域不尽相同,由于电子病历档案是结构化的数据,并且在多个字段中是以自由文本的形式出来,因此可以采用自动化或半自动化的方法来构建电子病历档案知识本体。

斯坦福大学Noy开发的Protégé已经成为构建电子病历档案知识本体库的主要工具,利用该工具构建电子病历档案知识本体一般需要经过以下七个步骤。

1.熟悉专业领域和范畴

熟悉电子病历档案本体的专业领域与范畴主要是指建立了电子病历档案本体是在特定的电子病历档案语境中建立的,建立的电子病历档案本体构成的电子病历档案本体库中采用的推理规则也是建立在电子病历档案语境下的。电子病历档案本体的建设是一个由点到线、由线及面不断深化全面的过程。现阶段电子病历档案本体可能以电子病历档案中的病历档案首页、入院记录、病程记录、检验检查报告单和出院记录等为主要对象进行建模。

2.复用现有本体的可能性(www.xing528.com)

电子病历档案本体本身是医学本体、医学信息学本体的一个子集,因此,电子病历档案本体可以复用其他本体的建模成果,既减轻了电子病历档案本体建模的工作压力,还可以使得建立的各类电子病历档案本体涉及的医学概念本体在标准化、一体化的医学语言系统中。

3.列出本体中的重要术语

电子病历档案本体涉及一些该领域的特殊表述专业术语,如病历档案首页、入院记录、病程记录、检验检查报告单和出院记录等内容中的主诉、现病史、手术史、过敏史、体格检查、专科检查、诊疗计划、初步诊断、出院诊断、ICD、发病情况、伴随症状、治疗经过、手术名称、麻醉记录、护理记录等。

4.定义类和类的等级体系

可以根据不同的胜任定义电子病历档案中的类与类的等级体系。可以将电子病历建构的类定义为病历概要、门(急)诊诊疗记录、住院诊疗记录。各类下又分别包括若干层级的数据项。例如,病历概要包括文档标识、服务对象标识、人口学、联系人、地址通信医保、事件摘要等项,而在服务对象标识下,又分个体生物学标识和个体危险性标识。

5.定义类的属性

定义类的属性主要包括四种属性关系:种属关系:主要是指电子病历档案中各个本体之间的逻辑层次种属关系,如住院诊疗记录逻辑包括住院病历档案首页、入院记录、病程记录、住院医嘱、护理记录、出院记录等。实例关系:主要是指电子病历档案中处于不同逻辑层面的本体之间概念与概念外延个体的实例关系,如病人检验检查结果在病程记录中与检验检查结果中的关系。实例间关系:主要是指电子病历档案中处于同一逻辑层面的本体或不同逻辑层面的本体之间的关系,如不同病历档案号的电子病历档案之间的关系。父子关系:主要是指反映电子病历档案中不同抽象程度的父子关系,入院记录中包括病人基本信息、入(出)院信息、费用信息等。

6.定义属性的分面

每个属性由赋值类型、属性值和赋值基数三个分面。赋值类型是指字符型、数值型、布尔型、枚举型、实例型等;属性值是指布尔型属性的真或假;赋值基数是指该赋值属性可以赋几个值。

7.创建实例

根据前面六个步骤基本可以实现电子病历档案本体建模。本体的顶层结构中包括出院记录、病历摘要、病历档案、相关检查记录、医疗机构信息、医学证明等本体。第二层结构中以病历摘要为例,又分为病人信息、家属信息、通信地址、医保和医疗费用信息等本体。建立的电子病历本体,将病历摘要、诊疗记录、治疗处置记录、护理记录、知情同意书、检验检查记录等本体作为电子病历本体的顶层结构。

出院记录本体中包括入院前、入院治疗和出院结论三类本体:入院前本体包括:主因、症状、持续时间、诱因、血压、查体、治疗、效果;入院治疗本体包括:初步诊断、血压、B超显示、查体、治疗、效果;出院结论包括出院诊断、血压、查体等。根据电子病历档案内容,可以得到高血压疾病的一个简单语义关系:病人由于某种原因诱发症状持续若干时间,经过仪器检查、查体得到初步诊断。

电子病历档案本体库建设是一个逐渐积累的过程,既有显性知识存储,又存在隐性知识显性化的过程,将赋予电子病历档案知识语义的不同知识集合形成电子病历档案知识库,为电子病历档案知识共享提供资源。电子病历档案本体库建设是一种知识管理的组织形式。建立电子病历档案知识本体库的目的是将诊断治疗、检验检查和护理服务等过程中形成的各类电子病历档案知识经过科学的组织、挖掘,使其能够实现共享。电子病历档案本体库建设应以建立本体库为核心。建立电子病历档案知识本体库的本质是实现电子病历档案知识的语义相关。基于语义相关的电子病历档案知识本体库可能将电子病历档案领域中的各类本体进行关联、映射,构建能够反映诊断治疗、检验检查和护理服务等知识结构的本体模型,并且可以有效地描述与组织电子病历档案知识源。建立各层次的电子病历档案知识本体概念模型,利用电子病历档案本体推理技术,将电子病历档案知识本体与用户需求实行关联,形成最佳匹配方式,实现基本电子病历档案本体的知识资源共享。电子病历档案知识本体库建设的目标是共享电子病历档案知识。

病历档案数据管理最终是获得病历档案中富含的种类病历档案知识,通过病历档案数据管理可以获得一种基于语义相关的病历档案知识。通过电子病历档案知识本体库可以发现电子病历档案知识潜在的价值,可以将诊断治疗、检验检查和护理服务等新的概念、实例和概念维护现有本体,按照病历档案知识关联关系实现语义概念智能检索,为发现电子病历档案知识提供基础。病历档案本体需要通过病历档案元数据得以展现。[3]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈