古代中医医案信息资源建设研究

(整期优先)网络出版时间:2022-01-17
/ 2

古代中医医案信息资源建设研究

李丹,闫朝升

黑龙江中医药大学,黑龙江哈尔滨 150040

摘要:本文梳理了古代中医医案信息资源建设现状,并从大数据云平台和微课两个角度,在分析现有问题基础上,提出了古代中医医案信息资源建设的途径。

关键词:中医医案;信息资源;大数据;云平台;微课

中图分类号:R2-03


作为历代医家诊疗疾病的真实记录,古代中医医案反映着辨证论治的过程和理法方药的应用,承载着不同时期下医家的临床经验及其学术思想。随着信息时代的飞速发展,古代中医医案信息资源现已成为中医药传承创新发展的基础信息资源。本文从数字化处理、共享平台建设两个方面,介绍古代中医医案信息资源建设现状,并在此基础上,提出古代中医医案信息资源建设途径,为新时期古代中医医案信息资源建设提供有益借鉴。

1.古代中医医案信息资源建设现状

古代中医医案信息资源建设主要涉及数字化处理和共享服务平台两方面。

1.1古代中医医案数字化处理

数据库技术是中医医案数字化处理的关键支撑技术。目前,关系型数据库是中医医案数据库建设的常见形式。根据数据格式化程度差异,中医医案关系型数据库分别存储了非结构化、半结构化和结构化的医案信息。另外,为了满足中医医案知识服务需求,基于图数据库的中医医案数字化处理得到深入开展。目前,知识图谱成为基于图数据库的中医医案数字化处理关键技术。

(1)非结构化处理

非结构化医案主要是指图像类型医案。一些研究者采用扫描设备和图像处理技术,通过扫描、压缩、转换、索引等过程,形成电子版医案,将中医医案的纸质文献资源转成中医医案资源图片并存入数据库,生成中医医案图像资源。上述图像存储不仅有助于避免纸质古籍的遗失、受潮、破损等问题,而且有益于呈现医案原貌。

(2)半结构化处理

半结构化医案主要是指通过拆解所生成文本类型医案。一些研究者利用中文分词技术,借助容纳词语、语句、短语等内容的语料库,对文本医案进行半结构化处理,完成医案信息的拆解;或者借助结构标引、框架分析、语义标注等技术,进行医案的半结构处理。例如,利用XML,进行医案的结构化标引和层次化处理,实现医案结构化标注处理;亦或利用MEDL,通过词法、语法和语义的自动化分析生成半结构化医案,并导入古代中医医案数据库[1];亦或利用语义标注,生成语义标注概念层和语料库,抽取医案特征信息,增强医案信息的完整性[2]

(3)结构化处理

结构化医案主要是指通过医案所含各要素的抽取特征以及形成各要素之间相互联系所建立的古代中医医案相关信息集合。通常,结构化类型医案的处理过程为:根据特定疾病(或证候)的古代中医诊疗规律研究实际需求,直接检索中医医案的纸质(或电子)文献资源,获取中医医案,并在建立数据模型基础上,存入中医医案关系型数据库。一方面,关系模型能够利用多个关系(即二维表)以及相互之间的联系,实现医案的结构化。一些研究者从数据采集方法角度,设计了医案数据采集流程,保证了古代医案数据采集的系统性和规范性[3];或者以方剂为核心,构建方剂、疾病和中药等数据库,并建立3个数据库之间的关联,为基于古代中医医案的“病/证/症-方-药”关联研究提供良好的信息存储环境。另一方面,多维模型能够利用多个维度及其与中心表之间的联系,实现医案的结构化。例如,一些研究者在古代中医医案的辨证、用药、组方等信息的分解和规范基础上,构建了哮喘病的古代文献医案数据仓库,支持该病的中医证治规律的研究。

(4)知识图谱构建

知识图谱是一种以符号形式来描述实体(或概念)以及实体(或概念)之间的关联关系,进而构建知识语义网络的技术。其中,本体库构建和语义网络设计是医案知识图谱构建的关键。例如,一些研究者通过抽取糖尿病的医案所含概念(如:症状、病因、诊断、治法、处方、按语等),在定义上述概念的类、属性和关系基础上,利用Protégé,创建了糖尿病医案的本体模型,并通过OWL进行本体的语义描述以及文件形式存储;或者在相关术语和关系的抽取基础上,利用图数据库Neo4j构建了《伤寒论》医案语义知识网络,形成了《伤寒论》医案知识图谱[4]

1.2古代中医医案信息网络共享平台建设

根据后台数据库的类型差异,古代中医医案信息资源的共享平台主要涉及:医案查询和知识服务两类。例如,一些研究者利用互联网环境,构建了医案共享平台,如:古今医案云平台、中医古籍医案库等,提供了古代医案、名家医案、病证医案的查询功能;或者研发了中医药学语言系统,提供了语义搜索,并以可视化语义图方式展示医案信息,直观地呈现医案所含概念之间的关联关系。

2.古代中医医案信息资源建设途径

2.1古代中医医案大数据云平台构建

通过大数据和云计算的整合应用,大数据云平台能够提供云存储服务器、网络软件、服务构件等基础设施和多源数据集成、分布式数据存储和高性能数据处理。目前,古代中医医案信息资源建设存在着分散性过强、重复性过重、信息完整性不足、类型差异性过大以及“用后遗弃”现象严重等诸多缺陷。另外,古代中医医案浩如烟海,且数据类型多样。因此,古代中医医案信息资源建设具有长期性、迭代性、协作性、高成本等突出特征。借助古代中医医案大数据云平台的高共享、高集成、高性能、低成本等优势,有益于解决上述的缺陷,有利于形成古代中医医案资源的迭代更新、多方协作建设模式以及按需求量使用、按使用量付费等资源使用模式。另外,借助大数据云平台的高性能数据处理功能,利用大数据的处理和分析技术,结合机器学习和数据挖掘,进行海量、多样医案数据的分析和处理,发现隐藏的、有潜在价值的信息,有益于丰富古代中医医案信息资源。

2.2古代中医医案微课资源建设

历代中医医案存在着形式、风格、体裁、用语等表述方面差异,导致医案具有医家个体特征。古代中医医案的数字化处理是从历代医案整体出发,将会忽略医案的个体特征。因此,古代中医医案信息资源建设应关注更为丰富、多样的信息资源建设。古代中医医案的微课将围绕某个具体的古代中医医案,在注重医案个体性基础上,形成在10分钟以内时间限制下的视频、案例、拓展等资源包。另外,思维导图是采用图文技术和树状结构来表达思维的一种可视化思维工具。基于思维导图的古代中医医案微课不仅能够呈现古代中医医案的各要素之间逻辑关系以及思维过程,便于医案内涵的理解和掌握;而且能够实现各要素以及相关信息(如:同类的医案、病证、方剂等)的资源整合,实现多个医案的信息融合。

参考文献

[1]于莉娟.中医医案管理和分析系统的设计与实现[D].大连:大连理工大学,2013.

[2]王瑞祥.中医医案数据库数据完备性问题研究[J].辽宁中医杂志,2011,38(10):1939-1940.

[3]李丹,孙忠人,姜德友,等.基于数据库技术的古代中医治疗数据采集方法的研究[J].中医药学报,2012,40(6):99-101.

[4]王菁薇,肖莉,晏峻峰.基于Neo4j的《伤寒论》知识图谱构建研究[J].计算机与数字工程,2021,49(2):264-267,396.




基金项目:黑龙江省中医药科研项目(ZHY2020-089,ZHY2020-090);黑龙江省高等教育教学改革研究重点委托项目(SJGZ20200162);黑龙江省经济社会发展重点研究课题(JD2017017);黑龙江省高等教育教学改革研究一般项目(SJGY20190618);“黑龙江中医药大学优秀青年骨干教师支持计划”基金资助(校党发 【2019】17号)。

作者简介:李丹(1981-),女,工程师,研究方向:中医医案信息化、中医药数据智能分析。