专利数据挖掘论文

2022-04-15

摘要:专利情报是商业中的重要情报,但是专利数据较为庞大,搜索相关情报较为困难,传统的知识图谱方法在处理专利数据的过程中时间较长。基于数据挖掘的专利数据处理技术研究,使用聚类算法,对专利数据进行聚类分析,确立专利情报中的运算指标,通过词语与文档的关联性对于关键词语进行数据挖掘,并且根据关联规则进行数据分析,根据文本特征进行数据处理。以下是小编精心整理的《专利数据挖掘论文(精选3篇)》,仅供参考,大家一起来看看吧。

专利数据挖掘论文 篇1:

基于专利数据挖掘的我国烟草产业发展态势分析

摘要 在对2001~2015年我国烟草产业相关专利进行检索统计的基础上,从基本统计分析、深度挖掘分析两方面分析了我国烟草产业相关专利的整体态势、区域分布、竞争主体、竞争领域4大因素。结果表明:最近几年,我国烟草产业发展势头良好,专利申请数量普遍增多,相关的技术发展迅速且绝对多数技术正处于技术发展的成长期;我国烟草产业的发展具有很强的区域局限性,呈现出局部区域集中度高、区域发展程度及分布不均的特点,且不同类型的专利申请人在专利申请类型、专利申请数量方面差异很大;烟草的调味或加香技术、无烟气的烟草制品及其制备方法、口含型烟草制品及其制备方法等技术创新难度相对较小,可拓展、创新的空间比较大,属于重热点技术领域。

关键词 烟草产业;专利分析;竞争格局;数据挖掘

Key words Tobacco industry; Patent analysis; Competitive landscape; Data mining

烟草产业是我国重要的经济支柱性产业,同时,也是带动农民致富增收的重要途径[1]。烟草产业的稳定发展与我国部分省市的经济稳定、繁荣密切相关,尤其是云南、湖南等烟草生产大省。目前,我国烟草产业呈现出产销量大,但综合实力欠缺的态势,主要体现在以下两方面:①整体产业生产集中度低,综合实力较弱;②缺乏全球性的跨国公司及市场占有率较高的高端品牌产品,国外市场份额占有率小,缺乏国际竞争力[2]。

专利文献是商业经营、科学研究和技术发展最重要的信息来源之一,专利信息数量庞大,价值突显,来源广泛[3]。在市场经济条件下,专利信息是企业生存发展和技术创新的重要资源,能最大化地保护企业的技术经济效益[4-5];同时,基于专利的情报分析[6-7]能有助于发现某一产业的技术前沿、研发动向等信息,可有效为企业、高校、政府部门、研究机构的知识产权布局、技术研发等提供参考依据[8]。

综上所述,考虑到我国烟草产业的发展现状以及专利分析方法的具体应用,开展国内烟草产业的专利分析研究,对我国烟草产业的发展、技术创新、人才引进以及核心竞争力的培育具有重要意义。

1 技术方案

该研究采用定性、定量的分析方法,对我国烟草产业的专利数据进行了分析。该研究分析了2001~2015年我国烟草产业相关的实用新型专利和发明专利(不包括港澳台的专利数据)。该研究将佰腾数据库作为专利的检索数据库,并借助佰腾网的专利分析平台[9]以及Excel、SPSS等软件对所检索的专利进行数据挖掘分析。

为较全面、准确高效地检索出烟草产业的相关专利,首先对烟草产业进行技术边界界定。考虑到技术边界界定的实际操作性以及该研究侧重点,结合相关文献[10-12]以及学术研究共识,确立了技术边界(图1)。其次,根据图1中技术边界界定的结果,采用“IPC分类号+技术边界+人工筛查”的检索策略,具体为:“ic2:((A24*) or (A01*) or (C12*) or (G01*) or (G06*) or (C05*) or (B65*) or (C07*) or (C11*) or (A61*) or (C08*) or (H04*) or (B01*) or (C02*))and ti:((烟苗*) or (烟株*)or(烟叶*)or(烟草*)or(烟丝*)or (烟油*)or(烟液*)or(电子烟*)or(卷烟*)or(电子雾化器*))”,在专利数据库中进行专利检索,并将最终的检索结果确定为样本数据为8 019项。

2 烟草产业专利分析

2.1 专利整体态势

专利的法律状态及专利类型能有效反映专利结构以及专利技术的发展、更新程度。目前,烟草产业相关的专利中授权的多为实用新型专利(3 734项),专利结构有待优化;授权的发明专利(1 891项)只占发明专利总量的43.22%,近57%的发明专利处于发明公开、实质审查状态,这有效说明了最近的1~3年是烟草产业技术发展、技术创新的高潮期,烟草产业相关技术的创新性、可拓展性强,技术发展空间大。

烟草产业的技术发展大致可以分为4个阶段(图2):第一阶段是2001~2005年,在此阶段涉及的专利申请人少,每年的专利申请量不足20件,技术发展不稳定,属于技术萌芽阶段;第二阶段是2006~2010年,在此阶段专利申请量及专利申请人较前一个阶段都有了较大的增幅,其中,2009年专利申请量达到131项,技术方向基本明确,属于技术成长期;第三阶段是2011~2014年,在此阶段专利申请量涨势明显,大量的专利申请人涉足该技术领域,技术创新取得了重大进展,技术方向明确,属于技术发展期;第四阶段是2015年,此阶段专利申请量、专利申请人皆有所下降,可能与我国最近相关的控烟政策及市场需求降低等有关,具体原因有待进一步分析。

2.2 专利区域分布

图3从专利区域分布的角度对我国烟草产业的技术区域分布进行了分析。从图3可以看出,我国烟草产业技术的发展与当地所在的烟草企业及研究机构存在很大的关联性,烟草产业的相关专利主要集中在广东、云南、河南、湖北、山东、湖南等省份。广东作为沿海地区,在电子烟专利技术申请方面占据绝对优势;相比沿海地区,地理位置欠佳的内地省份的烟草技术发展和相关专利的申请则多依托当地的中烟工业有限责任公司的引领和推动,例如云南中烟工业有限责任公司、河南中烟工业有限责任公司、川渝中烟工业有限责任公司等。

2.3 竞争主体

专利申请人的专利占有量及局部范围内专利申请人的专利集中度能有效地反映竞争主体的竞争实力以及当前产业技术领域的竞争格局。烟草专利申请人深度分析见表1。从表1可以看出,不同类型的专利申请人在专利申请类型、专利申请数量方面差异很大;企业类型的专利申请人在发明专利申请数量、专利申请总量方面都占据绝对优势,但是相较于高校及研究机构类型的专利申请人,其发明专利的占有比例明显偏低,专利结构不合理,有待进一步优化;个人类型的专利申请人相对来说,技术创新能力不足,综合竞争力较差,整体上处于劣势。从表2中可以看出,排在Top10的企业基本都是各省的中烟工业有限责任公司,其研发团队的规模都比较大,但人均发明专利占有量整体偏低,研发效率有待提高。根据表1~2中的数据,通过简单计算,Top10、Top50的专利申请人分别占专利总申请量的25.12%、52.46%,说明目前烟草产业的专利集中度比较高,存在技术垄断的风险。

采用K-means算法对表2中的数据进行聚类分析,结果见图4。结合表2、图4可以得出,在我国烟草产业相关技术领域中,中国烟草总公司郑州烟草研究院和豪尼机械制造股份公司是发明专利申请总量最多、研发团队规模最大的专利权人,两者申请的发明专利涵盖烟草产业的各个核心技术领域,专利布局较为合理,且专利授权率较高,被引证的专利数量较多;刘秋明、惠州市吉瑞科技有限公司以及深圳市合元科技有限公司主要涉及电子烟相关的技术领域,具体包括电子烟烟液(烟油)制备及调香方法、雾化器发热装置、电子烟的电池组件及相关装置等,其专利拥有量占电子烟技术领域的25.92%;相比以上2大类,各省份的中烟工业有限责任公司之间差异性较小,专利规模和人均发明专利占有量比较接近,其专利主要涉及烟草薄片的制备、烟叶浆料的处理、烟叶成丝的制备以及烟用香料的制备等领域。

2.4 竞争领域

该研究基于IPC小组分类方法,选取发明专利申请量Top10的技术领域进行专利系数的测算[13-14],计算公式如下:

r=a/A; β=a/(a+b)

式中,a为发明专利数量;b为实用新型专利数量;A为最近5年内发明专利的累计数量;r表示技术生长率,其值越趋于表示该技术处于生长阶段;β为技术成熟系数,其值越趋于0,表示该技术处于成熟期。

利用以上方法,计算得到我国烟草产业相关专利技术领域分析结果(表3)。从表3可以看出:①A24F47/00领域近年来发展速度很快,r′达到了0.648,且该技术领域占据烟草产业发明专利中最大的小组份额;但就β′计算结果来看,其技术整体独立性较强,整体而言该技术领域的创新难度较以往相对增大,整体发展潜力较前期有所下降;②从专利系数测算结果分析,A24B3/12、A24B15/24技术领域的r′、β′数值较大,新技术特征明显;③相较于A24B3/12、A24B15/24技术领域,Top10中其他技术领域的专利系数测算结果表明最近3年的平均技术生长率都比较高,基本达到0.35左右,且技术成熟系数较大,平均值达到0.7,说明以上技术领域的技术正处于技术发展的成长期,技术创新难度相对较小,可拓展空间较大。由此可以预测:烟草薄片及相关处理方法、电子烟油(烟液)的制备方法、烟草加料香精的制备方法以及口含型烟草制品及其制备方法等是未来烟草产业的重热点技术领域。

3 结论与建议

该研究采用“IPC分类号+技术边界+人工筛查”的检索方法对我国2001~2015年烟草产业相关专利的专利整体态势、区域分布、竞争主体、竞争领域等进行分析,结合我国具体国情,得出以下结论和建议。

(1)最近几年,我国烟草产业发展势头良好,专利申请数量普遍增多,相关的技术发展迅速。整体而言,绝对多数技术正处于技术发展的成长期,例如:烟草(烟丝)的调味或加香技术、无烟气的烟草制品及其制备方法、烟草加料香精的制备方法等技术创新难度相对较小,可拓展、创新的空间比较大,属于重热点技术领域。

(2)我国烟草产业的发展具有很强的区域局限性,呈现出局部区域集中度高、区域发展程度及分布不均的特点,其主要与当地烟草企业及研究机构存在很大的相关性;且不同类型的专利申请人在专利申请类型、专利申请数量方面差异很大。因此,不同区域、不同类型的相关企业及研究机构应多加强合作交流,打破区域、技术隔阂,有效实现跨越式发展。

(3)目前,我国烟草相关的企业在专利信息资源管理、利用及整合等方面仍存在很多不足,企业普遍只关注专利的申请,而忽视了专利的运营及其本身的情报价值挖掘。主要体现在以下几个方面:①前期专利申请布局规划不合理;②专利授权后产业化进程慢且效率低;③企业间缺乏专利池的构建;④基于专利分析在寻求发展商机、规避专利纠纷、制定竞争策略、失效专利的信息挖掘及二次创新等方面的应用还不够深入、普遍。

参考文献

[1]彭曙光.湖南省烟草公司烟叶产业链稳定性发展研究[D].长沙:中南大学,2012.

[2]朱彩霞.中外烟草行业发展现状及发展趋势研究[J].山东社会科学,2014(专辑):95-97.

[3]文庭孝.专利信息计量研究综述[J].图书情报知识,2014(5):72-77.

[4]曹建平.近20年国内外烟草相关专利信息对比分析与发展对策[J].中国烟草学报,2013,19(1):84-89.

[5]潘颖,卢章平.专利优先权网络:一种新的专利组合分析方法[J].图书情报工作,2012,56(16):97-101.

[6]杜尊峰,周清基,郭显杰.我国海洋漂浮式平台领域新兴技术研究:基于专利分析[J].情报杂志,2014,33(7):20-26.

[7]HUANG J Y.Patent portfolio analysis of the cloud computing industry[J].Journal of engineering and ttchnology management,2016,39:45-64.

[8]杨晓敏,李春成.基于专利计量的天津市LED产业专利分析及对策研究[J].科学管理研究,2015(3):124-126,148.

[9]佰腾网.佰腾网专利检索系统[DB/OL].[2016-05-09].http://so.baiten.cn.

[10]李继琳.云南烟草产业循环经济发展模式和对策研究[D].昆明:昆明理工大学,2014.

[11]钟术龄.中国烟叶产业链组织模式评价与优化研究[D].杨凌:西北农林科技大学,2014.

[12]陈长坤,周清明,张晓海,等.烟草行业科技专利的申报现状及对策研究[J].农技服务,2015,32(9):4-6.

[13]杨晓敏,李春成. 基于专利计量的天津市LED产业专利分析及对策研究[J].科学管理研究,2015(3):124-126,148.

[14]胡神松.我国新能源汽车产业专利分析与建议[J].武汉理工大学学报,2013,35(5):758-762.

作者:高杰 龙华 邵玉斌 杜庆治

专利数据挖掘论文 篇2:

基于数据挖掘的专利数据处理技术研究

摘要:专利情报是商业中的重要情报,但是专利数据较为庞大,搜索相关情报较为困难,传统的知识图谱方法在处理专利数据的过程中时间较长。基于数据挖掘的专利数据处理技术研究,使用聚类算法,对专利数据进行聚类分析,确立专利情报中的运算指标,通过词语与文档的关联性对于关键词语进行数据挖掘,并且根据关联规则进行数据分析,根据文本特征进行数据处理。通过实验论证分析,数据挖掘的专利数据处理方法对比传统的知识图谱方法数据处理效率更高。

关键词:情报;聚类分析;数据挖掘

目前,专利情报是企业技术创新的主要信息源,而且具有数量巨大、内容广泛的特点。这些专利反映着目前科学技术的新水平。专利情报作为技术的载体之一,包含着大量的技术信息,充分利用专利信息,可以节约大量的经费和时间。专利情报是技术发展的方向,对企业来说是极为重要的指标,企业也可以根据专利情报的趋势研究,对于不同地区的某类产品的先进程度进行预测[1]。根据专利可以指导企业的技术开发以及产品的销售策略,从而避开盲目开发,也可以对竞争对手的产品以及技术等进行信息的收集。但专利信息较为复杂,想要获得有用的专利信息则需要对相关信息进行处理。国外对于该方面的研究起步较早,通常都建立了专利数据库,以及对于专利数据的引文索引的數据库[2]。而我国起步较晚,并且相关专利信息的分析仍然处于初期阶段。关于竞争情报以及专利信息的研究者较少,但随着对专利信息的重要性的认识的不断提高,对于专利信息处理的研究者也逐步增加,目前我国专利信息处理技术常常采用知识图谱的处理方法[3]。但是该方法在处理大量的数据时常显得捉襟见肘,虽然可以图像化地显示专利数据但是处理速度较慢。数据挖掘技术是在大量数据中通过算法搜索隐藏的信息的方法,可以直接地对于专利信息中需求的关键词、引文索引进行搜索,对比传统的知识图谱数据处理方法更加方便。

1 专利数据处理流程

1.1专利数据聚类分析

使用聚类分析作为动态的分类方法,帮助后续的挖掘进行,将相似的事物归入相应的类别中,并且使其中的事物相似。而进行聚类分析常常将常用的指标比作“距离”以及“相似系数”,并且将分析对象用“点”表示,并且将“距离”或者“相似系数”较大的点分为一类中,并且将较小的分布另一类,使用该方法可以进行多类的聚类分析。而常用的距离指标使用欧式距离,公式如下:

[DX,Y=iXi-Yi2][i=1,2,...s]            (1)

在(1)式中将[X]和[Y]在这里表示空间中[n]个体中的两个点,如果聚类对象为变量,[X]和[Y]则表示在[k]个变量中的任意两个,并且维数为样本量[n]。而对于聚类分析中的相似度系数指标可以采用余弦相似度,余弦相似度的公式如下:

[SX,Y=iXiYiX2iY2i]                   (2)

其中[i=1,2,...s],通过计算余弦相似度也可以完成数据挖掘的聚类分析,而若是假设聚类的数据集合包括的n个数据对象,相关的数据对象可表达多种目标,对于内存的聚类算法可以选择数据矩阵,数据矩阵也被称为对象与变量矩阵,使用[p]个变量表现[n]个对象,根据数据关系表来表现,或者[n?m]维的矩阵来表示矩阵就是表示[n]个对象的[m]个属性,以此矩阵结构建立数据类型。聚类分析根本是帮助进行下一步的数据挖掘。

1.2 专利指标数拟定

专利信息因素较多,关于专利的指标计算较为困难,对于专利指标,主要包括几项,专利的有效期是专利受法律保护的期限,也可以作为数据挖掘时的指标之一,引文索引是相关专利所引用的专利数量,也可以作为指标[4]。而其中专利指标计算中较为重要的是专利的原创率,一项专利的原创率越高,则专利的创新价值就越高。技术生命周期,用来判断技术生命发展的阶段,技术周期时间用来衡量专利和专利改进后的时间,周期越短,表示技术进步越快,而专利的普遍性反映专利多样性,普遍率也高反映该专利的经济价值越高。选取四项专利指标,引文索引、专利原创率、专利普遍率、技术生命周期。并且运算这四项指标,并且进行数据离散分析,结果如表1所示。

关于专利数据的相关数据离散,使用数据挖掘来对于专利中的各指标进行处理。

1.3词语与文档关联性挖掘

数据挖掘技术,是从大量的、不完全的、模糊的各种数据中,提取那些具有潜在有用信息的过程。而相关数据挖掘技术的过程如下图所示。

首先是要对挖掘对象确定,并且进行采集、清洗、集成和交换。CHI统计方法是用来度量数据中的词语与文档之间的关联情况,在此方法下的词语文档间的一阶自由度[x2]的分布,采用此方法来对于专利数据进行处理,并且分析词语与文档分类间的关联性。CHI值的计算公式为:

[x2t,c=N×AD-CB2A+BB+DA+B+C+D]       (3)

(3)公式用来计算词语与文档中的相关性,[x2]值越高则相关性也就越高,也表示词语对于该文档的类比更加重要。在这里[N]表示文档数据集中的文档总数,[c]表示一个文档的类别符号,[t]表示计算的词语,[A]表示在该文档中的[c]包含的词语[t]的频数,[B]表示并不属于文档[c]的文档里关于[t]词语的出现频数,[C]表示虽然属于文档[c]但并不包含的[t]的出现频数,[D]表示并不属于文档[c]也并不包含词语[t]的文档频数。挖掘专利数据中的词语与文档之间的关联性,以对其关联性进行规制分析。

1.4 关联规则分析

对于专利数据进行关规程的挖掘,采取Apriori算法,该算法也是对于研究关联规则中最具有代表性的算法之一。首先,要建立最小支持度,而支持度的计数是通过定义事物中出现的项的个数,表示为:

[δX=X?ti,ti∈T]                    (4)

公式(4)中,项集[X]是事务[ti]的子集,此时应称事务包括项集[X]。在包含的特定项数的事务上反映它的支持度计数,这里项集[X]的支持度计数为[δX]。目前的Apriori的算法使用了候选项目及的观念,先使用候选项目奖,当候选项目奖的支持度大于或等于最小支持度时,此候选项目集称为频繁项目集。而在后面,要读入所有的交易,以得出候选单项目集的支持度,再找出频繁单项目集,利用这些频繁但项目集的集合,产生新的候选项目集。利用新的候选项目集找到新的频繁项目集,然后利用新的频繁项目集找到第三个候选项目集。而Apriori的算法要通过反复进行上述操作,直到不再出现新的候选项目集为止。在完成关联规则的分析后,要对专利数据的文本特征进行处理。

1.5 文本特征处理

对于文本特征的表示是使用特征信息来代替原来的文本,而文本数据和传统数据的区别在于文本数据是非机构化的数据。当处理时准备用现有的结构化数据的分析技术去分析非结构化的文本数据,面对的问题就是文本信息的结构化问题。在信息处理的过程中,采取向量空间模型来表示,向量的空间模式是对于文本内容特征的表示,向量空间模型的方法是用向量[w1,w2,...,wn]对文本进行表达,在向量空间模型中[wi]的第[i]个特征项权重[5]。在此向量模型中分量的取值常常被定为0或1的形式,在此特征项中的对应分量值为1,出现如果未出现特征项则为0。但是此方法往往无法表达该特征项在文本中的重要程度,所以可以使用词语来作为特征项,而对于绝对词频的计算方法如下:

[Wid=tfdmaxTFt×logNDFt+0.01]    (5)

在公式(5)中[tfdmaxTFt]代表词频,在词频中[tfd]代表单词[t]在文档[d]里出现的次数。[maxTFt]代表单词[t]在文档[d]里出现的最大次数,在该公式中,词频的值越大,表示单词在所在文档里的权重越高。[logNDFt+0.01]代表反文档频数,这里的[N]表示在文档集中的文档数,[DFt]表示单词[t]出现的文档个数。反文档频数表示的是单词的全局权重,当单词在文档中出现的次数变多,它的重要性也就降低。

2 实验论证分析

为了验证此数据处理技术的可行性,使用传统的数据处理技术进行对比实验,选用的数据为专利数据,而在IPC号上所有的现存的数据库中,都是以单个字段来存储一个专利的IPC分类号的,而每个分类号都是以“;”进行分隔,而每个专利号一般拥有4~10个左右的分类号,这也提高了数据分析的难度。使用同一个的专利文档,从原创率、普遍率、引文索引的三种处理方向进行数据处理,并且分析本文处理方法与传统的知识图谱数据处理方法的数据处理速度。实验结果如下:

从图2可得,本文使用的专利数据方法,对比传统方法处理速度更快。虽然数据挖掘技术运算量大容易出现处理速度慢的情况,但是专利数据较为复杂,运用数据挖掘技术对于此类型的数据处理更加方便,所以对比传统方法效率反而更高。但是本实验对比的仅仅是两者的处理速度,并为对其他方面进行对比,研究存在局限性。

3结束语

本文对于基于数据挖掘的专利数据处理技术进行研究,首先是对于专利数据进行聚类分析,然后确立专利指标,根据词语与文档的关联性进行数据挖掘,并且分析关联规则,反应文本的特征来完成数据处理,通过实验论证分析本文方法对比传统方法的数据处理效率更高。但是本研究的实验,仅仅针对两种数据处理方法的处理速度进行对比,并未对其他因素进行对比。研究仍有不完善的地方,仅供参考。

参考文献:

[1] 刘媛.美国自然语言处理技术专利情报分析及启示——基于1999-2018年专利数据[J].科技管理研究,2020,40(6):201-209.

[2] 段博睿,柯波,杨云帆,等.22省专利数据分析及影响因素研究——基于专利发明数据包数据研究[J].科技视界,2019(16):123-124.

[3] 武鵬飞,王爽.四川建筑职业技术学院专利数据分析[J].科技风,2018(29):221-223.

[4] 孔德婧,王坤.基于专利数据的技术投资预测——以快递物流领域为例[J].技术经济与管理研究,2018(8):14-20.

[5] 陈海宇.“大数据”时代背景下计算机信息处理技术的探讨[J].计算机产品与流通,2020(5):6.

【通联编辑:张薇】

作者:许学添 王鹏 陈志泽

专利数据挖掘论文 篇3:

基于数据挖掘分析中药专利复方治疗腹泻型肠易激综合征的用药规律

摘要 目的:應用关联规则、聚类分析等数据挖掘技术,分析中药专利复方治疗腹泻型肠易激综合征的用药规律。方法:检索治疗腹泻型肠易激综合征的中药专利复方,根据纳排标准进行筛选。建立Excel表,对入选的复方进行术语规范化处理,应用数据挖掘软件对数据进行频次统计、频繁项集分析、关联规则分析、聚类分析、复杂网络分析。结果:共得到96首专利复方,频次统计发现用药多温、平,以甘、辛、苦味药为主,使用频次较高的中药包括白芍、陈皮、白术、防风、茯苓、甘草、木香、黄连、麸炒白术、柴胡等;频繁项集分析显示药物配伍以调和肝脾、燥湿止泻为主;关联规则分析显示常见药对包括防风-白芍、柴胡-白芍、炙甘草-陈皮、山药-茯苓等;聚类分析发现3个中药功能模块,即补脾柔肝、祛湿止泻;理气止痛,燥湿止泻;温中散寒、涩肠止泻;复杂网络分析发现核心药物33味,核心配伍的功效为补脾柔肝、祛湿止泻。结论:数据挖掘为临床治疗腹泻型肠易激综合征提供了参考依据,应以调肝、健脾、温肾为基本大法,兼顾涩肠止泻、养心安神、调和寒热等,根据患者症状辨证论治。

关键词 肠易激综合征;腹泻型;肝郁脾虚;中药专利复方;数据挖掘;关联规则;聚类分析;复杂网络

Drug rule Analysis of Chinese Medicine Patent Compound in the Treatment of Diarrhea-Type Irritable Bowel Syndrome Based on Data Mining

HUANG Qiuyue1,2,JIA Xiaofen1,2,ZHANG En′en1,2,LIN Miaomiao1,2,YE Hui1,2,ZHANG Xuezhi1,2

(1 Department of Traditional Chinese Medicine and Integrated Traditional Chinese and Western Medicine,Peking University First Hospital,Beijing 100034,China; 2 Institute of Integrated Traditional Chinese and Western Medicine,Peking University,Beijing 100034,China)

肠易激综合征(Irritable Bowel Syndrome,IBS)是消化系统常见的功能性疾病之一,临床表现为反复发作的腹痛,与排便相关或伴排便习惯(频率和/或大便性状)改变[1]。排便习惯异常主要表现为腹泻、便秘,或腹泻与便秘交替进行,我国以腹泻型(IBS-D)最为多见[2]。目前IBS-D的发病机制尚未完全阐明,西医治疗主要采用解痉药、止泻药、抗抑郁药等对症治疗,在一定程度上改善单一症状,对情绪、免疫状态、肠道内环境等多因素以及与其他功能性胃肠病之间相互重叠等复杂临床问题缺乏疗效满意的方案[3]。临床实践和研究显示中医药治疗IBS-D具有复发率低、不良反应小的优势[4-5]。有研究对治疗IBS-D的中医药复方进行了挖掘,但多基于个人经验,高频用药等结果有一定的差异,体现了诊治的多样性,尚未充分反映更为整体水平的用药规律[6-7]。本研究基于中药专利复方数据库,以具有转化应用潜力的复方为研究对象,采用数据挖掘技术分析中药专利复方治疗IBS-D的用药规律,在为临床治疗提供参考的同时,以方测证、以药测证,在一定程度上反映当前IBS-D的证候特点。

1 资料与方法

1.1 资料来源

国家知识基础设施数据库(China National Knowledge Infrastructure,CNKI)中的专利数据库。

1.2 检索策略

以“肠易激综合征”或“肠易激”和“中药”或“方剂”或“药物组合”为关键词,检索2020年8月10日前所有治疗肠易激综合征的中药专利复方。

1.3 纳入标准

治疗IBS-D的中药专利复方,多种剂型均可(汤剂、颗粒剂、膏方等)。

1.4 排除标准

中药提取物;与西药等联用;超过1/2药物未在《中华人民共和国药典》或《中药学》收录;剂型为代茶饮、养生粥、药酒、外用膏药、穴位贴敷。

1.5 数据的规范与数据库的建立

1.5.1 数据库的建立

建立Excel表,将入选中药专利复方所含的药物信息录入。

1.5.2 数据库的规范

根据《中华人民共和国药典》和《中药学》规范药名,如云苓改为茯苓,杭白芍、炒白芍改为白芍,淮山、粘山药、炒山药改为山药,薏米、薏米苡仁改为薏苡仁,炒白术改为麸炒白术,附子片、制附子改为附子,诃子肉改为诃子,元胡改为延胡索等。

1.6 数据分析

将规范后数据导入古今医案云平台(http://www.yiankb.com/),利用“数据挖掘分析”模块对专利复方中的中药进行频次统计、关联分析和复杂网络分析。借助“中医药数据挖掘平台”(TCM Miner)进行频繁项集统计。利用SPSS Statistics进行聚类分析。

2 结果

2.1 用药频次分析

共纳入96首治疗IBS-D的中药专利复方,含260种中药。复方中药物数量最少为4个,最为37个,用药共1 000频次,平均每首方剂用药10~11个。用药频次前20的中药,药物功效主要为健脾燥湿、柔肝祛风、益气温阳、涩肠止泻等,其中白芍、陈皮、白术、防风、茯苓、甘草的使用频率超过30%。见表1。

2.2 用药属性分析

对药物的属性进行频次统计,四气频次统计显示用药以温(306次,30.60%)、平(224次,22.40%)为主,微寒(118次,11.80%)、寒(95次,9.50%)次之。五味频次统计表明用药以甘(425次,42.50%)、辛(389次,38.90%)、苦(364次,36.40%)为主,酸(154次,15.40%)、涩(68次,6.80%)次之。统计归经频次,前6位分别为脾(580次,58.00%)、肺(357次,35.70%)、胃(341次,34.10%)、肝(336次,33.60%)、肾(226次,22.60%)、心(201次,20.10%)。见图1~3。

2.3 频繁项集分析

2.3.1 两味药组合

以15%的最小支持度进行两味药物组合的频繁项集统计,按支持度高低排序。药物组合以补脾柔肝、燥湿止泻为主,其中陈皮-白芍的支持度>30%。见表2。

2.3.2 三味药组合

设置最小支持度为12%,进行三味药物组合的频繁项集统计。药物组合以健脾燥湿、柔肝祛风为主。其中陈皮-防风-白芍的频次>20%。见表3。

2.3.3 四味药组合

按照相同方法,以最小支持度為10%进行四味药物组合的频繁项集统计。从表中可以看出,药物组合以调和肝脾、祛湿止泻为主,其中白术-陈皮-防风-白芍正是痛泻要方的药物组成。见表4。

2.4 关联规则分析

根据关联规则,设置最低支持度为0.1,最小置信度为0.8,得到关联的药物组合25个。结果显示这些药物组合的功效主要为补脾柔肝,祛湿止泻。常见药对包括防风-白芍、柴胡-白芍、炙甘草-陈皮、山药-茯苓等。见表5。

2.5 聚类分析

对用药频次前20的中药进行聚类分析,大致归为3类:1)补脾柔肝、祛湿止泻:党参、茯苓、麸炒白术、炙甘草、苍术、薏苡仁、山药、陈皮、柴胡、白芍、防风;2)理气止痛,燥湿止泻:延胡索、木香、白术、甘草;3)温中散寒,涩肠止泻:吴茱萸、干姜、乌梅、肉豆蔻。见图4。

2.6 复杂网络分析

2.6.1 核心药物分析

根据节点度筛选核心药物,节点度越高,说明药物在网络中越重要。将节点度设置为68,得到33个核心药物。见图5。

2.6.2 核心配伍分析

根据边权重提取核心药物配伍,边权重越大,说明药物关系越密切,核心药物配伍功效为健脾柔肝,祛湿止泻。边权重≥20、边权重≥30、边权重≥40的药物配伍见图6~8。

3 讨论

中医无“肠易激综合征”的病名,根据症状,IBS-D可归属于中医“泄泻”“腹痛”的范畴,病位在肠,与肝、脾、肾密切相关。此病以湿为中心,湿邪缠绵是重要的病理因素,以肝气郁结贯穿始终,气机失调为标,脾胃虚弱、脾肾阳虚为本,虚实夹杂。即脾胃虚弱和(或)肝失疏泄是IBS-D发病的重要环节,肝郁脾虚是核心病机。其治疗难点在于如何在改善单项症状的同时达到长期症状的改善,并且缓解精神心理伴随症状[8]。中医治疗以补虚泻实为原则,或调肝理脾、或健脾化湿、或清热利湿、或温化寒湿、或平调寒热,以祛除肠道湿邪。以痛泻药方、参苓白术散、乌梅丸等为代表方剂。

本研究首先通过提取高频药物,尝试解读专利复方主要用药。用药频次分析显示高频使用药物的功效主要为健脾燥湿(陈皮、麸炒白术、茯苓、薏苡仁、苍术)、柔肝祛风(白芍、防风、柴胡)、益气温阳(党参、白术、山药、吴茱萸、干姜)、涩肠止泻(乌梅、肉豆蔻)等,符合IBS-D主要病机特点、主要治法,说明虽有组方变化,但其治则治法谨守IBS-D病机。其用药特点在于,在健脾燥湿等治疗泄泻常用药味之外,防风、柴胡等风药具有较高使用频次。IBS-D的发病与风邪关系密切[9]。《医宗必读·卷七·泄泻》:“经曰:春伤于风,夏生飧泄,邪气留连,乃为洞泄……泻皆成于土湿,湿皆本于脾虚。”指出风邪是发生泄泻的病因之一。又肝为风木之脏,主一身之气机,若风木壅滞,气机失调,脾胃气阻,通降不利,水走肠间,遂成泄泻。风药源于金代张元素提出的“药类法象”,是一类药性轻灵、具有辛散升发特点的药物,在IBS-D的治疗中具有升发清阳、健脾胜湿、疏肝理气、开通玄府的作用,对IBS-D的治疗具有画龙点睛的作用[10]。诸多学者在临床治疗IBS-D时注重配伍风药,如刘启泉认为配伍风药可以起到疏肝理脾、祛风胜湿、升举清阳、调气引经的作用[9,11-12]。基础研究表明,风药具有抑菌、抗病毒、抗炎止痛、提高免疫调节功能、解除平滑肌痉挛等作用,为风药的临床使用增加了药理学依据[13-14]。

药物性味分析体现了治疗IBS-D用药温平的特点。药味多甘、辛、苦,甘能补益,辛散行气解郁,苦能燥湿止泻。主要归脾、肺、胃、肝、肾、心经。《黄帝内经》有云,“魄门亦为五脏使”,IBS-D与五脏均有联系。《景岳全书》指出,泄泻之本,无不由于脾胃。脾主运化升清,脾胃虚弱运化不及,则湿邪下注肠道导致泄泻,从脾论治IBS-D,当益气健脾,渗湿止泻。肺主通调水道,与大肠相表里,从肺论治,当宣肺固肠止泻。肝主疏泄条达,肝气横逆犯脾则导致痛泻,从肝论治,当柔肝祛风,缓急止泻。肾主水,肾阳虚衰,水湿无以温化,则留于肠道导致泄泻,从肾论治,当温肾固本止泻。心主神明,调控魄门,且IBS-D患者往往伴随焦虑、失眠等症状,从心论治,当养心安神止泻。

频繁项集分析和关联规则分析发现核心药物组合的功效主要为补脾柔肝,祛湿止泻,不难发现其组成来源于痛泻要方。痛泻要方出自《丹溪心法》,由炒白术、炒白芍,炒陈皮和防风组成,是治疗肝脾不和之痛泻的常用方,临床以肠鸣腹痛、大便泄泻、泻必腹痛、泻后痛缓、脉象弦缓为辨证要点。由于肝郁脾虚、脾虚湿盛、脾肾阳虚仍为IBS-D的主流证候,其中肝郁脾虚最为常见,因而该方也成为IBS-D诊治中应用最为广泛、研究最为深入的方剂[15]。系统评价表明痛泻要方治疗肝郁脾虚型IBS、IBS-D具有良好效果[16-17]。网络药理学显示痛泻要方可通过多种有效成分,多种靶点,多种途径发挥降低内脏敏感性、调解炎症反应、改善肠道功能、调解免疫功能、抗抑郁的作用,从而治疗IBS-D[18-19]。

聚类分析发现3个中药功能模块,即补脾柔肝、祛湿止泻;理气止痛、燥湿止泻;温中散寒、涩肠止泻。复杂网络分析发现核心药物33味,核心配伍为陈皮-白术-白芍-防风。核心药物除了用药频次前20的药物,还有温补肾阳药:菟丝子、杜仲;解郁安神药:香附、郁金、合欢皮、酸枣仁;清热利湿药:马齿苋、泽泻等。中医诊疗专家共识将IBS-D分为5个证型:肝郁脾虚、脾虚湿盛、脾肾阳虚、脾胃湿热、寒热错杂。代表方分别为痛泻要方、参苓白术散、附子理中汤和四神丸、葛根芩连汤、乌梅丸,药物组成与数据挖掘的核心药物相似。

从数据挖掘的用药规律来看,IBS-D核心病机为肝郁气滞、脾虚湿盛,病情反复发作,迁延日久则导致脾肾阳虚,或有脾胃湿热、寒热错杂的情况。提示临床治疗IBS-D时应以疏肝解郁、健脾化湿、温肾助阳为基本治法,兼顾涩肠止泻、养心安神、调和寒热等方法,结合临床具体情况进行辨证论治。

本研究利用数据挖掘技术,揭示了中药专利复方治疗IBS-D的核心药物及配伍关系,为IBS-D的临床用药和新药开发提供了一定参考。其局限性在于,虽然各专利复方的用药规律相对一致,体现了专利复方组方严谨、谨守病机的特点,但总体治法及用药相对单一,而已经发表的文献中对于各类证型的不同用药方案,独有特色不鲜明,或可说过于着眼于肝郁脾虚證一证、痛泻要方一方。这一方面可能与数据挖掘所采用的方法有关:高频用药易被纳入核心组合,易提取诸多组方的共同之处而忽略了主要药物之外的加减变化;另一方面也与专利复方治法的单一性有关。就研究结果来看尚未有新的亮点用药出现,专利作为进一步转化应用的吸引力有限,因而整体上获得授权的比例有限。此外,专利申报内容多基于临床观察、疗效评估,基本仍停留在药物组方层面,还缺少化学-药效学-药动学等阐明其作用内涵的研究。专利内容的新颖性、创造性、完整性,证据的支撑性还不强,没有取得突破性的进展,这与我国整体中医药复方专利申请的数量不断攀升,但整体质量却不容乐观的形势是相同的[20]。因此,在“谨守病机,各司其属”的原则下,包括IBS-D在内的中药复方专利的申请,还应注重原始创新,药效、药理机制的发现,才能够进一步对疾病的新理论和创新药物研发提供更大助力。

参考文献

[1]中国中西医结合学会消化系统疾病专业委員会.肠易激综合征中西医结合诊疗共识意见(2017年)[J].中国中西医结合消化杂志,2018,26(3):227-232.

[2]吴师贤,陈一斌.腹泻型肠易激综合征的中西医治疗进展[J].中医临床研究,2019,11(34):145-148.

[3]吴寒,张振玉.肠易激综合征东西方指南对比解读[J].胃肠病学和肝病学杂志,2019,28(9):961-967.

[4]曹正龙,何镔,潘军,等.国医大师徐景藩抑肝扶脾法治疗腹泻型肠易激综合征经验应用的研究[J].中医药临床杂志,2013,25(7):604-606.

[5]楼茜欣,唐梅文,唐燕,等.腹泻型肠易激综合征中医治疗进展[J].辽宁中医杂志,2020,47(10):206-208.

[6]汪玲羽,施一春,朱海燕.基于验案数据挖掘探讨连建伟治疗腹泻型肠易激综合征用药规律[J].浙江中医杂志,2020,55(3):170-171.

[7]叶倩云,陈卓群,杨伟钦,等.基于数据挖掘的刘凤斌治疗肠易激综合征用药规律分析[J].长春中医药大学学报,2018,34(2):264-267.

[8]中华中医药学会脾胃病分会.肠易激综合征中医诊疗专家共识意见(2017)[J].中医杂志,2017,58(18):1614-1620.

[9]郭军雄,马丽,许小敏.风药论治腹泻型肠易激综合征探析[J].中国中医基础医学杂志,2019,25(2):166-167,190.

[10]许琳,王凤云,唐旭东,等.风药在肠易激综合征治疗中的应用[J].中医杂志,2016,57(23):1999-2003.

[11]李京尧,石芳,刘阳,等.风药在腹泻型肠易激综合征中的临床应用[J].环球中医药,2019,12(1):109-111.

[12]李京尧,赵蓓蓓,卫静静,等.刘启泉运用风药治疗腹泻型肠易激综合征的经验[J].时珍国医国药,2019,30(1):195-196.

[13]刘明坤,吴春雁,房玉涛.风药固肠止泻机制探讨[J].中华中医药杂志,2017,32(10):4600-4602.

[14]王楠,朱平.风药在内科疾病中的运用[J].河南中医,2018,38(1):29-33.

[15]陈婷,唐旭东,王凤云,等.腹泻型肠易激综合征中医辨证的源流及发展趋势[J].中华中医药杂志,2015,30(8),2671-2674.

[16]崔树婷,刘喜平,崔国宁,等.参苓白术散与痛泻要方对溃疡性结肠炎大鼠BMSCs向结肠黏膜组织归巢作用的影响[J].中成药,2020,42(2):480-484.

[17]王咏梅,时亚娟,王维国.以痛泻要方为基本方治疗肝郁脾虚型肠易激综合征临床疗效的系统评价[J].世界中医药,2017,12(9):2223-2227,2231.

[18]李帮洁,缪乐涛,芮俊乾,等.痛泻要方主要有效成分的多靶点网络构建与机制分析[J].中国实验方剂学杂志,2018,24(8):206-213.

[19]缪乐涛,张婧娴,芮俊乾,等.基于系统药理学探索痛泻要方治疗肠易激综合征的分子机制[J].中国现代中药,2017,19(11):1555-1561.

[20]寇学芳,徐文.浅析我国中药专利保护的现状与对策[J].中国药物警戒,2016,13(9):533-536.

(2021-03-04收稿 本文编辑:张乐杰)

作者:黄秋月 贾晓芬 张恩恩 蔺苗苗 叶晖 张学智

上一篇:网站网页设计论文下一篇:食品工业发展论文