专利分析方法之共现分析基本原理


共现分析的基本定义

共现分析,顾名思义,就是根据项目是否共同出现来分析的一种方法,比较学术的定义为将各种信息载体中的共现信息定量化的方法,用来揭示信息的内容关联和特性 项所隐含的寓意。共现分析方法论基础是心理学的邻近联系法则和知识结构及映射结构。在文献计量研究中,共同出现的特征项之间一定存在某种关联,关联程度可 以用共现频度来测定。

共现分析根据所研究共现项不同,通常可以分为共引分析、共词分析和共类分析。但是从数据库的角度理解,一般结构化数据均包含字段名和字段内容两部分,只要字 段内容是由多个项组成的,那么理论上这个字段就可以进行共现分析。例如,对于“作者”字段,通常包括多个作者合著,那么就可以对作者的共现情况进行分析, 也叫合作分析或合著分析;对于“引文”字段,一般的文献会包括多个参考文献,对参考文献的共现情况进行分析,则称之为共引分析;对关键词字段,对多个关键 词之间的共现关系进行共现分析,则为共词分析。对于专利文献,通常会分配一个专利分类号,诸如IPC,EC,FI,FT等,则对分类号共现的情况就可以进 行共类分析。如果对专利数据库比较熟悉,可以很轻易的举出包含可能包含多个项的数据字段:专利权人、发明人、关键词、IPC分类号、德温特手工分类号(MC)、FT分类号、UC分类号、引文字段……以上都可以进行共现分析。

共现在分析基本原理

进行共现分析的关键是要构建共现矩阵,并根据该共现矩阵形成网络图,并根据网络图来进行共现分析。共现矩阵也叫相邻矩阵或邻接矩阵,这是网络分析的中的一个 术语。共现分析从本质上属于网络分析。下面以一个简单的例子说明如何构建共现矩阵。首先给出P1,P2,P3三篇专利文献,其发明人均为多个发明人。 $$\begin{array}{cc} 公开号 & 发明人 \end{array} $$ $$\begin{array}{cc} P1 & A,B,C \end{array} $$ $$\begin{array}{cc} P2 & B,C,D \end{array} $$ $$\begin{array}{cc} P3 & A,B,C,D \end{array} $$

首先建立共现关系,对于P1,发明人为“A,B,C”,则存在A-B、A-C、B-C三种共现关系。这样上表可以进一步展开为共现关系明细表,如下:

$$\begin{array}{cc} P1 & A-B \end{array} $$ $$\begin{array}{cc} P1 & A-C \end{array} $$ $$\begin{array}{cc} P1 & B-C \end{array} $$ $$\begin{array}{cc} P2 & B-C \end{array} $$ $$\begin{array}{cc} P2 & B-D \end{array} $$ $$\begin{array}{cc} P2 & C-D \end{array} $$ $$\begin{array}{cc} P3 & A-B \end{array} $$ $$\begin{array}{cc} P3 & A-C \end{array} $$ $$\begin{array}{cc} P3 & A-D \end{array} $$ $$\begin{array}{cc} P3 & B-C \end{array} $$ $$\begin{array}{cc} P3 & B-D \end{array} $$ $$\begin{array}{cc} P3 & C-D \end{array} $$

表2:共现关系分解

进而根据上表进行统计共现频次,对发明人A,B,C,D形成共现矩阵,其中A-B和B-A是等同的,没有方向性,该矩阵也是以对角线对称分布的。

$$\begin{array}{ccccc} & A & B & C & D \end{array} $$ $$\begin{array}{ccccc} A & 0 & 2 & 2 & 1 \end{array} $$ $$\begin{array}{ccccc} B & 2 & 0 & 3 & 2 \end{array} $$ $$\begin{array}{ccccc} C & 2 & 3 & 0 & 2 \end{array} $$ $$\begin{array}{ccccc} D & 1 & 2 & 2 & 0 \end{array} $$

共现矩阵形成之后,就可以借助目前的网络分析软件来绘制网络图从而根据网络形态进行网络分析了。最后上一张对发明人所做的一张共现分析网络图。

enter image description here

当然本文只是讲解了共现分析的基本原理,但是在共现矩阵的形成需要对数据进行预处理来获得。目前对非专利文献,特别是WoS数据库的共现分析工具比较多(例 如Citespace2),而对特定专利数据库的特定字段的共现矩阵的形成则没有成熟的工具(Citespace2中还可以对DII数据进行共现分析)。 此外,对于如何根据共现矩阵进行后期的可视化分析以及聚类分析也将是共现分析的重点。

发表评论