- 相关推荐
基于专利共被引的世界500强企业技术竞争的专利地图分析
引言
在科学文献的引用行为中,引用动机大多是出于正面因素,例如向开拓者致敬(credit topioneer),对有关著作给予荣誉(honor to literature)等等,因此科学文献的引用体现出了一种知识的继承关系。与科学文献的引用动机不同的是,专利文献的引用动机则大多旨在指出所引用技术的问题、不足或缺陷,表达着对所引用技术的否定态度[1],所以专利的引用表达的更多的是技术的竞争关系。
技术竞争情报(Competitive Technical Intelligence)是指能给组织的竞争地位带来重大影响的外部科学或技术的威胁、机会或发展的信息,以及这些信息的获取、监控、分析、前瞻和预警过程[2]。专利计量方法已经成为企业技术竞争情报研究的一种主要手段[3, 4]。
在此前的研究中,作者通过建立大型专利共被引矩阵,对世界500 强中的工业企业的专利发表强度、被引情况、专利共被引网络进行了研究[5]。本文在以往研究的基础上,基于企业专利前向引用构建企业专利共被引矩阵,结合科学计量学领域近年来迅猛发展的信息可视化技术,对世界500 强企业进行技术竞争地图分析。
1 国内外研究现状
1.1 专利计量方法
作者在Web of Science 数据库(SCI、SSCI、A&HCI)和中文CNKI 中检索专利的相关文献,检索发现,目前关于专利的研究非常多,但主要是从专利法学角度进行的研究,定量分析的研究并不多见,尤其是专利共被引的研究很少,从Web of Science 中仅检索到3 篇相关论文,CNKI 中仅2 篇与专利共被引相关的论文(检索时间截至到2012 年8 月20 日)。
关于专利的研究主要集中在如下几个方面:
(1)专利统计分析专利统计分析是最常见的专利研究方法。包括专利的发明人统计、专利权人统计、专利分类号统计、专利的时序分析等等。
(2)专利引用分析早在1949年,Seildel就首次系统地提出专利引用分析的概念[6]。到了1966年,Seidel的设想被Garfield实现。Garfield仿照他创立的科学引文索引(即SCI数据库)的理念,利用美国专利商标局(USPTO)建立专利引文索引(patent citation indexing)[7]。1994年,Narin正式提出基于专利引用分析的专利计量学的概念[8]。近年来,国内关于专利引用分析的研究也日渐兴盛,例如杨中楷、梁永霞等对专利引用过程中知识活动的研究[9, 10],向希尧、蔡虹基于专利引用对技术溢出的分析[11]。
(3)专利共被引分析目前关于专利共被引的研究并不多见。主要有:Mogee等对礼来大药厂的专利进行共被引聚类分析来识别礼来药厂的主要技术前沿[12];Kuei-Kuei Lai利用专利共被引分析试图建立新的专利分类系统[13];国内方面,邱均平等对有机电激发光技术领域的69项高被引专利的共被引分析[14]、以及基于专利权人共被引分析对皮肤洗护类专利进行了研究[4];王贤文基于专利共被引方法对世界500强中的工业企业的大型专利共被引网络分析[5]。
(4) 专利内容图分析上述的统计、引用、共被引分析主要来自于科学计量学领域,而专利内容图分析主要是利用信息科学中的数据挖掘技术,深入到专利内容的文本内部。这方面包括Thomson Reuters公司Aureka 的专利地图功能、Derwent Analytics 的文本聚类分析功能、亚利桑那大学Hsinchun Chen 开发的基于SOM 算法的专利内容地图分析[15],以及通过对文献关键词聚类建立语义网络来探测新兴技术[16]。
整体看来,目前专利计量学在研究方法上以数量统计分析为主,关于引用、共被引的分析方法仍不多见,少数有关专利共被引的研究也只是涉及到某一领域的企业和专利。从未来的发展趋势来看,专利计量研究将更多地融入科学计量学中的引用分析、共被引分析,信息科学中的可视化技术、文本/数据挖掘方法,从而使得研究者们更多地深入专利数据的内部实质,更好地把握技术竞争结构,开展技术竞争情报研究。
1.2 专利计量在企业技术竞争情报研究中的应用
专利计量方法是技术竞争情报研究的一种主要手段。例如Breitzman等基于专利引用分析对企业的合并、收购进行技术竞争情报分析[3];王贤文基于专利共被引方法对世界500强中的工业企业的技术竞争分析[5];邱均平、罗力等基于专利权人共被引对皮肤洗护类企业技术竞争情报进行了实证研究[4];孙涛涛、金碧辉基于专利文献耦合和专利引用关系挖掘DVD激光头技术中的关键技术,研究企业技术竞争情报[17];王兴旺、孙济庆研究了专利地图与技术竞争分析之间的深层次联系,提出基于专利地图的技术竞争三维分析法[18]。
这些文献对企业技术竞争情报分析具有重要价值,有些还具有开创性的意义。然而,这些研究在研究对象的选择上都是侧重于分析某个企业、领域、行业,很少从宏观整体的角度来研究众多企业所形成的技术竞争结构。这其中的一个关键原因就是这些研究均是从专利的后向引用角度来进行分析。如果要对不同技术领域之间的专利进行共被引分析,例如本文选择的500强企业涉及到51个行业,从后向引用的角度则无法实现为数众多的企业共被引网络的构建。
2 数据与方法
2.1 数据
2.1.1 专利数据库
本文的专利数据来自于德温特创新索引(Derwent Innovation Index)。该专利数据库是以德温特世界专利索引(Derwent World Patent Index)和德温特世界专利引文索引(PatentsCitation Index)为基础形成的专利信息和专利引文信息数据库,于1948年在英国创建,是Thomson Reuters集团除了Web of Science之外的另一重要产品,目前是世界上最大的专利文献数据库,总计收录了19,204,885条专利数据(查询时间:2012年6月16日),并且还在以每周增加数万条的速度不断更新。
2.1.2 样本选择世界
500强(Global 500)是《财富》杂志(Fortune)按照营业收入评选出的世界上500家最大的公司,每年评选一次。该榜单对评选出的500家企业分成了49个行业领域,其中企业分布数量最多的行业分别是炼油41家、商业银行41家、车辆与零部件29家、电信18家、金属18家。
通过从德温特创新专利引文索引数据库中分别检索这些企业的专利发表数量,最后选择专利发表数量大于100 的前232 家企业,作为本文的研究样本。这些企业的行业分布如表1所示。
2.1.3 基于专利前向引用的全域共被引矩阵构造方法
根据 Web of Science 的解释,前向引用(forward citation)关系为某篇文献被哪些新的文献所引用,后向引用关系则为某篇文献引用哪些更早时期的文献。
以往的共被引分析都是针对后向引用关系来构建共被引矩阵。这种方法类似于社会网络分析中的雪球方法(Snowball Methods),从一个或者一组顶点开始,搜寻其他与之关联的顶点,然后构造出一个网络[20]。例如检索甲骨文公司,得到2542 条专利,通过对这些专利的1 万余条引用专利进行分析,构建出共被引矩阵。这种共被引关系可以称为局域共被引关系(Local Co-citation)。但是由于从原始数据中获得初始顶点的有限性,通过这种后向引文关系得到的共被引矩阵存在局限性。如果我们要研究汽车企业和电子、化工企业之间的专利共被引关系,利用后向引用关系则很难实现。
而通过专利的前向引用关系,可以构建出大型的专利共被引网络。类似于社会网络分析中的全网络方法(Full Network Methods)[19],即首先确定所有的顶点(企业),然后搜寻每一个顶点与其他顶点的所有关系(专利共被引关系),这种共被引关系为全域共被引关系(Global Co-citation)。但是这种方法的缺点是必须要处理海量的数据信息。因为一个企业的专利可能被成百上千的其他企业所引用,如果要分析多个企业之间的专利共被引关系(例如本文中的232 家500 强企业),涉及到的专利数量则数以千万计。
如所示,a0 为企业a 的发表专利集合,a1 为a0 的引用专利集合(后向引用),a2为引用a0 的专利集合(前向引用);b2 为b0 的前向引用专利集合。通过对a2 和b2 取交集运算,得到企业a、b 的专利共被引次数。同理,对任意两家企业的前向引用专利集合进行交集运算,最终构造出全部232 家企业的专利共被引矩阵。
表2列出了部分企业的专利共被引矩阵,检索时间段设定为2000-2012年。对角线上的数值为企业的专利总被引次数,其余数值为两家企业的专利共被引次数。专利被引次数最多的企业为日立公司,总被引264637次,它与东芝公司的专利共被引次数为65965次,与IBM的专利共被引次数为65965次。
2.2 方法
2.2.1 共被引系数矩阵由于不同企业发表的专利数量差别很大,例如汽车行业的丰田、福特;电子电器行业的索尼、松下、飞利浦历年发表的专利数量都数十万计。而信息技术的甲骨文、埃森哲历年发表的专利只有几千条。所以必须对原始的共被引次数矩阵进行标准化处理,即创建共被引系数矩阵。常见的计算共被引系数矩阵的方法有Jaccard系数、Cosine系数等,但是Van Eck与Waltman 认为关联强度(association strength)指标比Jaccard和Cosine更适合用来进行聚类分布的分析[20]。本文在此采用关联强度的计算方法将表2中的共被引次数矩阵转换成共被引系数矩阵,如下式所示:
2.2.2 专利地图构造类似于多维尺度分析(multidimensional scaling),在这一步骤中,将企业按照相似性矩阵中的相似性距离关系反映到二维平面中。企业i和企业j在地图中的距离是根据二者之间的相似度sij来计算的。两家企业的相似度越大,在地图中的距离则越小。
3 结果
3.1 基于相似性矩阵的企业聚类分布作者在此采用荷兰莱顿大学科学与技术研究中心(Centre for Science and TechnologyStudies,Leiden University)开发的VOSviewer 对232 家世界500 强企业进行可视化分析[20]。VOSviewer 与其余软件的多维尺度分析分析(例如SPSS、Ucinet、Pajek)所不同的是,为了避免样本数量太多造成点和标签的重叠,它在构图的时候开发出独特的去除重叠标签和层级显示技术,突出显示最重要节点的标签,如图2 所示。图中的232 个节点代表了232 家企业,节点的大小反映了该企业的被引次数,例如被引次数最高的企业日立公司(被引264637 次),其节点尺寸也是最大的。两节点之间的距离反映了两企业的共被引关联强度,例如左上角丰田汽车、日产汽车、通用汽车之间的距离非常小。由于VOSviewer 在构图上的去除重叠标签和层级显示技术,有部分节点的标签显示得比较淡或者没有显示,而那些最为重要的节点则得到突出显示。节点的不同颜色是按照Fortune 500 给每个企业的行业归类来划分的。39 种颜色代表了这232 家企业分属的39 种行业。 VOSviewer 中对全部232 家企业进行聚类。首先选择程序默认的Resolution 等于1.0,得到6 个聚类。如图3 所示。
进而选择 Resolution 等于2.0,得到24 个聚类,比较图4 与图3 可以发现,最明显的差异有两处:(1)图3 中右上方较大的节点都被划分成独立的聚类。例如三菱电机与日立、东芝、松下本来都属于电子电器行业,但是在图4 中它们被划分成许多分散的聚类。(2)图3 左下角的大聚类被重新划分为3 个小聚类,分别是最下边的杜邦、拜耳、默克、雅培等组成的化工制药聚类;化工制药聚类右上方由联合技术、波音、通用电气、霍尼韦尔等组成的航空国防聚类;以及其他零散企业组成的综合聚类。
如果进一步提高Resolution 值,会对被引次数较小的那些企业进行更为准确的聚类。传统的聚类分析都是通过树状图和龙骨图对样本进行聚类,如果样本过多的话(例如本文中的232 个样本),则需要很大的构图空间。而VOSviewer 创造性地将多维尺度分析与聚类分析结合起来,既大大节省了构图空间,又可以更加清晰直观地对聚类与聚类之间、样本与样本之间的关系进行判断。
从对 232 家世界500 强企业的聚类分布结果来看,电子电器、汽车、化工制药、航空国防、信息技术是最为突出的技术群。从聚类之间的位置来看,航空国防对电子电器技术和汽车技术都起了很重要的桥接作用。
3.2 基于 Kernel 密度插值分布
的技术竞争整体结构分析在图 4 的聚类分布的基础上,进一步对232 家企业进行Kernel 密度函数插值分析,从而更好地了解企业技术竞争的整体结构。
图为对232 家企业的专利共被引矩阵的Kernel 插值分布结果。图中红色区域代表企业分布密度最大,蓝色区域则代表企业分布稀疏。图4 中的企业的位置分布与图2、图3 完全一致,但是根据图4 的Kernel 密度函数插值分布,可以看到这223 家企业形成的技术竞争结构,其中以东芝、日立、NEC、富士通、IBM 等企业为代表的电子电器、信息技术是分布密度最大的区域。其次以丰田为代表的汽车技术领域,杜邦为代表的化工技术领域也比较显著。按照Nees Jan van Eck 与 Ludo Waltman 对VOSviewer 软件的解释,分布在这些红色区域中的企业整体上的专利被引次数也是相对最高的。
3.3 基于共被引网络的关键企业分析
在利用社会网络工具绘制共被引网络的时候,Leydesdorff 认为,Jaccard 系数更适合计算共被引强度矩阵[21]。因此,作者在此处采用Jaccard 系数方法将表2 中的共被引次数矩阵转换成共被引系数矩阵,再进一步利用社会网络分析工具Netdraw 进行分析。
设定阈值为0.03,网络中一共保留有132 个节点和1230 条连线,节点的大小是根据节点在网络中的中介中心性(betweenness centrality)大小计算出来的,节点连接不同聚类的连线越多,其中介中心性越大,因此中介中心性很好地体现了节点连接不同技术群聚类的关键性作用。图5 的共被引网络也呈现出清晰的技术聚类结构,例如由默克、辉瑞、百时美施贵宝、诺华、葛兰素史克、礼来等形成的制药产业技术群;由杜邦、陶氏、巴斯夫、拜耳形成的化工产业技术群;由福特、通用、大众、马自达等形成的汽车产业技术群;以及最中心的由索尼、东芝、西门子、日立、三星电子等形成的电子电器产业技术群等等。
然而,最关键的是,通过图5 的共被引网络,可以挖掘出使不同技术群产生联系的关键企业。例如,汽车产业技术群与电子电器产业技术群、化工产业技术群与电子电器产业技术群都是通过通用电气公司产生联系;而数据库巨擘甲骨文公司则使银行产业技术群与中央的主网络产生联系。我们在图6 中用虚线环标记了若干关键性企业,包括通用电气公司、杜邦化学、IBM、甲骨文、亚马逊网站等等。
而这些企业之所以成为关键性企业的原因,有如下两点:(1)该企业的核心技术具有多元化发展的特征,例如通用电气公司包括11 个业务集团,除了生产消费电器、工业电器设备外,还涉足武器制造、宇宙航空仪表、喷气飞机引航导航系统、多弹头弹道导弹系统、雷达和宇宙飞行系统等。(2)该企业的核心技术具有较强的基础性。例如甲骨文公司的数据库产品在金融服务业领域的广泛应用。
4 结论
本文通过从专利的前向引用关系构建出世界500 强企业的专利共被引矩阵,从而使得对众多不同行业的专利共被引研究成为可能。结合社会网络分析及信息可视化技术,本文对专利数量大于100 的232 家世界500 强企业进行技术竞争地图的实证研究,研究技术群的聚类分布、技术竞争的整体结构,以及挖掘技术竞争网络中的关键性企业。电子电器产业作为专利发表强度最突出的行业领域,在技术整体竞争中发挥了非常重要的作用。航空国防产业则在电子电器与汽车产业之间形成了重要的桥接作用。通过共被引网络挖掘出中介中心性最大的关键性企业,例如通用电气、IBM、甲骨文,其在不同产业之间的技术桥梁作用也非常重要。
[参考文献]
[1] 李睿,孟连生. 论专利引用行为与期刊论文引用行为在揭示知识关联方面的差异[J]. 情报学报,2012,29(3): 474-478.
[2] 李艳,赵新力,齐中英. 技术竞争情报的现状分析[J]. 情报学报, 2006,25(2): 242-253.
[3] Breitzman A, Thomas P, Cheney M. Technological powerhouse or diluted competence: techniques forassessing mergers via patent analysis[J]. R & D Management, 2002,32(1): 1-10.
[4] 邱均平,罗力,苏金燕, 等. 基于专利权人共被引的企业技术创新态势研究[J]. 情报科学, 2012,(2):161-165.
[5] 王贤文,刘则渊,侯海燕. 基于专利共被引的企业技术发展与技术竞争分析:以世界500 强中的工业企业为例[J]. 科研管理, 2012,31(4): 127-138.
[6] Seidel A. Citation system for patent office[J]. Journal of the Patent Office Society, 1949,31: 554-567.
[7] Garfield E. Patent Citation Indexing and the Notions of Novelty, Similarity, and Relevance[J]. Journal ofChemical Documentation, 1966,6(2): 63-65.
[8] Narin F. Patent bibliometrics[J]. Scientometrics, 1994,30(1): 147-155.
[9] 杨中楷,梁永霞, 刘则渊. USPTO 中我国专利引用状况的统计分析[J]. 图书情报工作, 2012,(02): 42-46.
[10] 杨中楷,梁永霞,刘倩楠. 专利引用过程中的知识活动探析[J]. 科研管理, 2012,(02): 171-177.
[11] 向希尧,蔡虹. 跨国技术溢出网络结构分析与路径识别——基于专利引用的实证分析[J]. 科学学研究,2012,(09): 1348-1354.
[12] Mogee ME. Patent co-citation analysis of Eli Lilly & Co. patents[J]. Research-Technology Management,1991,34(4): 43-49.
[13] Lai KK, Chang SM, Chang SB. Using patent citation to explore knowledge flow between differentindustries[M], 2007.
[14] 邱均平,马瑞敏,徐蓓, 等. 专利计量的概念、指标及实证——以全球有机电激发光技术相关专利为例[J]. 情报学报, 2012,27(4): 556-565.
[15] Li X, Lin Y, Chen H, et al. Worldwide nanotechnology development: a comparative study of USPTO, EPO,and JPO patents (1976-2004)[J]. Journal of Nanoparticle Research, 2007,9(6): 977-1002.
[16] Kim Y, Suh J, Park S. Visualization of patent analysis for emerging technology[J]. Expert Systems withApplications, 2012,34(3): 1804-1812.
[17] 孙涛涛,金碧辉. 关键技术挖掘与企业技术竞争情报——以 DVD 激光头技术为例[J]. 图书情报工作,2012,52(5): 129-132.
[18] 王兴旺,孙济庆. 专利地图在技术竞争分析中的应用研究[J]. 图书情报工作, 2012,53(12): 79-82.
[19] Hanneman R, Riddle M. Introduction to social network methods[EB/OL].
[20] Van Eck NJ, Waltman L. Software survey: VOSviewer, a computer program for bibliometric mapping[J].Scientometrics, 2012, 84:523–538.
[21] Leydesdorff L. On the normalization and visualization of author co-citation data: Salton's cosine versus theJaccard index[J]. Journal of the American Society for Information Science and Technology. 2012, 59(1):77-85.
【基于专利共被引的世界500强企业技术竞争的专利地图分析】相关文章:
中国企业500强与世界500强的比较12-07
企业专利资本化战略12-07
基于企业生态位理论的企业竞争策略研究03-19
企业专利申请战略的运用探讨03-23
高新技术企业基于价值链的竞争战略分03-01
基于技术跨越的企业技术学习探讨03-22
探讨世界500强的项目管理03-13
基于价值链理论的企业品牌竞争策略03-24