墙外的Google Patents,现在开的什么花?


自从2006年Google推出Google Patents服务以来,目前已经过去了10年,由于2009年Google在中国陷入“涉黄门”,Google宣布全面退出中国,随后Google Patents在国内的服务也噶然而止。而当时Google Patents还是培育期的幼苗,现如今已经长成挺拔的秀木,只不过是立于墙外。墙外的Google Patents到底开了什么花?笔者今天与您一起来欣赏一下。

1.专利数据覆盖面趋于全面

enter image description here 在2006年Google Patents推出伊始,实际上仅包括了美国专利数据,在很长一段时间内,数据范围并未扩大。一直到2012年,Google Patents 才将欧专局的数据进行收录更新。而这时已经距离Google退出中国两年了。随后,在2013年,Google Patents 进一步将专利文献范围扩大到了WIPO,丹麦(DPMA),加拿大(CIPO)和中国(SIPO)。所有的非英语语言都被翻译为英语并且可检索了。其中对于国内用户而言,最大的更新在于收录了中国专利,可以使用中文进行检索。其中,中国的专利不仅包括了发明名称、摘要、申请人等著录项目,还包括了专利权利要求书和说明书的全文文本,同时还提供了PDF的全文下载!此后,Google Patents就开始持续扩大专利文献数据的范围。截止目前,已经覆盖了美国、欧洲、韩国、中国、日本、俄罗斯、英法德等17个世界主要国家和地区的专利全文数据。Google Patents的检索主界面上点击“around world”也会实时显示当前所覆盖的专利文献范围,通过点击每个国家的的缩写,就可以显示该国的专利收录范围。

2.与Google Scholar联合检索

enter image description here 熟悉专利检索的朋友都知道,专利里面有一个“现有技术”的概念,即在申请日以前为公众所知的技术,其中重要的体现形式就是出版物公开,包含专利文献、学术期刊以及书籍等。在进行现有技术检索时,我们通常是先对专利文献进行检索,然后再换一个非专利数据库对期刊进行检索,尤其是笔者在当审查员的时候,时常幻想着要是能够直接输入检索词,就可以实现对专利文献和非专利文献进行检索该多好!而如今,Google Patent 已经将梦想变为现实。2015年,Google Patents中嵌入了Google scholar的所有数据,使用者就可以决定是否选择同时对非专利文献进行检索了。而且这并不是简单的数据合并,Google还利用机器自动分类的方法,将Google scholar中的数据用CPC分类体系进行分类标引。也就是说,我们也可以用CPC同时实现对专利文献和非专利文献进行检索。而这朵花,笔者认为是独一无二的。

3.文本片段检索

enter image description here 在Google patents检索入口中除了可以输入单个检索词之外,同样可以输入文字片段进行检索。尤其是在当前专利数据库覆盖了中国专利之后,我们可以直接输入中文进行检索。在输入中文之后,Google会自动对中文进行分词处理,然后根据分词处理结果自动生成检索式。这种方式严格意义来讲还是采用关键词检索,只不过进行了分词处理。文本片段检索类似于语义检索,但是与真正的语义检索又不完全一样,仅仅是通过自动提取关键词来自动生成检索式,用户可以对检索式进行人为修正。这比纯粹采用语义算法进行检索有多了一份灵活性。关于文本片段检索,最大的亮点在于除了可以采用英文文本进行检索之外,还可以采用中文、日文、韩文等其他非英语语言进行检索,这主要是借助于强大的Google Translate。 enter image description here

4.单篇专利相似文献查找

enter image description here

2012年,Google Patents还专门推出了“Prior Art Finder”工具,当我们进入单篇专利后,会出现“Find Prior Art”按钮,通过点击该按钮,则可以从该篇专利文献中自动抽取关键词并形成检索式来进行检索,同时会对公开日期进行限制,仅检索优先权日之前的文献。除此之外,在单篇文献浏览界面还提供了“similar documents”的推荐,Google Patents会针对该篇专利的文本相似度推荐25篇专利以列表的形式给出,这个功能类似于语义检索。但是应该注意的是,由于该相似文件的推荐是基于文本来进行的,当我们切换到英文文本时,所推荐的文献也同时会发生变化。因此在查找相似技术时,可以使用Prior Art Finder工具和“similar documents”进行快速查找,会极大提高现有技术检索的效率。

除了上面介绍的主要功能之外,Google Patents对于检索筛选界面以及检索语法都进行了很大更新,鉴于篇幅所限,就不一一列举了,感兴趣的朋友可以去实际体验一下,相信也会有很多新的收获。从目前Google对专利检索的认识上来看,未来的数据资源将会越来越全面,同时借助Google scholar,Google translate的技术优势,随着对专利检索的深入理解,也很容易引用更加先进的检索算法,功能上也会更加强大。但是目前Google Patents仍然是立足于专利检索,并未出现专利统计分析的相关功能。如果Google Patents在对数据资源进行整合完善后,继续专利分析功能进行增强,其杀伤力将会是巨大的。一旦哪天这堵墙倒掉,Google Patents恐怕就已经长成参天大树。

发表评论