人工智能(AI):或许是解救苦海中IPer的一味良药(下)


笔者在上篇介绍了人工智能在专利智能审查和专利机器翻译两个方向上的应用(人工智能(AI):或许是解救苦海中IPer的一味良药(上)),下篇将对人工智能在专利语义检索和专利价值评估的应用方面作一些展望。

专利语义检索

enter image description here

专利的语义检索是无数专利检索人员所追求的一种诱人的终极检索模式,犹如飞蛾扑火,因为一旦实现,专利检索人员也就消亡了。对于语义检索,笔者认为应该包括两个层面,第一个层面是语义理解,另外一个层面是相似度排序。

对于相似度排序,目前理论基础和算法已经非常成熟,通过将每篇专利文本转换到向量空间中去,每一篇文本就是一个向量,通过计算两个向量之间夹角的余弦值来计算两个向量之间的相似度,从而对检索结果进行排序。

另一个层面是语义理解,涉及到自然语言处理的领域。在语义理解上,英文比中文(包括韩文和日文等亚洲语系)具有很大的优势,因为英文文本中有天然空格进行分割,不涉及到分词的问题,而且英文的语义网络已发展的比较健全(例如Wordnet)。对于中文,专利文献的中文分词和中文语义网络的构建还有很长的路要走。

对于专利的语义检索,目前已经有很多商业性工具能够提供,例如以语义检索作为主打的Patentics。而尤为值得一提的是,2016年10月26日,日本野村综合研究所有限公司NRI-CyberPatent与日本人工智能大数据分析服务公司FRONTEO启动人工智能专利检索联合项目。NRI CyberPatent Desk 2检索系统将提供专利信息搜索引擎,FRONTEO公司Lit i View PATENT EXPLORER将提供专利研究和分析系统。

此次合作将为不同层次的专利分析(例如现有技术和无效检索)开发设计有效的解决方案,并设计了基于人工智能的流程。语义检索仍然是未来专利检索发展的方向,无限逼近理想,同样也能最大限度的降低专利检索的难度。

专利价值评估

enter image description here

关于专利价值评估,笔者觉得现在越来越觉得像是一种玄学。专利价值只有在发生了体现价值的事件才能够最终确定,在此之前进行的评估,多半是自圆其说,只不过各有各家的理论罢了。

笔者本次讨论的并不是严格意义上的专利价值评估,而只是一种专利的量化评分。这种评分只能是用于专利管理或者是专利分析的一种指标。对于专利量化评分体系的构建,目前通常采用的是一种确定影响专利价值的评价指标,然后分别对各指标赋予权重,最后经过数理统计的方法进行回归分析,建立一套评分模型。

而这种模型的构建方法其实仍然是一种最原始的线性回归分析方法,对于所选取的指标和所赋予的权重存在很大的人为因素。而在专利的量化评分方面引入人工智能,则可以采用更为复杂的机器学习算法,机器学习尤其擅长回归分析。

提到专利量化评分,就必须提及INNOGRAPHY的专利强度。INNOGRAPHY的专利强度就是一种采用大数据和机器学习的算法获得的评分。对于机器学习算法,训练样本的选择是重中之重。INNOGRAPHY的专利强度理论依据主要来自《valuable patent》这篇论文,其中阐述了与专利价值相关的一系列指标,同时根据实际情况,通常发生诉讼的专利的价值相对会比较高,这些涉诉专利自然也就成为用于机器学习训练的天然样本。

通过这个训练样本建立评价模型,从而进行量化评分。由于样本是动态变化的,因此这个评分模型不是一成不变的,而是动态的,这也就是INNOGRAPHY专利强度的精妙之处。即便如此,专利强度评分与专利价值评估也是不能等同的,只不过是可以作为一个重要的参考指标。

在上篇发文之时,恰逢两会召开,关于人工智能也受到广泛关注,并被写入2017年政府工作报告。但是人工智能在专利信息领域的运用可能还有较长的路要走,因为人工智能需要密集性资金和高水平人才投入,只有在商业前景逐渐明朗的情况下,这些要素才会聚集。不管怎样,人工智能仍然是专利信息服务未来发展的方向。(全文完)

发表评论