每月归档: 2016年8月s


专利分析中的开源运动(2)——专利数据的清洗 4

在前一篇中,我们对专利数据开放以及专利数据的获取方式进行了阐述,但是在获得专利数据后通常不能直接用于专利分析,而必须对专利数据进行清洗。本篇将进一步对专利数据的清洗进行介绍。 专利数据清洗的目的 为什么需要对专利数据进行清洗呢,主要是有以下原因:其一是获取得到的数据格式不能用于分析。例如,数据存储的格式包括了txt,xml,csv,json,甚至于bib格式,而当我们进行专利分析时通常是希望获得c […]


专利分析中的开源运动(1)——专利数据的获取

说起开源,多数人可能认为开源是属于软件领域的事情,似乎与专利分析没有任何干系。但是,大家在实际进行专利信息分析时往往会遇到很多的阻碍,比如说如果想要获取字段丰富、格式规范和批量的专利数据,通常需要借助商业数据库,而在对数据进行处理和可视化时也会使用到大量工具软件,而很多也是商业软件,可见,专利分析的全过程与工具是密不可分的。这样自然就存在一个需求,如果不借助商业工具,我们是否还能进行专利分析?答案 […]