pandas


Hello,Patent & Python!

专利信息,顾名思义,是一个“专利”与“信息”的交叉学科。往大了说,“专利”可归属于法律领域,而“信息”则归属于计算机领域,这两个领域本身就有极高的门槛,尤其是计算机领域的专业性极强,相比而言,专利知识反倒是更易于学习。 因此,有不少从计算机领域跨界到专利领域,而鲜有从专利领域跨界到计算机领域的。但是,随着高级编程语言的逐步普及,普通人学习编程的难度正在逐步降低。今天,笔者给各位读者介绍Python […]


专利分析中的开源运动(2)——专利数据的清洗 4

在前一篇中,我们对专利数据开放以及专利数据的获取方式进行了阐述,但是在获得专利数据后通常不能直接用于专利分析,而必须对专利数据进行清洗。本篇将进一步对专利数据的清洗进行介绍。 专利数据清洗的目的 为什么需要对专利数据进行清洗呢,主要是有以下原因:其一是获取得到的数据格式不能用于分析。例如,数据存储的格式包括了txt,xml,csv,json,甚至于bib格式,而当我们进行专利分析时通常是希望获得c […]