专利分析中的开源运动(3)-专利数据分析
当将专利数据清洗完毕,似乎可以歇口气直奔主题了,但笔者负责任的告诉你,最大的难题才刚刚开始。专利数据分析是专利领域与数据分析领域的一个交叉领域,实际上是将数据分析的方法以及工具应用到专利领域。广义的数据分析包括了数据统计、数值分析等传统内容,也包括了网络分析、文本挖掘与聚类、机器学习等更艰深的方向,可以说数据分析对于专利圈的人来说是一个无底洞,一旦掉进去,就会发现周围全是未知领域,学习曲线非常陡峭 […]
当将专利数据清洗完毕,似乎可以歇口气直奔主题了,但笔者负责任的告诉你,最大的难题才刚刚开始。专利数据分析是专利领域与数据分析领域的一个交叉领域,实际上是将数据分析的方法以及工具应用到专利领域。广义的数据分析包括了数据统计、数值分析等传统内容,也包括了网络分析、文本挖掘与聚类、机器学习等更艰深的方向,可以说数据分析对于专利圈的人来说是一个无底洞,一旦掉进去,就会发现周围全是未知领域,学习曲线非常陡峭 […]
说起开源,多数人可能认为开源是属于软件领域的事情,似乎与专利分析没有任何干系。但是,大家在实际进行专利信息分析时往往会遇到很多的阻碍,比如说如果想要获取字段丰富、格式规范和批量的专利数据,通常需要借助商业数据库,而在对数据进行处理和可视化时也会使用到大量工具软件,而很多也是商业软件,可见,专利分析的全过程与工具是密不可分的。这样自然就存在一个需求,如果不借助商业工具,我们是否还能进行专利分析?答案 […]