电力大数据中文地址解析和规范化方法研究

(整期优先)网络出版时间:2017-05-15
/ 1
由于长期以来我国地址的使用习惯复杂多样,使得电力系统业务部门中的地址数据不规范,阻碍了电力大数据的研发。针对此问题,在分析人类理解地址所用知识的基础上提出了基于地址知识库的地址解析和规范化方法,并结合地址的应用提出了为地址评估规范化置信水平的评价方法。实验结果表明,该方法对中文地址的解析F值可达95.37%,置信水平评估中82.40%的规范化地址可以直接应用到大数据分析等领域,具有重要的应用和研究参考价值。