文本语义分析的实现及应用

(整期优先)网络出版时间:2013-07-17
/ 1
淘宝网每天产生千万级的用户输入文本(简称UGC),它们是无结构的,因此与结构化数据相比,更难通过语义分析技术进行信息挖掘。然而,UGC的无结构化,又使得其能够挖掘的信息是无限的。本文将讲述如何利用文本语义分析技术来挖掘有价值的信息,并介绍该技术在淘宝网的应用情况。