专利内容由知识产权出版社提供
专利名称:网络评论数据的特征信息采集方法和装置专利类型:发明专利发明人:黄运杜,陈海勇申请号:CN201510563709.7申请日:20150907公开号:CN105183847A公开日:20151223
摘要:本申请公开了一种网络评论数据的特征信息采集方法和装置,通过初始阶段的遍历得到初始的属性词和情感词,然后进入迭代的遍历阶段,针对每条评论,根据预先设定的窗口距离,针对上一遍历阶段的属性词,在该属性词的前后窗口距离内查找新的情感词;针对上一遍历阶段的情感词,在该情感词的前后窗口距离内查找新的属性词;将本次遍历出的新的属性词和新的情感词与上一阶段的属性词和情感词合并,得到本阶段的属性词和情感词;重复本遍历阶段,直到遍历出的新的属性词和新的情感词的数量少于指定阈值时结束遍历阶段;对所得到的属性词和情感词进行配对;然后按照所述配对建立句式库,对应设置一种特征信息;按照所述句式库对原始评论进行句式匹配分析,得到评论对应句式的特征信息。本发明可以提高从评论数据采集出的特征信息的准确性。
申请人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司
地址:100080 北京市海淀区杏石口路65号西杉创意园西区11C楼东段1-4层西段1-4层
国籍:CN
代理机构:北京德琦知识产权代理有限公司
更多信息请下载全文后查看