专利名称:用于文本相似度计算的分词方法、装置、设备和介
质
专利类型:发明专利发明人:李柯,徐立坤,王振乾申请号:CN202110202080.9申请日:20210223公开号:CN112784570A公开日:20210511
摘要:本发明公开了一种用于文本相似度计算的分词方法、装置、设备和介质,该方法包括:获取用于计算文本相似度的至少两个文本对应的文本领域信息;确定与文本领域信息对应的语义树状层次结构,语义树状层次结构为按照词语的语义划分得到的具有层级关系的结构;根据语义树状层次结构,在至少两个文本中确定分词关键信息;基于分词关键信息对至少两个文本进行分词操作,得到分词结果。本发明能够有针对性地进行分词,提高了分词效果。
申请人:南方电网调峰调频发电有限公司信息通信分公司
地址:510000 广东省广州市番禺区东环街番禺大道北555号番禺节能科技园内街天安总部中心1号楼601房
国籍:CN
代理机构:佛山市神机营专利代理事务所(普通合伙)
代理人:许尤庆
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务