作者: 许阳, 刘功申, 孟魁
关键词: 向量模型;文本表示;PageRank;词语关系
摘要: 文本向量化是将文本转化为向量的代数模型建立过程,在文本处理领域具有重要的应用价值,是文本数据挖掘算法的关键环节。在著名的PageRank算法基础上,提出一种基于句中词语间关系的文本向量化算法。通过引入语义层面的词语关联来克服传统的基于词频统计数据的向量化方法语义敏感度不佳的缺陷。在不同的语料测试集上的实验表明,基于句中词语间关系的文本向量化算法有更高的准确率。
在线下载
文本类型理论下控制工程文本名词化结构的汉译研究A Study on the English-Chinese Translation of Nominalization in Control Engineering Texts from the Perspective of Text Typology Theory
周伟量
现代语言学Vol.11 No.7, 全文下载: PDF HTML XML DOI:10.12677/ML.2023.117418, July 26 2023
试析it形式主语句中that从句的句法成分An Analysis of the Syntactic Constituent of That Clause in the Sentence Pattern with Formal Subject “It”
赵欣语
现代语言学Vol.11 No.12, 全文下载: PDF HTML XML DOI:10.12677/ML.2023.1112788, December 13 2023
基于FP-Tree算法的汉语复句关系词依存关系规则的自动挖掘Automatic Mining of the Dependency Relation Rule of Relational Word in Chinese Compound Sentences Based on FP-Tree Algorithm
涂馨丹
计算机科学与应用Vol.11 No.5, 全文下载: PDF HTML XML DOI:10.12677/CSA.2021.115158, May 27 2021
基于分布式语义学的中文语义关系量化研究Quantitative Research on Chinese Semantic Relations Based on the Distributional Semantics
林植楠
现代语言学Vol.12 No.9, 全文下载: PDF XML DOI:10.12677/ml.2024.129821, September 20 2024
基于依存关系的复句关系词搭配库建设Establishment of Relation Markers Collocation Corpus for Compound Sentences Based on Dependency Relations
司贝贝, 杨进才 国家科技经费支持
软件工程与应用Vol.4 No.4, 全文下载: PDF HTML XML DOI:10.12677/SEA.2015.44011, August 18 2015
基于指针标注的中文医学文本实体关系抽取研究Research on Entity Relation Extraction of Chinese Medical Text Based on Pointer Tagging Framework
罗文龙, 王 勇
计算机科学与应用Vol.12 No.1, 全文下载: PDF HTML XML DOI:10.12677/CSA.2022.121018, January 26 2022