TermDocumentMatrix.DCorpus(tm.plugin.dc)
TermDocumentMatrix.DCorpus()所属R语言包:tm.plugin.dc
Term-Document Matrix from Distributed Corpora
从分布式语料库的术语文档矩阵
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Constructs a term-document matrix given a distributed corpus.
构造一个术语文档矩阵的分布式语料库。
用法----------Usage----------
## S3 method for class 'DCorpus'
TermDocumentMatrix(x, control = list())
参数----------Arguments----------
参数:x
A distributed corpus.
一个分布式的语料库。
参数:control
A named list of control options. The component weighting must be a weighting function capable of handling a TermDocumentMatrix. It defaults to weightTf for term frequency weighting. All other options are delegated internally to a termFreq call.
命名列表的控制选项。组件weighting必须能够处理一个TermDocumentMatrix的加权函数。它默认为weightTf术语频率加权。所有其他选项委派一个termFreq调用内部。
值----------Value----------
An object of class TermDocumentMatrix containing a sparse term-document matrix. The attribute Weighting contains the weighting applied to the matrix.
对象的类TermDocumentMatrix包含稀疏的术语文档矩阵。属性Weighting包含施加到矩阵的加权。
参见----------See Also----------
The documentation of termFreq gives an extensive list of possible options.
termFreq的文档提供了一个广泛的可能的选项列表。
TermDocumentMatrix
TermDocumentMatrix
实例----------Examples----------
data("crude")
tdm <- TermDocumentMatrix(as.DCorpus(crude),
control = list(weighting = weightTfIdf, stopwords = TRUE))
inspect(tdm[155:160,1:5])
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|