找回密码
 注册
查看: 1185|回复: 0

R语言 tm包 tm_combine()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-10-1 10:54:42 | 显示全部楼层 |阅读模式
tm_combine(tm)
tm_combine()所属R语言包:tm

                                        Combine Corpora, Documents, Term-Document Matrices, and Term Frequency Vectors
                                         结合语料库,文件,术语文档矩阵和词频向量

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

Combine several corpora into a single one, combine multiple documents into a corpus, combine multiple term-document matrices into a single one, or combine multiple term frequency vectors into a single term-document matrix.
结合成一个单一的,几个语料库的语料将多个文件合并成一个单一的,将多个术语文档矩阵,或将多个术语频率向量成一个单一的术语文档矩阵。


用法----------Usage----------


## S3 method for class 'Corpus'
c(x, ..., recursive = FALSE)
## S3 method for class 'TextDocument'
c(x, ..., recursive = FALSE)
## S3 method for class 'TermDocumentMatrix'
c(x, ..., recursive = FALSE)
## S3 method for class 'term_frequency'
c(x, ..., recursive = FALSE)



参数----------Arguments----------

参数:x
A corpus, a text document, a term-document matrix, or a term frequency vector.
一个主体,一个文本文件,一个术语文档矩阵,或术语频率向量。


参数:...
Corpora, text documents, term-document matrices, or term frequency vectors.
语料库,文本文件,术语文档矩阵,或术语频率向量。


参数:recursive
Logical. If recursive = TRUE existing corpus meta data is also merged, otherwise discarded.
逻辑。如果recursive = TRUE现有的语料库元数据合并,否则丢弃。


Details

详细信息----------Details----------

If recursive = TRUE, meta data from input objects (corpora or documents) is preserved during concatenation and intelligently merged into the newly created corpus. Although we use a sophisticated merging strategy (by using a binary tree for corpus specific meta data and by joining document level specific meta data in data frames) you should check the newly created meta data for consistency when merging corpora with (partly) identical meta data. However, in most cases the meta data merging strategy will produce validly combined and arranged meta data structures.
recursive = TRUE如果,从输入对象的元数据(语料或文件)保存在串联和智能合并到新创建的语料库。虽然我们使用了一个复杂的合并策略(使用二进制树语料库特定的元数据,并在数据框中加入特定的元数据文件级),你应该检查新创建的元数据的一致性(部分)相同的元数据合并时语料库。然而,在大多数情况下,元数据合并策略的有效组合和配置,将产生的元数据结构。


参见----------See Also----------

Corpus, TextDocument, TermDocumentMatrix, and termFreq.
Corpus,TextDocument,TermDocumentMatrix,termFreq。


实例----------Examples----------


data("acq")
data("crude")
summary(c(acq,crude))
summary(c(acq[[30]],crude[[10]]))
c(TermDocumentMatrix(acq), TermDocumentMatrix(crude))

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-6-18 21:54 , Processed in 0.024700 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表