makeChunks(tm)
makeChunks()所属R语言包:tm
Split a Corpus into Chunks
语料库分割成块
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Split a corpus into equally sized chunks conserving document boundaries.
分割成同样大小的数据块保存文件边界的语料库。
用法----------Usage----------
makeChunks(corpus, chunksize)
参数----------Arguments----------
参数:corpus
The corpus to be split into chunks.
语料库被分裂成块。
参数:chunksize
The chunk size.
块的大小。
值----------Value----------
A corpus consisting of the chunks. Note that corpus meta data is not passed on to the newly created chunk corpus.
块组成的语料库。需要注意的是语料库元数据传递给新创建的块语料库。
(作者)----------Author(s)----------
Ingo Feinerer
实例----------Examples----------
txt <- system.file("texts", "txt", package = "tm")
ovid <- Corpus(DirSource(txt))
sapply(ovid, length)
ovidChunks <- makeChunks(ovid, 5)
sapply(ovidChunks, length)
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|