找回密码
 注册
查看: 1365|回复: 0

R语言 tm包 VCorpus()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-10-1 10:55:39 | 显示全部楼层 |阅读模式
VCorpus(tm)
VCorpus()所属R语言包:tm

                                        Volatile Corpus
                                         挥发性语料库

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

Data structures and operators for volatile corpora.
挥发性语料库的数据结构和运营商。


用法----------Usage----------


Corpus(x,
       readerControl = list(reader = x$DefaultReader, language = "en"),
       ...)
VCorpus(x,
        readerControl = list(reader = x$DefaultReader, language = "en"),
        ...)
## S3 method for class 'VCorpus'
DMetaData(x)
## S3 method for class 'Corpus'
CMetaData(x)



参数----------Arguments----------

参数:x
A Source object for Corpus and VCorpus, and a corpus for the other functions.
ASource对象Corpus和VCorpus,和语料库的其他功能。


参数:readerControl
A list with the named components reader representing a reading function capable of handling the file format found in x, and language giving the text's language (preferably as <acronym>IETF</acronym> language tags). The default language is assumed to be English ("en"). Use NA to avoid internal assumptions (e.g., when the language is unknown or is deliberately not set).
命名的组件的列表reader阅读功能,可处理的文件格式在x,language文本的语言(最好<acronym> IETF </首字母缩写“>”语言标签“)。默认语言假设是英语("en")。使用NA,以避免内部的假设(例如,当语言是未知的,或者是故意不设置)。


参数:...
Optional arguments for the reader.
可选参数的reader。


Details

详细信息----------Details----------

Volatile means that the corpus is fully kept in memory and thus all changes only affect the corresponding R object. In contrast there is also a corpus implementation available providing a permanent semantics (see PCorpus).
波动性的手段,语料库完全保存在内存中,因此所有的改变只影响对应的R对象。与此相反,也有语料库的实施提供一个永久的语义(见PCorpus)。

The constructed corpus object inherits from a list and has two attributes containing meta information:
构建的语料库对象的继承从list有两个属性包含元数据信息:




CMetaData Corpus Meta Data contains corpus specific meta data in form of tag-value pairs and information about children in form of a binary tree. This information is useful for
CMetaData语料库元数据包含语料库特定的元数据标记 - 值对的形式和有关儿童的二叉树的形式。此信息是非常有用的




DMetaData Document Meta Data of class data.frame contains document specific meta data for the corpus. This data frame typically encompasses clustering or classification results which basically are metadata for documents but form an own entity (e.g., with its name, the value range,
DMetaData文件的元数据类data.frame包含文档元数据的语料库。这个数据框通常包括聚类或分类的结果基本上是元数据文件,但形成自己的实体(例如,用它的名字,值的范围,


值----------Value----------

An object of class VCorpus which extends the classes Corpus and list containing a collection of text documents.
扩展的类的对象类VCorpusCorpus和list包含文本文件的集合。


(作者)----------Author(s)----------


Ingo Feinerer



实例----------Examples----------


reut21578 <- system.file("texts", "crude", package = "tm")
(r <- Corpus(DirSource(reut21578),
             readerControl = list(reader = readReut21578XMLasPlain)))

转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-6-18 07:25 , Processed in 0.023410 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表