找回密码
 注册
查看: 1222|回复: 0

R语言 tm包 preprocessReut21578XML()函数中文帮助文档(中英文对照)

[复制链接]
发表于 2012-10-1 10:51:25 | 显示全部楼层 |阅读模式
preprocessReut21578XML(tm)
preprocessReut21578XML()所属R语言包:tm

                                        Preprocess the Reuters-21578 XML archive.
                                         预处理路透-21578 XML存档。

                                         译者:生物统计家园网 机器人LoveR

描述----------Description----------

Preprocess the Reuters-21578 <acronym>XML</acronym> archive by correcting invalid UTF-8 encodings and copying each text document into a separate file.
预处理路透“21578 <acronym>XML</首字母缩写纠正无效的UTF-8编码,每个文本文件复制到一个单独的文件归档。


用法----------Usage----------


preprocessReut21578XML(input, output, fixEnc = TRUE)



参数----------Arguments----------

参数:input
A character describing the input directory.
一个字符描述输入目录。


参数:output
A character describing the output directory.
一个字符描述输出目录。


参数:fixEnc
A logical value indicating whether an invalid UTF-8 encoding in the Reuters-21578 <acronym>XML</acronym> dataset should be corrected.
一个逻辑值,该值指示是否无效的UTF-8编码在路透社-21578 <acronym> XML </首字母缩写数据集应该被纠正。


值----------Value----------

No explicit return value. As a side product the directory output contains the corrected dataset.
没有明确的返回值。作为副产物的目录output包含校正后的数据集。


(作者)----------Author(s)----------


Ingo Feinerer



参考文献----------References----------

Collection Distribution 1.0. http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html
http://modnlp.berlios.de/reuters21578.html
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。


注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2025-6-18 22:59 , Processed in 0.027024 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表