R语言-数据抽取(二)

时间:2026-02-14 10:39:28

1、3)记录抽取

记录抽取函数: subset (x, condition)

x:需要处理的数据

condition:过滤条件

返回值: data.frame

案例:

items <- read.table('sales.csv', sep="|", header=TRUE, fileEncoding='utf-8', stringsAsFactors=FALSE)

sub_items <- subset(items, comments>10000)    ---提取 comments大于10000的记录

2、4)随机抽样

随机抽样函数: sample (length, size, replace = FASLE)

length:样本长度

size:抽样行数

replace:是否可回收样本,默认为不放回,即FALSE

返回值:行数的位置值数组

案例:

items <- read.csv ('sales.csv')     ---导入数据

rows <- nrow (items)    ---数据记录行,即抽样行数length

indexes <- sample (rows, 3, replace =TRUE)    ---使用 sample函数,在 rows(10行)抽取3个数据(抽取的是数据行位置行号)

data1 <- items [indexes, ]    ---提取出 items表中的随机抽取出的 indexes行号对应数据

R语言-数据抽取(二)

© 2026 海能知识库
信息来自网络 所有数据仅供参考
有疑问请联系站长 site.kefu@gmail.com