R语言数据框(data.frame)的使用小结

data-frame-1

统计分析中最常见的原始数据形式是类似于数据库表或Excel数据表的形式。 这样形式的数据在R中叫做数据框(data.frame)。
数据框类似于一个矩阵,有行、列, 但各列允许有不同类型:数值型向量、因子、字符型向量、日期时间向量。 同一列的数据类型相同。 在R中数据框是一个特殊的列表, 其每个列表元素都是一个长度相同的向量。

函数data.frame()可以生成数据框,如

d <- data.frame(
name=c("李明", "张聪", "王建"),
age=c(30, 35, 28),
height=c(180, 162, 175),
stringsAsFactors=FALSE)
print(d)

则输出内容为

  • name age height
  • 1 李明 30 180
  • 2 张聪 35 162
  • 3 王建 28 175

data.frame() 函数会将字符型列转换成因子, 加选项 stringsAsFactors=FALSE可以避免这样的转换。

作者:Qingyun
                
comments powered by Disqus