안녕하세요
이번 글에서는 R의 데이터 프레임에 대해 소개를 해보겠습니다.
데이터 프레임은 말로 어렵게 설명을 해보자면 2차원 공간의 행렬이라고 생각하시면 됩니다.
그래서 실제로 데이터를 참조할때도 행렬과 같은 방식으로 a[1, 1], a[1, 2]와 같은 방식으로 참조합니다.
Iris는 R의 기본적으로 들어있는 꽃에 관련된 데이터프레임인데요.
Iris의 첫번째 행의 첫번째 열의 데이터를 참조하자면..
이렇게 하면 됩니다.
응용을 좀 더 해볼까요?
Iris에서 Species가 setosa인것들만 보고 싶을때는..
그러면 여기서 벡터에 데이터 프레임을 집어넣을수는 없을까? 하는 의문이 드실수 있겠죠.
그래서 제가 직접 해봤는데 안됬습니다 ㅋㅋ ㅠㅠ
이렇게 되는 모습을 보실수가 있습니다.
그러면 데이터 프레임의 j번째 열에 데이터 프레임을 넣을수 있지 않을까?도 궁금하실수가 있겠죠
이것도 직접 해봤는데 안됬습니다 ㅋㅋㅋ
이렇게 친절하게 2개의 변수를 대체하기 위해서는 2개의 변수를 넣으라고 설명해주니까 해보도록 합시다
이렇게 해서 원래 생각했던 데이터 프레임의 j번째 열에 데이터 프레임을 새로 집어넣는건 안되고
데이터 프레임을 이어붙이는건 되는 모습을 보실수 있습니다.
근데 굳이 저렇게 안해도 data.frame이라는 함수를 사용하셔서 새로 만드시는게 더 편할겁니다.
(웬만한 상황에선 말이죠..)
# ...
# these arguments are of either the form value or tag = value.
# Component names are created based on the tag (if present)
# or the deparsed argument itself.
# 이건 좀 어렵게 써져 있지만 쉽게 생각하자면 데이터입니다.
# 벡터도 가능하고 데이터 프레임도 가능합니다.
# row.names
# NULL or a single integer or character string specifying a column
# to be used as row names,
# or a character or integer vector giving the row names for the data frame.
# 이 인자는 행의 이름을 일일이 붙여줄수 있게 해주는 인자입니다.
# 주의할점은 데이터 프레임의 길이에 맞게끔 해줘야 된다는 점입니다.
# 데이터 프레임은 행이 150개인데 row.names의 인자를 세팅해줄때 길이가 150이 안되게 세팅해주면 에러가 뜹니다.
# check.rows
# if TRUE then the rows are checked for consistency of length and names.
# 이 인자는 뭐하는 친군지 잘 모르겠네요.
# check.names
# logical. If TRUE then the names of the variables in the data frame are checked to
# ensure that they are syntactically valid variable names and are not duplicated.
# If necessary they are adjusted (by make.names) so that they are.
# 이 인자는 데이터 프레임의 변수 이름이 유효한지, 중복되지 않는지 검사해주는 인자입니다.
# fix.empty.names
# logical indicating if arguments which are “unnamed”
# (in the sense of not being formally called as someName = arg)
# get an automatically constructed name or rather name "".
# Needs to be set to FALSE even when check.names is false if "" names should be kept.
# 이것도 뭔지 잘 모르겠네요..
# stringsAsFactors
# logical: should character vectors be converted to factors?
# The ‘factory-fresh’ default has been TRUE previously but has been changed to FALSE
# for R 4.0.0.
# 문자형 값들을 Factor형 값들로 변환해주는 인자입니다.
# R 4.0.0버전 이후로 기본값이 TRUE에서 FALSE로 변경되었습니다.
data.frame(..., row.names = NULL, check.rows = FALSE,
check.names = TRUE, fix.empty.names = TRUE,
stringsAsFactors = FALSE)
'Dev > R' 카테고리의 다른 글
[R] 데이터 프레임을 다루는 함수 (1) | 2023.12.26 |
---|---|
[R] 기본 내장 함수 (1) | 2023.12.23 |
[R] 벡터 (0) | 2023.12.20 |