줄리아에서 빈 데이터프레임 만드는 법
개요
많은 언어에서 데이터프레임을 지원함에도 의외로 할 때마다 새롭고 짜증나는 게 빈 배열 생성이다.
코드
타입 지정
julia> using DataFrames
julia> df1 = DataFrame(x = Int64[], y = String[])
0×2 DataFrame
실제로 빈 배열을 데이터로써 넣어주면 된다. 이 때 타입을 지정하게 되는데, 데이터가 전혀 없을 땐 칼럼 이름과 타입도 보이지 않는다.
julia> push!(df1, [3, "three"])
1×2 DataFrame
│ Row │ x │ y │
│ │ Int64 │ String │
├─────┼───────┼────────┤
│ 1 │ 3 │ three │
julia> push!(df1, [3.14, "pi"])
┌ Error: Error adding value to column :x.
└ @ DataFrames C:\Users\rmsms\.julia\packages\DataFrames\GtZ1l\src\dataframe\dataframe.jl:1606
ERROR: InexactError: Int64(3.14)
데이터를 넣으면 정상적으로 칼럼 이름과 타입이 출력된다. 타입이 맞지 않을 경우 데이터가 추가되지 않으니 주의하자.
타입 미지정
julia> df2 = DataFrame(x = [], y = String[])
0×2 DataFrame
julia> push!(df2, [3, "three"])
1×2 DataFrame
│ Row │ x │ y │
│ │ Any │ String │
├─────┼─────┼────────┤
│ 1 │ 3 │ three │
julia> push!(df2, [3.14, "pi"])
2×2 DataFrame
│ Row │ x │ y │
│ │ Any │ String │
├─────┼──────┼────────┤
│ 1 │ 3 │ three │
│ 2 │ 3.14 │ pi │
데이터 프레임의 타입으로 스트레스를 받고 싶지 않다면 그냥 위와 같이 Any
의 빈 배열을 만들면 된다. 타입 지정과 달리 데이터가 잘 들어간 것을 확인할 수 있다.
환경
- OS: Windows
- julia: v1.6.2