brunch

You can make anything
by writing

C.S.Lewis

by 유윤식 Oct 04. 2020

PySaprk:DataFrame(4)

#스파크 #파이스파크 #lit( )

exam_child_dataframe. \

withColumn('SPEC', when((col('AGE') > 20) & (col('AGE') <= 30), col('AGE')).otherwise(lit(None))). \

show()

Lit?

무슨뜻일까?


우리 실생활 영어에서는 좀(?) 이상한 뜻으로 쓰이기도 하는데,

PyStark 에서 lit() 함수는 좀(!) 다른 용도로 사용됨.


간단하게만 알아보려고.


Code 01.


-- 01. exam_child_dataframe.show()

-- 02. exam_child_dataframe. \

withColumn('SPEC', when((col('AGE') > 20) & (col('AGE') <= 30), col('AGE')).otherwise(lit(None))). \

show()



결과를 보면 앞으로 lit() 함수를 어떻게 사용해야 할 지 감이올텐데.



코드상에서 볼 수 있듯이,

AGE 컬럼이 20 ~ 30 사이에 있는 사람들은 특별한 컬럼값을 추가 할 수 있고

나머지 사람들은 빈 값으로 대체됨.


.otherwise() 함수에 lit() 함수를 사용해서 null 값을 만들어냄.


사실 이건 데이터와 함께 관찰해보기 위해서 만든 스토리.


주요한 목적은 빈 컬럼을 만들어 내기 위해서 사용함.


사실 이것만 보고서

앞으로 lit() 함수를 사용해서 뭔가 원하는 결과를 만드는 중간 과정으로 사용 할 수 있겠지.

작가의 이전글 개발X집사: 고양이 용품 모델
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari