Spark CSV 의 의존성

Programming/Java

Spark CSV 의 의존성

라우드니스 2015. 12. 16. 11:10

Spark-csv 모듈은 Spark에서 CSV를 RDD화 시키는데 사용되는 모듈로, SparkSQL에서는 sql을 통해 csv를 바로 dataframe화 시키는것도 가능하다.

Spark-CSV를 이용할때, 모든 의존성 파일들을 spark 코드에 넣어준게 아니라면 spark-csv의 jar파일 뿐만 아니라 반드시 spark-submit에 의존성 jar파일로 commons-csv-1.1.jar 파일을 포함시켜줘야 한다.

sbt나 maven과 같은 빌드 도구들의 사용이 보편화됨에 따라 개별 의존성에 대한 정보의 공시는 더더욱 없어지는것 같다...

저작자표시 비영리 동일조건

'Programming > Java' 카테고리의 다른 글

HBase Coprocessor의 예제를 응용한 Distributed Count와 Apache Phoenix의 Count문 비교 (0)	2015.12.21
Maven 3.x 의존성과 함께 컴파일하기 (0)	2015.12.18
Spark on HBase 관련 코드들 (0)	2015.12.10
SparkSQL on HBase - hbase.column.mapping에 사용가능한 타입 (0)	2015.11.25
SparkSQL on HBase 사용방법 (0)	2015.11.23

현재글Spark CSV 의 의존성

세상밖으로...

부산대학교 정보컴퓨터공학부 지식공유동아리 untoC 2기

OpenGL, Hadoop, C, Programming, cloud computing, Virtualization, 프로그래밍, Hbase, Java, spark, Linux, Virtual Box, C++, Maven, Kubuntu, Data Communication, CMU, hibench, Android, MAPREDUCE,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

세상밖으로...