mvn package는 했다고 가정.
* 데이터 사이즈 관련 설정
HiBench/conf/10-data-scale-profile.conf 를 확인하면 데이터 생성하거나 실행할때 쓰이는 요소들을 알 수 있다. (예: 데이터 제작시 사용되는 데이터 크기 관련 숫자들)
* 여러 가지 클래스들
가령 나의 경우 Join 에 데이터 제작시 사용되는 HiBench.DataGen이 어디있는지 찾고싶었는데, 이 경우
HiBench/src/autogen/target/autogen-5.0-SNAPSHOT.jar 에 포함돼 있었다.
따라서 내가 직접 Join에 사용되는 데이터를 만들고 싶다면
hadoop jar autogen-5.0-SNAPSHOT-jar-with-dependencies.jar HiBench.DataGen -t hive -b /hive -n /hive/input -m 11 -r 1 -p 12000000 -v 100000000 -o sequence
라고 명령어를 넣으면 된다. ( -t는 DataGen 소스코드에서 분기로 사용됨, b 는 base 폴더, -n 은 실제 input 폴더, -p 와 -v의 수치는 데이터 사이즈 관련 설정의 huge 설정)
반응형
'Programming > 기타' 카테고리의 다른 글
Rancher Logging (Banzai Logging Operator) 사용 시 에러케이스 1) Docker log 파일이 외부 경로를 참조할 때 (0) | 2021.04.17 |
---|---|
Performance Evaluation of In-Memory Computing on Scale-Up and Scale-Out Cluster (0) | 2016.08.06 |
DBT-2를 ubuntu 13.10 64bit에서 컴파일 시 (0) | 2013.12.14 |
[Android]CPU의 가능한 Hz, mode와 현재 상태 구하기 (0) | 2013.03.11 |
[Android]어플리케이션이 내부 미디어플레이어를 이용할 때 네트워크 사용량 측정법? (0) | 2013.03.09 |