- Java 설치 (1.8)
http://java.oracle.com
- Python 설치 (3.5 기준)
https://www.python.org/
- Hadoop for Windows (2.6.5 Binary 버전)
http://hadoop.apache.org
압축을 풀면 끝
D:\Hadoop
- Apache Spark 다운로드 (2.0.2 Pre-build for Hadoop 2.6 버전) 설치
http://spark.apache.org/downloads.html
압축을 풀면 끝
D:\Spark
# Spark 설정
# Windows 환경변수 세팅 (공백이 없는 경로로 함)
JAVA_HOME=D:\Java\jdk1.8.0_111\jre
SPARK_HOME=D:\Spark
PYTHONPATH=%SPARK_HOME%\python\lib\pyspark.zip;%SPARK_HOME%\python\lib\py4j-0.10.3-src.zip
HADOOP_HOME=D:\Hadoop
* Windows의 경우 %HADOOP_HOME% 세팅을 하지 않는 경우 아래와 같은 에러가 발생
ERROR Shell: Failed to locate the winutils binary in the hadoop binary path
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
* Windows 에서 hive 에러 날 경우
%HADOOP_HOME%\bin\winutils.exe chmod 777 D:\tmp\hive
- conf 설정
cd %SPARK_HOME%\conf
copy og4j.properties.template log4j.properties
# log4j.properties 파일편집
log4j.rootCategory=WARN, console # INFO->WARN, INFO정보가 많이 출력 되므로 수정
cmd를 열어 실행하면 됨.
C:\>D:
D:\>spark\bin/pySpark
실행화면 맨위의 그림과 같다.
D:\>cd spark
D:\spark>%SPARK_HOME%/bin/spark-submit examples/src/main/python/pi.py 10
참조 url: http://cdecl.tistory.com/305
'IT와 꿍짝' 카테고리의 다른 글
프로젝트 관리 ( Project Management ) 간트 차트(Gantt Chart) 무료 SW입니다. (0) | 2017.04.17 |
---|---|
날씨 경영 우수기업에 도전하시길! 기상정보를 경영활동에 활용하면 얻게 되는 부분~ (0) | 2017.03.20 |
MS워드에서 목차의 수준을 지정하는 방법입니다. (0) | 2016.10.24 |
윈도우즈 시스템 가동 시간 확인 방법입니다. (1) | 2016.10.24 |
MS Office(오피스) Word(워드) doc 문서 내, 배경 화면 이미지를 선택 불가 해결책입니다. (0) | 2016.08.29 |
댓글