[Hadoop]install 하둡 설치 방법
빅데이터 솔루션에 대한 이야기가 많이 나오면서 하둡이
많이 언급되는데요. 하둡은 파일은 분산저장하는데 쓰입니다.
HDFS(Hadoop Distributed File System)
하둡 분산 파일 시스템으로 데이터를 복제해 분산저장할 수 있습니다.
name node와 data node로 구성되는데요.
name node는 rdb에서의 테이블스페이스와 같은 존재이고
data node 는 실제 데이터가 저장되는 것에 비유 할 수 있습니다.
먼저 하둡을 apache.tt.co.kr에서 다운받을 수 있는데요.
리눅스에서 위와같이 파일을 받을 수 있습니다.
설치한뒤 압축을 풀고 hadoop-env.sh파일에서 jdk경로를 잡아줘야합니다.
hadoop압출을 푼곳에서 conf를 가보시면 hadoop-env.sh파일을 볼 수 있습니다.
주석처리(#) 를 없애주고 자바경로를 제대로 잡아줘야합니다.
같은위치에 core-site.xml 을 열어서 <configuration>부분이 있는지 확인하고
추가해 줍니다.
mapred-site.xml에서도 위와같이 편집해줍니다.
hdfs-site.xml도 마찬가지로...
그다음 conf위치에서
sh hadoop-env.sh라는 명령어로 쉘스크립트를 실행시켜줍니다.
hadoop namenode -format
이라는 명령어를 먼저 실행시켜줍니다.
그다음
bin하위 폴더에서 bin/start-all.sh
라는 명령어를 주시면 하둡이 시작된것입니다.
localhost의 알맞는 포트번호로 들어가서 이런 창을 만나면
성공적으로 하둡이 돌아가고 있는것입니다.
댓글