'hadoop dbms'에 해당되는 글 1건

  1. 2009.08.03 Hadoop DB 6

Hadoop DB

|
뜬금없는 포스팅이긴 한데 ...

예일대학에서 HadoopDB 라는 논문과 오픈소스로 공개를 했습니다.
자세한 내용은 옆의 링크를 참고하세요.  http://db.cs.yale.edu/hadoopdb/hadoopdb.html

MapReduce Framework 을 task coordinator 와 network communication layer 로 사용하고  각각 datanode에 MySQL 또는 PostgreSQL 을 설치, JDBC 을 이해할 수 있도록 InputStream 을 수정해서 마치DBMS 를 HDFS의 data source 처럼 인식토록 해서 구현한 것 같습니다. 그리고 Hive 의 확장해서 SQL Planner 라는 것을 제공하고 있습니다. 한마디로 TaskTracker 란 녀석한테 JDBC을 가르켜서 각 데이터노드에 설치된 DBMS 와 대화할 수 있도록 한 것이죠.

제가 생각하는 장점은 기존의 Hadoop Framework 을 그대로 사용하면서 확장되었기 때문에 동시에 운용이 가능하다는 겁니다. Join 같은 structured data에 걸맞는 operation 에는 DBMS가 아무래도 빠르니까 이점이 있을 것 같구요. 여튼 재밌는 응용입니다.

하지만 아직은 alpha 수준이라서 당분간 지켜봐야 겠고, 아무튼 Hadoop 이 뜨거운 감자인 건 확실한 것 같습니다. 이렇듯 다양한 응용이 나오는 걸 보니까요.
And
prev | 1 | next