2013年Hadoop實時查詢將成現實,Cloudera公司的兩個新項目:Impala 和 Trevni,將有助在2013年實現Hadoop實時查詢。
Impala 是開源版的 Dremel (Dremel 是 Google 大數據查詢解決方案,其原理可參見這篇博文《Google Dremel 原理 – 如何能3秒分析1PB》)。預計明年第一季度發布 Impala 的首個 beta 版。
Impala 允許你在 Hadoop 的HDFS、 Hbase 和 Hive 之上運行實時查詢。不必遷移。
不過真正的變革,還得把 Doug Cutting (Lucene和 Hadoop等的作者)做的 Trevni 和 Impala 整合在一起。Trevni 是一種新的列式(columnar)數據存儲格式,可保證讀取大型列式存儲數據集有極好性能。
在大數據實時查詢性能方面, Impala+Trevni 很有希望和 Google 的 Dremel 處于同一個級別,并有更多的功能。
英文原文:Maarten Ectors,編譯:伯樂在線
文章來源:伯樂在線