摘要:根據作者原話,因爲apache kafka是一個用來優化讀寫的系統,所以用一個作家的名字來命名並不奇怪。從java和linux入手,其後逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相關知識一一分享。

Hadoop

說起 hadoop ,可能現在許多人都不會陌生,但讀就不一定讀的對了。

Hadoop的發音是 [hædu:p]。

大數據開發,這三個名詞Hadoop,Spark,Kafka你都知道它的故事嗎

Hadoop這個名字是Hadoop項目創建者Doug Cutting 的兒子的一隻玩具的名字。他的兒子一直稱呼一隻黃色的大象玩具爲 Hadoop 。這剛好滿足Cutting 的命名需求,簡短,容易拼寫和發音,毫無意義,不會在別處使用。於是 Hadoop 就誕生了。

Zookeeper

關於“ZooKeeper”這個項目的名字,其實也有一段趣聞。在立項初期,考慮到之前內部很多項目都是使用動物的名字來命名的(例如著名的Pig項目),雅虎的工程師希望給這個項目也取一個動物的名字。

時任研究院的首席科學家RaghuRamakrishnan開玩笑地說:“在這樣下去,我們這兒就變成動物園了!”

此話一出,大家紛紛表示就叫動物園管理員吧一一一因爲各個以動物命名的分佈式組件放在一起,雅虎的整個分佈式系統看上去就像一個大型的動物園了,而Zookeeper正好要用來進行分佈式環境的協調一一於是,Zookeeper的名字也就由此誕生了。

大數據開發,這三個名詞Hadoop,Spark,Kafka你都知道它的故事嗎

spark

Apache Spark的故事始於2009年,當時加州大學伯克利分校中一個名爲的Matei Zaharia班級項目,項目名爲Mesos。

當時的想法是構建一個可以支持各種集羣系統的集羣管理框架,類似 Yarn 。在構建了 Mesos 後,開發人員需要一個基於 Mesos 架構的實際產品。這,這就是Spark的誕生方式。對大數據以及人工智能概念都是模糊不清的,該按照什麼線路去學習,學完往哪方面發展,想深入瞭解,想學習的同學歡迎加入大數據學習qq羣:515269485,有大量乾貨(零基礎以及進階的經典實戰)分享給大家,並且有清華大學畢業的資深大數據講師給大家免費授課,給大家分享目前國內最完整的大數據高端實戰實用學習流程體系 。從java和linux入手,其後逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相關知識一一分享!

Spark有火花,鼓舞的意思,稱之爲Spark的原因是,他們希望這款產品能夠激發基於Mesos的幾款創新產品。

但是,正如我們現在所知,Spark現在已成爲自己的項目,並且比大數據生態系統中的任何其他產品都具有更大的吸引力。所謂無心插柳,莫過於此。

大數據開發,這三個名詞Hadoop,Spark,Kafka你都知道它的故事嗎

Apache

首先我們要明白,Apache 是一個 http 服務器,而我們熟悉的另一種說法"Apache Hadoop"中的 Apache 則指的是 Apache 軟件基金會。

"Apache"是 Apache 軟件基金會中的一個項目。

關於其名字,流傳最廣的解釋是(也是最顯而易見的):這個名字來自於一個事實,當Apache在1995年初開發的時候,它是由當時最流行的HTTP服務器NCSA HTTPd 1.3的代碼修改而成的,因此是“一個修補的(a patchy)”服務器。

然而,在Apache服務器官方網站的FAQ中是這麼解釋的:“Apache這個名字是爲了紀念名爲Apache的美洲原住民印第安人的一支,衆所周知他們擁有高超的作戰策略和無窮的耐性。”

貝倫多夫說:“我選擇阿帕奇這個名字是取其積極含義。阿帕奇族是最後一個屈服於美國政府的民族。當時我們擔心大公司遲早會參與競爭並‘教化’這塊最早的網絡之地,所以在我看來,阿帕奇是個很好的名稱,也有人說這個詞一語雙關-因爲正如Apache(與"a patchy"諧音)的名字所表明的那樣,他們確實是在給服務器打補丁。”

Kafka

如果你記性比較好,你應該會記得一篇高中的課文《變形記》。它的作者也叫kafka,全名是“Franz Kafka”。

那麼apache kafka和Franz Kafka的名字相同只是巧合嗎。這還真不是!

根據作者原話,因爲apache kafka是一個用來優化讀寫的系統,所以用一個作家的名字來命名並不奇怪。而且作者在大學時非常喜歡Franz Kafka。此外,這個名字對於開源來說聽起來很酷(emm...有點道理啊)。

tomcat

Tomcat最初是由Sun的軟件構架師詹姆斯·鄧肯·戴維森開發的。後來他幫助將其變爲開源項目,並由Sun貢獻給Apache軟件基金會。

由於大部分開源項目O'Reilly都會出一本相關的書, 並且將其封面設計成某個動物的素描,因此他希望將此項目以一個動物的名字命名。

因爲他希望這種動物能夠自己照顧自己,最終,他將其命名爲Tomcat(英語公貓或其他雄性貓科動物) 此外tomcat還有一個組件“Catalina”,它的名字也蠻有意思的。

Catalina是tomcat的核心組件,主要作用是處理servlet。Catalina原本是美國西海岸靠近洛杉磯22英里的一個小島,因爲其風景秀麗而著名。爲什麼要這個模塊起名爲“Catalina”呢?因爲作者真的真的很喜歡這個島啊。

從作者原話可以看得出“Even though I don't live in Southern CA, I've always liked what I've read and seen of Catalina Island” 另外在開發的早期階段,Tomcat是被搭建在一個叫Avalon的服務器框架上,而Avalon則是Catalina島上的一個小鎮的名字。

以上~

對大數據以及人工智能概念都是模糊不清的,該按照什麼線路去學習,學完往哪方面發展,想深入瞭解,想學習的同學歡迎加入大數據學習qq羣:515269485,有大量乾貨(零基礎以及進階的經典實戰)分享給大家,並且有清華大學畢業的資深大數據講師給大家免費授課,給大家分享目前國內最完整的大數據高端實戰實用學習流程體系 。從java和linux入手,其後逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相關知識一一分享!

相關文章