Java開發(fā)者對Apache Kafka應該不會感到陌生,這是一個分布式的發(fā)布訂閱消息系統(tǒng),作為一個非常重要的開源項目,它已經(jīng)被許多公司以及產品用作關鍵組件。Kafka及其配套的Key-Value存儲系統(tǒng)如今也越來越多地被用來為關系數(shù)據(jù)庫提供持久性存儲,大多數(shù)數(shù)據(jù)庫也使用Key-Value存儲系統(tǒng)作為基礎。
本文將要介紹的這款數(shù)據(jù)庫正是由 Apache Kafka提供支持,它同樣使用了來自Kafka配套的Key-Value存儲系統(tǒng)。

近期面世的KarelDB是一款關系數(shù)據(jù)庫,它幾乎完全基于開源組件構建,包括用于SQL引擎的Apache Calcite以及用于事務和控制功能的Apache Omid。到目前為止,這款數(shù)據(jù)庫僅支持單節(jié)點,但 KarelDB的作者表示它在將來會擴大支持規(guī)模。
和其他的新興數(shù)據(jù)庫一樣,KarelDB同樣基于Kafka的嵌入式Key-Value存儲系統(tǒng)和名為 KCache 的內存緩存(in-memory cache)。默認情況下,KarelDB使用配置成RocksDB緩存的KCache,由應用廣泛的Kafka流處理軟件提供支持。
KarelDB的作者,同時任職于Confluent公司(基于Apache Kafka提供流數(shù)據(jù)平臺的供應商)的Robert Yokota表示:“這使得KarelDB能夠支持規(guī)模更大的數(shù)據(jù)集和擁有更快的啟動時間。”他還在最近介紹KarelDB的博文中補充道:“KCache可被配置成使用內存緩存而非RocksDB。”
與 Confluent基于Kafka的平臺不同,KarelDB不是流數(shù)據(jù)庫。盡管如此,Yokota還是選擇了關系數(shù)據(jù)庫,主要是因為它基于Kafka支持的開源組件。因此,他認為KarelDB有機會流行起來。這些開源組件包括Calcite,它是一個SQL框架,支持將關系查詢推送到數(shù)據(jù)存儲系統(tǒng),這個方法被認為可以提供更高效的處理。Yokota表示KarelDB會從即將推出的Calcite優(yōu)化機制中“自動受益”。
與此同時,Apache Omid框架與KarelDB一起使用,以支持Key-Value存儲系統(tǒng)上的事務。Omid最初被設計為面向HBase NoSQL數(shù)據(jù)庫的事務管理器,但由于它使用現(xiàn)有的Key-Value存儲系統(tǒng)來維護事務元數(shù)據(jù),因此與KCache輕松地配套使用。
Yokota指出,KarelDB將類似的功能堆疊在KCache的上面以管理事務。Omid還使用一種獨有的名為多版本并發(fā)控制(multi-version concurrency control)的技術,以在其他關系數(shù)據(jù)庫中實現(xiàn)“快照隔離(snapshot isolation)”機制。此外,KarelDB還支持作為嵌入式數(shù)據(jù)庫或服務器運行。在第二種情況下,它使用 Apache Avatica 來支持遠程過程調用傳輸協(xié)議(Remote Procedure Call wire protocol)。
Yokota還認為使用Kafka運行這些開源組件有許多優(yōu)點,其中一個就是多臺服務器能夠“追蹤”同一主題集。也就使得多臺KarelDB服務器可以作為一個集群運行,而不會產生單一故障點。”
對了,KarelDB名字的靈感來自一位科學家——它以捷克科幻小說作家Karel Capek的名字命名,Karel Capek被認為發(fā)明了“機器人”(robot)一詞。此外,還有一門編程語言也是以他的名字命名。
特別提醒:本網(wǎng)內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網(wǎng)有任何內容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內處理完畢。