【源码后台登录教程】【源码和补码合成】【搭建积分下载源码】zookeeper hbase源码-皮皮网

【源码后台登录教程】【源码和补码合成】【搭建积分下载源码】zookeeper hbase源码

2024-12-27 03:34:03 来源：javaweb免费源码网站分类：热点

1.zookeeper是源码什么？
2.Hbaseè¯»ååç
3.ZooKeeperå¨HBaseä¸çåºç¨
4.HBase 底层原理详解（深度好文，建议收藏）
5.è¦ä¸è¦ç¨hbaseèªå¸¦çzookeeperï¼
6.JAVA连接HBase客户端及HBase写入数据和读取数据原理解析

zookeeper hbase源码

zookeeper是源码什么？

zookeeper是动物管理员的意思。

ZooKeeper是源码一个分布式的，开放源码租前慎的源码分布式应用程序协调服务，是源码Google的Chubby一个开源的实现，是源码源码后台登录教程Hadoop和Hbase的重要组件。它是源码一个为分布式应用提供一致性服务的软件，提供的源码功能包括:配置维护、域名服务、源码分布式同步、源码组服务等。源码

ZooKeeper的源码目标就是封装好复杂易出错的关键服务，将简单易用的源码接口和性能高效、功能稳定的源码系统提供给用户。

ZooKeeper包含一个简单的源码原语集，提供Java和C的接口。

ZooKeeper代码版本中，提供了分布式独享锁、选举、源码和补码合成队列的接口，代码在$zookeeper_home\src\recipes。其中分布锁和队列有Java和C两个版本，选举只有Java版本。

它的原理：

ZooKeeper是以Fast Paxos算悔判法为基础的，Paxos 算法存在活锁的问题，即当有多个proposer交错提交时，有弊敬可能互相排斥导致没有一个proposer能提交成功，而Fast Paxos做了一些优化，通过选举产生一个leader (领导者)，只有leader才能提交proposer，具体算法可见Fast Paxos。因此，要想弄懂ZooKeeper首先得对Fast Paxos有所了解。

ZooKeeper的基本运转流程:1、选举Leader。2、同步数据。搭建积分下载源码3、选举Leader过程中算法有很多，但要达到的选举标准是一致的。4、Leader要具有最高的执行ID，类似root权限。5、集群中大多数的机器得到响应并接受选出的Leader。

Hbaseè¯»ååç

ä¸ååæåå«åå¨ä¸åçæä»¶å¤¹éã

ä¸MySQLæ¯è¾

é¦åHbaseæ¯ä¾èµäºHDFSåzookeeperçã

RegionServerç®¡çäºå¾å¤çRegionï¼è¡¨ï¼ï¼RegionServeréé¢çWAL(HLog)æ¯é¢åå¥æ¥å¿ï¼åè½æ¯é²æ¢ååä¸çæ°æ®æ²¡ææ¥çåè½çæ¶ä¸¢å¤±ãå¨Regionéé¢ç®¡ççStoreç®¡ççæ¯åæï¼Storeéé¢æMem Storeï¼ååï¼ï¼Flushä¹åï¼å é¤ååä¸çæ°æ®ï¼åæ¶åå¥æä»¶StoreFile Hfile,Hfile å¶å®æ¯å¨DataNodeéé¢çã

Hbaseçè¯»æ¯åæ¢ã

ï¼1ï¼é¦åå®¢æ·ç«¯åzkè¯·æ±åæ°æ®è¡¨æå¨çRegionServerï¼zkè¿åç»å®¢æ·ç«¯metaè¡¨æå¨çregionServerã

æ³¨ï¼metaè¡¨æå¨çä½ç½®ä¿¡æ¯ä¿åå¨zkçmeta-region-serverèç¹ä¸ï¼å®¢æ·ç«¯é¦åå°±æ¯å¨è¿ä¸ªèç¹ä¸å·®è¯¢metaè¡¨æå¨çRegionServerãmetaè¡¨éé¢çä¿¡æ¯å°±æ¯è¡¨ä¸å¶å¯¹åºçRegionServerçä¿¡æ¯

ä¸åçåææ¯å¨ä¸åçæä»¶å¤¹ã

MemStoreå·åæ¶æºï¼

å¨å±çMemStoreçå®¹éï¼é»è®¤æ¯å ååç%ãè¿ä¸ªå®¹éå¼ä¼è§¦åflushæä½ï¼ææçMemStoreé½è¦å·åï¼flushæä½ä¼é»å¡è¯»åæä½ã

ä¼å·åå¹¶é»å¡å°å°MemStoreå¤§å°éå°å®çæå¤§å®¹éç%

WALæ¥å¿çå·åæ¶æºï¼

ï¼1ï¼ä»zkæ¾metaè¡¨æå¨çRegionServer

ï¼2ï¼ä»ä¸è¿°RegionServeréçmetaè¡¨éæ¾ç®æ è¡¨æå¨çRegionServerï¼åæ¶æmetaè¡¨ç¼åï¼å éåé¢çæ¥è¯¢ã

RegionServeréé¢æblock Cacheå¯ä»¥ç¼åç£ççæ°æ®ï¼å éæ¥è¯¢ãå¦æblock Cacheéé¢æï¼å°±å°ç¼ååMemStoreçæ°æ®mergeç¶ååææ°æ¶é´æ³ï¼æ²¡æå°±æ¯æç£çè¯»çåMemStoreéé¢çåå¹¶ãæä»¥hbaseå¤§å¤æ°è¯»è¦èµ°ç£çï¼æä»¥è¯»å¾æ¢ã

æ¯æ¬¡å·åä¼çææ°çHfileï¼Hfileå¾å°å¹¶ä¸æ°éå¤çæ¶åä¼å½±åæ¥è¯¢çéåº¦ãæä»¥è¦è¿è¡åå¹¶ãåå¹¶åä¸ºminor Compactionåmajor Compaction

minor Compactionå°ä¸´è¿çè¥å¹²è¾å°çHfileåå¹¶æä¸ä¸ªè¾å¤§çHfileï¼ä¸ä¼æ¸çè¿æåå é¤çæ°æ®ï¼major Compactionä¼å°ä¸ä¸ªStoreéé¢çææHfileåå¹¶æä¸ä¸ªå¤§çHfileï¼å¹¶ä¸ä¼æ¸çæè¿æåå é¤çæ°æ®ã

ä½æ¯DDLè¯è¨æ¯è¦æHmasterç

Flushåmajor Compact

ï¼2ï¼major compaction ä¼æ¸é¤è¿ææå é¤çæ°æ®ã

Splitçæ¶æºï¼

ï¼1ï¼å½ä¸ä¸ªRegionä¸çæä¸ªStoreä¸çStoreFileçæ»å¤§å°æ¥è¿æä¸ªå¼ï¼ç±åæ°hbase.hregion.max.filesizeè®¾å®ï¼é»è®¤gï¼ï¼è¯¥Regionå°±ä¼æç§RowKeyè¿è¡æåã

ï¼2ï¼å¨æ°çæ¬ä¸è¿ä¸ªå¼æ¯Minï¼R^2*"hbase.hregion.memStore.flush.sizeï¼Mï¼","hbase.hregion.max.filesize"ï¼,Ræ¯å½åRegionServerä¸å±äºè¯¥TableçRegionä¸ªæ°ãåregionæ¯æç§RowKeyååçãè¿ä¼å¯¼è´æ°æ®å¾æï¼å°±æ¯å ä¸ºååçéå¼å¨ååï¼å¯¼è´ååä¹åçregionæ°æ®éä¸ååï¼å¯¼è´çç¹çé®é¢ãæä»¥å¨å»ºè¡¨çæ¶åè¦åé¢ååºï¼å°±æ¯ç¨RowKeyè§åå¥½å¤å°ä¸ªregionï¼ä¸è®©hbaseèªå·±çååé»è¾ååã

deleteæä½ï¼

ï¼1ï¼è®¾ç½®RowKeyï¼æçå é¤æ è®°æ¯deleteFamilyï¼å é¤å¤ä¸ªçæ¬

ï¼2ï¼è®¾ç½®RowKey+Familyï¼æçæ è®°æ¯deleteFamilyï¼å é¤å¤ä¸ªçæ¬

ï¼3ï¼è®¾ç½®RowKey+family+columnï¼æaddColumn()åaddColumns().addColumnæ¯å é¤ææ°ççæ¬æèå é¤æå®æ¶é´æ³ççæ¬ï¼å é¤æ è®°æ¯deleteæ è®°ãaddColumnsæ¯å é¤ææççæ¬æèå é¤æå®æ¶é´æ³æä¹åççæ¬ï¼å é¤æ è®°æ¯deleteColumn

Deleteçæä½å¶å®ä¹æ¯putæä½ï¼putçæ¯å é¤çæ è®°ã

å¨Hbaseä¸HMasterè´è´£çæ§HRegionServerççå½å¨æï¼åè¡¡RegionServerçè´è½½ï¼å¦æHMasterææäºï¼é£ä¸ªæ´ä¸ªHbaseéç¾¤å°å¤äºä¸å¥åº·çç¶æï¼å¹¶ä¸æ¤æ¶çå·¥ä½ç¶æä¸ä¼ç»´æå¤ªä¹ãæä»¥Hbaseæ¯æå¯¹HMasterçé«å¯ç¨éç½®ã

å¨Hbaseçconfç®å½ä¸æ°å»ºbackup-mastersæä»¶ï¼vimå å¥å¤ä»½Masterï¼æ¯å¦slave,slave.å¨ææä»¶ååå°åä¸ªslaveéï¼ç¶ååå¯å¨hbase å°±è½å®ç°HMasterçé«å¯ç¨äºã

ï¼1ï¼æå¨è®¾å®é¢ååº

æå¨è®¾ç½®RowKeyåäº5ä¸ªregion

ï¼2ï¼çæè¿å¶åºåé¢ååº

ï¼3ï¼æç§æä»¶ä¸è®¾ç½®çè§åé¢ååº

åå»ºsplit.txt

ç¶åæ§è¡

ï¼4ï¼ä½¿ç¨JavaAPIé¢ååº

ï¼1ï¼å¸ææ°æ®è½å¤å°½éååçåéå¨å¤ä¸ªååºéé¢ï¼æ£åæ§ï¼ã

ï¼2ï¼å¯ä¸æ§

ï¼3ï¼é¿åº¦ååï¼çäº§ç¯å¢å°ä½ï¼

å¸¸è§çè®¾è®¡æ¹æ¡ï¼

ï¼1ï¼çäº§éæºæ°ãhashãæ£åå¼

ï¼2ï¼åç¬¦ä¸²åè½¬

ï¼3ï¼åç¬¦ä¸²æ¼æ¥

çµä¿¡é¡¹ç®ï¼

ä¸æ¬¡éè¯çè®°å½ï¼-> -- ::

åè®¾åä¸ªåº

ååºé®æä¹è®¾è®¡ï¼

ï¼ä¸ªé®ï¼

...

RowKeyçåé¢ä¸è¬ä¼æ¼ä¸_,_,...,_

è¿æ ·åçå¥½å¤æ¯ï¼æ ¹æ®åä¸ä½å°±è½ç¥éåªä¸ªååºã

åå¸åä½ï¼[ï¼^ï¼.hash]%

åè®¾è¦æ¥è¯¢æç¨æ·å¹´2æçéè¯è®°å½ï¼å¯ä»¥ç¨ åstartRowkeyï¼ åendRowKey

å¾®åã

1ãéæ±

ï¼1ï¼å¾®ååå®¹çæµè§

ï¼2ï¼ç¨æ·ç¤¾äº¤ï¼å³æ³¨ç¨æ·ï¼åå³ç¨æ·

ï¼3ï¼æåå³æ³¨äººçå¾®åç¨æ·

2ãè®¾è®¡è¡¨

ï¼1ï¼å¾®ååå®¹è¡¨Content

è¡é®ï¼ç¨æ·id+æ¶é´æ³

ï¼2ï¼ç¨æ·å³ç³»è¡¨

è¡é®ï¼ç¨æ·id

ï¼3ï¼åå§åé¡µé¢çè¡¨ï¼æ¾ç¤ºå³æ³¨çäººçæè¿ä¸æ¡å¾®åï¼

ZooKeeperå¨HBaseä¸çåºç¨

ä¸ä¸ªåå¸å¼HBaseç³»ç»å®è£ä¾èµäºä¸ä¸ªè¿è¡ççZooKeeperéç¾¤ï¼ææåä¸çèç¹åå®¢æ·ç«¯å¿é¡»è½å¤æ£å¸¸è®¿é®è¿è¡ççZooKeeperéç¾¤ãHBaseé»è®¤ä¸ºä½ æä¾ä¸ä¸ªèç¹çZooKeeperéç¾¤ï¼å®ä¼ä¼´éçHBase start/stopè¿ç¨çå¯å¨/åæ¢èå¯å¨/åæ¢ãé£ä¹HBaseä¸»è¦ç¨ZooKeeperæ¥å¹²ä»ä¹å¢ï¼HBaseä¸»è¦ç¨ZooKeeperæ¥å®ç°HMasteréä¸¾ä¸ä¸»å¤åæ¢ãç³»ç»å®¹éãRootRegionç®¡çãRegionç¶æç®¡çååå¸å¼SplitWALä»»å¡ç®¡ççã

ä¸ï¼HMasteréä¸¾ä¸ä¸»å¤åæ¢

HMasteréä¸¾ä¸ä¸»å¤åæ¢çåçåHDFSä¸NameNodeåYARNä¸ResourceManagerçHAåçç¸åã

äºï¼ç³»ç»å®¹é

å½HBaseå¯å¨æ¶ï¼æ¯ä¸ªRegionServeré½ä¼å°ZooKeeperç/hbase/rsèç¹ä¸åå»ºä¸ä¸ªä¿¡æ¯èç¹ï¼ä¸æä¸ï¼æä»¬ç§°è¯¥èç¹ä¸ºârsç¶æèç¹âï¼ï¼ä¾å¦/hbase/rs/[Hostname]ï¼åæ¶ï¼HMasterä¼å¯¹è¿ä¸ªèç¹æ³¨åçå¬ãå½æä¸ª RegionServer ææçæ¶åï¼ZooKeeperä¼å ä¸ºå¨ä¸æ®µæ¶é´åæ æ³æ¥åå¶å¿è·³ï¼å³ Session å¤±æï¼ï¼èå é¤æè¯¥ RegionServer æå¡å¨å¯¹åºç rs ç¶æèç¹ãä¸æ¤åæ¶ï¼HMaster åä¼æ¥æ¶å° ZooKeeper ç NodeDelete éç¥ï¼ä»èæç¥å°æä¸ªèç¹æå¼ï¼å¹¶ç«å³å¼å§å®¹éå·¥ä½ã

ä¸ï¼Regionç®¡ç

åï¼åå¸å¼SplitWALä»»å¡ç®¡ç

HBase 底层原理详解（深度好文，建议收藏）

HBase是一个分布式的、面向列的开源数据库，基于Hadoop，主要用于存储大量数据。它在HDFS之上构建，依赖Hadoop生态系统。HBase介于NoSQL和RDBMS之间，只能通过主键（row key）和范围检索数据，支持单行事务。情侣博客搭建源码其表具有行键排序和位置相关性特性。

HBase中表的特点是行键用于检索记录，支持三种访问方式：按行键、按行键范围和通过Zookeeper。行键可以是任意字符串，长度为KB，实际应用中长度一般为-bytes，存储为字节数组。行键排序存储，设计时应考虑经常一起读取的行应放在一起。存储时数据按字典顺序排序，读写操作是原子的。

列族是表的结构的一部分，列归属于列族。列族用于访问控制、磁盘和内存使用统计。列族过多会增加读取数据的I/O和搜索文件次数，因此除非必要，源码数怎么扩展不要设置过多列族。

列是列族下的具体列，类似于MySQL中的具体列。时间戳用于记录数据的多个版本，通过行键、列和时间戳确定数据单元（cell）。HBase提供两种数据版本回收方式，根据列族设置。单元由row key、column和version唯一确定。数据存储为字节码，版本号为默认时间戳，类型为Long。

HRegion存储在HDFS上的StoreFile格式，每个StoreFile包含Trailer、FileInfo、Data Index、Meta Index和Data Block。Data Block是HBase I/O的基本单位，可选择压缩方式存储，以提高效率。每个Data Block由Magic、Key、Value组成，其中Value为二进制数据。

Memstore和StoreFile组成一个HRegion，写操作先写入Memstore，当达到阈值时，触发Flush到StoreFile。StoreFile达到一定大小，触发Compact合并操作或Split操作，实现负载均衡。读操作先在Memstore查找，找不到再查找StoreFile。

HLog（WAL log）用于记录数据变更，用于灾难恢复。每个Region Server维护一个Hlog，而非每个Region一个。合并操作分为Minor Compact和Major Compact，将相同Key的修改合并，形成大StoreFile。当StoreFile大小达到阈值，进行Split，分为两个StoreFile。

HBase的读写过程包括读请求和写请求。读请求先从Zookeeper获取Meta表信息，访问Meta表所在HRegionServer，扫描Memstore和StoreFile获取数据。写请求先写入HLog和Memstore，Memstore达到阈值触发Flush到StoreFile，系统记录redo point。数据写入后，进行Compact和Split操作，以维持高效的数据管理。

HRegion管理包括分配、上线和下线。HMaster记录HRegion Server状态，当需要分配HRegion时，发送装载请求给有空闲空间的HRegion Server。HRegion Server上线和下线由HMaster监控，HRegion Server下线时，HMaster重新分配HRegion。

HMaster工作机制包括上线和下线。HMaster下线导致元数据修改被冻结，集群短时间内不受影响。HMaster下线后，集群中会有一个HMaster等待时机抢占位置。

HBase的三个重要机制包括Flush机制、Compact机制和Split机制。Flush机制控制Memstore大小，触发数据写入StoreFile。Compact机制合并StoreFile，清理过期数据，将版本号保存为1。Split机制将过大的HRegion一分为二，减少StoreFile数量。

è¦ä¸è¦ç¨hbaseèªå¸¦çzookeeperï¼

å ä¸ºæä»¬æ¯å¥½å¤hbaseéç¾¤å±ç¨ä¸ä¸ªzookeeperçï¼å¶ä¸ä¸ä¸ªéç¾¤éè¦ä»hbase 0..2 åçº§å°hbase 0.ä¸ï¼èªç¶ï¼åä¹è¦æ´æ°ãä½æ¯å¶ä¸ä¸å°regionserverä¸é¢åæ¶ä¹æè·zookeeperï¼èzookeeperè¿æ¯ç¨hbase 0..2 èªå¸¦çzookeeperå¨è·ã

çæ¯èç¼ãæ¬æ¥åªæ¯åçº§hbaseï¼zkå´å¼ºè¦åäºã

JAVA连接HBase客户端及HBase写入数据和读取数据原理解析

JAVA连接HBase客户端进行一系列操作，借助HbaseUtil工具类静态代码块一次性创建连接对象、Table对象与Admin对象，实现数据展示、创建表、扫描表、写入数据与读取数据等功能。

写入数据原理图步骤解析如下：客户端向Zookeeper发送请求，请求向Hbase中写入数据至特定表。Zookeeper返回元数据表meta位置，客户端向指定regionserver请求meta表，下载并缓存到本地。解析meta表找到目标数据所在的hostname与regionname，向对应的regionserver写入数据。数据先存入regionserver的内存memorystore中，当内存达到M或触发flush时，数据被写入到hdfs的文件中，形成store file，即hfile。

读取数据原理图步骤解析：客户端向Zookeeper请求读取数据，获得meta表位置，下载并解析meta表，请求对应regionserver读取数据。regionserver首先在内存缓存与内存存储中查找数据，找到直接返回；未找到，则在hdfs中利用布隆过滤器快速定位并返回所需数据。布隆过滤器原理见：你不知道的查找算法之布隆过滤器。

注意点包括flush时机与hdfs中数据真实路径。路径为/hbase/data/namespace/table_name/region_name/cf_name/hfile。

【源码后台登录教程】【源码和补码合成】【搭建积分下载源码】zookeeper hbase源码

热点文章

重点关注