TokuDB ·引擎机制· TokuDB线程池-阿里云RDS 数据库内核月报

牛骨文教育服务平台(让学习变的简单)

牛骨文首页

: 阿里云RDS-数据库内核月报目录; 数据库内核月报－ 2016/09; MySQL · 社区贡献 · AliSQL那些事儿; PetaData · 架构体系 · PetaData第二代低; MySQL · 社区动态 · MariaDB 10.2 前瞻; MySQL · 特性分析 · 执行计划缓存设计与实现; MySQL · 捉虫状态 · bug分析两例; PgSQL · 源码分析 · PG优化器浅析; PgSQL · 源码分析 · PG中的无锁算法和原子操作应用; SQLServer · 最佳实践 · TEMPDB的设计; 数据库内核月报－ 2016/08; MySQL · 特性分析 ·MySQL 5.7新特性系列四; PgSQL · PostgreSQL 逻辑流复制技术的秘密; MySQL · 特性分析 · MyRocks简介; GPDB · 特性分析· Greenplum 备份架构; SQLServer · 最佳实践 · RDS for SQL; TokuDB · 引擎特性 · REPLACE 语句优化; MySQL · 专家投稿 · InnoDB物理行中null值; PgSQL · 实战经验 · 旋转门压缩算法在Postgre; MySQL · 源码分析 · Query Cache并发处理; PgSQL · 源码分析· pg_dump分析; 数据库内核月报－ 2016/07; MySQL · 特性分析 ·MySQL 5.7新特性系列三; MySQL · 特性分析 · 5.7 代价模型浅析; PgSQL · 实战经验 · 分组TOP性能提升44倍; MySQL · 源码分析 · 网络通信模块浅析; MongoDB · 特性分析 · 索引原理; SQLServer · 特性分析 · XML与JSON应用比; MySQL · 最佳实战 · 审计日志实用案例分析; MySQL · 性能优化 · 条件下推到物化表; MySQL · 源码分析 · Query Cache内部剖析; MySQL · 捉虫动态 · 备库1206错误问题说明; 数据库内核月报－ 2016/06; MySQL · 特性分析 · innodb 锁分裂继承与迁移; MySQL · 特性分析 ·MySQL 5.7新特性系列二; PgSQL · 实战经验 · 如何预测Freeze IO风暴; GPDB · 特性分析· Filespace和Tablesp; MariaDB · 新特性 · 窗口函数; MySQL · TokuDB · checkpoint过程; MySQL · 特性分析 · 内部临时表; MySQL · 最佳实践 · 空间优化; SQLServer · 最佳实践 · 数据库实现大容量插入的; 数据库内核月报－ 2016/05; MySQL · 引擎特性 · 基于InnoDB的物理复制实现; MySQL · 特性分析 · MySQL 5.7新特性系列一; PostgreSQL · 特性分析 · 逻辑结构和权限体系; MySQL · 特性分析 · innodb buffer p; PG&GP · 特性分析 · 外部数据导入接; SQLServer · 最佳实践 · 透明数据加密在SQLS; MySQL · TokuDB · 日志子系统和崩溃恢复过程; MongoDB · 特性分析 · Sharded clust; PostgreSQL · 特性分析 · 统计信息计算方法; MySQL · 捉虫动态 · left-join多表导致cr; 数据库内核月报－ 2016/04; MySQL · 参数故事 · innodb_addition; GPDB · 特性分析 · Segment事务一致性与异常处; GPDB · 特性分析 · Segment 修复指南; MySQL · 捉虫动态 · 并行复制外键约束问题二; PgSQL · 性能优化 · 如何潇洒的处理每天上百TB的数; Memcached · 最佳实践 · 热点 Key 问题解决; MongoDB · 最佳实践 · 短连接Auth性能优化; MySQL · 最佳实践 · RDS 只读实例延迟分析; MySQL · TokuDB · Savepoint漫谈; 数据库内核月报－ 2016/03; MySQL · TokuDB · 事务子系统和 MVCC 实; MongoDB · 特性分析 · MMAPv1 存储引擎原理; PgSQL · 源码分析 · 优化器逻辑推理; SQLServer · BUG分析 · Agent 链接泄露; Redis · 特性分析 · AOF Rewrite 分析; MySQL · BUG分析 · Rename table 死; MySQL · 物理备份 · Percona XtraBac; GPDB · 特性分析· GreenPlum FTS 机制; MySQL · 答疑解惑 · 备库Seconds_Behin; MySQL · 答疑解惑 · MySQL 锁问题最佳实践; 数据库内核月报－ 2016/02; MySQL · 引擎特性 · InnoDB 文件系统之文件物; MySQL · 引擎特性 · InnoDB 文件系统之IO系; MySQL · 特性分析 · InnoDB transact; PgSQL · 会议见闻 · PgConf.Russia 2; PgSQL · 答疑解惑 · PostgreSQL 9.6; MySQL · TokuDB · TokuDB之黑科技工具; PgSQL · 性能优化 · PostgreSQL TPC-; MariaDB · 版本特性 · MariaDB 的 GTI; MySQL · 特性分析 · 线程池; MySQL · 答疑解惑 · mysqldump tips; 数据库内核月报－ 2016/01; MySQL · 引擎特性 · InnoDB 事务锁系统简介; GPDB · 特性分析· GreenPlum Primary; MySQL · 专家投稿 · MySQL5.7 的 JSON; MySQL · 特性分析 · 优化器 MRR &am; MySQL · 答疑解惑 · 物理备份死锁分析; MySQL · TokuDB · Cachetable 的工; MySQL · 特性分析 · drop table的优化; MySQL · 答疑解惑 · GTID不一致分析; PgSQL · 特性分析 · Plan Hint; MariaDB · 社区动态 · MariaDB on Po; 数据库内核月报－ 2015/12; PgSQL · 特性介绍 · 全文搜索介绍; MongoDB · 捉虫动态 · Kill Hang问题排查; MySQL · 参数优化 ·RDS MySQL参数调优最佳实; PgSQL · 特性分析 · 备库激活过程分析; MySQL · TokuDB · 让Hot Backup更完; MySQL · 特性分析 · Index Condition; MariaDB · 社区动态 · MariaDB on Po; MySQL · 特性分析 · 企业版特性一览; 数据库内核月报－ 2015/11; MySQL · 社区见闻 · OOW 2015 总结 MyS; MySQL · 特性分析 · Statement Diges; PgSQL · 答疑解惑 · PostgreSQL 用户组权; MySQL · 特性分析 · MDL 实现分析; PgSQL · 特性分析 · full page write; MySQL · 捉虫动态 · MySQL 外键异常分析; MySQL · 答疑解惑 · MySQL 优化器 range; MySQL · 捉虫动态 · ORDER/GROUP BY; MySQL · TokuDB · TokuDB 中的行锁; MySQL · 捉虫动态 · order by limit; 数据库内核月报－ 2015/10; MySQL · 引擎特性 · InnoDB 全文索引简介; MySQL · 特性分析 · 跟踪Metadata lock; MySQL · 答疑解惑 · 索引过滤性太差引起CPU飙高分; PgSQL · 特性分析 · PG主备流复制机制; MySQL · 捉虫动态 · start slave cra; MySQL · 捉虫动态 · 删除索引导致表无法打开; PgSQL · 特性分析 · PostgreSQL Auro; TokuDB · 捉虫动态 · CREATE DATABAS; MySQL · 特性分析 · MySQL权限存储与管理; 数据库内核月报－ 2015/09; MySQL · 引擎特性 · InnoDB Adaptive; PgSQL · 特性分析 · clog异步提交一致性、原子操; MySQL · 捉虫动态 · BUG 几例; PgSQL · 答疑解惑 · 诡异的函数返回值; MySQL · 捉虫动态 · 建表过程中crash造成重建表; PgSQL · 特性分析 · 谈谈checkpoint的调度; MySQL · 特性分析 · 5.6 并行复制恢复实现; MySQL · 备库优化 · relay fetch 备库优; MySQL · 特性分析 · 5.6并行复制事件分发机制; MySQL · TokuDB · 文件目录谈; 数据库内核月报－ 2015/08; MySQL · 社区动态 · InnoDB Page Com; PgSQL · 答疑解惑 · RDS中的PostgreSQL; MySQL · 社区动态 · MySQL5.6.26 Rel; PgSQL · 捉虫动态 · 执行大SQL语句提示无效的内存; MySQL · 社区动态 · MariaDB InnoDB表; PgSQL · 答疑解惑 · 归档进程cp命令的core文件; MySQL · TokuDB · 疯狂的 filenum++; MySQL · 功能分析 · 5.6 并行复制实现分析; MySQL · 功能分析 · MySQL表定义缓存; 数据库内核月报－ 2015/07; MySQL · 引擎特性 · Innodb change b; MySQL · TokuDB · TokuDB Checkp; PgSQL · 特性分析 · 时间线解析; PgSQL · 功能分析 · PostGIS 在 O2O应用; MySQL · 引擎特性 · InnoDB index lo; MySQL · 社区动态 · MySQL内存分配支持NUMA; MySQL · 答疑解惑 · 外键删除bug分析; MySQL · 引擎特性 · MySQL logical r; MySQL · 答疑解惑 · 浮点型的显示问题; 数据库内核月报－ 2015/06; MySQL · 引擎特性 · InnoDB 崩溃恢复过程; MySQL · 捉虫动态 · 唯一键约束失效; MySQL · 捉虫动态 · ALTER IGNORE TA; MySQL · 答疑解惑 · MySQL Sort 分页; MySQL · 答疑解惑 · binlog event 中的; PgSQL · 功能分析 · Listen/Notify 功; MySQL · 捉虫动态 · 任性的 normal shut; PgSQL · 追根究底 · WAL日志空间的意外增长; MySQL · 社区动态 · MariaDB Role 体系; MySQL · TokuDB · TokuDB数据文件大小计; MySQL · 引擎特性 · InnoDB redo log; MySQL · 专家投稿 · MySQL数据库SYS CPU; MySQL · 捉虫动态 · 5.6 与 5.5 InnoD; MySQL · 答疑解惑 · InnoDB 预读 VS Or; PgSQL · 社区动态 · 9.5 新功能BRIN索引; MySQL · 答疑解惑 · set names 都做了什么; MySQL · 捉虫动态 · 临时表操作导致主备不一致; TokuDB · 引擎特性 · zstd压缩算法; MySQL · 答疑解惑 · binlog 位点刷新策略; 数据库内核月报－ 2015/04; MySQL · 引擎特性 · InnoDB undo log; TokuDB · 产品新闻 · RDS TokuDB小手册; PgSQL · 社区动态 · 说一说PgSQL 9.4.1中; MySQL · 捉虫动态 · 连接断开导致XA事务丢失; MySQL · 捉虫动态 · GTID下slave_net_; MySQL · 捉虫动态 · Relay log 中 GTI; MySQL · 答疑释惑 · UPDATE交换列单表和多表的; MySQL · 捉虫动态 · 删被引用索引导致crash; MySQL · 答疑释惑 · GTID下auto_posit; 数据库内核月报－ 2015/03; MySQL · 答疑释惑· 并发Replace into导; MySQL · 性能优化· 5.7.6 InnoDB pa; MySQL · 捉虫动态· pid file丢失问题分析; MySQL · 答疑释惑· using filesort V; MySQL · 优化限制· MySQL index_cond; MySQL · 捉虫动态·DROP DATABASE外键约束; MySQL · 答疑释惑· lower_case_tabl; PgSQL · 特性分析· Logical Decoding; PgSQL · 特性分析· jsonb类型解析; TokuDB ·引擎机制· TokuDB线程池; 数据库内核月报－ 2015/02; MySQL · 性能优化· InnoDB buffer p; MySQL · 社区动态· 5.6.23 InnoDB相关B; PgSQL · 特性分析· Replication Slot; PgSQL · 特性分析· pg_prewarm; MySQL · 答疑释惑· InnoDB丢失自增值; MySQL · 答疑释惑· 5.5 和 5.6 时间类型兼; MySQL · 捉虫动态· 变量修改导致binlog错误; MariaDB · 特性分析· 表/表空间加密; MariaDB · 特性分析· Per-query var; TokuDB · 特性分析· 日志详解; 数据库内核月报－ 2015/01; MySQL · 性能优化· Group Commit优化; MySQL · 新增特性· DDL fast fail; MySQL · 性能优化· 启用GTID场景的性能问题及优; MySQL · 捉虫动态· InnoDB自增列重复值问题; MySQL · 优化改进· 复制性能改进过程; MySQL · 谈古论今· key分区算法演变分析; MySQL · 捉虫动态· mysql client cr; MySQL · 捉虫动态· 设置 gtid_purged 破; MySQL · 捉虫动态· replicate filte; TokuDB·特性分析· Optimize Table; 数据库内核月报－ 2014/12; MySQL· 性能优化·5.7 Innodb事务系统; MySQL· 踩过的坑·5.6 GTID 和存储引擎那会事; MySQL· 性能优化·thread pool 原理分析; MySQL· 性能优化·并行复制外建约束问题; MySQL· 答疑释惑·binlog event有序性; MySQL· 答疑释惑·server_id为0的Rotat; MySQL· 性能优化·Bulk Load for CRE; MySQL· 捉虫动态·Opened tables blo; MySQL· 优化改进· GTID启动优化; TokuDB· Binary Log Group Comm; 数据库内核月报－ 2014/11; MySQL· 捉虫动态·OPTIMIZE 不存在的表; MySQL· 捉虫动态·SIGHUP 导致 binlog; MySQL· 5.7改进·Recovery改进; MySQL· 5.7特性·高可用支持; MySQL· 5.7优化·Metadata Lock子系统; MySQL· 5.7特性·在线Truncate undo; MySQL· 性能优化·hash_scan 算法的实现解析; TokuDB· 引擎特性· FAST UPDATES; MariaDB· 性能优化·filesort with s; 数据库内核月报－ 2014/10; MySQL· 5.7重构·Optimizer Cost Mo; MySQL· 系统限制·text字段数; MySQL· 捉虫动态·binlog重放失败; MySQL· 捉虫动态·从库OOM; MySQL· 捉虫动态·崩溃恢复失败; MySQL· 功能改进·InnoDB Warmup特性; MySQL· 文件结构·告别frm文件; MariaDB· 新鲜特性·ANALYZE stateme; TokuDB· 主备复制·Read Free Replic; TokuDB· 引擎特性·压缩; 数据库内核月报－ 2014/09; MySQL· 捉虫动态·GTID 和 DELAYED; MySQL· 限制改进·GTID和升级; MySQL· 捉虫动态·GTID 和 binlog_chec; MySQL· 引擎差异·create_time in sta; MySQL· 参数故事·thread_concurrenc; MySQL· 捉虫动态·auto_increment; MariaDB· 性能优化·Extended Keys; MariaDB·主备复制·CREATE OR REPLAC; TokuDB· 参数故事·数据安全和性能; TokuDB· HA方案·TokuDB热备; 数据库内核月报－ 2014/08; MySQL· 参数故事·timed_mutexes; MySQL· 参数故事·innodb_flush_log_; MySQL· 捉虫动态·Count(Distinct) E; MySQL· 捉虫动态·mysqldump BUFFER; MySQL· 捉虫动态·long semaphore wa; MariaDB·分支特性·支持大于16K的InnoDB P; MariaDB·分支特性·FusionIO特性支持; TokuDB· 性能优化·Bulk Fetch; TokuDB·社区八卦·TokuDB团队; PgSQL · 最佳实践 · pg_rman源码浅析与使用; MongoDB · 特性分析· Sharding原理与应用; MySQL · TokuDB · TokuDB索引结构--F; MySQL · 引擎特性 · InnoDB 事务子系统介绍; PgSQL · 答疑解惑 · 表膨胀; PgSQL · 特性分析 · pg_receivexlog工; MySQL · 答疑解惑 · open file limit; MySQL · 功能介绍 · binlog拉取速度的控制; 数据库内核月报－ 2015/05; MySQL · 捉虫动态 · MySQL DDL BUG; TokuDB· 版本优化· 7.5.0; TokuDB· 数据结构·Fractal-Trees与LSM

这次还是以介绍TokuDB内部机制为主, 本篇来谈谈TokuDB内部的线程池模型。

TokuDB内部有一个线程池实现kibbutz，代码: https://github.com/Tokutek/ft-index/blob/master/util/kibbutz.cc

其调度思想基于work-stealing，代码也很简洁，大体思路就是：维护一个任务队列，空闲线程自己去这个队列领取任务。

kibbutz中文为“基布兹”,是以色列的一个集体社区，感兴趣的戳这里。

TokuDB内部线程池按功能可以分为以下3大块：

节点“饱和”apply线程池

当一个节点“饱和”的时候，TokuDB需要把节点message buffer中的数据apply到子节点(这个行为是由TokuDB的特殊索引结构决定)。

这个线程池的作用是实现并发apply“饱和”节点，线程数目为物理CPU的个数。

缓存专用线程池

这个线程池专门为缓存服务，包括两大块:

a) 节点预读线程，比如做区间查找的时候，在某些条件下会触发子节点预读，提前在后台线程把节点读取到缓存。

b) LRU剔除线程，当缓存大小到达高水位的时候，后台线程把LRU尾端的脏节点刷到磁盘，并从LRU中清除。

这个池子里的线程数目较多，干的活也比较重，线程数目为物理CPU数*2。

checkpoint克隆线程池

这个线程池比较特殊。

做checkpoint的时候，如果一个节点处于“pin”状态，并且它是可克隆的，就使用后台线程把它的数据克隆出来并刷到磁盘，这样checkpoint可以继续进行下去(如果此节点不可克隆，checkpoint线程会一直等到这个pin状态结束）。

这个线程数为物理CPU数/4（如果CPU > 4)。

好的线程池设计+好的任务调度算法，应该是一个引擎高效的最基本条件，让任务尽量并行起来。

copyright © 2008-2026 亿联网络版权所有备案号：粤ICP备14031511号-2