TokuDB· 性能优化·Bulk Fetch-阿里云RDS 数据库内核月报

牛骨文教育服务平台(让学习变的简单)

牛骨文首页

: 阿里云RDS-数据库内核月报目录; 数据库内核月报－ 2016/09; MySQL · 社区贡献 · AliSQL那些事儿; PetaData · 架构体系 · PetaData第二代低; MySQL · 社区动态 · MariaDB 10.2 前瞻; MySQL · 特性分析 · 执行计划缓存设计与实现; MySQL · 捉虫状态 · bug分析两例; PgSQL · 源码分析 · PG优化器浅析; PgSQL · 源码分析 · PG中的无锁算法和原子操作应用; SQLServer · 最佳实践 · TEMPDB的设计; 数据库内核月报－ 2016/08; MySQL · 特性分析 ·MySQL 5.7新特性系列四; PgSQL · PostgreSQL 逻辑流复制技术的秘密; MySQL · 特性分析 · MyRocks简介; GPDB · 特性分析· Greenplum 备份架构; SQLServer · 最佳实践 · RDS for SQL; TokuDB · 引擎特性 · REPLACE 语句优化; MySQL · 专家投稿 · InnoDB物理行中null值; PgSQL · 实战经验 · 旋转门压缩算法在Postgre; MySQL · 源码分析 · Query Cache并发处理; PgSQL · 源码分析· pg_dump分析; 数据库内核月报－ 2016/07; MySQL · 特性分析 ·MySQL 5.7新特性系列三; MySQL · 特性分析 · 5.7 代价模型浅析; PgSQL · 实战经验 · 分组TOP性能提升44倍; MySQL · 源码分析 · 网络通信模块浅析; MongoDB · 特性分析 · 索引原理; SQLServer · 特性分析 · XML与JSON应用比; MySQL · 最佳实战 · 审计日志实用案例分析; MySQL · 性能优化 · 条件下推到物化表; MySQL · 源码分析 · Query Cache内部剖析; MySQL · 捉虫动态 · 备库1206错误问题说明; 数据库内核月报－ 2016/06; MySQL · 特性分析 · innodb 锁分裂继承与迁移; MySQL · 特性分析 ·MySQL 5.7新特性系列二; PgSQL · 实战经验 · 如何预测Freeze IO风暴; GPDB · 特性分析· Filespace和Tablesp; MariaDB · 新特性 · 窗口函数; MySQL · TokuDB · checkpoint过程; MySQL · 特性分析 · 内部临时表; MySQL · 最佳实践 · 空间优化; SQLServer · 最佳实践 · 数据库实现大容量插入的; 数据库内核月报－ 2016/05; MySQL · 引擎特性 · 基于InnoDB的物理复制实现; MySQL · 特性分析 · MySQL 5.7新特性系列一; PostgreSQL · 特性分析 · 逻辑结构和权限体系; MySQL · 特性分析 · innodb buffer p; PG&GP · 特性分析 · 外部数据导入接; SQLServer · 最佳实践 · 透明数据加密在SQLS; MySQL · TokuDB · 日志子系统和崩溃恢复过程; MongoDB · 特性分析 · Sharded clust; PostgreSQL · 特性分析 · 统计信息计算方法; MySQL · 捉虫动态 · left-join多表导致cr; 数据库内核月报－ 2016/04; MySQL · 参数故事 · innodb_addition; GPDB · 特性分析 · Segment事务一致性与异常处; GPDB · 特性分析 · Segment 修复指南; MySQL · 捉虫动态 · 并行复制外键约束问题二; PgSQL · 性能优化 · 如何潇洒的处理每天上百TB的数; Memcached · 最佳实践 · 热点 Key 问题解决; MongoDB · 最佳实践 · 短连接Auth性能优化; MySQL · 最佳实践 · RDS 只读实例延迟分析; MySQL · TokuDB · Savepoint漫谈; 数据库内核月报－ 2016/03; MySQL · TokuDB · 事务子系统和 MVCC 实; MongoDB · 特性分析 · MMAPv1 存储引擎原理; PgSQL · 源码分析 · 优化器逻辑推理; SQLServer · BUG分析 · Agent 链接泄露; Redis · 特性分析 · AOF Rewrite 分析; MySQL · BUG分析 · Rename table 死; MySQL · 物理备份 · Percona XtraBac; GPDB · 特性分析· GreenPlum FTS 机制; MySQL · 答疑解惑 · 备库Seconds_Behin; MySQL · 答疑解惑 · MySQL 锁问题最佳实践; 数据库内核月报－ 2016/02; MySQL · 引擎特性 · InnoDB 文件系统之文件物; MySQL · 引擎特性 · InnoDB 文件系统之IO系; MySQL · 特性分析 · InnoDB transact; PgSQL · 会议见闻 · PgConf.Russia 2; PgSQL · 答疑解惑 · PostgreSQL 9.6; MySQL · TokuDB · TokuDB之黑科技工具; PgSQL · 性能优化 · PostgreSQL TPC-; MariaDB · 版本特性 · MariaDB 的 GTI; MySQL · 特性分析 · 线程池; MySQL · 答疑解惑 · mysqldump tips; 数据库内核月报－ 2016/01; MySQL · 引擎特性 · InnoDB 事务锁系统简介; GPDB · 特性分析· GreenPlum Primary; MySQL · 专家投稿 · MySQL5.7 的 JSON; MySQL · 特性分析 · 优化器 MRR &am; MySQL · 答疑解惑 · 物理备份死锁分析; MySQL · TokuDB · Cachetable 的工; MySQL · 特性分析 · drop table的优化; MySQL · 答疑解惑 · GTID不一致分析; PgSQL · 特性分析 · Plan Hint; MariaDB · 社区动态 · MariaDB on Po; 数据库内核月报－ 2015/12; PgSQL · 特性介绍 · 全文搜索介绍; MongoDB · 捉虫动态 · Kill Hang问题排查; MySQL · 参数优化 ·RDS MySQL参数调优最佳实; PgSQL · 特性分析 · 备库激活过程分析; MySQL · TokuDB · 让Hot Backup更完; MySQL · 特性分析 · Index Condition; MariaDB · 社区动态 · MariaDB on Po; MySQL · 特性分析 · 企业版特性一览; 数据库内核月报－ 2015/11; MySQL · 社区见闻 · OOW 2015 总结 MyS; MySQL · 特性分析 · Statement Diges; PgSQL · 答疑解惑 · PostgreSQL 用户组权; MySQL · 特性分析 · MDL 实现分析; PgSQL · 特性分析 · full page write; MySQL · 捉虫动态 · MySQL 外键异常分析; MySQL · 答疑解惑 · MySQL 优化器 range; MySQL · 捉虫动态 · ORDER/GROUP BY; MySQL · TokuDB · TokuDB 中的行锁; MySQL · 捉虫动态 · order by limit; 数据库内核月报－ 2015/10; MySQL · 引擎特性 · InnoDB 全文索引简介; MySQL · 特性分析 · 跟踪Metadata lock; MySQL · 答疑解惑 · 索引过滤性太差引起CPU飙高分; PgSQL · 特性分析 · PG主备流复制机制; MySQL · 捉虫动态 · start slave cra; MySQL · 捉虫动态 · 删除索引导致表无法打开; PgSQL · 特性分析 · PostgreSQL Auro; TokuDB · 捉虫动态 · CREATE DATABAS; MySQL · 特性分析 · MySQL权限存储与管理; 数据库内核月报－ 2015/09; MySQL · 引擎特性 · InnoDB Adaptive; PgSQL · 特性分析 · clog异步提交一致性、原子操; MySQL · 捉虫动态 · BUG 几例; PgSQL · 答疑解惑 · 诡异的函数返回值; MySQL · 捉虫动态 · 建表过程中crash造成重建表; PgSQL · 特性分析 · 谈谈checkpoint的调度; MySQL · 特性分析 · 5.6 并行复制恢复实现; MySQL · 备库优化 · relay fetch 备库优; MySQL · 特性分析 · 5.6并行复制事件分发机制; MySQL · TokuDB · 文件目录谈; 数据库内核月报－ 2015/08; MySQL · 社区动态 · InnoDB Page Com; PgSQL · 答疑解惑 · RDS中的PostgreSQL; MySQL · 社区动态 · MySQL5.6.26 Rel; PgSQL · 捉虫动态 · 执行大SQL语句提示无效的内存; MySQL · 社区动态 · MariaDB InnoDB表; PgSQL · 答疑解惑 · 归档进程cp命令的core文件; MySQL · TokuDB · 疯狂的 filenum++; MySQL · 功能分析 · 5.6 并行复制实现分析; MySQL · 功能分析 · MySQL表定义缓存; 数据库内核月报－ 2015/07; MySQL · 引擎特性 · Innodb change b; MySQL · TokuDB · TokuDB Checkp; PgSQL · 特性分析 · 时间线解析; PgSQL · 功能分析 · PostGIS 在 O2O应用; MySQL · 引擎特性 · InnoDB index lo; MySQL · 社区动态 · MySQL内存分配支持NUMA; MySQL · 答疑解惑 · 外键删除bug分析; MySQL · 引擎特性 · MySQL logical r; MySQL · 答疑解惑 · 浮点型的显示问题; 数据库内核月报－ 2015/06; MySQL · 引擎特性 · InnoDB 崩溃恢复过程; MySQL · 捉虫动态 · 唯一键约束失效; MySQL · 捉虫动态 · ALTER IGNORE TA; MySQL · 答疑解惑 · MySQL Sort 分页; MySQL · 答疑解惑 · binlog event 中的; PgSQL · 功能分析 · Listen/Notify 功; MySQL · 捉虫动态 · 任性的 normal shut; PgSQL · 追根究底 · WAL日志空间的意外增长; MySQL · 社区动态 · MariaDB Role 体系; MySQL · TokuDB · TokuDB数据文件大小计; MySQL · 引擎特性 · InnoDB redo log; MySQL · 专家投稿 · MySQL数据库SYS CPU; MySQL · 捉虫动态 · 5.6 与 5.5 InnoD; MySQL · 答疑解惑 · InnoDB 预读 VS Or; PgSQL · 社区动态 · 9.5 新功能BRIN索引; MySQL · 答疑解惑 · set names 都做了什么; MySQL · 捉虫动态 · 临时表操作导致主备不一致; TokuDB · 引擎特性 · zstd压缩算法; MySQL · 答疑解惑 · binlog 位点刷新策略; 数据库内核月报－ 2015/04; MySQL · 引擎特性 · InnoDB undo log; TokuDB · 产品新闻 · RDS TokuDB小手册; PgSQL · 社区动态 · 说一说PgSQL 9.4.1中; MySQL · 捉虫动态 · 连接断开导致XA事务丢失; MySQL · 捉虫动态 · GTID下slave_net_; MySQL · 捉虫动态 · Relay log 中 GTI; MySQL · 答疑释惑 · UPDATE交换列单表和多表的; MySQL · 捉虫动态 · 删被引用索引导致crash; MySQL · 答疑释惑 · GTID下auto_posit; 数据库内核月报－ 2015/03; MySQL · 答疑释惑· 并发Replace into导; MySQL · 性能优化· 5.7.6 InnoDB pa; MySQL · 捉虫动态· pid file丢失问题分析; MySQL · 答疑释惑· using filesort V; MySQL · 优化限制· MySQL index_cond; MySQL · 捉虫动态·DROP DATABASE外键约束; MySQL · 答疑释惑· lower_case_tabl; PgSQL · 特性分析· Logical Decoding; PgSQL · 特性分析· jsonb类型解析; TokuDB ·引擎机制· TokuDB线程池; 数据库内核月报－ 2015/02; MySQL · 性能优化· InnoDB buffer p; MySQL · 社区动态· 5.6.23 InnoDB相关B; PgSQL · 特性分析· Replication Slot; PgSQL · 特性分析· pg_prewarm; MySQL · 答疑释惑· InnoDB丢失自增值; MySQL · 答疑释惑· 5.5 和 5.6 时间类型兼; MySQL · 捉虫动态· 变量修改导致binlog错误; MariaDB · 特性分析· 表/表空间加密; MariaDB · 特性分析· Per-query var; TokuDB · 特性分析· 日志详解; 数据库内核月报－ 2015/01; MySQL · 性能优化· Group Commit优化; MySQL · 新增特性· DDL fast fail; MySQL · 性能优化· 启用GTID场景的性能问题及优; MySQL · 捉虫动态· InnoDB自增列重复值问题; MySQL · 优化改进· 复制性能改进过程; MySQL · 谈古论今· key分区算法演变分析; MySQL · 捉虫动态· mysql client cr; MySQL · 捉虫动态· 设置 gtid_purged 破; MySQL · 捉虫动态· replicate filte; TokuDB·特性分析· Optimize Table; 数据库内核月报－ 2014/12; MySQL· 性能优化·5.7 Innodb事务系统; MySQL· 踩过的坑·5.6 GTID 和存储引擎那会事; MySQL· 性能优化·thread pool 原理分析; MySQL· 性能优化·并行复制外建约束问题; MySQL· 答疑释惑·binlog event有序性; MySQL· 答疑释惑·server_id为0的Rotat; MySQL· 性能优化·Bulk Load for CRE; MySQL· 捉虫动态·Opened tables blo; MySQL· 优化改进· GTID启动优化; TokuDB· Binary Log Group Comm; 数据库内核月报－ 2014/11; MySQL· 捉虫动态·OPTIMIZE 不存在的表; MySQL· 捉虫动态·SIGHUP 导致 binlog; MySQL· 5.7改进·Recovery改进; MySQL· 5.7特性·高可用支持; MySQL· 5.7优化·Metadata Lock子系统; MySQL· 5.7特性·在线Truncate undo; MySQL· 性能优化·hash_scan 算法的实现解析; TokuDB· 引擎特性· FAST UPDATES; MariaDB· 性能优化·filesort with s; 数据库内核月报－ 2014/10; MySQL· 5.7重构·Optimizer Cost Mo; MySQL· 系统限制·text字段数; MySQL· 捉虫动态·binlog重放失败; MySQL· 捉虫动态·从库OOM; MySQL· 捉虫动态·崩溃恢复失败; MySQL· 功能改进·InnoDB Warmup特性; MySQL· 文件结构·告别frm文件; MariaDB· 新鲜特性·ANALYZE stateme; TokuDB· 主备复制·Read Free Replic; TokuDB· 引擎特性·压缩; 数据库内核月报－ 2014/09; MySQL· 捉虫动态·GTID 和 DELAYED; MySQL· 限制改进·GTID和升级; MySQL· 捉虫动态·GTID 和 binlog_chec; MySQL· 引擎差异·create_time in sta; MySQL· 参数故事·thread_concurrenc; MySQL· 捉虫动态·auto_increment; MariaDB· 性能优化·Extended Keys; MariaDB·主备复制·CREATE OR REPLAC; TokuDB· 参数故事·数据安全和性能; TokuDB· HA方案·TokuDB热备; 数据库内核月报－ 2014/08; MySQL· 参数故事·timed_mutexes; MySQL· 参数故事·innodb_flush_log_; MySQL· 捉虫动态·Count(Distinct) E; MySQL· 捉虫动态·mysqldump BUFFER; MySQL· 捉虫动态·long semaphore wa; MariaDB·分支特性·支持大于16K的InnoDB P; MariaDB·分支特性·FusionIO特性支持; TokuDB· 性能优化·Bulk Fetch; TokuDB·社区八卦·TokuDB团队; PgSQL · 最佳实践 · pg_rman源码浅析与使用; MongoDB · 特性分析· Sharding原理与应用; MySQL · TokuDB · TokuDB索引结构--F; MySQL · 引擎特性 · InnoDB 事务子系统介绍; PgSQL · 答疑解惑 · 表膨胀; PgSQL · 特性分析 · pg_receivexlog工; MySQL · 答疑解惑 · open file limit; MySQL · 功能介绍 · binlog拉取速度的控制; 数据库内核月报－ 2015/05; MySQL · 捉虫动态 · MySQL DDL BUG; TokuDB· 版本优化· 7.5.0; TokuDB· 数据结构·Fractal-Trees与LSM

Bulk Fetch是为了提升区间操作性能的，聊它之前，先简单唠叨下读取机制，TokuDB由两部分组成: tokuFT和 tokudb-engine 。
tokuFT是个支持事务的key/value存储层，tokudb-engine是MySQL API对接层，调用关系为:tokudb-engine ->tokuFT。
tokuFT里的一个value，在tokudb-engine里就是一条row数据，底层存储与上层调用解耦，是个很棒的设计。
在tokuFT是个key里，索引的每个node都是大块头(4MB)，node又细分为多个＂小块＂(internal node的叫做partition，leaf node的叫做basement)。
从磁盘读取数据到内存的方式有２种：

仅读一个＂小块＂的数据，反序列化到内存（提升point query性能，只读取需要的那部分数据即可)
读取整个node数据，反序列化到内存（提升区间性能，一次读取整个node磁盘数据）

对于tokudb-engine层的区间操作（比如get_next等），tokuFT这层是无状态的，必须告诉当前的key，然后给你查找next，流程大体是:

 tokudb-engine::get_next(current_key) --> tokuFT::search_next(current_key) --> tokuFT::return next

这样，即使tokuFT缓存了整个node数据，tokudb-engine还是遍历着跟tokuFT要一遍：tokuFT每次都要根据当前key，多次调用compare操作最终查出next，路径太长了！
有什么办法优化呢？这就是Bulk Fetch的威力: tokudb-engine向tokuFT一次要回整个node的数据，自己解析出next row数据，tokuFT的调用就省了:

 tokudb-engine::get_next(current_key) --> tokudb-engine::parse_next

从Tokutek的测试看，在使用Bulk Fetch后，能有2x-5x的性能提升。
但并不是所有的区间操作都可以Bulk Fetch的(比如涉及update/delete)，TokuDB目前实现了:SELECT、CREATE_TABLE、INSERT_SELECT和REPLACE_SELECT的Bulk Fetch功能，预计发布在7.1.8版，更多Bulk Fetch介绍：
https://github.com/Tokutek/tokudb-engine/wiki/Bulk-Fetch

copyright © 2008-2019 亿联网络版权所有备案号：粤ICP备14031511号-2