【七彩虹教育】Linux操作系统内存分配方式(成都七彩虹教育)

在Linux操作系统下进程通过C标准库中的内存分配函数 malloc 向系统申请内存(malloc() 并不是系统调用,也不是运算符,而是C库里的函数,用于动态分配内存。),但真正与内核交互之间,其实还隔了一层,即内存分配管理器(memory allocator)。

目前Linux系统常见的内存分配器包括:ptmalloc(Glibc)、tcmalloc(Google)、jemalloc(FreeBSD)。

分别介绍下大致的功能:

1.ptmalloc(glibc malloc)

GNU Libc 的内存分配器(allocator)—ptmalloc,起源于Doug Lea的malloc。由Wolfram Gloger改进得到可以支持多线程。

内存分配器中只有一个主分配区(main arena),每次分配内存都必须对主分配区加锁,分配完成后释放锁,在SMP多线程环境下,对主分配区的锁的争用很激烈,严重影响了malloc的分配效率。ptmalloc增加了动态分配区(dynamic arena),主分配区与动态分配区用环形链表进行管理。每一个分配区利用互斥锁(mutex)使线程对于该分配区的访问互斥。每个进程只有一个主分配区,但可能存在多个动态分配区,ptmalloc根据系统对分配区的争用情况动态增加动态分配区的数量,分配区的数量一旦增加,就不会再减少了。而动态分配区每次使用mmap()向操作系统“批发HEAP_MAX_SIZE大小的虚拟内存,如果内存耗尽,则会申请新的内存链到动态分配区heap data的“strcut malloc_state”。如果用户请求的大小超过HEAP_MAX_SIZE,动态分配区则会直接调用mmap()分配内存,并且当free的时候调用munmap(),该类型的内存块不会链接到任何heap data。

Chunk说明:

一个arena 中最顶部的 chunk 被称为「top chunk」。它不属于任何 bin 。当所有 bin 中都没有合适空闲内存时,就会使用 top chunk 来响应用户请求。当top chunk 的大小比用户请求的大小小的时候,top chunk 就通过 sbrk(main arena)或 mmap( thread arena)系统调用扩容。

优点:

ptmalloc是GNU C库(glibc)中的默认内存分配器,广泛用于Linux系统。

基于Doug Lea的malloc实现,采用了多种技术,如自由链表、分离器和堆的延迟绑定等。

ptmalloc的特点是成熟、稳定,并且与GNU C库紧密集成。

缺点:

如果后分配的内存先释放,无法及时归还系统。因为ptmalloc收缩内存是从top chunk开始,如果与top chunk相邻的 chunk不能释放, top chunk 以下的 chunk 都无法释放。

内存不能在线程间移动,多线程使用内存不均衡将导致内存浪费。

每个chunk至少8字节的开销很大。

不定期分配长生命周期的内存容易造成内存碎片,不利于回收。

加锁耗时,无论当前分区有无耗时,在内存分配和释放时,会首先加锁。

从上述来看ptmalloc的主要问题其实是内存浪费、内存碎片、以及加锁导致的性能问题。

2.tcmalloc(Google malloc)

tcmalloc是Google开发的内存分配器,在Golang、『Chrome』中都有使用该分配器进行内存分配。有效的优化了ptmalloc中存在的问题。

tcmalloc是专门对多线并发的内存管理而设计的,tcmalloc主要是在线程级实现了缓存,使得用户在申请内存时大多情况下是无锁内存分配。整个 TCMalloc 实现了三级缓存,分别是ThreadCache(线程级缓存),Central Cache(中央缓存:CentralFreeeList),PageHeap(页缓存),最后两级需要加锁访问

特点:

tcmalloc是Google开发的内存分配器,主要用于Google的C++代码。

tcmalloc通过减少锁的竞争和减少内存碎片来提高性能。

它使用线程本地缓存(Thread-Caching Malloc)的概念,将内存分配的任务分散到不同的线程中,以减少对共享数据结构的竞争。

tcmalloc还有其他一些优化策略,如小对象合并、高效的分配器缓存等。

tcmalloc也带来了一些问题,使用自旋锁虽然减少了加锁效率,但是如果使用大内存较多的情况下,内存在Central Cache或者Page Heap加锁分配。而tcmalloc对大小内存的分配过于保守,在一些内存需求较大的服务(如推荐系统),小内存上限过低,当请求量上来,锁冲突严重,CPU使用率将指数暴增。

3.jemalloc

jemalloc是facebook推出的,目前在firefox、facebook『服务器』、android 5.0 等服务中大量使用。 jemalloc最大的优势还是其强大的多核/多线程分配能力. 以现代计算机硬件架构来说, 最大的瓶颈已经不再是内存容量或cpu速度, 而是多核/多线程下的lock contention(锁竞争). 因为无论CPU核心数量如何多, 通常情况下内存只有一份. 可以说, 如果内存足够大, CPU的核心数量越多, 程序线程数越多, jemalloc的分配速度越快。

jemalloc解决方法是将一把global lock分散成很多与线程相关的lock。而针对多核心, 则要尽量把不同线程下分配的内存隔离开, 避免不同线程使用同一个cache-line的情况

jemalloc 按照内存分配请求的尺寸,分了 small object (例如 1 – 57344B)、 large object (例如 57345 – 4MB )、 huge object (例如 4MB以上)

jemalloc是一款通用的内存分配器,由FreeBSD社区开发,并逐渐被其他系统广泛采用。

jemalloc致力于提供高度可扩展性和低碎片化的内存分配。

它使用了多个技术,如分离的内存区域、伙伴分配器、线程本地缓存等。

jemalloc还提供了高级特性,如背景线程执行释放、空间利用统计和分析等。

多线程下加锁大大减少

特别声明:[【七彩虹教育】Linux操作系统内存分配方式(成都七彩虹教育)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

空间 AI 颠覆工业动画!LuxReal 破解工业三维动画的行业痛点(空间rn)

从传统到创新:工业动画的蜕变之路传统的工业动画主要依赖专业团队使用复杂的CAD软件进行手动建模,这一过程不仅耗时长,而且成本高昂。 结论LuxReal通过其创新的空间AI技术,彻底改变了工业动画的制作流程,…

空间 AI 颠覆工业动画!LuxReal 破解工业三维动画的行业痛点(空间rn)

狂野时代》大扑街!被评为烂片退票率骤增,『易烊千玺』遭业内内涵(狂野时代小说)

刚刚加冕影帝的『易烊千玺』,其首部上映作品《狂野时代》并未迎来预期的喝彩,反而陷入了一场巨大的口碑危机。这部从定档起就承载无数目光的电影,上映后却迅速遭遇票房与口碑的双重“雪崩”。 影片上映第一天,“《狂野时代…

《<strong>狂野时代</strong>》大扑街!被评为烂片退票率骤增,『易烊千玺』遭业内内涵(狂野时代小说)

特朗普:美国与俄乌“已非常接近达成协议”(美国与特朗普最近的消息)

如不能正常浏览请选用IE浏览器 天津北方网讯:………

特朗普:美国与俄乌“已非常接近达成协议”(美国与特朗普最近的消息)

甲骨文部分用于OpenAI的『数据中心』完工时间将从2027年推迟到2028年(甲骨文主要用于)

财联社12月13日电,知情人士透露,甲骨文公司已将其为OpenAI准备的一些『数据中心』的完工日期从2027年推迟至2028年。消息人士称,这些延误主要是由于人力和材料短缺所致。自从签署以来,甲骨文一直在努力完成…

甲骨文部分用于OpenAI的『数据中心』完工时间将从2027年推迟到2028年(甲骨文主要用于)

解锁分子生物学展厅:当AR穿透微观壁垒,科学也能“触手可及”|生物医药展厅设计|生物医疗展厅设计|生物科技展厅设计|『干细胞』展厅设计|『干细胞』科普馆设计

在我们近期打造的达瑞生物展厅项目中,我们没有选择传统的展板,而是构建了一条细胞“生命通道”。 如果你也希望你的生物医药展厅,不再只是产品的陈列室,而是一个能与公众对话、能激发科研热情的“生命剧场”,欢迎私信…

解锁分子生物学展厅:当AR穿透微观壁垒,科学也能“触手可及”|生物医药展厅设计|生物医疗展厅设计|生物科技展厅设计|『干细胞』展厅设计|『干细胞』科普馆设计