1.Ӳ?硬盘源码̲???Դ??
2.文件系统概述:性能指标、设计思路、擦除可靠性保障
3.nfs copyånfs opençåºå«
4.linux内核源码:内存管理——内存分配和释放关键函数分析&ZGC垃圾回收
5.撕码是硬盘源码什么意思?
6.ROMçå®ä¹
Ӳ?̲???Դ??
Linux计算机安装后,在我们不断的擦除使用过程中,因为添加、硬盘源码删除软件和上网冲浪、擦除lucene in action 源码调试程序等行为,硬盘源码硬盘中会产生各种各样的擦除垃圾文件,而随着这些垃圾文件的硬盘源码不断膨胀,它们不仅会平白吞噬掉我们宝贵的擦除硬盘空间,更会拖累机器的硬盘源码运行速度,影响我们的擦除工作效率。本文介绍一下给 Linux 系统减肥的硬盘源码方法和工具的使用技巧,本文使用的擦除 Linux 发行版本是Ubuntu. 。本文介绍的硬盘源码工具包括:Activity Log Manager、BleachBit、find、fdupes、Geeqie、GConf Cleaner,这些工具都是开源工具,Linux 用户可以通过下载编译源代码在其他流行的 Linux 版本(如 Redhat、SUSE 等)上使用。Linux 下哪些文件属于垃圾文件
软件安装过程中产生的临时文件
许多 bin 格式的软件在安装时,首先要把自身的安装文件解压缩到一个临时目录(一般为/tmp 目录)然后再进行安装。如果软件设计有疏忽或者系统有问题,当安装结束后,这些临时文件就会变得并不临时,成为硬盘里的一堆垃圾,很多时候它们以*.tmp 的面孔出现。
软件运行过程中产生的临时文件
和安装过程一样,在软件的spring core 源码下载运行过程中通常也会产生一些临时交换文件,有些软件运行过后遗留下来的垃圾甚至多达数百兆,比如ssh服务器和客户端连接过程中时产生的文件。还有虚拟机运行时产生的文件。另外我们删除一个账户之后,还会存在一些无用垃圾文件及目录。
上网冲浪产生的临时文件
我们在上网的时候,浏览器总是将网页文件下载到本地机器上,这些缓存文件不但占用了宝贵的磁盘空间,还常常会把我们的个人隐私公之于众。
一些不常用的鸡肋文件
比如一些应用软件自带的帮助和系统手册页等。既然食之无味索性也将它们视作垃圾文件的一种表现。占用空间甚大,更会严重拖累系统和一些图形处理软件的运行速度。另外还有一些损坏的桌面文件,它包括损坏的应用程序菜单按钮和文件关联。
各种缓存文件
如果 Linux 用户安装使用 GIMP 或者 Geeqie 等图形编辑工具,在这些软件都有预览功能,在保存了的文件夹下会产生一个名为Thumbs.db的文件,这个文件会随着文件的增加而膨胀。还有就是.DS_Store 文件,DS_Store 文件是用来存储这个文件夹的显示属性的:比如文件图标的摆放位置。删除以后的副作用就是这些信息的失去。另外还有使用 apt 或者yum软件包安装过程中生成的缓存文件。
使用 Linux 命令删除垃圾文件 删除用户后遗留下的垃圾文件
这里我们使用到的主要命令是 find 。举个例子: 我们删除一个账户之后,还会存在一些无用垃圾文件及目录,我们要找出属于这个用户的垃圾东西,使用 find / -user 用户名 :就可以找到根目录下属于这个用户的相关文件 ,使用命令:
#find ./ -nouser |xargs rm rf
core 文件
当我们在系统下运行某个程序出错的时候,系统会自动将残留在内存中的数据存成 core 文件,久而久之,系统中遗留下来的 core 会越来越多,就像灰尘一样散落在系统的每一个角落里很是烦人。这个时候,xwork1.1.3源码我们就可以应用 find 命令加上exec参数来清理它们。使用命令:
# find / -name core -print -exec rm -rf { } ;
多余的手册页
另外 Linux 提供了众多语言的手册页(man)比如 Ubuntu 的 手册页位于/usr/share/man 目录下 ,可以使用命令删除多余语言的手册页保留中英文即可。
# cd /usr/share/man # find ./ -maxdepth 1 -type d | tail -n +2 | grep -E -v '(en|zh|man).*' | while read d; do rm -rf $d; done
说明:关键字是(en|zh|man) ,您可以根据自己的情况修改。
使用 fdupes 工具删除指定目录下重复文件
fdupes 是一个命令行工具,它会查找和删除指定目录的重复文件,它通过文件的大小和 MD5 值进行比较 。一个字节一个字节进行对比。 首先安装这个工具
# apt-get install fdupes
在 /etc 目录查找重复文件 ,使用如下命令:
#fdupes /etc
可以与 Linux 命令组合使用,删除文件 :
#fdupes -r -f . | grep -v ^$ | tee duplicate.txt cat duplicate.txt | while read file; do rm -v $file; done
另外也可以与sed命令组合使用,删除文件 :
# fdupes -r -n -S /tmp | sed -r s/^/#rm / | sed -r s/$// duplicate-files.sh
删除缓存文件
清理旧版本的软件缓存
# apt-get autoclean
清理所有软件缓存:
#apt-get clean
使用 Geeqie 工具找出相似图像文件
现在的硬盘容量是越来越大,出于备份的考虑,很多朋友会采取宁滥勿缺的原则保存,这就可能出现文件重复的情况,造成文件搜索的效率低下。要在海量的存储空间中找出重复的文档,并不是一件容易的工作。其实借助著名的图像浏览工具 Geeqie 可以很轻松地找出系统中的重复和相似图像文件。这些文件相比文本文件更大,时间长了会占用很多硬盘空间。使用上面介绍的 fdupes 工具就不行,因为 fdupes 工具只能删除完全相同 (md5sum相同) 的重复文件, 但若要剔除 相似 的文件, 则可使用 geeqie 工具。首先安装这个工具:
# apt-get install gqview
下面运行这个工具,在要搜索的目录上按鼠标右键, 选择 Find duplicates recursive...见图 1 。
选择左下角的 Compare by: 下拉菜单可选择比对方式 Similarity (custom)找出相似度 % 以上的,另外可以勾选 Thumbnails 可显示缩略图见图 2
下面在被选取的项目上按鼠标右键, 点选 Delete 即可删除所有被选取的, 删除前会有一个的确认界面以免误删。说明 %是相似度的缺省值,用户可以通过如下方式修改参数:在 Edit Preferences Preferences... Behavior Miscellaneous: Custom similarity threshold 见图 3 。江湖婚庆3.0 源码
使用 BleachBit 清理文件 简介
BleachBit 是一款开源免费的系统清理工具,功能类似 Windows 平台的 CCleaner。BleachBit 能够删除隐藏的垃圾文件,以及简单的保护你的隐私。擦除缓存,删除 cookies 文件,清除互联网浏览历史,删除未使用的本地化碎片日志,删除临时文件,是一款非常实用的跨平台的系统清理工具。BleachBit 提供有rpm和 deb 二进制包,适用于Fedora/CentOS/RHEL、Debian/Ubuntu 等 Linux 发行版。其它 Linux 用户可以选择 BleachBit 的源码包(下载地址:mit、install三步。
write log就是写日志,日志中最主要的内容是,一个事务中被修改后的block的数据和block的位置。
commit是写日志结束的标志,同时也是一个写事务完成的标志,我们可以认为在commit之后,消息就已经被安全地写入了,应用程序可以响应用户。
install则发生在commit之后任何一个可能的时间,其将写操作真正应用到文件系统的其他位置,即将这些block的数据写入block的位置。注意这一步是幂等的,即不管执行多少次,甚至在install的过程中发生了崩溃,只要最终执行完成即可。
如果在commit前系统崩溃/断电了,查看exe源码软件则程序没有响应用户,这条日志最终也不会被install。如果在commit后系统崩溃/断电了,则在之后某次系统上线后,会install这条日志。如果在install的时候系统崩溃/断电了,则下次系统上线会重新install这条日志且不会发生重复写错误。
并发和事务在同一时间,可能多个程序同时向操作系统提交了写操作。如果每个程序的文件IO操作串行执行的话,硬盘会反复发起IO完成的中断,带来多次CPU上下文的切换。同时硬盘本身也无法充分发挥自己的写性能(比如SSD 1ms 可以写入1M,但是操作系统和CPU 1ms内最多提交一个k的写请求),且无法优化随机写的性能(比如因为HDD的寻址优化)。因此文件系统总是会尽可能多地将多个写请求(程序 -> 文件系统)合并为一个写事务(文件系统 -> 硬盘驱动)。
具体而言,合并的方式比较多样,比如根据时间片来划分,每ms内的写请求进行一次合并;或者根据写入的数据的大小做划分,每1MB写入一次;或者采用一些混合策略,或者启发性策略。
一般而言,所有的写请求(比如在C语言中的write函数调用)并不会立马发生磁盘IO,从write函数中返回也不意味着这个写操作已经成功了;这只意味着文件系统已经了解了这个写操作。只有从flush函数中返回,才意味着这个写操作已经随着事务commit了。
和数据库中类似,文件系统的每个事务也都有唯一的id,而且id会不断增长。这个id需要持久化保存。
commit的标志有些人可能会疑问,为什么我们要单独强调commit这个操作呢?write log写完,不就是写日志结束吗?这是因为write log的过程中,系统也可能会崩溃,进而我们可能无法区分硬盘上的数据,到底是我们写入的,还是由于硬盘的惰性擦除而留下的脏数据。因此对于文件系统而言,需要将commit单独拎出来,视为非常重要的一步。
因此这里的核心问题和计算机网络中某些问题很像:怎么验证消息没有被篡改?最自然而然的方式是,给消息添加一个校验码(hash值)。当文件系统在内存中准备好日志之后,我们可以计算日志的hash值,并放入到日志之前。然后将hash值和日志的写请求一起交给硬盘。
只有hash值和日志都完整写入,之后install前的校验(hash(日志) == hash值)才能通过。有任何一块没写入,或没有完整写入,则校验无法通过,则认为这条日志没有commit,不需要install。
install的时机commit之后,数据还没有在其应该在的位置。假如我们修改了一个文件的1字节,并在commit之后,跳过文件系统去查看磁盘的内容,会发现该文件并没有发生改变。但是如果我们通过文件系统去读取这个文件,会发现文件改变了。
在读取过程中,我们可能会命中文件系统的page cache,所以根本不会发生硬盘IO。如果没有命中page cache,则我们要去读硬盘了。而在读硬盘前,我们会检查一下将要读取的block是
nfs copyånfs opençåºå«
åµå ¥å¼çæ件系ç»æ¯ææåµå ¥å¼ç³»ç»æåºç¨çæ件系ç»ã大å¤æ°åµå ¥å¼ç³»ç»éç¨äºLinuxãåµå ¥å¼ç³»ç»å¯¹æ件系ç»çè¦æ±è¦æ±æ件系ç»å¨é¢ç¹çæ件æä½ï¼ä¾å¦ï¼æ°å»ºï¼å é¤ï¼æªæï¼ä¸è½å¤ä¿æè¾é«ç读åæ§è½ï¼è¦æ±ä½ç¢çåãæ¥å¿æ件系ç»ï¼XFS,ReiserFS,Ext3çï¼è½ä¿ææ°æ®çå®æ´æ§ï¼ä½æ¶èè¿å¤ç³»ç»èµæºçå¼±ç¹ä½¿ä¹ä¸è½æ为åµå ¥å¼ç³»ç»ä¸ç主æµåºç¨ã并ä¸è¿äºé½æ¯ä¸é¨ä¸ºç¡¬çè¿ç±»çåå¨è®¾å¤ä¼åï¼å¯¹äºflashè¿ç±»çåå¨ä»è´¨å¹¶ä¸éç¨ãåµå ¥å¼æ件系ç»çè½½ä½æ¯ä»¥Flash为主çåå¨ä»è´¨ï¼Flashçæ¦é¤æ¬¡æ°æ¯æéçï¼æ以为äºå»¶é¿Flashç使ç¨å¯¿å½ï¼åºè¯¥å°½éåå°å¯¹Flashçåå ¥æä½ãåµå ¥å¼æ件系ç»çè½½ä½æ¯ä»¥Flash为主çåå¨ä»è´¨ï¼Flashçæ¦é¤æ¬¡æ°æ¯æéçï¼æ以为äºå»¶é¿Flashç使ç¨å¯¿å½ï¼åºè¯¥å°½é使对Flashçåå ¥æä½åååå¸å¨æ´ä¸ªFlashä¸ãNFSæ¯NetFileSystemçç®åï¼å³ç½ç»æ件系ç»ãç½ç»æ件系ç»æ¯FreeBSDæ¯æçæ件系ç»ä¸çä¸ç§ï¼å®å 许ä¸ä¸ªç³»ç»å¨ç½ç»ä¸ä¸å®äººå ±äº«ç®å½åæ件ãéè¿ä½¿ç¨NFSï¼ç¨æ·åç¨åºå¯ä»¥è±¡è®¿é®æ¬å°æ件ä¸æ ·è®¿é®è¿ç«¯ç³»ç»ä¸çæ件ãYAFFSï¼YetAnotherFlashFileSystemï¼æ¯ç¬¬ä¸ä¸ªä¸é¨ä¸ºNANDFlashåå¨å¨è®¾è®¡çåµå ¥å¼æ件系ç»ï¼éç¨äºå¤§å®¹éçåå¨è®¾å¤ï¼å¹¶ä¸æ¯å¨GPLï¼GeneralPublicLicenseï¼åè®®ä¸åå¸çï¼å¯å¨å ¶ç½ç«å è´¹è·å¾æºä»£ç ã
linux内核源码:内存管理——内存分配和释放关键函数分析&ZGC垃圾回收
本文深入剖析了Linux内核源码中的内存管理机制,重点关注内存分配与释放的关键函数,通过分析4.9版本的源码,详细介绍了slab算法及其核心代码实现。在内存管理中,slab算法通过kmem_cache结构体进行管理,利用数组的形式统一处理所有的kmem_cache实例,通过size_index数组实现对象大小与kmem_cache结构体之间的映射,从而实现高效内存分配。其中,关键的计算方法是通过查找输入参数的最高有效位序号,这与常规的0起始序号不同,从1开始计数。
在找到合适的kmem_cache实例后,下一步是通过数组缓存(array_cache)获取或填充slab对象。若缓存中有可用对象,则直接从缓存分配;若缓存已空,会调用cache_alloc_refill函数从三个slabs(free/partial/full)中查找并填充可用对象至缓存。在对象分配过程中,array_cache结构体发挥了关键作用,它不仅简化了内存管理,还优化了内存使用效率。
对象释放流程与分配流程类似,涉及数组缓存的管理和slab对象的回收。在cache_alloc_refill函数中,关键操作是检查slab_partial和slab_free队列,寻找空闲的对象以供释放。整个过程确保了内存资源的高效利用,避免了资源浪费。
总结内存操作函数概览,栈与堆的区别是显而易见的。栈主要存储函数调用参数、局部变量等,而堆用于存放new出来的对象实例、全局变量、静态变量等。由于堆的动态分配特性,它无法像栈一样精准预测内存使用情况,导致内存碎片问题。为了应对这一挑战,Linux内核引入了buddy和slab等内存管理算法,以提高内存分配效率和减少碎片。
然而,即便使用了高效的内存管理算法,内存碎片问题仍难以彻底解决。在C/C++中,没有像Java那样的自动垃圾回收机制,导致程序员需要手动管理内存分配与释放。如果忘记释放内存,将导致资源泄漏,影响系统性能。为此,业界开发了如ZGC和Shenandoah等垃圾回收算法,以提高内存管理效率和减少内存碎片。
ZGC算法通过分页策略对内存进行管理,并利用“初始标记”阶段识别GC根节点(如线程栈变量、静态变量等),并查找这些节点引用的直接对象。此阶段采用“stop the world”(STW)策略暂停所有线程,确保标记过程的准确性。接着,通过“并发标记”阶段识别间接引用的对象,并利用多个GC线程与业务线程协作提高效率。在这一过程中,ZGC采用“三色标记”法和“remember set”机制来避免误回收正常引用的对象,确保内存管理的精准性。
接下来,ZGC通过“复制算法”实现内存回收,将正常引用的对象复制到新页面,将旧页面的数据擦除,从而实现内存的高效管理。此外,通过“初始转移”和“并发转移”阶段进一步优化内存管理过程。最后,在“对象重定位”阶段,完成引用关系的更新,确保内存管理过程的完整性和一致性。
通过实测,ZGC算法在各个阶段展现出高效的内存管理能力,尤其是标记阶段的效率,使得系统能够在保证性能的同时,有效地管理内存资源。总之,内存管理是系统性能的关键因素,Linux内核通过先进的算法和策略,实现了高效、灵活的内存管理,为现代操作系统提供稳定、可靠的服务。
撕码是什么意思?
撕码(Shred Code)是指将源代码或二进制代码彻底摧毁的过程,其目的是为了保护个人隐私或避免代码泄露。撕码可以将代码彻底删除,不留任何痕迹,极大地增强了数据安全性。
撕码应用广泛,尤其对于那些需要保护知识产权的企业是非常重要的。例如IT安全公司中对于源码的安全保密、司法机关中嫌疑人电脑硬盘数据的处理、个人因泄露而需要删掉代码等这些场景都需要用到撕码。
撕码有多种实现方式,一般可以通过覆盖数据、磁盘擦除、磁盘碎片化等技术手段来实现,同时还有一种专门的边缘设备撕码机,撕完码的芯片也会被粉碎。而在企业中,很多开发人员也使用特殊的插件和软件,将源码进行压缩、加密等操作,从而达到对源代码的保护和限制。
ROMçå®ä¹
ROM æ¯ ROM imageï¼åªè¯»å åéåï¼çç®ç§°ï¼å¸¸ç¨äºææºå®å¶ç³»ç»ç©å®¶çååä¸ãæºè½ææºé ç½®ä¸çROMæçæ¯ EEProm (çµæ¦é¤å¯ååªè¯»åå¨å¨)ï¼ç±»ä¼¼äºè®¡ç®æºç硬çï¼ä¸è¬ææºå·æºçè¿ç¨ï¼å°±æ¯å°åªè¯»å åéåï¼ROM imageï¼åå ¥åªè¯»å åï¼ROMï¼çè¿ç¨ã
常è§ç ROM image æ imgãzip çæ ¼å¼ï¼åè é常ç¨fastbootç¨åºéè¿æ°æ®çº¿å·å ¥ï¼çº¿å·ï¼ï¼åè éå¸¸ç¨ recovery 模å¼ä» sdå·å ¥ï¼å¡å·ï¼ï¼åº img éåä¹è¢«ç§°ä¸ºçº¿å·å ï¼zip éåä¹è¢«ç§°ä¸ºå¡å·å ã
å 为 ROM image æ¯å®å¶ç³»ç»æ常è§çåå¸å½¢å¼ï¼æ以é常ç©å®¶ä¼ä½¿ç¨ ROM è¿ä¸ªè¯æ代ææºçæä½ç³»ç»ã
å½å çå®å¶ç³»ç»å¼åè ï¼ç»å¸¸ä¼é·å ¥èªå·±ç产å究ç«æ¯åºè¯¥ç§°ä¸º OS è¿æ¯ UI çäºè®ºï¼ä¸ºäºé¿å æ¤ç±»äºè®ºå表示谦èï¼ä¼èªç§°ä¸º ROMãå¾å¤å®å¶ç³»ç»ç©å®¶ä¹ä¼ç»ä¸å°å®å¶ç³»ç»ç§°ä¸º ROMã
å 为系ç»æºç éè¦æå æè½æ为éåï¼æ以 ROM ä¹ä¼è¢«ç§°ä¸ºãå ãã