默认的 Linux 内核被设计为一种通用解决方案,能够在不同的系统和硬件配置上提供广泛的兼容性。它稳定、可靠且经过广泛测试,但并不总是针对特定用例提供最佳性能。
自定义内核(例如 XanMod)则能满足这一需求。XanMod 内核是基于最新稳定版本的 Linux 内核,旨在通过低延迟提高系统的响应性能。它是由社区驱动的项目,结合了其他内核的最佳特性和独特的增强功能,更加专注于优化桌面、多媒体和游戏工作负载,以提供更具响应性和流畅性的 Linux 使用体验。
对于较旧的 Linux 发行版来说,切换到像 XanMod 这样的自定义内核可以提供显著的性能改进。但需要注意的是,使用自定义内核需要更多的技术知识,而且可能不像默认 Linux 内核那样稳定。
XanMod 旨在增强 Linux 的使用体验,以下是 XanMod 官方网站上列出的一些主要特点:
XanMod 项目提供多种不同的内核构建,每种构建都针对特定的用例和硬件配置。
XanMod MAIN 内核
MAIN 内核是标准的 XanMod,包括最新稳定版本的 Linux 内核,并针对桌面、多媒体和游戏工作负载进行了优化。MAIN 内核有四个版本可供选择:
linux-xanmod-x64v1linux-xanmod-x64v2linux-xanmod-x64v3linux-xanmod-x64v4XanMod EDGE 内核
EDGE 内核专为想要最新功能和增强的用户而设计,它们包括最近版本的 Linux 内核,并针对高性能工作负载进行了优化。EDGE 内核有三个版本可供选择:
linux-xanmod-edge-x64v2linux-xanmod-edge-x64v3linux-xanmod-edge-x64v4XanMod LTS 内核
LTS(长期支持)内核是为将稳定性和可靠性放在优先考虑的用户而设计,它们包括较旧但经过更多测试的 Linux 内核版本,并针对通用工作负载进行了优化。LTS 内核有四个版本可供选择:
linux-xanmod-lts-x64v1linux-xanmod-lts-x64v2linux-xanmod-lts-x64v3linux-xanmod-lts-x64v4XanMod RT 内核
RT(实时)内核是为关键应用场景设计的,例如 Linux 游戏服务器、流媒体、直播制作和超低延迟需求的用户,它们包括 PREEMPT_RT 实时补丁,可降低系统的延迟并提高响应性。RT 内核有三个版本可供选择:
linux-xanmod-rt-x64v2linux-xanmod-rt-x64v3linux-xanmod-rt-x64v4这些特定的 XanMod 内核构建被设计用于特定的硬件配置,涵盖从较旧的 x86-64 系统到最新的 AMD 和 Intel 处理器。您可以在 XanMod 网站上找到不同内核构建硬件兼容性的更详细信息。
更新系统
sudo apt update && sudo apt upgrade添加并注册 APT 存储库
sudo apt install gnupgecho 'deb http://deb.xanmod.org releases main' | sudo tee /etc/apt/sources.list.d/xanmod-kernel.listwget -qO - https://dl.xanmod.org/gpg.key | sudo apt-key --keyring /etc/apt/trusted.gpg.d/xanmod-kernel.gpg add -apt update
更新 apt 软件包索引
sudo apt update检查CPU支持内核版本
注意:一定要选择符合的版本进行安装,否则将导致无法正常启动!
awk -f <(wget -O - https://dl.xanmod.org/check_x86-64_psabi.sh)根据输出的内容,你可以清楚地看到v2、v3或v4的标识,据此选择对应的 XanMod 内核
安装内核
以下命令以 XanMod EDGE x64 v3 内核的安装为例,你可以根据自己的需求修改命令
sudo apt install linux-xanmod-edge-x64v3查看所有内核
dpkg --list | egrep -i --color 'linux-image|linux-headers'如果安装成功,你就可以看到 XanMod EDGE x64 v3 内核
删除不需要的内核和配置文件
内核已经安装成功,但是当前并未生效,所以你需要将其他内核删除。当然,你也可以不删除,指定启动内核即可。关于此请自行搜索教程。
删除内核(请根据上面命令中输出结果,修改下面的命令)sudo apt remove linux-image-5.10.0-26-amd64删除内核配置文件(请根据上面命令中输出结果,修改下面的命令)sudo apt purge linux-image-amd64查看到的所有内核列表中:前面标记ii的,即为内核。其中linux-headers为当前使用的启动内核,linux-image为当前系统中安装的内核;前面标记rc的,为已被删除的内核所留存的配置文件。
更新系统软件包并清除未使用的依赖项
sudo apt-get updatesudo apt-get autoremove
更新 GRUB 配置
sudo update-grub验证安装
cat /proc/version重启系统
reboot查看正在使用的内核
uname -mrs查看BBR3状态
modinfo tcp_bbr如果提示:modinfo: ERROR: Module tcp_bbr not found.错误请执行sudo depmod命令再查看BBR3状态。
现在 XanMod 内核已经安装成功并生效。
以下是本人使用的XanMod 内核优化设置,你可以无脑替换/etc/sysctl.conf文件中的所有内容,也可以根据自己的实际情况进行优化。
# ------ 网络调优: 基本 ------# TTL 配置, Linux 默认 64# net.ipv4.ip_default_ttl=64# 参阅 RFC 1323. 应当启用.net.ipv4.tcp_timestamps=1# ------ END 网络调优: 基本 ------# ------ 网络调优: 内核 Backlog 队列和缓存相关 ------# Ref: https://www.starduster.me/2020/03/02/linux-network-tuning-kernel-parameter/# Ref: https://blog.cloudflare.com/optimizing-tcp-for-high-throughput-and-low-latency/# Ref: https://zhuanlan.zhihu.com/p/149372947# 有条件建议依据实测结果调整相关数值# 缓冲区相关配置均和内存相关net.core.wmem_default=16384net.core.rmem_default=262144net.core.rmem_max=536870912net.core.wmem_max=536870912net.ipv4.tcp_rmem=8192 262144 536870912net.ipv4.tcp_wmem=4096 16384 536870912net.ipv4.tcp_adv_win_scale=-2net.ipv4.tcp_collapse_max_bytes=6291456net.ipv4.tcp_notsent_lowat=131072net.core.netdev_max_backlog=10240net.ipv4.tcp_max_syn_backlog=10240net.core.somaxconn=8192net.ipv4.tcp_abort_on_overflow=1# 流控和拥塞控制相关调优# Egress traffic control 相关. 可选 fq, cake# 实测二者区别不大, 保持默认 fq 即可net.core.default_qdisc=fq_pie# Xanmod 内核 6.X 版本目前默认使用 bbr3, 无需设置# 实测比 bbr, bbr2 均有提升# 不过网络条件不同会影响. 有需求请实测.# net.ipv4.tcp_congestion_control=bbr3# 显式拥塞通知# 已被发现在高度拥塞的网络上是有害的.# net.ipv4.tcp_ecn=1# TCP 自动窗口# 要支持超过 64KB 的 TCP 窗口必须启用net.ipv4.tcp_window_scaling=1# 开启后, TCP 拥塞窗口会在一个 RTO 时间# 空闲之后重置为初始拥塞窗口 (CWND) 大小.# 大部分情况下, 尤其是大流量长连接, 设置为 0.# 对于网络情况时刻在相对剧烈变化的场景, 设置为 1.net.ipv4.tcp_slow_start_after_idle=0# nf_conntrack 调优# Add Ref: https://gist.github.com/lixingcong/0e13b4123d29a465e364e230b2e45f60net.nf_conntrack_max=1000000net.netfilter.nf_conntrack_max=1000000net.netfilter.nf_conntrack_tcp_timeout_fin_wait=30net.netfilter.nf_conntrack_tcp_timeout_time_wait=30net.netfilter.nf_conntrack_tcp_timeout_close_wait=15net.netfilter.nf_conntrack_tcp_timeout_established=300net.ipv4.netfilter.ip_conntrack_tcp_timeout_established=7200# TIME-WAIT 状态调优# Ref: http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html# Ref: https://www.cnblogs.com/lulu/p/4149312.html# 4.12 内核中此参数已经永久废弃, 不用纠结是否需要开启# net.ipv4.tcp_tw_recycle=0## 只对客户端生效, 服务器连接上游时也认为是客户端net.ipv4.tcp_tw_reuse=1# 系统同时保持TIME_WAIT套接字的最大数量# 如果超过这个数字 TIME_WAIT 套接字将立刻被清除net.ipv4.tcp_max_tw_buckets=55000# ------ END 网络调优: 内核 Backlog 队列和缓存相关 ------# ------ 网络调优: 其他 ------# Ref: https://zhuanlan.zhihu.com/p/149372947# Ref: https://www.starduster.me/2020/03/02/linux-network-tuning-kernel-parameter/#netipv4tcp_max_syn_backlog_netipv4tcp_syncookies# 启用选择应答# 对于广域网通信应当启用net.ipv4.tcp_sack=1# 启用转发应答# 对于广域网通信应当启用net.ipv4.tcp_fack=1# TCP SYN 连接超时重传次数net.ipv4.tcp_syn_retries=3net.ipv4.tcp_synack_retries=3# TCP SYN 连接超时时间, 设置为 5 约为 30snet.ipv4.tcp_retries2=5# 开启 SYN 洪水攻击保护# 注意: tcp_syncookies 启用时, 此时实际上没有逻辑上的队列长度,# Backlog 设置将被忽略. syncookie 是一个出于对现实的妥协,# 严重违反 TCP 协议的设计, 会造成 TCP option 不可用, 且实现上# 通过计算 hash 避免维护半开连接也是一种 tradeoff 而非万金油,# 勿听信所谓“安全优化教程”而无脑开启net.ipv4.tcp_syncookies=0# Ref: https://linuxgeeks.github.io/2017/03/20/212135-Linux%E5%86%85%E6%A0%B8%E5%8F%82%E6%95%B0rp_filter/# 开启反向路径过滤# Aliyun 负载均衡实例后端的 ECS 需要设置为 0net.ipv4.conf.default.rp_filter=2net.ipv4.conf.all.rp_filter=2# 减少处于 FIN-WAIT-2 连接状态的时间使系统可以处理更多的连接# Ref: https://www.cnblogs.com/kaishirenshi/p/11544874.htmlnet.ipv4.tcp_fin_timeout=10# Ref: https://xwl-note.readthedocs.io/en/latest/linux/tuning.html# 默认情况下一个 TCP 连接关闭后, 把这个连接曾经有的参数保存到dst_entry中# 只要 dst_entry 没有失效,下次新建立相同连接的时候就可以使用保存的参数来初始化这个连接.通常情况下是关闭的net.ipv4.tcp_no_metrics_save=1# unix socket 最大队列net.unix.max_dgram_qlen=1024# 路由缓存刷新频率net.ipv4.route.gc_timeout=100# Ref: https://gist.github.com/lixingcong/0e13b4123d29a465e364e230b2e45f60# 启用 MTU 探测,在链路上存在 ICMP 黑洞时候有用(大多数情况是这样)net.ipv4.tcp_mtu_probing = 1# No Ref# 开启并记录欺骗, 源路由和重定向包net.ipv4.conf.all.log_martians=1net.ipv4.conf.default.log_martians=1# 处理无源路由的包net.ipv4.conf.all.accept_source_route=0net.ipv4.conf.default.accept_source_route=0# TCP KeepAlive 调优# 最大闲置时间net.ipv4.tcp_keepalive_time=300# 最大失败次数, 超过此值后将通知应用层连接失效net.ipv4.tcp_keepalive_probes=2# 发送探测包的时间间隔net.ipv4.tcp_keepalive_intvl=2# 系统所能处理不属于任何进程的TCP sockets最大数量net.ipv4.tcp_max_orphans=262144# arp_table的缓存限制优化net.ipv4.neigh.default.gc_thresh1=128net.ipv4.neigh.default.gc_thresh2=512net.ipv4.neigh.default.gc_thresh3=4096net.ipv4.neigh.default.gc_stale_time=120net.ipv4.conf.default.arp_announce=2net.ipv4.conf.lo.arp_announce=2net.ipv4.conf.all.arp_announce=2# ------ END 网络调优: 其他 ------# ------ 内核调优 ------# Ref: Aliyun, etc# 内核 Panic 后 1 秒自动重启kernel.panic=1# 允许更多的PIDs, 减少滚动翻转问题kernel.pid_max=32768# 内核所允许的最大共享内存段的大小(bytes)kernel.shmmax=4294967296# 在任何给定时刻, 系统上可以使用的共享内存的总量(pages)kernel.shmall=1073741824# 设定程序core时生成的文件名格式kernel.core_pattern=core_%e# 当发生oom时, 自动转换为panicvm.panic_on_oom=1# 表示强制Linux VM最低保留多少空闲内存(Kbytes)# vm.min_free_kbytes=1048576# 该值高于100, 则将导致内核倾向于回收directory和inode cachevm.vfs_cache_pressure=250# 表示系统进行交换行为的程度, 数值(0-100)越高, 越可能发生磁盘交换vm.swappiness=10# 仅用10%做为系统cachevm.dirty_ratio=10vm.overcommit_memory=1# 增加系统文件描述符限制# Fix error: too many open filesfs.file-max=1048575fs.inotify.max_user_instances=8192fs.inotify.max_user_instances=8192# 内核响应魔术键kernel.sysrq=1# 弃用# net.ipv4.tcp_low_latency=1# Ref: https://gist.github.com/lixingcong/0e13b4123d29a465e364e230b2e45f60# 当某个节点可用内存不足时, 系统会倾向于从其他节点分配内存. 对 Mongo/Redis 类 cache 服务器友好vm.zone_reclaim_mode=0
至此,全部结束。