在Windows系统下安装和使用Cygwin软件

发表于2023 年 8 月 29 日由chenlianfu

1. Cygwin简介

Cygwin软件是Windows系统下的一个终端软件。它其实是一个小型的Linux虚拟机，它能运用大部分的Linux原生命令，也能访问Windows的文件系统。

2. 安装Cygwin软件

在Cygwin官网https://www.cygwin.com/中下载最新版本的软件安装包，然后在windows系统下进行安装。需要注意的是，安装的时候要选择或填写可用的镜像站点网址（例如，http://mirrors.163.com/cygwin/）才能进行联网下载和安装。需要注意的是，在安装过程中要选择并安装一些常用的软件，例如 procps, gcc, make, cmake, openssh, curl, wget, perl, python, rsync, vim, lynx和chere等。在安装流程的选择软件包界面，查看的下拉菜单中选择完整，利用搜索来检索软件名称并双击跳过来进行软件的选择和安装。

软件安装完毕后，双击windows系统桌面上的软件图标，则打开了一个Linux系统的终端，用于Linux系统命令的直接运行。此外，Cygwin软件在Windows目录C:\cygwin64\bin下生成了各个Linux命令的exe文件，可以在windows下CMD中运行。需要注意的是， C:\cygwin64目录是Cygwin Linux系统的根目录，而windows的各个磁盘分区位于Cygwin Linux系统的/cygdrive目录下。

后续可以使用apt-cyg命令在Cygwin Linux中安装系统软件，需要安装其包管理器软件apt-cyg：

# 从官网下载apt-cyg软件，其实是一个bash脚本程序
curl https://raw.githubusercontent.com/transcode-open/apt-cyg/master/apt-cyg > apt-cyg
chmod 755 apt-cyg
mv apt-cyg /usr/bin

# 设置apt-cyg的源
apt-cyg mirror http://mirrors.163.com/cygwin
# 下载并安装rsync和oenssh软件
apt-cyg install rsync openssh procps
# 若报错没有wget和lynx命令，则重新双击Cygwin安装软件再次安装，搜索并选中wget和lynx命令，额外安装这两个命令后，则可以让apt-cyg顺利运行。

若需要更新Cygwin软件，直接下载最新版软件，再次安装到相同目录即可覆盖和更新，不影响Cygwin系统中已经安装好的软件和用户配置。

此外，若打开的Cygwin终端中不能正确显示中文主机名，可以在终端界面右击打开Options选项，做成点击Text栏，右侧在Locale菜单中选择C，Character set菜单中选择GBK，应用保存后，重新打开Cygwin终端，即可正常显示中文字符。

3. 在Windows系统的文件夹或桌面右键点击后打开Cygwin

默认情况下，通过桌面快捷方式或开始菜单中打开Cygwin软件，进入的工作目录是用户的家目录。为了更方便进行数据操作，可以实现：在某个文件夹或桌面上右键点击，再于弹出的菜单中点击打开Cygwin软件，并自动进入到所在的工作文件夹中。

有两种方法能实现右击打开Cygwin并进入工作目录：

1. 在Cygwin Linux系统中安装chere软件后，以管理员权限打开Cygwin Linux终端，执行命令：chere -i -t mintty -s bash，成功后，右键菜单中有“Bash Prompt Here”选项，点击即可打开Cygwin Linux终端，且自动进入目标文件夹。改进效果：按win+r,输入regedit按回车键后打开注册表编辑器，打开路径“计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Classes\Directory\background\shell\cygwin64_bash”，将默认数据“&Bash Prompt Here”改为“在此处打开 Cygwin”，能修改右击后菜单的选项名称；然后在页面右侧空白处右击新建字符串值并改名为“Icon”，双击它并填入数据值“C:\cygwin64\Cygwin-Terminal.ico”，使之指向一个图片log文件，能修改右击有菜单选项的图片log；左键点击下级选项command，双击右侧的默认选项，修改其值为：C:\cygwin64\bin\mintty.exe -e /bin/bash --login -i -c "cd '%V';exec bash"，则表示使用右击菜单中的Cygwin打开时执行的CMD命令，能让打开Cygwin的方式更好。
2. 直接手动修改Windows系统的注册表信息：按win+r,输入regedit按回车键后打开注册表编辑器，打开路径“计算机\HKEY_CLASSES_ROOT\Directory\Background\shell\Cygwin\command”；新建项Cygwin及其字符串Icon，该项的默认数据值设置为“在此处打开 Cygwin”，字符串Icon的数据值设置为“C:\cygwin64\Cygwin-Terminal.ico”；在其下新建项command，其默认数据值设置为C:\cygwin64\bin\mintty.exe -e /bin/bash --login -i -c "cd '%V';exec bash"。

以上通过修改Windows系统注册表的方式实现了右击打开Cygwin软件，修改后立马生效，不需要重启系统。

4. 一键同时打开多个排列整齐的Cywin终端并同时自动连接服务器

打开Cygwin软件的命令是 C:\cygwin64\bin\mintty.exe，可以在Cygwin终端中执行命令”mintty –help”查看其使用方法。可以通过一些参数设置终端窗口在Windows桌面上的位置、终端的行数和列数、是否有窗口边界、是否有标题、进入终端后执行的命令等。

在我个人笔记本电脑的Windows桌面上生成文件aa.bat，写入以下三行内容：

C:\cygwin64\bin\mintty.exe --position 3,3 --size 113x35 --title 1 --Border void -e ssh -p 7118 -i C:\cygwin64\home\chenlianfu\.ssh\id_rsa chenlianfu@122.205.95.116
C:\cygwin64\bin\mintty.exe --position 3,1060 --size 113x34 --title 1 --Border void -e ssh -p 7118 -i C:\cygwin64\home\chenlianfu\.ssh\id_rsa chenlianfu@122.205.95.116
C:\cygwin64\bin\mintty.exe --position 1930,3 --size 112x69 --title 1 --Border void -e ssh -p 7118 -i C:\cygwin64\home\chenlianfu\.ssh\id_rsa chenlianfu@122.205.95.116

当双击桌面上aa.bat文件时，即可同时打开3个Cygwin终端，能整齐排列并占满桌面；每个终端打开后则执行ssh命令并无密码自动登录到我的远程服务器中。

通过热键进行一键启动的高级用法：我个人通过AutoHotkey软件设置热键，当按 alt+f 键时，即表示执行了aa.bat，即可同时打开多个排列整齐的Cywin终端并同时自动连接服务器。操作方法：首先通过AutoHotkey官网https://www.autohotkey.com/下载并安装AutoHotkey软件；然后在桌面上生成文件aa.ahk，其内容如下，用于设置热键；双击aa.ahk文件运行程序，使热键生效；将aa.ahk文件放置到C:\Users\xxx\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startup路径（其中xxx是用户名）下，让aa.ahk程序能开机启动，从而实现永久生效。

; 在Windows系统桌面上打开多个cygwin终端
; 设置快捷的热键：^表示control键；#表示windows键；!表示Alt键；Right表示方向键右。
!f::
Run C:\User\Desktop\aa.bat
Return

通过SSH远程连接Windows系统并进行管理

发表于2023 年 3 月 16 日由chenlianfu

1. 在Windows系统中安装OpenSSH服务端

在Windows11系统下，按 Windows+i 打开设置，点击应用，点击可选功能，点击查看功能，勾选OpenSSH服务器，点击下一步，点击安装。

或者使用Windows Terminal安装OpenSSH：按Windows + x，点击Windows终端（管理员），输入以下命令分别安装OpenSSH客户端和服务端。

# Install the OpenSSH Client
Add-WindowsCapability -Online -Name OpenSSH.Client~~~~0.0.1.0

# Install the OpenSSH Server
Add-WindowsCapability -Online -Name OpenSSH.Server~~~~0.0.1.0

安装完毕OpenSSH服务端后，还需要启动SSH服务，设置开机启动，设置防火墙。在Windows终端（管理员）中执行以下命令：

# Start the sshd service
Start-Service sshd

# OPTIONAL but recommended:
Set-Service -Name sshd -StartupType 'Automatic'

# Confirm the Firewall rule is configured. It should be created automatically by setup. Run the following to verify
if (!(Get-NetFirewallRule -Name "OpenSSH-Server-In-TCP" -ErrorAction SilentlyContinue | Select-Object Name, Enabled)) {
    Write-Output "Firewall Rule 'OpenSSH-Server-In-TCP' does not exist, creating it..."
    New-NetFirewallRule -Name 'OpenSSH-Server-In-TCP' -DisplayName 'OpenSSH Server (sshd)' -Enabled True -Direction Inbound -Protocol TCP -Action Allow -LocalPort 22
} else {
    Write-Output "Firewall rule 'OpenSSH-Server-In-TCP' has been created and exists."
}

操作完毕后，即可使用SSH登录到Windows系统终端了。登录后的操作，和在目标机器上打开其Windows终端进行操作是等同的。

ssh username@servername

修改OpenSSH配置文件，使支持使用密钥远程登录Windows系统。修改C:\ProgramData\ssh\sshd_config文件的内容，修改如下几项：

PubkeyAuthentication yes
PermitRootLogin no
ClientAliveInterval 60
ClientAliveCountMax 10
UseDNS no
GatewayPorts yes

修改完配置文件后，在Windows终端中重启SSH服务：

Stop-Service sshd; Start-Service sshd
或
Restart-Service -Name sshd

2. 实现在Linux服务器上执行一个命令后，能播放我个人笔记本电脑上的一段音乐

我经常远程登录Linux服务器进行比较耗时的计算，却又想在程序结束后能及时提醒我。于是，我在输入一个耗时较长的命令后，额外加一个命令finishing_reminder_by_ringingSong.pl。该命令在远程Linux系统上运行后，能播放我当前笔记本电脑Windows系统中的一段响铃音乐。具体的操作流程如下：

2.1 在Windows系统设置无密码登录的密钥和授权文件

将在Linux系统上的密钥文件id_rsa拷贝到Windows系统用户的.ssh文件夹下，将授权文件authorized_keys拷贝到C:\ProgramData\ssh文件夹下并重命名为administrators_authorized_keys。在Windows终端（管理员）中对这两个文件再进行权限设置，修改拥有者权限：

icacls.exe "C:\Users\chenlianfu\.ssh\id_rsa" /inheritance:r /grant "chenlianfu:F"
icacls.exe "C:\ProgramData\ssh\administrators_authorized_keys" /inheritance:r /grant "Administrators:F" /grant "SYSTEM:F"

2.2 在Windows系统设置反向隧道连接到我的一台公网服务器

在Windows系统上执行命令，构建到公网服务器的反向隧道：

ssh -f -N -R 52228:localhost:22 chenlianfu@chenlianfu.com

考虑设置开机时在联网状态下自动运行以上命令：右击我的电脑，显示更多选项，管理，任务计划程序，创建任务，在弹出的页面中进行设置。触发器：启动后1分钟；条件：只有在有网络连接可用时才启动；操作：以上ssh命令。

在远程Linux计算服务器上检测能否使用密钥登录到Windows笔记本电脑上：

ssh -p 52228 chenlianfu@chenlianfu.com

2.3 在Windows下使用命令播放音乐

设置Windows系统Path路径：按Windows+q搜索“高级系统设置”，点击“查看高级系统设置”，在弹出的窗口中点击“环境变量”，鼠标左键选中“Path”所在行，再点击编辑，浏览到文件夹C:\Program Files (x86)\Windows Media Player和C:\Program Files (x86)\Tencent\QQMusic\QQMusic1917.16.31.32，从而将该路径添加进去，再点击确定。此外，我将音频文件放置于D:\ringing_sound_01.mp3路径。关闭所有Windows终端，再重新打开，输入命令即可播放音乐：

wmplayer.exe D:\ringing_sound_01.mp3
QQMusic.exe D:\ChenLianfu_Data\05.设置数据\ringing_sound_01.mp3

2.4 在Linux服务器中远程播放本地笔记本电脑上的音乐

在远程Linux服务器中执行命令，即可播放本地笔记本电脑上的音频。

ssh -p 52228 chenlianfu@chenlianfu.com "wmplayer.exe D:\ChenLianfu_Data\05.设置数据\ringing_sound_01.mp3"

备份Windows系统

发表于2023 年 3 月 10 日由chenlianfu

1. 创建系统印象

按Windows+q，在搜索框输入“控制面板”，打开Window7时代的控制面板页面，再点击“备份和还原（Windows 7）”，于打开的页面中点击“创建系统映像”，即可将系统中的所有设置和软件备份到指定的驱动器下，生成文件夹WindowsImageBackup。

2. 创建回复驱动器

按Windows+q，在搜索框输入“创建恢复驱动器”，打开的页面中会自动识别驱动器，此时插上U盘后会自动刷新找到U盘的驱动器盘符，按提示将U盘做成启动盘，用于系统恢复。

安装Windows子系统

发表于2023 年 2 月 6 日由chenlianfu

1. 在Windows10或Windows11系统中安装WSL (Windows Subsystem for Linux)

按windows+q键，在打开的搜索栏中输入“功能”，点击出现的“启用或关闭Windows功能”，在出现的复选框拆单中中，勾选“适用于Linux的Windows子系统”和“虚拟机平台”。然后等待一段时间用于安装WSL，完毕后提示重启计算机，按提示确认重启即可。

或使用Windows自带的命令行终端进行操作：按windows+x键，再按字母a，则打开管理员PowerShell；输入命令“wsl –install”，然后重启计算机即可。

目前，WSL有1和2两个版本，默认安装的是WSL2。WSL2相比WSL1，它多了3个功能：托管VM，完整的Linux内核和完全的系统调用兼容性，但其跨OS文件系统的性能较差。在管理员PowerShell中使用如下命令可以切换WSL版本：“wsl –set-default-version 1”。

2. 安装Linux子系统

在Windows系统的微软应用商店中搜索Linux子系统，选择一个进行下载安装即可。

或者打开Windows管理员Power Shell，使用命令“wsl –list –online”检测可以使用的Linux子系统，当前结果如下：

NAME FRIENDLY NAME
Ubuntu Ubuntu
Debian Debian GNU/Linux
kali-linux Kali Linux Rolling
SLES-12 SUSE Linux Enterprise Server v12
SLES-15 SUSE Linux Enterprise Server v15
Ubuntu-18.04 Ubuntu 18.04 LTS
Ubuntu-20.04 Ubuntu 20.04 LTS
Ubuntu-22.04 Ubuntu 22.04 LTS
OracleLinux_8_5 Oracle Linux 8.5
OracleLinux_7_9 Oracle Linux 7.9

然后，下载相应的Linux系统，例如，在浏览器中输入https://aka.ms/wslubuntu2204网址，即可下载得到文件Ubuntu2204-221101.AppxBundle。下载完毕后，双击安装即可。需要注意，可能双击安装不成功，此时需要根据提示，在浏览器中打开https://aka.ms/wslstore网址，并下载WSL2 Linux内核更新包并安装，然后再安装Ubuntu2204。安装完毕后根据提示设置用户名和密码。

3. 使用Linux子系统

打开Windows Power Shell，使用命令bash或ubuntu即可进入到Linux子系统。我安装了cygwin虚拟机，在cygwin中输入ubuntu命令也能进入到Linux子系统。

在Linux子系统中创建/etc/wsl.conf，能对Linux子系统进行一些设置，例如：是否自动挂载Windows系统的磁盘分区、设置主机名、是否将Windows程序添加到PATH环境变量。简单示例如下：

[network]
hostname=ubuntu2204

重启Linux子系统方法：（1）在Linux子系统或Windows Power Shell中，输入命令“wsl.exe –shutdown”即可；（2）在 Windows Power Shell中，输入命令“net stop LxssManager”关闭相应服务，在输入命令“net stop LxssManager”开启服务。

若设置用户无密码sudo时，需要修改/etc/sudoers文件内容“%sudo ALL=(ALL:ALL) NOPASSWD:ALL”，而仅单独对用户进行NOPASSWD设置依然不能生效。

使用Linux子系统前，推荐先安装一些软件：

sudo apt-get update
sudo apt-get install gcc sra-toolkit net-tools sysstat

在CentOS8系统安装Docker

发表于2022 年 9 月 19 日由chenlianfu

CentOS8系统默认没有安装Docker软件，而是同为容器软件的Podman。在CentOS8系统上安装Docker软件，首先要卸载runc及依赖它的Podman软件，因为Docker软件安装需要依赖的containerd.io和runc冲突。然后，安装Docker的dnf源来安装Docker。

sudo dnf erase runc
sudo dnf config-manager --add-repo=https://download.docker.com/linux/centos/docker-ce.repo
sudo dnf install -y docker-ce

# 若是CentOS7系统，则使用yum命令，在添加docker源命令上不同
yum erase runc podman
yum-config-manager --add-repo=https://download.docker.com/linux/centos/docker-ce.repo
yum install -y docker-ce

设置Docker开机启动并检查Docker信息和启动状态。

sudo systemctl enable --now docker.service

systemctl status docker.service

docker --version
docker info

查看到docker的根目录位于 /var/lib/docker，docker数据放于该文件夹下，容易导致根分区爆满。推荐修改docker数据的存放路径。

第一方法修改docker数据的存放路径。通过修改系统服务启动文件中启动命令的参数，需要重载启动配置文件。

perl -p -i -e 's#^(ExecStart=.*)#$1 --data-root /home/.docker#' /usr/lib/systemd/system/docker.service
systemctl daemon-reload
systemctl restart docker.service

docker info

第二种方法修改docker数据的存放路径。通过docker专门的配置文件修改参数，能更方便修改更多参数，并值得推荐。

cat <<EOF > /etc/docker/daemon.json
{
  "storage-driver": "vfs",
  "data-root": "/ceph/.docker"
}
EOF
# 以上修改了两个参数。由于数据存放路径在CEPH文件系统上，其驱动方式也要相应修改为vfs。默认为overlay2。

docker info

文本编辑或查看软件

发表于2022 年 9 月 13 日由chenlianfu

在Linux系统下，使用 less 命令能较好查看文件内容，使用 vim 命令能编辑文件内容。它们都适用于对大文件内容的查看和编辑。

而在Windows系统下，使用记事本或notepad++等软件仅能对小文件内容进行查看和编辑。若需要对大文件内容进行查看和编辑，推荐使用EmEditor或PilotEdit软件。

CEPH系统更换坏的机械硬盘

发表于2022 年 9 月 5 日由chenlianfu

1. 确定坏磁盘对应的SN编号、OSD编号和Linux系统识别编号。

第一种方法：批量化使用smartctl命令检测CEPH系统中机械硬盘的信息，确定有坏道磁盘的SN编号，或留取正常磁盘的SN编号。

第二种方法：在CEPH网页管理界面的OSD栏目中搜索关键词down，检测对应OSD的编号、磁盘SN编号和磁盘在Linux系统中的识别名称，如下图所示。

以上示例中找到的损坏磁盘关键信息：

磁盘对应的OSD编号：osd.174           后续需要删除并重建该osd编号。
磁盘SN编号：ZL23XVRL                有利于拔下有问题的硬盘，以免拔错。
Linux下的磁盘识别名称：sdaf           加上新盘后，需要对该盘进行分区操作。

2. 关停CEPH系统，关闭CEPH存储服务器，跟换坏磁盘，重启CEPH存储服务器

在计算服务器上卸载CEPH文件系统（可选）。我这边由于需要通过一台登录节点服务器作为中转，再登录CEPH服务器进行操作。因此，该登录节点服务器需要卸载 CEPH文件系统，以免CEPH文件系统掉线后，无法登录该服务器。

for i in 1 2 11 12 13 14 15 16 17 18 19 20
do
    echo "ssh node$i sudo umount -l /ceph"
done > command.umount.list
ParaFly -c command.umount.list -CPU 12

通过指令暂停CEPH系统：

ceph osd set noout
ceph osd set norecover
ceph osd set norebalance
ceph osd set nobackfill
ceph osd set nodown
ceph osd set pause

再关闭所有CEPH服务器或仅关闭有坏道的CEPH存储服务器的Linux系统。本次是在ceph105机器上发现有坏盘，对该机器关机并更换硬盘后手动启动，其它存储服务器重启。

echo "ssh ceph110 sudo shutdown -r now
ssh ceph109 sudo shutdown -r now
ssh ceph108 sudo shutdown -r now
ssh ceph107 sudo shutdown -r now
ssh ceph106 sudo shutdown -r now
ssh ceph105 sudo shutdown -h now
ssh ceph104 sudo shutdown -r now
ssh ceph103 sudo shutdown -r now
ssh ceph102 sudo shutdown -r now" > command.shutdown.list
ParaFly -c command.shutdown.list -CPU 9
ssh ceph101 sudo shutdown -r now

重启CEPH集群后，进行时间同步、网络优化和CEPH参数优化。

for ((i=102;i<=110;i=i+1))
do
    echo "ssh ceph$i ntpdate ceph101"
done > command.ntpdate.list
ParaFly -c command.ntpdate.list -CPU 9
for ((i=102;i<=110;i=i+1))
do
    echo "ssh ceph$i systemctl restart chronyd.service"
done > command.chronyd.list
ParaFly -c command.chronyd.list -CPU 9

for ((i=102;i<=110;i=i+1))
do
    echo "ssh ceph$i /root/bin/rc.local"
done > command.rc_local.list
ParaFly -c command.rc_local.list -CPU 9
/root/bin/rc.local
for ((i=102;i<=110;i=i+1))
do
    echo "ssh ceph$i /root/bin/ethtool_lro.sh"
done > command.ethtool_lro.list
ParaFly -c command.ethtool_lro.list -CPU 9
/root/bin/ethtool_lro.sh
for ((i=102;i<=110;i=i+1))
do
    echo "ssh ceph$i /root/bin/test.sh"
done > command.ethtool_test.list
ParaFly -c command.ethtool_test.list -CPU 9
/root/bin/test.sh

for ((i=101;i<=110;i=i+1))
do
    echo "ssh ceph$i /root/bin/modifing_OSD_parameters.pl 22 8 true 10 86400 604800 0.5 0.05 259200 100 10 10 100"
done > command.modifing_OSD_parameters.list
ParaFly -c command.modifing_OSD_parameters.list -CPU 10

ceph config set mds mds_log_max_segments 1024
ceph config set mds mds_cache_trim_threshold 25600000
ceph config set mds mds_cache_trim_decay_rate 0.01
ceph config dump

取消CEPH系统的暂停操作：

ceph osd set noout
ceph osd set norecover
ceph osd set norebalance
ceph osd set nobackfill
ceph osd set nodown
ceph osd set pause

给CEPH存储服务器添加虚拟内存（可选）。我管理的CEPH存储服务器每个节点内存为256 GiB，在MDS服务器上可能不够，给每台服务器再添加256G SWAP空间。

for ((i=101;i<=110;i=i+1))
do
    echo "ssh ceph$i swapon /swapadd"
done > command.swapon.list
ParaFly -c  command.swapon.list -CPU 10

3. 对新加入的磁盘进行分区操作

在更换了坏盘的ceph105主机上进行新盘的分区操作。

根据最开始安装CEPH系统时留下的磁盘分区的操作记录信息，对新加入的磁盘进行相同的分区操作。首先，使用新加入的磁盘，添加到一个新的虚拟盘中。

vgcreate ceph-block-31 /dev/sdaf

然后，对虚拟盘进行分区。

lvcreate -l 100%FREE -n block-31 ceph-block-31

以上命令需要确定新加入磁盘对应的Linux识别编号和虚拟盘编号，是操作的成败关键。

由于新加入的盘替换了坏盘的位置，重启服务器后，其Linux识别编号不变。若采用不关停CEPH系统直接更换硬盘的话，则热插拔更换硬盘后，其Linux识别编号在所有磁盘识别编号往后计数，和坏盘之前的编号不一致。

由于最初安装CEPH系统时，直接使用了ceph-block-num的虚拟盘分区名称。若此时未保留最初的磁盘分区命令，可以使用lvdisplay查看系统中的虚拟盘分区（也称为逻辑卷）信息，查看缺失的逻辑卷名称。

lvdisplay | grep " LV Name" | grep block | sort
lvdisplay | grep " VG Name" | grep block | sort

4. 删除并重建OSD

删除OSD编号：

ceph auth del osd.174
ceph osd crush remove osd.174
ceph osd rm 174

根据最开始安装CEPH系统时留下的OSD创建记录，将新的虚拟盘分区创建成OSD。由于使用了bluestore的方法，一个OSD包含一个完整物理磁盘做的逻辑卷和一块固态硬盘部分扇区做的逻辑卷。后者的逻辑卷名称不能搞错，因此该步骤一定要有最初安装CEPH系统时留下的OSD创建记录。

ceph-volume lvm create --bluestore --data ceph-block-31/block-31 --block.db ceph-db-4/db-31

以上步骤会自动分配一个新的OSD编号。CEPH系统应该是自动按照数字编号往后进行OSD编号分配。由于刚删除了一个编号，新的自动分配的编号就刚好是删除的OSD编号。

新的OSD上线后，数据会自动进行重新分配（rebalancing），结束后CEPH恢复健康状态。

[root@ceph101 ~]# ceph -s
  cluster:
    id:     8f1c1f24-59b1-11eb-aeb6-f4b78d05bf17
    health: HEALTH_WARN
            Slow OSD heartbeats on back (longest 23249.475ms)
            Slow OSD heartbeats on front (longest 23245.394ms)

  services:
    mon: 5 daemons, quorum ceph101,ceph103,ceph107,ceph109,ceph105 (age 21m)
    mgr: ceph107.gtrmmh(active, since 22m), standbys: ceph101.qpghiy
    mds: cephfs:3 {0=cephfs.ceph108.iuobhj=up:active,1=cephfs.ceph102.imxzno=up:active,2=cephfs.ceph104.zhkcjt=up:active} 1 up:standby
    osd: 360 osds: 360 up (since 17m), 360 in (since 17m); 47 remapped pgs

  data:
    pools:   4 pools, 10273 pgs
    objects: 386.82M objects, 657 TiB
    usage:   1.2 PiB used, 4.0 PiB / 5.2 PiB avail
    pgs:     8742316/3849861458 objects misplaced (0.227%)
             10220 active+clean
             47    active+remapped+backfilling
             6     active+clean+scrubbing+deep

  io:
    client:   3.4 MiB/s rd, 392 MiB/s wr, 6 op/s rd, 221 op/s wr
    recovery: 181 MiB/s, 103 objects/s

  progress:
    Rebalancing after osd.174 marked in (17m)
      [=======.....................] (remaining: 44m)

提升CEPH系统对日志的Trim速度

发表于2022 年 8 月 30 日由chenlianfu

1. CEPH系统 MDSs behind on trimming 的警报

在CEPH系统的MDS服务中，文件系统的元数据以日志形式存放于segment中，每个sgement存放1024个操作记录。当文件系统的数据使用完毕，CEPH系统则会以一定的速度Trim (消除) 元数据信息，此时会将MDS服务器中的数据回写到CEPH的磁盘OSD中，以降低MDS服务器上运行的mds服务的内存消耗。当segment数量超过默认128个时，则CEPH报警，意味着MDS服务器中保存了过量的元数据信息，占用内存可能较多，需要及时注意。

[root@ceph101 ~]# ceph health detail
HEALTH_WARN 2 MDSs behind on trimming
[WRN] MDS_TRIM: 2 MDSs behind on trimming
    mds.cephfs.ceph102.imxzno(mds.1): Behind on trimming (2235/128) max_segments: 128, num_segments: 2235
    mds.cephfs.ceph106.hggsge(mds.2): Behind on trimming (4260/128) max_segments: 128, num_segments: 4260

当遇到以上警告，若发现MDS服务器的内存足够，可以将默认阈值128提高，或加大Trim速度。

2. 解决办法

通过设置mds_log_max_segments参数来提高CEPH的 max_segments 数，在CEPH系统任意主机上运行即可。

ceph config set mds mds_log_max_segments 1024

通过设置参数来提升Trim速度。CEPH系统根据mds_cache_trim_threshold (默认256Ki)和mds_cache_trim_decay_rate (默认1.0)两个参数设置sgements的消除速度。默认设置下，当CEPH系统进行持续且Trim速度达到最大时，每秒钟Trim的记录数量为 ln(0.5)/rate*threshold 。当在CEPH系统中并行化读取或写入文件时，短时间内进行大量的文件操作，极容易导致segments过多，无法及时Trim。因此，需要提高Trim速度，其实也消耗不了太多CPU资源。

mds_cache_trim_threshold 设置了一定时间内能消除的最大文件数量。在进行Trim时，CEPH系统中有一个Counter程序记录了一定时间内被消除的文件数量。mds_cache_trim_decay_rate 参数和Counter程序的半衰期相关，该值越小，则半衰期越短。

默认参数值过于保守，下当为了提高Trim速度，推荐将 mds_cache_trim_threshold 参数提升到100倍，将mds_cache_trim_decay_rate参数降低到100倍。在任意一台CEPH主机中运行命令：

ceph config set mds mds_cache_trim_threshold 25600000
ceph config set mds mds_cache_trim_decay_rate 0.01

提升CEPH系统对PG的Scrub和Backfilling速度

发表于2022 年 8 月 8 日由chenlianfu

1. 进行PG Srub的参数和原理

对PG进行Scrub，即检测PG分布到各OSDs上的数据是否一致。包含两种算法：第一种为Scrub，即仅检测数据的元信息，例如时间戳和文件大小等信息，速度快且基本不消耗磁盘；第二种为deep Scrub，会额外检测数据的内容是否一致，速度较慢且消耗大量磁盘读取。在CEPH系统进行scrub和deep-scrub的主要参数为：

（1）osd_scrub_begin_hour：设置进行Scrub的起始时间，推荐设置为22，即在晚上10点开始进行Scrub。CEPH系统默认值是0。
（2）osd_scrub_end_hour：设置进行Scrub的结束时间，推荐设置为8，即在早上8点结束scrub。CEPH系统默认值是24。
（3）osd_scrub_auto_repair：设置发现PG在多个OSDs中的数据不一致后，是否进行修复，推荐设置为true，即表示自动进行修复。CEPH系统默认值为false。
（4）osd_max_scrubs：进行Scrub时，设置单个OSD能同时进行Scrub操作数，推荐设置为10。CEPH系统默认值是1，会导致整个系统能同时进行的Scrub操作数很少。提高该值能明显增加Scrub的并行数，增加Scrub速度。否则，可能导致pgs not deep-scrubbed in time的警报。
（5）osd_scrub_min_interval：设置单个PG进行Scrub的最小间隔时间，默认值为86400，一天。
（6）osd_scrub_max_interval：设置单个PG进行Scrub的最大间隔时间，默认值为604800，一周。
（7）osd_scrub_interval_randomize_ratio：设置单个PG进行Scrub时，间隔会额外增加一定的随机时间，该时间为osd_scrub_min_interval*该阈值，默认值为0.5。
（8）osd_deep_scrub_randomize_ratio：在进行Scrub时，随机变更为deep scrub的概率，推荐设置为0.05。CEPH系统默认值为0.15。
（9）osd_deep_scrub_interval：设置进行deep Scrub的时间间隔，推荐设置为259200，即一月30天。CEPH系统默认值为604800，即若有PG没能在一周内进行deep scrub，则导致pgs not deep-scrubbed in time的警报。改变该值应该并不能减慢或加快deep scrub的速度。

以上参数表示：对每个PG进行清理，每隔1~1.5天即会进行一次Scrub。每次进行Scrub时，有5%的概率变更为deep scrub，这表示平均20~30天会对所有PGs进行一轮deep Scrub。当一个星期后，若有PG未进行scrub，或一个月后，若有PG未进行deep-scrub，则进行报警。进行优化方式：通过增大 osd_max_scrubs 参数值来加快scrub速度；通过减少 osd_deep_scrub_randomize_ratio 参数值来减少deep scrub任务量，减少对磁盘的读取消耗。

2. 进行PG backfilling的参数和原理

当CEPH系统更换硬盘时，会将一些PGs转移到新硬盘做的OSD上，这时需要对数据进行回填。默认情况下，回填速度极慢，需要修改OSD参数增加回填速度。

（10）osd_max_backfills：设置CEPH系统一次最多对指定数量的PGs进行回填，推荐根据需要回填的PGs数量和CEPH系统的整体OSDs数量来设置。默认值为1，过小，会导致回填速度极慢，可能需要数天才能让数据修复完毕。咱们系统有一次更换硬盘后需要对66个PGs进行回填，我直接设置该值为66即可。推荐该值 * PG副本数 / OSDs总数 不要超过 3，即让每个硬盘同时的读和写并发不要过大。
（11）osd_recovery_max_active：进行数据恢复时，设置每个OSD的最大读写请求数，推荐设置为10。CEPH系统默认值为3。
（12）osd_recovery_max_active_hdd：进行数据恢复时，设置每个OSD的机械硬盘最大读写请求数，推荐设置为10。CEPH系统默认值为3。
（13）osd_recovery_max_active_ssd：进行数据恢复时，设置每个OSD的固态硬盘最大读写请求数，推荐设置为100。CEPH系统默认值为10。

3. 通过命令行修改OSD参数

需要在各台CEPH存储服务器上运行程序，对各自的OSDs进行参数修改。且通过命令行修改仅在当前CEPH系统中生效，重启服务器后失效。

ceph tell osd.0 injectargs --osd_scrub_begin_hour=22 --osd_scrub_end_hour=8 --osd_scrub_auto_repair=true --osd_max_scrubs=10 --osd_scrub_min_interval=86400 --osd_scrub_max_interval=604800 --osd_scrub_interval_randomize_ratio=0.5 --osd_deep_scrub_randomize_ratio=0.05 --osd_deep_scrub_interval=259200 --osd_max_backfills=100 --osd_recovery_max_active=10 --osd_recovery_max_active_hdd=10 --osd_recovery_max_active_ssd=100

查看修改后的参数结果：

ceph daemon osd.0 config show | egrep "osd_scrub_begin_hour|osd_scrub_end_hour|osd_scrub_auto_repair|osd_max_scrubs|osd_scrub_min_interval|osd_scrub_max_interval|osd_scrub_interval_randomize_ratio|osd_deep_scrub_randomize_ratio|osd_deep_scrub_interval|osd_max_backfills|osd_recovery_max_active|osd_recovery_max_active_hdd|osd_recovery_max_active_ssd"

提升CEPH PG scrub的速度

发表于2022 年 8 月 2 日由chenlianfu

CEPH会定期（默认每个星期一次）对所有的PGs进行scrub，即通过检测PG中各个osds中数据是否一致来保证数据的安全。

当CEPH更换一块坏硬盘，进行数据修复后，出现了大量的PGs不能及时进行scrub，甚至有些PGs数据不一致，导致CEPH系统报警，如下所示：

  cluster:
    id:     8f1c1f24-59b1-11eb-aeb6-f4b78d05bf17
    health: HEALTH_ERR
            6 scrub errors
            Possible data damage: 5 pgs inconsistent
            1497 pgs not deep-scrubbed in time
            1466 pgs not scrubbed in time

  services:
    mon: 5 daemons, quorum ceph101,ceph103,ceph107,ceph109,ceph105 (age 5d)
    mgr: ceph107.gtrmmh(active, since 9d), standbys: ceph101.qpghiy
    mds: cephfs:3 {0=cephfs.ceph106.hggsge=up:active,1=cephfs.ceph104.zhkcjt=up:active,2=cephfs.ceph102.imxzno=up:active} 1 up:standby
    osd: 360 osds: 360 up (since 5d), 360 in (since 5d)

  data:
    pools:   4 pools, 10273 pgs
    objects: 331.80M objects, 560 TiB
    usage:   1.1 PiB used, 4.2 PiB / 5.2 PiB avail
    pgs:     10261 active+clean
             7     active+clean+scrubbing+deep
             5     active+clean+inconsistent

  io:
    client:   223 MiB/s rd, 38 MiB/s wr, 80 op/s rd, 12 op/s wr

此时，需要提高对PGs的scrub速度。默认情况下一个OSD近能同时进行一个scrub操作且仅当主机低于0.5时才进行scrub操作。我运维的CEPH系统一个PG对应10个OSDs，每个OSD仅能同时进行一个scrub操作，导致大量scrub操作需要等待，而同时进行的scrub操作数量一般为8个。因此需要在各台存储服务器上对其OSDs进行参数修改，来提高scrub速度。

osd_max_scrubs参数用于设置单个OSD同时进行的最大scrub操作数量；osd_scrub_load参数设置负载阈值。主要修改以上两个参数来提高scrub速度，其默认值为1和0.5。

例如，对ceph101主机中的所有OSDs进行参数修改：

首先，获取ceph101中所有的OSD信息：

ceph osd dump | grep `grep ceph101 /etc/hosts | perl -ne 'print $1 if m/(\d\S*)/'` | perl -ne 'print "$1\n" if m/(osd.\d+)/' > /tmp/osd.list

然后，对所有OSD的参数进行批量修改：

for i in `cat /tmp/osd.list`
do
    ceph tell $i injectargs --osd_max_scrubs=10 --osd_scrub_load_threshold=10
done

检查修改后的效果

for i in `cat /tmp/osd.list`
do
    echo $i
    ceph daemon $i config show | egrep "osd_max_scrubs|osd_scrub_load"
done

对所有的CEPH主机进行上述修改后，同时进行scrub的数量提高了30倍，并且使用top命令可以看到ceph-osd进程对CPU的资源消耗明显上升。

  cluster:
    id:     8f1c1f24-59b1-11eb-aeb6-f4b78d05bf17
    health: HEALTH_ERR
            6 scrub errors
            Possible data damage: 5 pgs inconsistent
            1285 pgs not deep-scrubbed in time
            1208 pgs not scrubbed in time
            1 slow ops, oldest one blocked for 37 sec, daemons [osd.124,osd.352] have slow ops.

  services:
    mon: 5 daemons, quorum ceph101,ceph103,ceph107,ceph109,ceph105 (age 5d)
    mgr: ceph107.gtrmmh(active, since 9d), standbys: ceph101.qpghiy
    mds: cephfs:3 {0=cephfs.ceph106.hggsge=up:active,1=cephfs.ceph104.zhkcjt=up:active,2=cephfs.ceph102.imxzno=up:active} 1 up:standby
    osd: 360 osds: 360 up (since 5d), 360 in (since 5d)

  data:
    pools:   4 pools, 10273 pgs
    objects: 331.80M objects, 560 TiB
    usage:   1.1 PiB used, 4.2 PiB / 5.2 PiB avail
    pgs:     10041 active+clean
             152   active+clean+scrubbing+deep
             75    active+clean+scrubbing
             3     active+clean+scrubbing+deep+inconsistent+repair
             2     active+clean+inconsistent

  io:
    client:   65 MiB/s rd, 4.2 MiB/s wr, 21 op/s rd, 2 op/s wr

此外，注意：（1）提高scrub的并行数可能对CEPH集群内网的网速要求较高，推荐使用10GE以上交换机。（2）条scrub的并行数，会导致一个OSD对应的硬盘同时并行读取的操作数量较高，当导致磁盘100%被使用时，可能磁盘的利用效率并不高，因此不推荐将 osd_max_scrubs参数调节到10以上。

对两个星期内（当前时间2022-08-03）未进行deep-scrubbed，已经有报警信息的PGs进行操作。

ceph pg dump | perl -e 'while (<>) { @_ = split /\s+/; $pg{$_[0]} = $1 if ($_[22] =~ m/2022-07-(\d+)/ && $1 <= 21); } foreach ( sort {$pg{$a} <=> $pg{$b}} keys %pg ) { print "ceph pg deep-scrub $_; sleep 30;\n"; }' > for_deep_scrub.list

sh for_deep_scrub.list

陈连福的生信博客

第22期培训班将于2024.01.27-2024.02.05期间在武汉市举办！

作者归档：chenlianfu