来源: 阿里云ECS(Ubuntu)单节点Kubernetes部署——小白教程 – LifeOfCoding – 博客园
目录
开始部署
查看部署状态
安装网络插件
测试
排错工具
友情链接
参考资料:
前言
这篇文章是比较久之前写的了,无聊翻了下博客发现好几篇博文排版莫名其妙的变了… 于是修改并完善了下。当初刚玩k8s的时候真的是踩坑踩到怕,官方的指引很多不能直接使用,然后百度上找到的很多资料都是直接搬运官网ε=(´ο`*)))唉。 最后还是硬着头皮百度谷歌了很久才算入了门。在这里写下这篇文章帮助下其他孩纸。
准备
在撸起袖子开干之前最好是对k8s有点基本的认识,比如什么是kubelet,啥是kubectl,配置文件又是什么东东之类的基础。可以翻看我其它有关k8s的文章简单了解下,虽然写得不好,但也不会很辣眼睛。有能力的还是到谷歌和官网看看(看英文版)。
环境、工具
阿里云学生机ECS、Ubuntu、docker、kubectl1.15.4、kubelet1.15.4、kubeadm1.15.4、
kubeadm、kubectl、kubelet简介
kubeadm
用于部署k8s的工具很多,kubeadm就是其中之一,因为比较简单、好上手所以用的比较多,这是一个命令行的工具,可以通过一条简单的命令就把k8s部署好。
kubectl
kubectl也是一个命令行工具,用来管理集群。在用kubeadm工具部署好集群环境后,几乎所有的操作都是通过kubectl来完成的。啥操作?那多了去咯,譬如在k8s中运行一个应用、部署应用服务、查看集群环境等等。最基本的一条命令就是
kubectl create
这条命令用于创建资源,什么是资源?k8s集群中所有东西都可以看做是资源,如用户凭证,用户角色以及用于 ”存放“ 容器的pod等。
kubectl create -f xxx.yaml
如上命令就是用配置文件创建资源的例子。”-f“ 用来指定配置文件,”xxx.yaml“就是配置文件,配置文件可以是yaml格式也可以是json,不过yaml用的比较多。配置文件基本上就是对资源属性的描述,并不难。
配置文件可以是本地文件也可以是网络上的文件,k8s官网的很多配置文件都是直接引用”raw.githubusercontent.com“的内容。当然,不用配置文件,直接使用命令行也是可以创建一些简单资源的:
kubectl create serviceaccount admin-user -n kubernetes-dashboard
这就创建了一个serviceaccount资源。
kubelet
kubelet是一个自动管理、调度集群资源的程序,不需要像kuectl一样手动去操纵它从而完成某些需求,只要懂得如何进行配置,如何查看日志即可。kubelet的配置项非常非常多,但是作为新手不用太过于关注,简单了解即可。
安装kubeadm、kubectl、kubelet
配置软件源
默认apt软件源里没有这几个软件,需要添加谷歌官方的软件源。但是因为官方提供的源无法访问,所以这里改成阿里的源:
curl -s https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg | apt-key add -
cat <<EOF >/etc/apt/sources.list.d/kubernetes.list
deb https://mirrors.aliyun.com/kubernetes/apt/ kubernetes-xenial main
EOF
apt-get update
命令说明:
1.通过下载工具下载位于https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg
的deb软件包密钥,然后通过”apt-key”命令添加密钥
2.通过cat把源deb https://mirrors.aliyun.com/kubernetes/apt/ kubernetes-xenial main
写入到”/etc/apt/sources.list.d/kubernetes.list”
*此处下载工具使用curl,若未安装,先执行如下命令安装。“apt-transport-https”工具允许apt通过https来下载软件,可以不用安装这个,只装curl
apt-get update && apt-get install -y apt-transport-https curl
完成以上步骤,可通过”apt-key list”命令看到类似如下的密钥信息:
查看”/etc/apt/sources.list.d/kubernetes.list”,如下:
选择软件版本
kubeadm、kubectl、kubelet三者的版本要一致,否则可能会部署失败,小版本号不同倒也不会出什么问题,不过尽量安装一致的版本。记住kubelet的版本不可以超过API server的版本。例如1.8.0的API server可以适配 1.7.0的kubelet,反之就不行了。
可以通过”apt-cache madison”命令来查看可供安装的软件的版本号
例:
apt-cache madison kubeadm kubelet kubectl
开始安装
这里安装的版本是”1.15.4-00″,别忘了后面的”-00″。
需要注意,安装kubeadm的时候,会自动安装kubectl、kubelet和cri-tool,安装kubelet时则会自动安装kubernetes-cni,如下:
然而这并不是一件好事,仔细看会发现自动安装的kubectl和kubelet是最新版本的,与kubeadm版本不一致。。。
所以应该更改安装顺序,先安装kubectl和kubelet,命令如下:
apt-get install kubectl=1.15.4-00 kubelet=1.15.4-00 kubeadm=1.15.4-00
如果不想让软件更新,可以输入:
apt-mark hold kubeadm kubectl kubelet
允许更新:
apt-mark unhold kubeadm kubectl kubelet
部署前准备
关闭防火墙
阿里云ECS的ufw默认是”inactive”,即处于关闭状态,这步可以跳过
在ubuntu下,可以使用”ufw”管理防火墙。
查看防火墙状态:
ufw status
禁用防火墙:
ufw diable
启用防火墙:
ufw enable
关闭selinux(可跳过)
阿里云ecs没有selinux,这步跳过。如果是其它服务器提供商,如下是网上找到的方法,在此不作验证:
- 修改/etc/selinux/config文件中设置SELINUX=disabled,然后重启服务器
- 使用setenforce
- setenforce 1 设为enforcing模式
- setenforce 0 设为permissive模式
关闭swap
kubelet1.8+要求把swap关闭,详细原因可以访问Kubernetes 设计分析: 为什么 kubelet 运行时不能打开 swap?
如果你非要开启swap的话,可以配置”–fail-swap-on flag”参数。
- 临时修改,重启复原
- 关闭
swapoff -a
- 开启
swapon -a
- 永久修改,重启生效
- 把根目录文件系统设为可读写
sudo mount -n -o remount,rw /
- 修改”/etc/fstab”文件,在”/swapfile”一行前加#禁用并保存退出重启服务器
配置并开启kubelet服务(可跳过)
貌似安装kubelet的时候会自动配置好。这步可以跳过。
kubelet --network-plugin=cni
systemctl enable kubelet
修改Docker的cgroup-driver
docker的cgroup-driver应该与kubelet的一致,kubelet默认为“systemd”。
方法一,修改docker的cgroup-driver为systemd
编辑”/etc/docker/daemon.json”(如果没有这个文件就自己新建一个)
添加如下信息:
"exec-opts": ["native.cgroupdriver=systemd"]
注意,如果之前添加了其它的镜像源,或者添加了其它参数,需要在其它配置项后用“,”逗号隔开,再添加新的配置项,否则配置文件会解析失败。
修改完后保存,重新载入配置文件,重启docker
systemctl daemon-reload
systemctl restart docker
方法二,修改kubelet的cgroup-driver为cgroupfs
修改”/etc/systemd/system/kubelet.service.d/10-kubeadm.conf”文件(该文件在安装kubelet时生成),在”Environment=”KUBELET_KUBECONFIG_ARGS=”后增加–cgroup-driver=cgroupfs
Environment="KUBELET_KUBECONFIG_ARGS=--bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf --cgroup-driver=cgroupfs"
配置iptable转发规则
docker 1.13+ 版本,启动后默认把iptable的FORWARD策略改为DROP,可能会影响k8s集群报文转发功能,需要修改FORWARD链的默认策略为ACCEPT。
- 查看iptables策略
iptables -vnL
- 临时修改
iptables -P FORWARD ACCEPT
- 永久修改
修改docker的service文件,文件路径”/lib/systemd/system/docker.service”,添加
ExecStartPost=/sbin/iptables -P FORWARD ACCEPT # 当docker启动后会额外执行此条命令。此行加到ExecStart行下面。
重启docker
systemctl daemon-reload
systemctl start docker
systemctl enable docker
开始部署
kubeadm init --kubernetes-version=v1.15.4 --ignore-preflight-errors=NumCPU --pod-network-cidr=10.244.0.0/16 --image-repository registry.aliyuncs.com/google_containers
参数说明:
- “kubernetes-version”:指定k8s的版本,对于不同版本k8s,kubeadm会去拉取不同版本的镜像。
- “–pod-network-cidr”: 指定使用”cidr”方式给pod分配IP,参数的数值必须跟接下来要安装的网络插件flannel的配置一致, 否则flannel部署失败。后面用到的网络插件为flannel,flannel配置文件中默认的数值是“10.244.0.0/16”。
- “–image-repository”: 指定镜像仓库,kubeadm默认的仓库地址没法访问,需要指定为阿里云的地址——”registry.aliyuncs.com/google_containers”
- “–ignore-preflight-errors”:kubeadm在初始化之前,会执行“preflight”(预检),当条件不满足时会报错并停止初始化进程,但是有些报错并不会影响集群的初始化,因此可以指定该参数忽略特定的错误。阿里云学生机cpu只有单核,而k8s要求双核及以上,所以需要指定参数”–ignore-preflight-errors=NumCPU”。
该参数的用法如下:
--ignore-preflight-errors=<option>
<option>就是错误的类型,如上图所示,错误提示是”[ERROR NumCPU]”,那么参数就写成:
--ignore-preflight-errors=NumCPU
查看部署状态
当看到上述信息就表示集群Master节点初始化成功,在同一网络下的机器上同样地安装kuneadm、kubelet并配置好环境之后,即可通过”kubeadm join”命令连接到Master节点使集群成为多节点集群:
kubeadm join 192.168.1.73:6443 --token gkp9ws.rv2guafeusg7k746 \
--discovery-token-ca-cert-hash sha256:4578b17cd7198a66438b3d49bfb878093073df23cf6c5c7ac56b3e05d2e7aec0
该token默认有效期为24小时,可通过”kubeadm token create –print-join-command”命令创建新token,并打印连接命令:
初始化成功后,在master节点上可以通过kubectl命令来查看集群上资源的状态,但是kubectl在访问API Server时需要认证,否则会出现”The connection to the server localhost:8080 was refused”这样的错误。有如下两种解决方法:
一、
认证信息在”/etc/kubernetes/admin.conf”文件里,所以需要把文件拷贝到”$HOME/.kube/config/”下,
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
这段命令会在初始化成功后打印出来,直接拷贝即可。
二、
也可以直接添加环境变量指定文件地址:
export KUBECONFIG=/etc/kubernetes/admin.conf
可以把这条变量添加到”/etc/profile”,然后”source /etc/profile”。
配置好后,通过”kubectl get node”即可看到集群的所有节点状态:
可以看到当前节点处于”NotReady”状态,通过”kubectl describe node <your_node>”命令查看node情况,<your_node>替换成自己的节点名,此时可以看到这样的信息:
在”Ready”一行,”status”为”false”,”message”提示”Runtime newtwork not ready”,意思是网络插件未准备好,所以此时应该给集群安装网络插件。
安装网络插件
网络插件有很多种,此处选择”flannel”,flannel的安装比较简单,直接指定配置文件,用”kubectl”安装即可。配置文件如下:
flannel.yaml
博客园markdown的details标签不好用,格式可能有点问题,给个github的传送门
128行的network数值应与”kubeadm”初始化时指定的”–pod-network-cidr”一致,该值表示给pod分配ip时的ip前缀。
创建好配置文件后,通过”kubeclt”安装flannel:
kubectl create -f <flannel_yaml_path>
把<flannel_yaml_path>替换成自己的配置文件路径,执行命令后稍等片刻,单节点k8s集群就部署好了。
测试
处理taint
默认情况下,出于安全考虑,master节点会被打上一个叫”NoSchedule”的Taint(污点),可以通过”kubectl describe”看到:
这个taint使得master节点不能被调度,也就是说master节点不能部署应用,由于现在搭建的是单节点集群,当前节点既充当master又得充当worker,所以需要把这个taint去掉:
kubectl taint node <node_name> <taint>-
<node_name>替换成自己节点名称,<taint>替换成taint,如:
kubectl taint node yo node-role.kubernetes.io/master:NoSchedule-
注意别忘了taint后面的横杠”-“,”-“表示“减号”,即把taint去掉。如果想把”taint”加回去,只需要把”-“去掉,并在”:”前加上”=”,如”kubectl taint node yo node-role.kubernetes.io/master=:NoSchedule”
运行nginx:
docker pull nginx
kubectl run nginx --image=nginx
稍等片刻nginx就部署好了,可以通过”kubectl get pods –all-namespaces”查看,或者直接访问”curl localhost:80″。
排错工具
kubectl
kubectl get <resource_type>
“kubectl get”可以列出集群环境中的某类资源,对于k8s,几乎所有内容都是“资源”,如Node、Pod、Service等,只要把”<resource_type>”替换成想查看的资源类型即可。
如查看节点资源:
kubectl get node
对于pod等其它的资源,kubectl的用法会有些许不同。k8s使用”namespace”来对集群中的资源进行分组管理,可以把”namespace”当做“分组的名称”,也可以把”namespace”当做k8s集群中的”集群”,不同”namespace”的资源在逻辑上彼此隔离,以此提高安全性,提高管理效率。用kubeectl查看这些个资源时,需要用”-n”来指定”namespace”,如:
kubectl get pod -n kube-system
还可以用”–all-namespaces”来查看所有”namespaces”下的资源:
kubectl get pod --all-namespaces
kubectl describe <resource_type> <resource_name>
对于处于异常状态的资源,可以使用该命令查看其详细信息,只要把<resource_type>替换成资源类别,把<resource_name>替换成资源名称即可,当然也还需要用”-n”指明”namespaces”。
如:
kubectl describe pod -n kubernetes-dashboard kubernetes-dashboard-6b855d4584-9sgsk
然后就可以看到该pod的事件信息:
docker ps -a
该命令可以查看当前所有docker容器,”-a”表示所有容器,当不加该参数时,显示的则是正在运行的容器。由于要查看的是k8s相关的容器,以此可以使用管道命令和”grep”对显示结果进行筛选:
docker ps -a | grep kube
对于处于”Exited”状态的异常容器,使用”docker logs <container_id>”命令查看容器日志。如:
docker logs 37443d902aee
此处”37443d902aee”是我机器上”kubernetes-dashboard”的容器id。