Cilium
Cilium 是一个基于 eBPF 和 XDP 的高性能容器网络方案,代码开源在 https://github.com/cilium/cilium。其主要功能特性包括
    安全上,支持 L3/L4/L7 安全策略,这些策略按照使用方法又可以分为
      基于身份的安全策略(security identity)
      基于 CIDR 的安全策略
      基于标签的安全策略
    网络上,支持三层平面网络(flat layer 3 network),如
      覆盖网络(Overlay),包括 VXLAN 和 Geneve 等
      Linux 路由网络,包括原生的 Linux 路由和云服务商的高级网络路由等
    提供基于 BPF 的负载均衡
    提供便利的监控和排错能力

eBPF 和 XDP

eBPF(extended Berkeley Packet Filter)起源于BPF,它提供了内核的数据包过滤机制。BPF的基本思想是对用户提供两种SOCKET选项:SO_ATTACH_FILTERSO_ATTACH_BPF,允许用户在sokcet上添加自定义的filter,只有满足该filter指定条件的数据包才会上发到用户空间。SO_ATTACH_FILTER插入的是cBPF代码,SO_ATTACH_BPF插入的是eBPF代码。eBPF是对cBPF的增强,目前用户端的tcpdump等程序还是用的cBPF版本,其加载到内核中后会被内核自动的转变为eBPF。Linux 3.15 开始引入 eBPF。其扩充了 BPF 的功能,丰富了指令集。它在内核提供了一个虚拟机,用户态将过滤规则以虚拟机指令的形式传递到内核,由内核根据这些指令来过滤网络数据包。
XDP(eXpress Data Path)为Linux内核提供了高性能、可编程的网络数据路径。由于网络包在还未进入网络协议栈之前就处理,它给Linux网络带来了巨大的性能提升。XDP 看起来跟 DPDK 比较像,但它比 DPDK 有更多的优点,如
    无需第三方代码库和许可
    同时支持轮询式和中断式网络
    无需分配大页
    无需专用的CPU
    无需定义新的安全网络模型
当然,XDP的性能提升是有代价的,它牺牲了通用型和公平性:(1)不提供缓存队列(qdisc),TX设备太慢时直接丢包,因而不要在RX比TX快的设备上使用XDP;(2)XDP程序是专用的,不具备网络协议栈的通用性。

部署

版本要求
    Linux Kernel >= 4.8 (推荐 4.9.17 LTS)
    KV 存储(etcd >= 3.1.0 或 consul >= 0.6.4)

Kubernetes Cluster

1
# mount BPF filesystem on all nodes
2
$ mount bpffs /sys/fs/bpf -t bpf
3
4
$ wget https://raw.githubusercontent.com/cilium/cilium/doc-1.0/examples/kubernetes/1.10/cilium.yaml
5
$ vim cilium.yaml
6
[adjust the etcd address]
7
8
$ kubectl create -f ./cilium.yaml
Copied!

minikube

1
minikube start --network-plugin=cni --bootstrapper=localkube --memory=4096 --extra-config=apiserver.Authorization.Mode=RBAC
2
kubectl create clusterrolebinding kube-system-default-binding-cluster-admin --clusterrole=cluster-admin --serviceaccount=kube-system:default
3
kubectl create -f https://raw.githubusercontent.com/cilium/cilium/HEAD/examples/kubernetes/addons/etcd/standalone-etcd.yaml
4
kubectl create -f https://raw.githubusercontent.com/cilium/cilium/HEAD/examples/kubernetes/1.10/cilium.yaml
Copied!

Istio

1
# cluster clusterrolebindings
2
kubectl create clusterrolebinding kube-system-default-binding-cluster-admin --clusterrole=cluster-admin --serviceaccount=kube-system:default
3
# etcd
4
kubectl create -f https://raw.githubusercontent.com/cilium/cilium/HEAD/examples/kubernetes/addons/etcd/standalone-etcd.yaml
5
6
# cilium
7
curl -s https://raw.githubusercontent.com/cilium/cilium/HEAD/examples/kubernetes/1.10/cilium.yaml | \
8
sed -e 's/sidecar-http-proxy: "false"/sidecar-http-proxy: "true"/' | \
9
kubectl create -f -
10
11
# Istio
12
curl -L https://git.io/getLatestIstio | sh -
13
ISTIO_VERSION=$(curl -L -s https://api.github.com/repos/istio/istio/releases/latest | jq -r .tag_name)
14
cd istio-${ISTIO_VERSION}
15
cp bin/istioctl /usr/local/bin
16
17
# Patch with cilium pilot
18
sed -e 's,docker\.io/istio/pilot:,docker.io/cilium/istio_pilot:,' \
19
< install/kubernetes/istio.yaml | \
20
kubectl create -f -
21
22
# Configure Istio’s sidecar injection to use Cilium’s Docker images for the sidecar proxies
23
kubectl create -f https://raw.githubusercontent.com/cilium/cilium/HEAD/examples/kubernetes-istio/istio-sidecar-injector-configmap-release.yaml
Copied!

安全策略

TCP 策略:
1
apiVersion: "cilium.io/v2"
2
kind: CiliumNetworkPolicy
3
description: "L3-L4 policy to restrict deathstar access to empire ships only"
4
metadata:
5
name: "rule1"
6
spec:
7
endpointSelector:
8
matchLabels:
9
org: empire
10
class: deathstar
11
ingress:
12
- fromEndpoints:
13
- matchLabels:
14
org: empire
15
toPorts:
16
- ports:
17
- port: "80"
18
protocol: TCP
Copied!
CIDR 策略
1
apiVersion: "cilium.io/v2"
2
kind: CiliumNetworkPolicy
3
metadata:
4
name: "cidr-rule"
5
spec:
6
endpointSelector:
7
matchLabels:
8
app: myService
9
egress:
10
- toCIDR:
11
- 20.1.1.1/32
12
- toCIDRSet:
13
- cidr: 10.0.0.0/8
14
except:
15
- 10.96.0.0/12
Copied!
L7 HTTP 策略:
1
apiVersion: "cilium.io/v2"
2
kind: CiliumNetworkPolicy
3
description: "L7 policy to restrict access to specific HTTP call"
4
metadata:
5
name: "rule1"
6
spec:
7
endpointSelector:
8
matchLabels:
9
org: empire
10
class: deathstar
11
ingress:
12
- fromEndpoints:
13
- matchLabels:
14
org: empire
15
toPorts:
16
- ports:
17
- port: "80"
18
protocol: TCP
19
rules:
20
http:
21
- method: "POST"
22
path: "/v1/request-landing"
Copied!

监控

microscope 汇集了所有 Nodes 的监控数据(从 cilium monitor 获取)。使用方法为:
1
$ kubectl apply -f
2
https://github.com/cilium/microscope/blob/master/docs/microscope.yaml
3
$ kubectl exec -n kube-system microscope -- microscope -h
Copied!

参考资料

最近更新 2yr ago