Docker存储卷
1、COW机制
Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。
描述:如果一个文件在最底层是可见的,如果在layer1上标记为删除,最高的层是用户看到的Layer2的层,在layer0上的文件,在layer2上可以删除,但是只是标记删除,用户是不可见的,总之在到达最顶层之前,把它标记来删除,对于最上层的用户是不可见的,当标记一删除,只有用户在最上层建一个同名一样的文件,才是可见的。
对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。
而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。
2、什么是存储卷
存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。
在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。
3、使用存储卷的好处
如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。
我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。
Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。
这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。
4、为什么要使用存储卷
关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。
因此Docker存在的问题有:
- 存储于联合挂载文件系统中,不易于宿主机访问
- 容器间数据共享不便
- 删除容器其数据会丢失
而要解决这些问题,解决方案就是使用存储卷。
5、存储卷管理方式
存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。
Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。
存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。
卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。
6、存储卷的分类
Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:
-
Bind mount volume(绑定挂载卷):
在宿主机上的路径要人工的指定一个特定的路径,在容器中也需要指定一个特定的路径,两个已知的路径建立关联关系
-
Docker-managed volume(docker管理卷):
只需要在容器内指定容器的挂载点是什么,而被绑定宿主机下的那个目录,是由容器引擎daemon自行创建一个空的目录,或者使用一个已经存在的目录,与存储卷建立存储关系,这种方式极大解脱用户在使用卷时的耦合关系,缺陷是用户无法指定那些使用目录,临时存储比较适合;
7、容器数据管理
用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。
容器中管理数据主要有两种方式:
- 数据卷(Data Volumes)
- 数据卷容器(Data Volumes Containers)
容器Volume使用语法:
Docker-managed volume
docker run -it --name CONTAINER_NAME -v VOLUMEDIR IMAGE_NAME
Bind mount volume
docker run -it --name CONTAINER_NAME -v HOSTDIR:VOLUMEDIR IMAGE_NAME
7.1 在容器中使用数据卷
在容器内创建一个数据卷
下面使用busybox镜像创建一个zsl1容器,并创建一个数据卷挂载到容器的/data目录下:
[root@localhost ~]# docker run -it --name zsl1 -v /data busybox (另起一个终端) root@localhost ~]# df -h Filesystem Size Used Avail Use% Mounted on overlay 17G 2.2G 15G 13% /var/lib/docker/overlay2/c4129ee11ded440f3ad6561b4dd47ef3ba66cfb6a8c5d69bc21a6f3548cdef6d/merged [root@localhost ~]# docker inspect zsl1 ...... "Mounts": [ { "Type": "volume", "Name": "66d90c8e3765212d7cf54dde2d27e9590d1fb71b454b2d8a26a2a8b8ceae4dcc", "Source": "/var/lib/docker/volumes/66d90c8e3765212d7cf54dde2d27e9590d1fb71b454b2d8a26a2a8b8ceae4dcc/_data", "Destination": "/data", "Driver": "local", "Mode": "", "RW": true, "Propagation": "" } ], ...... # 本机里的/var/lib/docker/volumes/66d90c8e3765212d7cf54dde2d27e9590d1fb71b454b2d8a26a2a8b8ceae4dcc/_data和容器zsl1的/data建立绑定关系 # 在本机的/var/lib/docker/volumes/.../_data中创建abc [root@localhost ~]# cd /var/lib/docker/volumes/66d90c8e3765212d7cf54dde2d27e9590d1fb71b454b2d8a26a2a8b8ceae4dcc/_data/ [root@localhost _data]# ls [root@localhost _data]# echo "hello word" > abc [root@localhost _data]# cat abc hello word # 容器zsl1: / # ls bin data dev etc home proc root sys tmp usr var / # cd data/ /data # ls abc /data # cat abc hello word # 删除容器zsl1,存储卷中的文件不会删除 [root@localhost _data]# docker rm -f zsl1 zsl1 [root@localhost _data]# docker ps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES [root@localhost _data]# ls abc [root@localhost _data]# cat abc hello word
挂载一个主机目录作为数据卷、
[root@localhost ~]# docker run -it --name zsl2 -v /mydata:/data busybox (另开一个终端) [root@localhost ~]# df -h Filesystem Size Used Avail Use% Mounted on overlay 17G 2.2G 15G 13% /var/lib/docker/overlay2/5cbe700b6509eb7ccd0f77b4a860afe49b8585795692ca1d18bb063f8de0ba82/merged [root@localhost ~]# docker inspect zsl2 "Mounts": [ { "Type": "bind", "Source": "/mydata", "Destination": "/data", "Mode": "", "RW": true, "Propagation": "rprivate" } ], #本机里的/mydata和容器zsl2的/data建立绑定关系 # 在本机的/mydata中创建abc [root@localhost ~]# cd /mydata/ [root@localhost mydata]# ls [root@localhost mydata]# echo 'hello word' > abc [root@localhost mydata]# cat abc hello word # 容器zsl2: / # ls bin data dev etc home proc root sys tmp usr var / # cd data/ /data # cat abc hello word # 删除容器zsl2,存储卷中的文件不会删除 [root@localhost mydata]# docker rm -f zsl2 zsl2 [root@localhost mydata]# docker ps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES [root@localhost mydata]# ls abc [root@localhost mydata]# cat abc hello word
上面的命令加载主机的mydata
目录到容器的/webapp
目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。
Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:
[root@localhost ~]# docker run -it --name zsl2 -v /mydata:/data:ro busybox
加了:ro以后,容器内挂载的数据卷的数据就无法修改了。
挂载一个本地主机文件作为数据卷
-v选项也可以从主机挂载单个文件到容器中作为数据卷:
[root@localhost ~]# docker run -it -v ~/.bash_history:/.bash_history centos /bin/bash
这样就可以记录在容器输入过的命令历史了。
如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。所以推荐的方式是直接挂载文件所在的目录。
7.2 数据卷容器
如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:
首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:
[root@localhost ~]# docker run -dit --rm -v /dbdata --name dbdata centos be8dec2b258efc53277b73f2544b2d112b97918037fb6ab2340a405e0f0f330a [root@localhost ~]# docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES be8dec2b258e centos "/bin/bash" 5 seconds ago Up 3 seconds dbdata
然后可以在其他容器中使用--volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:
[root@localhost ~]# docker run -dit --name db1 --volumes-from dbdata centos 4f1ef71cfcbefdddfac7ea0081398a319b275401399ae433bdcfa3107063a417 [root@localhost ~]# docker run -dit --name db2 --volumes-from dbdata centos f10bd5829df2869bd33660a9ee2c7de2491e13722fd19607b63ae94fccbb5d43
此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
例如,在dbdata容器中创建一个abc文件:
[root@localhost ~]# docker exec -it dbdata /bin/bash [root@be8dec2b258e /]# ls bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv sys tmp usr var [root@be8dec2b258e /]# cd dbdata/ [root@be8dec2b258e dbdata]# echo 'hello word' > abc [root@be8dec2b258e dbdata]# ls abc [root@be8dec2b258e dbdata]# cat abc hello word
在db1容器中查看:
[root@localhost ~]# docker exec -it db1 /bin/bash [root@4f1ef71cfcbe /]# cd dbdata/ [root@4f1ef71cfcbe dbdata]# ls abc [root@4f1ef71cfcbe dbdata]# cat abc hello word
在db2容器中查看:
[root@localhost ~]# docker exec -it db2 /bin/bash [root@f10bd5829df2 /]# cd dbdata/ [root@f10bd5829df2 dbdata]# ls abc [root@f10bd5829df2 dbdata]# cat abc hello word
可以多次使用--volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:
[root@localhost ~]# docker run -it --name db3 --volumes-from db1 centos [root@2401a2dcba43 /]# ls bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv sys tmp usr var [root@2401a2dcba43 /]# cd dbdata/ [root@2401a2dcba43 dbdata]# cat abc hello word
使用--volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。
如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。
7.3 利用数据卷容器迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
备份
使用下面的命令来备份dbdata数据卷容器内的数据卷:
# 创建容器dbdata [root@localhost ~]# docker run -dit --name dbdata -v /dbdata centos 963e962cfece193a42af85b1492af6c7dcd4d680bcface6d0661925f5ee1e008 # 进入容器dbdata [root@localhost ~]# docker exec -it dbdata /bin/bash [root@963e962cfece /]# ls bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv sys tmp usr var # 在dbdata下创建数据 [root@963e962cfece /]# cd dbdata/ [root@963e962cfece dbdata]# echo 'hello word' > abc [root@963e962cfece dbdata]# ls abc [root@963e962cfece dbdata]# dd if=/dev/zero of=test bs=1M count=10 10+0 records in 10+0 records out 10485760 bytes (10 MB, 10 MiB) copied, 0.00523796 s, 2.0 GB/s [root@963e962cfece dbdata]# ls abc test [root@963e962cfece dbdata]# du -sh * 4.0K abc 10M test # 创建备份数据的容器backup [root@localhost ~]# docker run --name worker --volumes-from dbdata -v $(pwd):/backup centos tar cvf /backup/backup.tar /dbdata tar: Removing leading `/' from member names /dbdata/ /dbdata/abc /dbdata/test [root@localhost ~]# ls anaconda-ks.cfg backup.tar # 删除备份文件,测试启动容器后是否会在备份 [root@localhost ~]# rm -f backup.tar [root@localhost ~]# docker ps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 5d21d931d708 centos "tar cvf /backup/bac…" About a minute ago Exited (0) About a minute ago worker 963e962cfece centos "/bin/bash" 10 minutes ago Up 10 minutes dbdata [root@localhost ~]# docker restart worker worker # 由此可见,启动容器后会执行备份操作 [root@localhost ~]# ls anaconda-ks.cfg backup.tar
这个命令稍微有点复杂,具体分析下。
首先利用centos镜像创建了一个容器worker。使用--volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。
恢复
如果要恢复数据到一个容器,可以按照下面的操作。首先创建一个带有数据卷的容器dbdata2:
[root@localhost ~]# docker run -it --name dbdata2 -v /dbdata centos /bin/bash
然后创建另一个新的容器,挂载dbdata2容器,并使用untar解压备份文件到所挂载的容器卷中即可:
[root@localhost ~]# docker run --rm --volumes-from dbdata2 -v $(pwd):/backup centos tar xvf /backup/backup.tar dbdata/ dbdata/abc dbdata/test [root@localhost ~]# docker exec -it dbdata2 /bin/bash [root@2f0cf0a0f425 /]# ls bin dbdata dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv sys tmp usr var [root@2f0cf0a0f425 /]# cd dbdata/ [root@2f0cf0a0f425 dbdata]# ls abc test [root@2f0cf0a0f425 dbdata]# cat abc hello word [root@2f0cf0a0f425 dbdata]# du -sh test 10M test