【TensorFlow学习笔记】4:认识Variable及其重用(共享),在scope上的初始化

news/2024/7/7 14:45:39

学习《深度学习之TensorFlow》时的一些实践。


认识TF中的Variable

TF通过name来标识变量(Variable),这和调用者定义的程序里的"变量名"无关。当不指定name时,由TF自己指定,当创建的变量的name已经存在时,TF会为其改名。

变量的创建和name指定

# 两个未命名的变量,TF会自动给名字
a = tf.Variable(1.0)
print("a:", a.name)
b = tf.Variable(2.0)
print("b:", b.name)
# 两个name一样的变量,TF会为第二个改名字
c = tf.Variable(3.0, name='var')
print("c:", c.name)
d = tf.Variable(4.0, name='var')
print("d:", d.name)

a: Variable:0
b: Variable_1:0
c: var:0
d: var_1:0

读取变量的值

# 在Session中读取变量的值
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print("a:", a.eval())
    print("b:", b.eval())
    print("c:", c.eval())
    print("d:", d.eval())

a: 1.0
b: 2.0
c: 3.0
d: 4.0

使用tf.get_variable()

通过一系列参数,获取一个已经存在的变量,或者创建一个新的变量。

下面即创建一个名为ok,shape为[1]的变量,初始化为6.6。

ok = tf.get_variable("ok", [1], initializer=tf.constant_initializer(6.6))
print("ok:", ok.name)

ok: ok:0

变量的scope

要使用相同name的变量,一般要指定在不同的scope里。当使用tf.get_variable()创建变量时,会去检查计算任务中是否已经创建过这个变量,如果创建过了,而且本次没有使用共享方式,就会出错。

with tf.variable_scope("v1"):
    ok = tf.get_variable("ok", [1], initializer=tf.constant_initializer(6.6))
    print("ok:", ok.name)

with tf.variable_scope("v2"):
    ok = tf.get_variable("ok", [1], initializer=tf.constant_initializer(6.6))
    print("ok:", ok.name)

ok: v1/ok:0
ok: v2/ok:0

嵌套scope

变量作用域可以嵌套。

with tf.variable_scope("v4"):
    ok4 = tf.get_variable("ok", [1], initializer=tf.constant_initializer(6.6))
    with tf.variable_scope("v5"):
        ok45 = tf.get_variable("ok", [1], initializer=tf.constant_initializer(6.6))

print("ok4:", ok4.name)
print("ok45:", ok45.name)

ok4: v4/ok:0
ok45: v4/v5/ok:0

Variable的重用

指向同一个Variable的程序变量即重用(共享)了。这在有些需要协作的模型(如GAN)里是比较关键的。

reuse_variables()

用上面的方式指定的两个变量是不同的,如果要在一个作用域里指定两个变量是相同的,可以在该作用域下开启变量重用。

with tf.variable_scope("v3") as v3:
    p1 = tf.get_variable("p", [1], initializer=tf.constant_initializer(2.2))
    print("p1:", p1.name)
    v3.reuse_variables()  # 开启变量重用
    p2 = tf.get_variable("p")
    print("p2:", p2.name)

p1: v3/p:0
p2: v3/p:0

# 查看这两个变量的值
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(p1), sess.run(p2))

[2.2] [2.2]

共享变量的一般用法

一般是将共享的一个作用域里的变量放到两个网络中去,也就是在某个网络中:

with tf.variable_scope("v6"):
    g1 = tf.get_variable("g1", [1], initializer=tf.constant_initializer(1.1))
    with tf.variable_scope("v7"):
        g2 = tf.get_variable("g2", [1], initializer=tf.constant_initializer(2.2))

在另一个网络中,相应的scope开启reuse(这里的reuse可以级联传递):

with tf.variable_scope("v6", reuse=True):
    g3 = tf.get_variable("g1", [1], initializer=tf.constant_initializer(1.1))
    with tf.variable_scope("v7"):
        g4 = tf.get_variable("g2", [1], initializer=tf.constant_initializer(2.2))

最终g1和g3共享了,g2和g4共享了:

print(g1.name, g3.name)
print(g2.name, g4.name)

v6/g1:0 v6/g1:0
v6/v7/g2:0 v6/v7/g2:0

关于自动重用

如果在第一个v6上开启reuse=True,那么会报错:

ValueError: Variable v6/g1 does not exist, or was not created with tf.get_variable(). Did you mean to set reuse=tf.AUTO_REUSE in VarScope?

也就是说,开启重用的scope会去找里面先前已经定义好的变量,并重用之,如果找不到就会出问题。

在某些情况下,开启自动重用(reuse=tf.AUTO_REUSE)是比较合适的,它可以兼顾“重用”和“创建新变量”,即能重用就重用,不能就直接创建新变量。

with tf.variable_scope("v3", reuse=tf.AUTO_REUSE) as v3:
    p1 = tf.get_variable("p", [1], initializer=tf.constant_initializer(2.2))
    print("p1:", p1.name)
    p2 = tf.get_variable("p")
    print("p2:", p2.name)

p1: v3/p:0
p2: v3/p:0

Variable在scope上的初始化

在scope上可以指定initializer,对于未指定initializer的Variable和子scope,它会级联传递;对于指定了initializer的子scope,它会被覆盖,并以覆盖后的值向下级联传递。

with tf.variable_scope("s1", initializer=tf.constant_initializer(1.1)):
    s1a = tf.get_variable("s1a", [1])
    s1b = tf.get_variable("s1b", [1], initializer=tf.constant_initializer(1.2))
    with tf.variable_scope("s2"):
        s2a = tf.get_variable("s1a", [1])
    with tf.variable_scope("s3", initializer=tf.constant_initializer(2.1)):
        s3a = tf.get_variable("s1a", [1])

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(s1a), sess.run(s1b), sess.run(s2a), sess.run(s3a))

[1.1] [1.2] [1.1] [2.1]


http://www.niftyadmin.cn/n/1662885.html

相关文章

LINUX网络服务01:DHCP

第一步:安装rpm -ivh /mnt/Packages/dhcp-4.2.5-58.el7.centos.x86_64.rpm第二步:修改配置文件rpm -qc dhcpvi /etc/dhcp/dhcpd.conf 查看dhcp服务相关的配置文件subnet 192.168.80.0 netmask 255.255.255.0 {range 192.168.80.100 192.168.80.200;optio…

QT—动态属性系统

目录 一、创建动态属性 二、Q_PROPERTY宏参数类型 三、演示 四、通过基类读写动态属性 1.读属性 2.改属性 一、创建动态属性 在标准C中,为了保证封装性,我们经常声明一个私有变量,然后声明两个公有函数,即set函数和get函…

Python中列表并不是首选,其他序列类型介绍:数组、内存视图、NumPy 、双向队列deque

数组array.array 比如我们要存放100万个浮点数的话,使用数组就会更高效一点,因为数组背后存储是不是float对象,而是数字对应的机器翻译,也就是字节表述。 数组支持所有可变序列的操作,比如.pop .insert .extend。另外…

【TensorFlow学习笔记】5:variable_scope和name_scope,图的基本操作

学习《深度学习之TensorFlow》时的一些实践。 variable_scope 一般的嵌套 上节有学到在嵌套scope中的变量,一般是: import tensorflow as tf# with tf.variable_scope("scopeA") as spA: # var1 tf.get_variable("v1", [1])…

WPF中的资源(二) - 二进制资源

原文:WPF中的资源(二) - 二进制资源WPF中的二进制资源,就是类似于MFC中在对话框程序中添加的图片、字符串等资源,程序在运行时将其转换成二进制,以供程序使用。下面以将字符串转换成二进制为例来说明,二进制…

【Vue.js学习笔记】3:数据绑定,事件绑定

数据绑定 使用Vue时在Vue对象的el字段中要指定一下根容器,这里用id选择器。这个例子同时学习了data和methods的基本用法。 数据绑定(data-binding)可以将Vue对象中的data的值绑定到HTML标签中的某些位置,则修改时只需要修改对象…

Python的映射类型介绍

dict类型是Python语言的基石,至关重要。Python对它做了高度优化,散列表是字典类型性能出众个跟本原因。 collection.abc 模块里面有Mapping和MutableMapping这两个抽象基类,他们的作用为dict和类似的类型提供形式接口。其他的映射类型&#…

零基础入门MATLAB(一篇十分钟)

目录 一、复数 二、取整函数 三、无穷量(Inf)和非数值量(NaN) 四、逻辑类型 五、字符和字符串 六、函数句柄 七、结构体 八、数组类型 九、单元数组 十、map容器类型 参考《MATLAB R2020a 完全自学一本通》 一、复数 …