python特殊字符作为变量python将特殊不可见字符Unicode编码转换

目录
  • 一、默认参数
  • 二、List作为默认参数的一个坑
  • 三、函数初始化
  • 四、可变与不可变
  • 五、最佳操作

不可变对象改变值时会将新的值放在另一个内存地址中,原内存地址释放。从编程者的视角看,变量名没有发生变化,但该变量名指向的内存地址已经发生改变。对于可变对象,例如list,改变list的值,其内存起始地址不变,id(list)输出值一样。因此用list做函数参数的默认值时,再次使用该函数不会对该参数重新赋值一个默认的list,而是使用之前的list,但这个list很可能已经发生多了变化,因此会引发bug。

如非特别说明,下文均基于Python3

一、默认参数

python为了简化函数的调用,提供了默认参数机制:

def pow(x, n = 2): r = 1 while n > 0: r *= x n -= 1 return r

这样在调用pow函数时,就可以省略最终一个参数不写:

print(pow(5)) output: 25

在定义有默认参数的函数时,需要注意下面内容:

  • 必选参数必须在前面,默认参数在后;
  • 设置何种参数为默认参数?一般来说,将参数值变化小的设置为默认参数。

例如python内建函数:

print(*objects, sep=’ ‘, end=’n’, file=sys.stdout, flush=False)

函数签名可以看出,使用print(‘hello python’)这样的简单调用的打印语句,实际上传入了许多默认值,默认参数使得函数的调用变得非常简单。

二、List作为默认参数的一个坑

引用一个官方的经典示例地址 :

def bad_append(new_item, a_list=[]): a_list.append(new_item) return a_list print(bad_append(‘1’)) print(bad_append(‘2’))

这个示例并没有按照预期打印:

[&039;1&039;]
[&039;2&039;]

而是打印了:

[&039;1&039;]
[&039;1&039;, &039;2&039;]

其实这个错误难题不在默认参数上,而是我们对于及默认参数的初始化的领会有误。

三、函数初始化

按照Python哲学:一切皆对象

函数也一个对象,如下示例:

import types def test(): pass print(type(test)) <class ‘function’> print(isinstance(test, types.FunctionType)) True

如此,函数就是类types.FunctionType或者其子类的实例对象。那么对象必然有其初始化的时候,一般来说,解释器在读到函数末尾时完成函数实例的初始化。初始化后,就有了函数名到函数对象这样一个映射关系,可以通过函数名访问到函数对象了,并且,函数的一切属性也确定下来,包括所需的参数,默认参数的值。因此每次调用函数时,默认参数值是相同的(如果有默认参数)。

我们以一个直观的例子来说明:

import datetime as dt from time import sleep def log_time(msg, time=dt.datetime.now()): sleep(1) 线程暂停一秒 print(“%s: %s” % (time.isoformat(), msg)) log_time(‘msg 1’) log_time(‘msg 2’) log_time(‘msg 3’)

运行这个程序,得到的输出是:

2017-05-17T12:23:46.327258: msg 1
2017-05-17T12:23:46.327258: msg 2
2017-05-17T12:23:46.327258: msg 3

即使使用了sleep(1)让线程暂停一秒,排除了程序执行很快的影响。输出中三次调用打印出的时刻还是相同的,即三次调用中默认参数time的值是相同的。

上面的示例或许还不能完全说明难题,下面内容通过观察默认参数的内存地址的方式来说明。

开头来说需要了解内建函数id(object) :

id(object) Return the “identity” of an object. This is an integer which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value. CPython implementation detail: This is the address of the object in memory.

即id(object)函数返回一个对象的唯一标识。这个标识一个在对象的生活周期期间保证唯一并且不变的整数。在重叠的生活周期中,两个对象可能有相同的id值。
在CPython解释器实现中,id(object)的值为对象的内存地址。

如下示例使用id(object)函数清楚说明了难题:

def bad_append(new_item, a_list=[]): print(‘address of a_list:’, id(a_list)) a_list.append(new_item) return a_list print(bad_append(‘1’)) print(bad_append(‘2’))

output:

address of a_list: 31128072
[&039;1&039;]
address of a_list: 31128072
[&039;1&039;, &039;2&039;]

两次调用bad_append,默认参数a_list的地址是相同的。

而且a_list是可变对象,使用append技巧添加新元素并不会造成list对象的重新创建,地址的重新分配。这样,‘恰好’就在默认参数指向的地址处修改了对象,下一次调用再次使用这个地址时,就可以看到上一次的修改了。

那么,出现上述的输出就不奇怪了,由于它们本来就是指向同一内存地址。

四、可变与不可变

当默认参数指向可变类型对象和不可变类型对象时,会表现出不同的行为。

可变默认参数 的表现就像上诉示例一样。

不可变默认参数

开头来说看一个示例:

def immutable_test(i = 1): print(‘before operation, address of i’, id(i)) i += 1 print(‘after operation, address of i’, id(i)) return i print(immutable_test()) print(immutable_test())

Output:

before operation, address of i 1470514832
after operation, address of i 1470514848
2
before operation, address of i 1470514832
after operation, address of i 1470514848
2

很明显,第二次调用时默认参数i的值不会受第一次调用的影响。由于i指向的是不可变对象,对i的操作会造成内存重新分配,对象重新创建,那么函数中i += 1之后名字i指向了另外的地址;根据默认参数的制度,下次调用时,i指向的地址还是函数定义时赋予的地址,这个地址的值1并没有被改变。

其实,可变默认参数和不可变默认参数放在这里讨论并没太大的价格,就像其他语言中所谓的值传递还是引用传递一样,不只会对默认参数造成影响。

五、最佳操作

不可变的默认参数的多次调用不会造成任何影响,可变默认参数的多次调用的结局不符合预期。那么在使用可变默认参数时,就不能只在函数定义时初始化一次,而应该在每次调用时初始化。

最佳操作是定义函数时指定可变默认参数的值为None,在函数体内部重新绑定默认参数的值。下面内容是对上面的两个可变默认参数示例最佳操作的应用:

def good_append(new_item, a_list = None): if a_list is None: a_list = [] a_list.append(new_item) return a_list print(good_append(‘1’)) print(good_append(‘2’)) print(good_append(‘c’, [‘a’, ‘b’]))??????? import datetime as dt from time import sleep def log_time(msg, time = None): if time is None: time = dt.datetime.now() sleep(1) print(“%s: %s” % (time.isoformat(), msg)) log_time(‘msg 1’) log_time(‘msg 2’) log_time(‘msg 3’)

到此这篇关于python将独特不可见字符Unicode编码转换成可见字符串的文章就介绍到这了,更多相关python Unicode编码转可见字符串内容请搜索风君子博客以前的文章或继续浏览下面的相关文章希望大家以后多多支持风君子博客!

无论兄弟们可能感兴趣的文章:

  • python3.x编码解码unicode字符串的实现示例
  • Python使用unicodedata实现字符串标准化
  • python去除删除数据中u0000u0001等unicode字符串的代码
  • python去掉 unicode 字符串前面的u技巧
  • python中将\uxxxx转换为Unicode字符串的技巧
  • Python中的字符串操作和编码Unicode详解
版权声明

返回顶部