当前位置：主页 > python教程 > Python字典底层实现原理

关于Python字典的底层实现原理

发布：2023-04-13 16:50:01 59

本站收集了一篇相关的编程文章，网友孙浩穰根据主题投稿了本篇教程内容，涉及到Python字典、字典底层实现原理、Python字典实现原理、Python字典底层实现原理相关内容，已被305网友关注，涉猎到的知识点内容可以在下方电子书获得。

Python字典底层实现原理

字典是否是有序

在Python3.6之前，字典是无序的，但是Python3.7+，字典是有序的。

在3.6中，字典有序是一个implementation detail，在3.7才正式成为语言特性，因此3.6中无法确保100%有序。

字典的查询、添加、删除的时间复杂度

字典的查询、添加、删除的平均时间复杂度都是O(1)，相比列表与元祖，性能更优。

字典的实现原理

Python3.6之前的无序字典

字典底层是维护一张哈希表，可以把哈希表看成一个列表，哈希表中的每一个元素又存储了哈希值（hash）、键（key）、值（value）3个元素。

enteies = [
    ['--', '--', '--'],
    [hash, key, value],
    ['--', '--', '--'],
    ['--', '--', '--'],
    [hash, key, value],
]

带入具体的数值来介绍

# 给字典添加一个值，key为hello，value为word
# my_dict['hello'] = 'word'

# hash表初始如下
enteies = [
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
]

hash_value = hash('hello')  # 假设值为 12343543 

index = hash_value & ( len(enteies) - 1)  # 假设index值计算后等于3

# 下面会将值存在enteies中
enteies = [
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
    [12343543, 'hello', 'word'],  # index=3
    ['--', '--', '--'],
]

# 继续向字典中添加值
# my_dict['color'] = 'green'

hash_value = hash('color')  # 假设值为 同样为12343543
index = hash_value & ( len(enteies) - 1)  # 假设index值计算后同样等于3

# 下面会将值存在enteies中
enteies = [
    ['--', '--', '--'],
    ['--', '--', '--'],
    ['--', '--', '--'],
    [12343543, 'hello', 'word'],  # 由于index=3的位置已经被占用，且key不一样，所以判定为hash冲突，继续向下寻找
    [12343543, 'color', 'green'],  # 找到空余位置，则保存
]

enteies表是稀疏的，随着我们插入的值不同，enteies表会越来越稀疏（enteies也是一个会动态扩展长度的，每一此扩展长度，都会重新计算所有key的hash值），所以新的字典实现就随之出现。

Python3.7+后的新的实现方式

Python3.7+带入数据演示

# 给字典添加一个值，key为hello，value为word
# my_dict['hello'] = 'word'

# 假设是一个空列表，hash表初始如下
indices = [None, None, None, None, None, None]
enteies = []

hash_value = hash('hello')  # 假设值为 12343543
index = hash_value & ( len(indices) - 1)  # 假设index值计算后等于3

# 会找到indices的index为3的位置
indices = [None, None, None, 0, None, None]
# 此时enteies会插入第一个元素
enteies = [
    [12343543, 'hello', 'word']
]

# 我们继续向字典中添加值
my_dict['haimeimei'] = 'lihua'

hash_value = hash('haimeimei')  # 假设值为 34323545
index = hash_value & ( len(indices) - 1)  # 假设index值计算后等于 0

# 会找到indices的index为0的位置
indices = [1, None, None, 0, None, None]
# 此时enteies会插入第一个元素
enteies = [
    [12343543, 'hello', 'word'],
    [34323545, 'haimeimei', 'lihua']
]

查询字典

# 下面是一个字典与字典的存储
more_dict = {'name': '张三', 'sex': '男', 'age': 10, 'birth': '2019-01-01'}

# 数据实际存储
indices = [None, 2, None, 0, None, None, 1, None, 3]
enteies = [
    [34353243, 'name', '张三'],
    [34354545, 'sex', '男'],
    [23343199, 'age', 10],
    [00956542, 'birth', '2019-01-01'],
]

print(more_dict['age'])  # 当我们执行这句时

hash_value = hash('age')  # 假设值为 23343199
index = hash_value & ( len(indices) - 1)  # index = 1

entey_index = indices[1]  # 数据在enteies的位置是2
value = enteies[entey_index]  # 所以找到值为 enteies[2]

时间复杂度

字典的平均时间复杂度是O(1)，因为字典是通过哈希算法来实现的，哈希算法不可避免的问题就是hash冲突，Python字典发生哈希冲突时，会向下寻找空余位置，直到找到位置。

如果在计算key的hash值时，如果一直找不到空余位置，则字典的时间复杂度就变成了O(n)了。

常见的哈希冲突解决方法

1 开放寻址法（open addressing）

开放寻址法中，所有的元素都存放在散列表里，当产生哈希冲突时，通过一个探测函数计算出下一个候选位置，如果下一个获选位置还是有冲突，那么不断通过探测函数往下找，直到找个一个空槽来存放待插入元素。

2 再哈希法

这个方法是按顺序规定多个哈希函数，每次查询的时候按顺序调用哈希函数，调用到第一个为空的时候返回不存在，调用到此键的时候返回其值。

3 链地址法

将所有关键字哈希值相同的记录都存在同一线性链表中，这样不需要占用其他的哈希地址，相同的哈希值在一条链表上，按顺序遍历就可以找到。

4 公共溢出区

其基本思想是：所有关键字和基本表中关键字为相同哈希值的记录，不管他们由哈希函数得到的哈希地址是什么，一旦发生冲突，都填入溢出表。

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持码农之家。

上一篇：Python argparse中的action=store_true用法小结
下一篇：Tensor 和 NumPy 相互转换的实现

参考资料

Python字典的三级菜单实现方法

发布：2019-09-17

下面小编就为大家带来一篇Python字典实现简单的三级菜单(实例讲解)。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧

Python中如何给字典设置默认值

发布：2023-03-30

这篇文章主要介绍了Python中如何给字典设置默认值问题，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

python字典操作提取key,value的代码分享

发布：2020-02-06

这篇文章主要介绍了python 字典操作提取key,value的方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

python字典过滤条件的实例详解

发布：2021-04-12

今天小编就为大家分享一篇对python字典过滤条件的实例详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

python字典set方法的特殊方法

发布：2019-11-19

python字典有set方法，set跟dict一样是key的集合,不可重复；创建一个set集合,需要提供一个list作为输入集合；不可存储可变的数据类型作为key值,内部存储原理跟dict一样,只是没有value罢了。

python基础知识之字典(Dict)

发布：2023-04-04

这篇文章主要介绍了python基础知识之字典(Dict)的相关资料,需要的朋友可以参考下

python字典添加元素的实例方法

发布：2019-09-17

python字典是另一种可变容器模型，且可存储任意类型对象。向python字典添加新内容的方法是增加新的键/值对。

python字典之中len方法是什么？len方法有什么作用？

发布：2022-04-03

讲解了python字典之中len()方法是什么以及它的作用

网友讨论

最新更新

最近更新

05-29Go语言面试八股文大全
05-29MySQL 8.4中文手册
05-29华为OD机考100题(真题)
05-29Python+OpenCV入门计算机视觉实战项目52讲 v1.0
05-21敏捷软件测试实践指南
05-21编写可维护的JavaScript
05-21Modbus协议
05-21竹林蹊径：深入浅出Windows驱动开发
05-21PCIE规范合集(PCI_Express_Base 1.0/2.1/3.0/4.0/5.0/6.0)
05-21深入理解Rust并发编程

热门资源