树的概念
树(tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。
特点
- 每个节点有零个或多个子节点;
- 没有父节点的节点称为根节点;
- 每一个非根节点有且只有一个父节点
- 除了根节点外,每个子节点可以分为多个不相交的子树
树的术语
- 节点的度:一个节点含有的子树的个数称为该节点的度
- 树的度:一棵树中,最大的节点的度称为树的度
- 叶节点或终端节点:度为零的节点
- 父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点
- 子节点:一个节点含有的子数的根节点称为该节点的子节点
- 兄弟节点:具有相同父节点的节点互称为兄弟节点
- 节点的层次:从根开始定义起,根为第一层,根的子节点为第二层,以此类推
- 树的高度或深度:树中节点的最大层次
- 堂兄弟节点:父节点的同一层的节点互为堂兄弟
- 节点的祖先:从根到该节点所分支上的所有节点
- 子孙:以某节点为根的子树中任一节点都称为该节点的子孙
- 森林:由m( m>=0 )棵互不相交的树的集合称为森林
树的种类
- 无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
- 有序树:树中任意节点的子节点之间由顺序关系,这种树称为有序树;
- 二叉树:每个节点最多含有两个子树称为二叉树
- 完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达到最大值,且第d层所有节点从左到右连续的紧密排列,这样的二叉树被称为完全二叉树,其中满二叉树的定义是所有叶节点都在最底层的完全二叉树。
- 平衡二叉树(AVL树):当且仅任何节点的两颗子树的高度差的绝对值不大于1的二叉树
- 排序二叉树(二叉查找树/二叉搜索树/有序二叉树)
- 霍夫曼树(用于信息编码):带权路径最短的二叉树称为哈弗曼树或最优二叉树
- B树:一种对读写操作及逆行优化的自平衡的二叉查找树,能够保证数据有序,拥有多余两个子树
树的存储与表示
顺序存储
将数据结构存储在固定的数组中,然在遍历速度尚右一定的优势,但因所占空间比较大,是非主流二叉树。二叉树通过以链式存储
特点
优点:随机存储表中元素,存储密度大
缺点:插入和删除操作需要移动元素
链式存储
由于对节点的个数无法掌握,常见树的存储表示都转换成二叉树进行处理,子节点个数最多为2
特点
- 比顺序存储结构的存储密度小(链式存储结构中每个节点都由数据域于指针域两部分组成,相比顺序存储结构增加了存储空间)
- 逻辑上相邻的节点物理上不必相邻
- 插入,删除灵活(不必移动节点,只要改变节点上的指针)
- 查找节点时链式存储要比顺序存储慢
- 每个节点是由数据域和指针域组成
- 由于簇是随机分配的,这也使数据删除后覆盖几率降低,恢复可能性大
总结
算法设计的要求
- 时间效率高
- 存储量低
顺序存储结构和链式存储结构的区别
- 链式存储结构的内存地址不一定是连续的,但顺序存储结构的内存地址一定是连续的。
- 链式存储适用于在较频繁的插入,删除,更新元素时,而顺序存储结构适用于频繁查询时使用。
顺序存储结构和链式存储结构的优缺点
- 空间
顺序比链式节约空间。因为链式结构每一个节点都有一个指针存储域 - 存储操作
顺序支持随机存储,方便操作 - 插入和删除
链式要比顺序的方便
(因为插入的话顺序表也很方便,问题是顺序表的插入要执行更大的空间复杂度,包括一个表头索引以及索引后的元素后移,而链表是索引后,插入就完成了)
例如:当在字典中查询一个字母 j 的时候,有两种方式
第一:顺序查询,从第一页依次查询直到查询到 j
第二:索引查询,从字典的索引中,直接查出 j 的页数,或许比顺序查询更快。
常见的一些树的应用场景
- xml,html等,那么编写这些东西的解析器的时候,不可避免用到树
- 路由协议就是使用了树的算法
- mysql数据库索引
- 文件系统的目录结构
- 所以很多经典的AI算法其实都是树搜索,此外机器学习中的decision tree也是树结构
二叉树
二叉树的基本概念
二叉树是每个节点最多的两个子树的树结构。
通过子树被称为左子树(left subtree)和右子树(right subtree)
二叉树的性质
- 性质1:在二叉树的第i层上至多有2^(i-1)个结点(i>0)
- 性质2:在深度为k的二叉树至多有2^k -1个结点(k>0)
- 性质3:对于任意一棵二叉树,如果其叶节点数为N0,而度数为2的结点总数的N2,则N0=N2+1
- 性质4:具有n个结点的完全二叉树的深度必为log2(n+1)
- 性质5:对完全二叉树,若从上到下,从左到右编号,则编号为i的结点,其左孩子编号为2i,其右孩子编号为2i+1;其双亲的编号必为i/2(i=1时为根,除外)
完全二叉树
若设二叉树的高度为h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第h层有叶子结点,并且叶子结点都是从左到右依次排布,这就是完全二叉树。
满二叉树
除了叶结点外每一个结点都有左右子叶且叶子结点都处在最底层的二叉树
二叉树的结点表示以及树的创建
通过使用Node类中定义三个属性,分别为elem本身的值,还有lchild左孩子和rchild右孩子
class Node(object):
"""节点类"""
def __init__(self, elem=-1, lchild=None, rchild=None):
self.elem = elem
self.lchild = lchild
self.rchild = rchild
树的创建,创建一个树的类,并给root根节点,一开始为空,随后添加节点
class Tree(object):
"""树类"""
def __init__(self, root=None):
self.root = root
def add(self, elem):
"""为树添加节点"""
node = Node(elem)
#如果树是空的,则对根节点赋值
if self.root == None:
self.root = node
else:
queue = []
queue.append(self.root)
#对已有的节点进行层次遍历
while queue:
#弹出队列的第一个元素
cur = queue.pop(0)
if cur.lchild == None:
cur.lchild = node
return
elif cur.rchild == None:
cur.rchild = node
return
else:
#如果左右子树都不为空,加入队列继续判断
queue.append(cur.lchild)
queue.append(cur.rchild)
拜师教育学员文章:作者:夏天老师,
转载或复制请以 超链接形式 并注明出处 拜师资源博客。
原文地址:《数据结构5 – 树和二叉树的概念》 发布于2020-09-16
评论 抢沙发