樹與樹的表示

一、什麼是樹

客觀世界中許多事物存在層次關係

人類社會家譜
社會組織結構
圖書信息管理

其中，人類社會家譜如下圖所示：

通過上述所說的分層次組織，能夠使我們在數據的管理上有更高的效率！那麼，對於數據管理的基本操作——查找，我們如何實現有效率的查找呢？

二、查找

查找：根據某個給定關鍵字K ，從集合R 中找出關鍵字與 K 相同的記錄

靜態查找：集合中記錄是固定的，即對集合的操作沒有插入和刪除，只有查找

動態查找：集合中記錄是動態變化的，即對集合的操作既有查找，還可能發生插入和刪除（動態查找不在我們考慮範圍內）

2.1 靜態查找

2.1.1 方法1：順序查找

/* c語言實現 */

int SequentialSearch (StaticTable *Tbl, ElementType K)
{
// 在表Tbl[1]~Tb1[n]中查找關鍵字爲K的數據元素
  int i;
  Tbl->Element[0] = K; // 建立哨兵，即沒找到可以返回哨兵的索引0表示未找到
  for (i = Tbl->Length; Tbl->Element[i] != K; i--); // 查找成功返回所在單元下標；不成功放回0
  return i;
}

順序查找算法的時間複雜度爲 O(n)

2.1.2 方法2：二分查找（Binary Search）

假設n個數據元素的關鍵字滿足有序（比如：小到大），即 \(k_1<k_2<\cdots<k_n\) ，並且是連續存放（數組），那麼可以進行二分查找。

例：假設有13個數據元素，按關鍵字由小到大順序存放。二分查找關鍵字爲 444 的數據元素過程如下圖：

仍然以上面13個數據元素構成的有序線性表爲例，二分查找關鍵字爲 43 的數據元素如下圖：

/* c語言實現 */

int BinarySearch (StaticTable *Tbl, ElementType K)
{
  // 在表中Tbl中查找關鍵字爲K的數據元素
  int left, right, mid, NoFound = -1;
  
  left = 1; // 初始左邊界
  right = Tbl->Length; // 初始右邊界
  while (left <= right)
  {
    mid = (left + right) / 2; // 計算中間元素座標
    if (K < Tbl->Element[mid]) right = mid - 1; // 調整右邊界
    else if (K > Tbl->Element[mid]) left = mid + 1; // 調整左邊界
    else return mid; // 查找成功，返回數據元素的下標
  }
  return NotFound; // 查找不成功，返回-1
}

二分查找算法具有對數的時間複雜度 O(logN)

二分查找算法雖然解決了查找的時間複雜度問題，但是對於數據的插入和刪除確是O(n)的，因此有沒有一種數據結構，既可以減少數據查找的時間複雜度，又可以減少數據的插入和刪除的複雜度呢？

三、二分查找判定樹

除了使用上述兩個方法進行關鍵字的查找，我們還可以通過二叉樹這種數據結構完成關鍵字的查找。

從上圖可以看出，如果我們需要尋找數字8，可以通過以下4步實現（可能看不懂，未來會看得懂）：

根節點6小於8，往6的右子節點9找
結點9大於8，往9的左子結點7找
結點7小於8，往7的左子結點找
找到8

判定樹上每個結點需要的查找次數剛好爲該結點所在的層數；
查找成功時查找次數不會超過判定樹的深度
N個結點的判定樹的深度爲 \([log_2{n}]+1\)
\(ASL = (4*4+4*3+2*2+1)/11 = 3\)

四、樹的定義

樹（Tree）： \(n(n\geq{0})\) 個結點構成的有限集合。

當n=0時，稱爲空樹
對於任一顆非空樹（n>0），它具備以下性質：
- 樹中有一個稱爲根（Root）的特殊結點，用 r 表示
- 其餘結點可分爲 m（m>0）個互不相交的有限集 \(T_1,T_2,\cdots,T_m\) ，其中每個集合本身又是一棵樹，稱爲原來樹的子樹（SubTree）

五、樹與非樹

牢記樹有以下3個特性：

子樹是不相交的；
除了根結點外，每個結點有且僅有一個父結點；
一顆N個結點的樹有 N-1條邊

5.1 非樹

5.2 樹

六、樹的一些基本術語

結點的度（Degree）：結點的子樹個數
樹的度：樹的所有結點中最大的度數
葉結點（Leaf）：度爲0 的結點
父結點（Parent）：有子樹的結點是其子樹的根結點的父結點
子結點（Child）：若A結點是B結點的父結點，則稱B結點是A結點的子結點；子結點也稱孩子結點
兄弟結點（Sibling）：具有同一父結點的各結點彼此是兄弟結點
路徑和路徑長度：從結點 \(n_1\) 到 \(n_k\) 的路徑爲一個結點序列 \(n_1 , n_2 ,\cdots, n_k\) , \(n_i\) 是 \(n_{i+1}\) 的父結點。路徑所包含邊的個數爲路徑的長度
祖先結點(Ancestor)：沿樹根到某一結點路徑上的所有結點都是這個結點的祖先結點
子孫結點(Descendant)：某一結點的子樹中的所有結點是這個結點的子孫
結點的層次（Level）：規定根結點在1層，其它任一結點的層數是其父結點的層數加1
樹的深度（Depth）：樹中所有結點中的最大層次是這棵樹的深度