织梦CMS - 轻松建站从此开始!

罗索

二叉树迭代器算法

jackyhwei 发布于 2013-07-17 10:00 点击:次 
二叉树(Binary Tree)的前序、中序和后续遍历是算法和数据结构中的基本问题,基于递归的二叉树遍历算法更是递归的经典应用。
TAG:

二叉树(Binary Tree)的前序、中序和后续遍历是算法和数据结构中的基本问题,基于递归的二叉树遍历算法更是递归的经典应用。

假设二叉树结点定义如下:

  1. // C++ 
  2. struct Node { 
  3.     int value; 
  4.     Node *left; 
  5.     Node *right; 

中序递归遍历算法:

  1. // C++ 
  2. void inorder_traverse(Node *node) { 
  3.     if (NULL != node->left) { 
  4.         inorder_traverse(node->left); 
  5.     } 
  6.     do_something(node); 
  7.     if (NULL != node->right) { 
  8.         inorder_traverse(node->right); 
  9.     } 

前序和后序遍历算法类似。

但是,仅有遍历算法是不够的,在许多应用中,我们还需要对遍历本身进行抽象。假如有一个求和的函数sum,我们希望它能应用于链表,数组,二叉树等等不同的数据结构。这时,我们可以抽象出迭代器(Iterator)的概念,通过迭代器把算法和数据结构解耦了,使得通用算法能应用于不同类型的数据结构。我们可以把sum函数定义为:

  1. int sum(Iterator it) 

链表作为一种线性结构,它的迭代器实现非常简单和直观,而二叉树的迭代器实现则不那么容易,我们不能直接将递归遍历转换为迭代器。究其原因,这是因为二叉 树递归遍历过程是编译器在调用栈上自动进行的,程序员对这个过程缺乏足够的控制。既然如此,那么我们如果可以自己来控制整个调用栈的进栈和出栈不是就达到 控制的目的了吗?我们先来看看二叉树遍历的非递归算法:

  1. // C++ 
  2. void inorder_traverse_nonrecursive(Node *node) { 
  3.     Stack stack; 
  4.     do { 
  5.         // node代表当前准备处理的子树,层层向下把左孩子压栈,对应递归算法的左子树递归 
  6.         while (NULL != node) { 
  7.             stack.push(node); 
  8.             node = node->left; 
  9.         } 
  10.         do { 
  11.             Node *top = stack.top(); 
  12.             stack.pop(); //弹出栈顶,对应递归算法的函数返回 
  13.             do_something(top); 
  14.             if (NULL != top->right) { 
  15.                 node = top->right; //将当前子树置为刚刚遍历过的结点的右孩子,对应递归算法的右子树递归 
  16.                 break
  17.             } 
  18.         } 
  19.         while (!stack.empty()); 
  20.     } 
  21.     while (!stack.empty()); 

通过基于栈的非递归算法我们获得了对于遍历过程的控制,下面我们考虑如何将其封装为迭代器呢? 这里关键在于理解遍历的过程是由栈的状态来表示的,所以显然迭代器内部应该包含一个栈结构,每次迭代的过程就是对栈的操作。假设迭代器的接口为:

  1. // C++ 
  2. class Iterator { 
  3.     public
  4.         virtual Node* next() = 0; 
  5. }; 

下面是一个二叉树中序遍历迭代器的实现:

  1. //C++ 
  2. class InorderIterator : public Iterator { 
  3.     public
  4.         InorderIterator(Node *node) { 
  5.             Node *current = node; 
  6.             while (NULL != current) { 
  7.                 mStack.push(current); 
  8.                 current = current->left; 
  9.             } 
  10.         } 
  11.         virtual Node* next() { 
  12.             if (mStack.empty()) { 
  13.                 return NULL; 
  14.             } 
  15.             Node *top = mStack.top(); 
  16.             mStack.pop(); 
  17.             if (NULL != top->right) { 
  18.                 Node *current = top->right; 
  19.                 while (NULL != current) { 
  20.                     mStack.push(current); 
  21.                     current = current->left; 
  22.                 } 
  23.             } 
  24.             return top; 
  25.          } 
  26.     private
  27.         std::stack<Node*> mStack; 
  28. }; 

下面我们再来考察一下这个迭代器实现的时间和空间复杂度。很显然,由于栈中最多需要保存所有的结点,所以其空间复杂度是O(n)的。那么时间复杂度 呢?一次next()调用也最多会进行n次栈操作,而整个遍历过程需要调用n次next(),那么是不是整个迭代器的时间复杂度就是O(n^2)呢?答案 是否定的!因为每个结点只会进栈和出栈一次,所以整个迭代过程的时间复杂度依然为O(n)。其实,这和递归遍历的时空复杂度完全一样。

除了上面显式利用栈控制代码执行顺序外,在支持yield语义的语言(C#, Python等)中,还有更为直接的做法。下面基于yield的二叉树中序遍历的Python实现:

  1. // Python 
  2. def inorder(t): 
  3.     if t: 
  4.         for x in inorder(t.left): 
  5.             yield x 
  6.         yield t.label 
  7.         for x in inorder(t.right): 
  8.             yield x 

yield与return区别的一种通俗解释是yield返回时系统会保留函数调用的状态,下次该函数被调用时会接着从上次的执行点继续执行,这是一种与 栈语义所完全不同的流程控制语义。我们知道Python的解释器是C写的,但是C并不支持yield语义,那么解释器是如何做到对yield的支持的呢? 有了上面把递归遍历变换为迭代遍历的经验,相信你已经猜到Python解释器一定是对yield代码进行了某种变换。如果你已经能够实现递归变非递归,不 妨尝试一下能否写一段编译程序将yield代码变换为非yield代码。

(@文艺复兴记(todd))
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/201307/16695.html]
本文出处:酷壳 作者:@文艺复兴记(todd) 原文
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容