实现C#yield语句的算法

我想自己搞清楚,但我想知道什么是转换一个函数与yield语句到枚举器的状态机的算法是什么?例如C#如何转动:

IEnumerator<string> strings(IEnumerable<string> args)
 { IEnumerator<string> enumerator2 = getAnotherEnumerator();     
   foreach(var arg in arg) 
    { enumerator2.MoveNext();
      yield return arg+enumerator.Current;
    } 
 }

进入:

bool MoveNext()
 { switch (this.state)
    {
        case 0:
            this.state = -1;
            this.enumerator2 = getAnotherEnumerator();
            this.argsEnumerator = this.args.GetEnumerator();
            this.state = 1;
            while (this.argsEnumerator.MoveNext())
            {
                this.arg = this.argsEnumerator.Current;
                this.enumerator2.MoveNext();
                this.current = this.arg + this.enumerator2.Current;
                this.state = 2;
                return true;

              state1:
                this.state = 1;
            }
            this.state = -1;
            if (this.argsEnumerator != null) this.argsEnumerator.Dispose();
            break;

        case 2:
            goto state1;
    }
    return false;
}

当然,结果可以完全不同,取决于原始代码。

您正在查看的特定代码示例涉及一系列变换。
请注意,这是算法的近似描述。编译器使用的实际名称和它生成的确切代码可能不同。然后想法是一样的。

第一个变换是“foreach”变换,它转换这个代码:

foreach (var x in y)
{
   //body
}

代码:

var enumerator = y.GetEnumerator();
while (enumerator.MoveNext())
{
    var x = enumerator.Current;
    //body
}

if (y != null)
{
    enumerator.Dispose();
}

第二个转换在函数体中找到所有yield return语句,为每个(状态值)分配一个数字,并在yield之后创建一个“goto label”。

第三个转换将方法体中的所有局部变量和函数参数提升为一个称为闭包的对象。

给定你的示例中的代码,看起来类似于:

 class ClosureEnumerable : IEnumerable<string>
 {
    private IEnumerable<string> args;
    private ClassType originalThis;
    public ClosureEnumerator(ClassType origThis, IEnumerable<string> args)
    {
        this.args = args;
        this.origianlThis = origThis;
    }
    public IEnumerator<string> GetEnumerator()
    {
        return new Closure(origThis, args);
    }
 }

class Closure : IEnumerator<string>
{
    public Closure(ClassType originalThis, IEnumerable<string> args)
    {
        state = 0;
        this.args = args;
        this.originalThis = originalThis;
    }

    private IEnumerable<string> args;
    private IEnumerator<string> enumerator2;
    private IEnumerator<string> argEnumerator;

    //- Here ClassType is the type of the object that contained the method
    //  This may be optimized away if the method does not access any 
    //  class members
    private ClassType originalThis;

    //This holds the state value.
    private int state;
    //The current value to return
    private string currentValue;

    public string Current
    {
        get 
        {
            return currentValue;
        }
    }
}

然后将方法体从原始方法移动到名为MoveNext的“Closure”中的方法,该方法返回一个bool,并实现IEnumerable.MoveNext。
对任何本地人的任何访问通过“this”路由,并且对任何类成员的任何访问都通过this.originalThis路由。

任何“yield return expr”被翻译成:

currentValue = expr;
state = //the state number of the yield statement;
return true;

任何yield break语句都被翻译成:

state = -1;
return false;

在函数的结尾有一个“implicit”yield break语句。
然后在过程的开始处引入switch语句,该语句查看状态号并跳转到相关联的标签。

原来的方法然后翻译成这样:

IEnumerator<string> strings(IEnumerable<string> args)
{
   return new ClosureEnumerable(this,args);
}

事实上,方法的状态都被推入一个对象,并且MoveNext方法使用switch语句/状态变量是什么允许迭代器的行为,好像控制被传递回到紧接在最后一个“yield return”之后的点“语句下一次调用”MoveNext“。

然而,重要的是要指出,C#编译器使用的转换不是最好的方法。当尝试使用递归算法使用“yield”时,它的性能很差。有一个很好的文章,概述一个更好的方法来做到这里:

http://research.microsoft.com/en-us/projects/specsharp/iterators.pdf

这是值得一读,如果你还没有阅读它。

翻译自:https://stackoverflow.com/questions/131871/algorithm-for-implementing-c-sharp-yield-statement

转载注明原文:实现C#yield语句的算法