hiphop原理分析2 原创--胡志广_C/C++_编程开发_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 编程开发 > C/C++ > hiphop原理分析2 原创--胡志广

hiphop原理分析2 原创--胡志广

 2013/7/10 4:35:36  saiyaren  程序员俱乐部  我要评论(0)
  • 摘要:我在”hiphop原理分析1”中主要引入了编译原理和hiphop的简单的词法和语法的工作原理,这章节中我将具体的来讲hiphop的语法结构、树的生成、作用域和其他语法结构的关系、以及静态分析的流程。主要内容1.基本语法结构2.生成树的结构3.作用域的结构以及关系4.analyzeprogram分析1.基本语法结构首先来说一下hiphop的整体语法结构如下:lToken:是词的概念。lExpression:表达式,类似短语的概念。lStatement:语句,可以理解短语和词组成的一句话
  • 标签:原创 分析

?

我在”hiphop原理分析1”中主要引入了编译原理和hiphop的简单的词法和语法的工作原理,这章节中我将具体的来讲hiphop的语法结构、树的生成、作用域和其他语法结构的关系、以及静态分析的流程。

?

主要内容

1.基本语法结构

2.生成树的结构

3.作用域的结构以及关系

4.analyzeprogram分析

?

1.??基本语法结构

首先来说一下hiphop的整体语法结构如下:

l??Token:是词的概念。

l??Expression表达式,类似短语的概念。

l??Statement:语句,可以理解短语和词组成的一句话。

l??Scopeclassscope,functionscope):域。可以理解为文章中的段落。作用域:是指一个方法或者一个表达式起作用的范围。

l??FileScope:文件域。可以理解为书中的章节。

l??ArAnalysisResult。可以理解为一本书。

?

上面我由小到大的将hiphop的整体的语法结构进行了一下整体概念的整理,具体的细节结构我将在第三大章节中讲解细节。

?

Hiphop?的整体编译环节的文件都在Src/complier文件夹下:

Token:Src/complier/parser/parser.cpp下定义了ScannerTokenToken类;

Expression:Src/complier/expression目录下hiphop中的所有Expression结构都定义在该目录下;

Statement:Src/complier/ Statement目录下hiphop中的所有statement结构都定义在该目录下;

Scope:src/ complier/analysis/

file_scope.cpp,function_scope.cpp,class_scope.cpp,block_scope.cpp4个文件定义了hiphop所有的scope结构;

AnalysisResult:src/ complier/analysis/analysis_result.cpp中,他封装上了所有的结构和对hiphop的静态分析阶段的所有操作接口

?

?

2.??生成树的结构

2.1.??生成树结构

树是在src/compiler/parser/parser.cppsaveParseTree()中生成。

在词法解析完成后,进入到语法解析,语法主要分为statementexpression,expresionstatement的下级结构,下面的流程图是一个树状的结构,是一个递归的这么一个树状结构:

statementList=>statement=>expressionList=>expression

?

2.2.??生成树处理流程图:

?

(1)??????hiphop通过lex词法解析完毕后

(2)??????进入语法分析阶段,首先进入到最小的expression,然后将?expression添加到expressionList或者statement下面,然后再将statement添加到statementList下;

如果该statementclass或者method?设置这些statement的作用域,最终其实语法树就是一个statementList,然后将每个叶子的statementexpression都设置上相应的scope

(3)??????树封装完毕后(语法树最终封装到Parser类的m_tree中,调用saveParseTree函数封装语法树),每个saveParseTree保存一个文件的语法树,然后在ar中保存上所有filescope,在analysisprogram阶段是通过遍历filesope然后再遍历语法树的;

(4)??????saveParseTree函数中,最终会创建一个虚主函数(通过createPseudoMain函数),创建一个functionStatementfunctionScope,然后将m_tree封装到该functionStatement的下级statement中,并将树的作用域指向该function的作用域(PseudoMain),然后将这个主函数的作用域设定为该文件作用域;

(5)??????完成语法树的生成

?

最终的封装结构为:

analysisResult=>fileScopes(所有文件)=>filesope=>functionScope=>statementList=>statement=>ExpressionList=>Expression

?

?

?

2.3.??函数例子

举个例子:

functiontest(param1,param2,……){

?? $a =1;

?? $b =param1;

?? if(b==7){echo “……”}

?? ……

}

?

语法解析后结构:

Function test():functionStatement

param1,param2,……:M_params(ExpressionLIst)

param1(..n):ParamterExpression

function内的所有语句封装在m_stmts(statementList)

$a=1是一个Expstatement

$b=param1;是一个Expstatement

if(b==7){echo“……”}?是一个Ifstatement=>ifbrandstatement, ifbrandstatement又包括条件表达式(m_conditions是一个Expression)和块语句(m_stmt是一个blockstatement);

m_conditions是一个二元表达式(BinaryExpression),b是一个SimpleVarbleExpression封装在m_exp中,op==7是一个ScalarExpresion;

块语句{echo “……”}:是一个statementList下面封装了所有的语句(根据不同语句在进行语法解析,如:echo “…”,拆成了2个语句EchoStatement?Expstatement

?

生成的function的语法树如下图所示:

2.4.??类例子:

举个类的例子

Class test_c{

???????? functiontest(){

?????????????????? inta = 1;

?????????????????? …..

???????? }

???????? intd = 5;

???????? ….

}

语法解析后结构:

Class test_c {}解析为一个classstatement;

Test_c{..}块内的内容封装到一个m_stmts(statementList),将类块内的内容封装到该语句内;

Function test():类内的所有的函数都会封装成一个methodstatement,methodstatementfunctionstatement的父类,如果有多个类成员函数,那么就创建多个methodstatement封装到m_stmts中,methodstatement块内的结构和参数结构可参考函数例子中的语法树;

?

生成的树形结构图如下所示:

?

3.??作用域的结构

3.1.??作用域的结构

作用域包括:文件作用域(filescope)、方法作用域(functionscope)、类作用域(classscope)以及块作用域(blockscope)。其中块作用域是其他所有域的基类。

?

各作用域之间的结构如下图:

?

?

?

3.2.??作用域之间的关系

l??所有文件域的最外层是analyze_result,是一个blockscope块域,每个文件域Filescopeouterscope均指向它。

l??因为在php中不存在main函数,所以在Filescope中会创建一个pseudomain保存file下的所有的语句(statement)、表达式、作用域(classfunction)

l??整体作用域关系图如下:

3.3.??作用域和语法树的关系

作用域和语法树在运行过程中是相互依存的,既作用域中包含下级语法树,同时语法树也包含着当前所在的域。

关系图如下:

语句中会封装该语句所在的作用域;

作用域中也会封装上该作用域中的顶级语句列表(statementList)

?

作用域的内部关系如下图:

?

?

4.??Analyzeprogram分析

4.1.??Analyzeprogram流程

1.初始化系统变量信息,将系统变量存入到symbol

2.收集作用域内的所有函数、类

3.把变量、常量、类的对象进行排序

4.检查派生类,保存类之间的派生关系

5.执行该文件下的所有analyzeProgramfilescope,statment,expression)

6.收集用户类下的所有函数

7.收集系统类下的所有函数

?

67步骤中收集的信息保存在analyzeResult类的如下变量中:

l??m_functionDecs(保存函数信息),m_functionReDecs(保存重复定义的函数信息),m_classDecs(保存类信息)

l??m_methodToClassDecs?类方法集合(key:函数名,value:类的集合(如多个类定义同名的函数))

l??系统类如扩展类、系统自带的一些类(m_systemClasses

l??上面的这些收集信息的成员变量都是用Map存储的

?

analyzeProgram函数在src/complier/analysis/analysis_result.cpp中实现;

?

analyzeProgram函数遍历流程图(hiphop静态分析流程):

?

Hiphop中很好的用了面向对象中的多态,在scope,statementexpression的所有类中都有一个analyzeProgram函数实现,然后通过analysisResult类的analyzeProgram作为接口向下调用,从作用域(ar)=>文件作用域(filescope)=>函数作用域(functionscope)=>语句(statement)=->表达式(Expression),然后剩下的流程就走最开始上面那7个步骤了,遍历流程是这个流程;

?

4.2.??Analyzeprogram作用

Analyzeprogram的主要作用就是收集所有的类、函数的作用域信息,并且对如参数类型等内容进行类型的初始化设置,和对一些变量创建符号对象(symbol),保存到符号表(varibleTable)

作用域中有作用域的符号表如functionScope,classScope,如变量表,常量表

?

?

5.??小结

这章节中主要对语法树的生成,包括语法树结构等进行了初步的认识,然后又分析了作用域,包括作用域和语句之间的关系,最后对静态分析(analyzeProgram)的流程和作用进行介绍;

在下一节中,我将详细的介绍hiphop中的所有statementexpression和对应php的语法关系,包括analyzeProgram的各个环节(statement,expression)的处理细节。

?

下一节:hiphop原理分析3(1)

  • 大小: 6 KB
  • 大小: 37.4 KB
  • 大小: 19.3 KB
  • 大小: 5.4 KB
  • 大小: 7.1 KB
  • 大小: 9.7 KB
  • 大小: 3.3 KB
  • 大小: 4.6 KB
  • 大小: 9.7 KB
  • 查看图片附件
发表评论
用户名: 匿名