V8引擎的解析过程

认识浏览器的内核

  • 不同的浏览器又不同的内核组成
    • Gecko:早期被Netscape和Mozilla Friefox浏览器使用;
    • Trident:微软开发,被IE4~IE11浏览器使用,但是Edge浏览器已经转向Blink;
    • Webkit:苹果基于KHTML开发、开源的,用于Safari、Google Chrome之前也在使用;
    • Blink:是Webkit的一个分支,Google开发,目前应用于Google Chrome、Edge、Opera等;
  • 事实上,我们经常说的浏览器内核指的是浏览器的排版引擎:
    • 排版引擎(layout engine),也称为浏览器引擎(browser engine)、页面渲染引擎(rendering engine)或模板引擎。

浏览器的工作原理

  • JavaScript代码,在浏览器中是如何被执行的?
    浏览器加载文件.png

浏览器渲染过程

  • 但是在这个执行过程中,HTML解析的时候遇到了JavaScript标签,应该怎么办?

    • 会停止解析HTML,而去加载和执行JavaScript代码;


      浏览器渲染过程.png
  • 那么,JavaScript代码由谁来执行呢?

    • JavaScript引擎

认识JavaScript引擎

  • 为什么需要JavaScript引擎呢?

    • 我们前面说过,高级的编程语言都是需要转成最终的机器指令来执行的;
    • 事实上我们编写的JavaScript无论你交给浏览器或者Node执行,最后都是需要被CPU执行的;
    • 但是CPU只认识自己的指令集,实际上是机器语言,才能被CPU所执行;
    • 所以我们需要JavaScript引擎帮助我们将JavaScript代码翻译成CPU指令来执行;
  • 比较常见的JavaScript引擎有哪些呢?

    • SpiderMonkey:第一款JavaScript引擎,由Brendan Eich开发(也就是JavaScript作者);
    • Chakra:微软开发,用于IT浏览器;
    • JavaScriptCore:Webkit中的JavaScript引擎,Apple公司开发;
    • V8:Google开发的强大JavaScript引擎,也帮助Chrome从众多浏览器中脱颖而出;

浏览器内核和JS引擎的关系

  • 这里我们先以Webkit为例,Webkit事实上由两部分组成的:
    • WebCore: 负责HTML解析、布局、渲染等相关的工作;
    • JavaScriptCore:解析、执行JavaScript代码;
  • 在小程序中编写的JavaScript代码就是被JSCore执行的;


    浏览器内核和JS引擎的关系.png

V8引擎的原理

  • 我们来看一些官方对V8引擎的定义:

    • V8是用C++编写的Google开源高性能JavaScript和WebAssembly引擎,它用于Chrome和Node.js等。
    • 它实现ECMAScript和WebAssembly,并在Windows 7或更高版本,macOS 10.12+和使用x64,IA-32,ARM或MIPS处理器的Linux系统上运行。
    • V8可以独立运行,也可以嵌入到任何C++应用程序中。
      V8引擎的原理.png
  • Parse对JavaScript源代码进行解析,包括词法分析和语法分析

const name = "why"
// 词法分析: 
tokens: [{type: "keyword", value: "const"}, 
{type: 'identifier', value: 'name'}]
  • 根据tokens进行语法分析,生成AST抽象语法树
  • Ignition将ast转为字节码(因为不同的环境能执行的机器指令不同),字节码再转为汇编代码再转为机器指令
  • TurboFan收集信息,比如类型信息(例如某个执行频率较高的函数),将这些字节码直接生成机器码。
  • Deoptimization操作对机器指令进行反向操作,把机器指令转为字节码

V8引擎的架构

  • V8引擎本身的源码非常复杂,大概有超过100w行C++代码,通过了解它的架构,我们可以知道它是如何对JavaScript执行的:
  • Parse模块会将JavaScript代码转换成AST(抽象语法树),这是因为解析器并不直接认识JavaScript代码;
    • 如果函数没有被调用,那么是不会被转换成AST的;
    • Parse的V8官方文档:https://v8.dev/blog/scanner
  • Ignition是一个解析器,会将AST转换成ByteCode(字节码)
    • 同时会收集TurboFan优化所需要的信息(比如函数参数的类型信息,有了类型才能进行真实的运算);
    • 如果函数只调用一次,Ignition会解析执行ByteCode;
    • Ignition的V8官方文档:https://v8.dev/blog/ignition-interpreter
  • TurboFan是一个编译器,可以将字节码编译为CPU可以直接执行的机器码;
    • 如果一个函数被多次调用,那么就会被标记为热点函数,那么就会经过TurboFan转换成优化的机器码,提高代码的执行性能;
    • 但是,机器码实际上也会被还原为ByteCode,这是因为如果后续执行函数的过程中,类型发生了变化(比如sum函数原来执行的是number类型,后来执行变成了string类型),之前优化的机器码并不能正确的处理运算,就会逆向的转换成字节码;
    • TurboFan的V8官方文档:https://v8.dev/blog/turbofan-jit

V8执行的细节

  • 那么我们的JavaScript源码是如何被解析(Parse过程)的呢?
  • Blink将源码交给V8引擎,Stream获取到源码并且进行编码转换;
  • Scanner会进行词法分析(lexicla annalysis),词法分析会将代码转换成tokens;
  • 接下来tokens会被转换成AST树,经过Parser和PreParser:
    • Parser就是直接将tokens转成AST树架构;
    • PreParser称之为预解析,为什么需要预解析呢?
      • 这是因为并不是所有的JavaScript代码,在一开始时就会被执行。那么对所有的JavaScript代码进行解析,必然会影响网页的运行效率;
      • 所以V8引擎实现了Lazy Parsing(延迟解析)的方案,它的作用是将不必要的函数进行预解析,也就是只解析暂时需要的内容,而对函数的全量解析是在函数被调用时才会进行;
      • 比如我们在一个函数outer内部定义了另外一个函数inner,那么inner函数就会进行预解析;


        V8引擎的解析图.png

你可能感兴趣的:(V8引擎的解析过程)