Comi - 小程序 markdown 渲染和代码高亮解决方案
发布于 4 年前 作者 lzhao 3235 次浏览 来自 分享

写在前面

Comi 读 ['kəʊmɪ],类似中文 科米,是腾讯 Omi 团队开发的小程序代码高亮和 markdown 渲染组件。有了这个组件加持,小程序技术社区可以开始搞起来了。

体验

感谢【小程序•云开发】提供技术支持。

预览

Comi 基于下面的 5 个组件进行开发:

  • prismjs
  • wxParse
  • remarkable
  • html2json
  • htmlparser

先看 Comi 使用,再分析原理。

使用

先拷贝 此目录 到你的项目。

js:

const comi = require('../../comi/comi.js');

Page({
  onLoad: function () {
    comi(`你要渲染的 md!`, this)
  }
})

wxml:

<include src="../../comi/comi.wxml" />

wxss:

@import "../../comi/comi.wxss";

简单把!

在 omip 中使用

先拷贝 此目录 到你的项目。

js:

import { WeElement, define } from 'omi'
import './index.css'
import comi from '../../components/comi/comi'

define('page-index', class extends WeElement {

  install() {
    comi(`你要渲染的 md`, this.$scope)
  }

  render() {
    return (
      <view>
        <include src="../../components/comi/comi.wxml" />
      </view>
    )
  }
})

WeElement 里的 this 并不是小程序里的 this,需要使用 this.$scope 访问小程序 Page或 Component 的 this。

css:

@import '../../components/comi/comi.wxss';

原理

在开发 Comi 之前,我们进行了预研,是否有必要造这个轮子。

代码高亮预研

  • wxParse 只是用标签包括代码,并未处理代码转成 WXML,所以渲染出的代码是没有颜色
  • 老牌的 highlightjs 没有 WXML 对应的方案
  • 老牌的 highlightjs 对 JSX 高亮支持太差
  • prismjs 是 react 官方使用的高亮插件,对 JSX 支持高亮很好
  • prismjs 支持几乎所有的语言,并且支持自定义扩展语言
  • prismjs 拥有 Line Highlight 插件(目前还未移植到 Comi)

综合上面信息,决定基于 prismjs 二次开发。

markdown 渲染预研

  • wxParse 老牌的渲染组件,支持 markdown
  • wxParse 内置的 showdownjs 不满足代码高亮的格式需求(比如语言种类也会生成一个标签,当然可以通过 wxss 隐藏)
  • 小程序基础库 1.4.0 开始支持 rich-text 组件展示富文本,但是格式需要转成 json
  • 高性能 remarkable,Facebook 和 Docusaurus 都在使用,支持 md 语法修改和扩展
<rich-text nodes="{{nodes}}" bindtap="tap"></rich-text>
Page({
  data: {
    nodes: [{
      name: 'div',
      attrs: {
        class: 'div_class',
        style: 'line-height: 60px; color: red;'
      },
      children: [{
        type: 'text',
        text: 'Hello&nbsp;World!'
      }]
    }]
  },
  tap() {
    console.log('tap')
  }
})

综合上面信息,放弃 rich-text,决定基于 wxParse + remarkable 二次开发,移除 showdownjs。Comi 需要 remarkable 的高性能和灵活性。markdown 会持久化存在 db, 在小程序内运行时转换成 wxml,所以对性能还是有一定要求。

劫持 prismjs tokens

tokens: function(text, grammar, language) {
  var env = {
    code: text,
    grammar: grammar,
    language: language
  };
  _.hooks.run('before-tokenize', env);
  env.tokens = _.tokenize(env.code, env.grammar);
  _.hooks.run('after-tokenize', env);

  for (var i = 0,
  len = env.tokens.length; i < len; i++) {
    var v = env.tokens[i]
    if (Object.prototype.toString.call(v.content) === '[object Array]') {
      v.deep = true this._walkContent(v.content)
    }
  }
  return env.tokens
},

这段代码增加 tokens 方法到 prismjs 中,原库自带的 prism.highlight 的会把 tokens 转成 html,因为我们的目标的 wxml,所以这里提前把 tokens
作为方法返回值。当然还做了一件事,就是扩展了 token item 的 deep 属性来决定是否需要继续向下遍历生成 wxml。

原始的 jsx:

render() {
    const { tks } = this.data
    return (
      <view class='pre language-jsx'>
        <view class='code'>
          {tks.map(tk => {
            return tk.deep ? <text class={'token ' + tk.type}>{
              tk.content.map(stk => {
                return stk.deep ? stk.content.map(sstk => {
                  return <text class={'token ' + sstk.type}>{sstk.content || sstk}</text>
                }) : <text class={'token ' + stk.type}>{stk.content || stk}</text>
              })}</text> : <text class={'token ' + tk.type}>{tk.content || tk}</text>
          })}
        </view>
      </view>
    )
  }

jsx 编译出生成的 wxml,把这段 wxml 嵌入到 wxparse 里:

<!-- 千万 不要格式化下面的 wxml,不然 text 嵌套 text 导致换行全部出来了 -->
<template name="wxParseCode">
  <view class="pre language-jsx">
      <view class="code">
          <block wx:for="{{item.tks}}" wx:for-item="tk">
              <block wx:if="{{tk.deep}}"><text class="{{'token ' + tk.type}}"><block wx:for="{{tk.content}}" wx:for-item="stk"><block wx:if="{{stk.deep}}"><text class="{{'token ' + sstk.type}}" wx:for="{{stk.content}}" wx:for-item="sstk">{{sstk.content || sstk}}</text>
              </block>
              <block wx:else><text class="{{'token ' + stk.type}}">{{stk.content || stk}}</text>
              </block>
          </block>
          </text>
  </block>
  <block wx:else><text class="{{'token ' + tk.type}}">{{tk.content || tk}}</text>
  </block>
  </block>
  </view>
  </view>
</template>

这段 wxml 不能进行格式化美化,不然多出许多换行符,因为 text 嵌套 text 会保留换行符!!

修改 wxparse 里的分支逻辑:

<block wx:elif="{{item.tagType == 'block'}}">
  <view class="{{item.classStr}} wxParse-{{item.tag}}" style="{{item.styleStr}}">
    <block wx:if="{{item.tag == 'pre'}}">
        <template is="wxParseCode" data="{{item}}" />
    </block>
    <block wx:elif="{{item.tag != 'pre'}}" >
      <block wx:for="{{item.nodes}}" wx:for-item="item" wx:key="">
        <template is="wxParse1" data="{{item}}" />
      </block>
    </block>
  </view>
</block>

item.tagpre 的时候使用 wxParseCode 模板,数据传入 item。item 的数据从哪里来?

先修改 md 渲染器为 Remarkable:

} else if (type == 'md' || type == 'markdown') {
  var converter = new Remarkable()
  var html = converter.render(data)
  transData = HtmlToJson.html2json(html, bindName);
}

使用上面的 prism.tokens 计算出代码片段的 tokens,用于 wxparse 的模板渲染:

function transPre(transData) {
  transData.nodes.forEach((node, index) => {
    if (node.tag == 'pre') {
      var lan = 'markup'
      if (node.nodes[0].classStr) {
        lan = node.nodes[0].classStr.split(' ')[0].replace('language-', '')
      }
      var tks = prism.tokens(node.nodes[0].nodes[0].text, prism.languages[lan], lan)
      transData.nodes[index].tks = tks
    }
  })
}

language- 支持多少种呢?目前 comi 默认支持:

  • markup
  • css
  • clike
  • javascript
  • bash
  • json
  • typescript
  • jsx
  • tsx

默认使用的主题 css 是 okaidia。如果 comi 默认的配置不支持你的需求,你可以:

  • https://prismjs.com/download.html 这里自行下载
  • 劫持 prismjs tokens 拷贝进你下载的 prismjs 里
  • 把 prismjs 拷贝替换掉 comi 自带的 prismjs

精简 comi 使用流程

WXML 提供两种文件引用方式 import 和 include。和 import 不同,include 可以将目标文件除了 template 和 wxs 外的整个代码引入,相当于是拷贝到 include 位置,如:

<!-- index.wxml -->
<include src="header.wxml" />
<view>body</view>
<include src="footer.wxml" />
<!-- header.wxml -->
<view>header</view>
<!-- footer.wxml -->
<view>footer</view>

comi 利用了 import 和 include 特性简化使用流程:

comi.wxml

<import src="./wxParse.wxml"/>
<template is="wxParse" data="{{wxParseData:article.nodes}}"/>

comi.js

var WxParse = require('./wxParse.js');

module.exports = function comi(md, scope) {
  WxParse.wxParse('article', 'md', md, scope, 5);
}

comi.wxss

@import './wxParse.wxss';
@import './prism.wxss';

使用时,只需要 :

  • import comi.js
  • include comi.wxml
  • import comi.wxss

另外,在 omip 使用 comi 时候发现不会拷贝 include 的文件到 dist,发现 taro/omip 的正则没有去匹配 include 文件,所以,把:

exports.REG_WXML_IMPORT = /<[import](.*)?src=(?:(?:'([^']*)')|(?:"([^"]*)"))/gi

改成:

exports.REG_WXML_IMPORT = /<[import|inculde](.*)?src=(?:(?:'([^']*)')|(?:"([^"]*)"))/gi

搞定。

开始使用吧

6 回复

小程序效果:

__
__

想要的效果:

蛮不错的,但是复杂了点

prismjs 生成的tokens, 对象深度就够了3层? 没研究过这个库

试了下,解析MD里的```引用会有问题。

代码:

解析后:

使用有点复杂,能不能变成一个 component ,参数传入要渲染的 md 内容即可

回到顶部