fix(markdown): identify CJK correctly (#5402)

master
Ika 2018-11-10 01:00:58 +08:00 committed by GitHub
parent 1bce579f8d
commit 4e7fca5047
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
3 changed files with 23 additions and 2 deletions

View File

@ -4,8 +4,23 @@ const cjkRegex = require("cjk-regex");
const regexpUtil = require("regexp-util");
const unicodeRegex = require("unicode-regex");
const cjkPattern = cjkRegex().toString();
const kPattern = unicodeRegex({ Script: ["Hangul"] }).toString();
const cjkPattern = cjkRegex()
.union(
unicodeRegex({
Script_Extensions: ["Han", "Katakana", "Hiragana", "Hangul", "Bopomofo"],
General_Category: [
"Other_Letter",
"Letter_Number",
"Other_Symbol",
"Modifier_Letter"
]
})
)
.toString();
const kPattern = unicodeRegex({ Script: ["Hangul"] })
.union(unicodeRegex({ Script_Extensions: ["Hangul"] }))
.toString();
// http://spec.commonmark.org/0.25/#ascii-punctuation-character
const asciiPunctuationCharset = /* prettier-ignore */ regexpUtil.charset(

View File

@ -6,6 +6,8 @@ exports[`chinese-japanese.md - markdown-verify 1`] = `
全  形 空白全  形 空白全  形 空白全  形 空白全  形 空白全  形 空白全  形 空白
空白全形空白全形空白全形空白 空白全形空白全形空白全形空白 空白全形空白全形空白全形空白 空白全形空白全形空白全形空白
何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
這是一段很長很長很長很長很長很長很長很長很長很長很長很長很長很長很長很長很長很長
很長的段落
@ -16,6 +18,8 @@ exports[`chinese-japanese.md - markdown-verify 1`] = `
空白全形空白全形空白全形空白 空白全形空白全形空白全形空白 空白全形空白全形空白
全形空白 空白全形空白全形空白全形空白
何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。
`;
exports[`korean.md - markdown-verify 1`] = `

View File

@ -3,3 +3,5 @@
全  形 空白全  形 空白全  形 空白全  形 空白全  形 空白全  形 空白全  形 空白
空白全形空白全形空白全形空白 空白全形空白全形空白全形空白 空白全形空白全形空白全形空白 空白全形空白全形空白全形空白
何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。