Update docs

hantang · Oct 25, 2024 · d6b6ca7 · d6b6ca7
1 parent 8e1b7a2
commit d6b6ca7
Show file tree

Hide file tree

Showing 7 changed files with 1,079 additions and 3 deletions.
diff --git a/docs/wiki/essays/note0.md b/docs/wiki/essays/note0.md
diff --git a/docs/wiki/essays/note1.md b/docs/wiki/essays/note1.md
@@ -0,0 +1,78 @@
+---
+title: 命、晓览：86五笔取码规则简介
+---
+
+> 86 五笔取码规则简介（包含隐性规则）
+> Original 命、晓览 小拆五笔教程 2016 年 08 月 08 日 00:01
+
+很多五笔教材，包括王永民在官方的教材中讲的几条规则，并没有讲这些规则的优先级的概念，使得某个汉字在拆分时按照不同的规则可以有不同的拆分方法，甚至有些教材对优先级讲的是完全错误的。比如一个号称“五笔字型资深教师”的人写的五笔教材里说：一般情况下，先保证拆出最大的字根，然后，再依照“散”比“连”优先，“连”比“交”优先的原则进行拆分。这是完全错误的，很容易举出反例。
+
+我们现在按照 86 版五笔字型规定的汉字编码来对原有规则加以补充，使绝大多数汉字的编码都能按照下面的规则讲出道理，使无理字的数量达到最少。
+
+## ① 书写顺序
+
+这一条就不用解释了，当然要按照书写顺序拆了，总不能倒着从后往前拆吧？
+
+## ② 取大优先
+
+这个规则可以解释为：按书写顺序拆分汉字时，应以“再添一个笔画便不能使其成为字根”为限，每次都拆取一个“尽可能大”的，即“尽可能笔画多”的字根。
+
+例如“夫”可以拆为“一+大”或“二+人”，根据取大优先的原则，应取后者的拆法。
+
+但取大优先必须建立在书写顺序的基础之上，例如“妻”虽然包含字根“十”，但“妻”字的前两笔并不是“十”，所以第一个字根只能取“一”。同理，“再”不取“王”；“禹”不取“虫”；“曹”不取“卄”。
+
+## ③ 能散不连
+
+两个非单笔画字根之间没有间隙时，我们将其视为“散”的关系。也就是说，能看作“散”，就不看作“连”，这条规则主要针对上下型和杂合型的判别上。
+
+## ④ 能连不交
+
+例如“天”可以拆为“一+大”或“二+人”；“生”可以拆为“丿+”或“+土”，但前者是连（散）的关系，后者是交的关系，所以都取前者的拆法。
+
+为什么不按照“取大优先”的原则取后者的拆法呢？这就涉及到一个优先级的问题了。我们规定：能连不交的优先级高于取大优先。
+
+## ⑤ 最少字根
+
+一个字应该拆成尽量少的字根。这个规则是其他五笔教材中没有的，属于隐性规则。如果不考虑“最少字根”这条规则，而只按照上面几条规则和优先级，“缶”就要拆成“+十+凵”了。但是最少字根规则也必须建立在书写顺序的基础上。所以，最少字根的优先级高于连交关系，低于书写顺序。
+
+## ⑥ 同向笔画
+
+同向笔画尽量结成一块，不拆分开。这个规则也属于隐性规则。如果不考虑同向笔画，“带”的上半部分就要拆成“艹+丨”，“舞”的中间部分就要拆成“艹+ 两竖”，“亍”就要拆成“一+丁”了。
+
+## ⑦ 兼顾直观
+
+我们在拆字时，要先按自然间隙来拆分，可以打破书写顺序。
+
+例如“乘”，按自然间隙，可拆为“禾、北的左边 、匕”三个构件，它们正好是三个字根（“秉”没有自然间隙，所以要按笔顺拆）；
+
+例如“匿”，按自然间隙，可拆为“匚、艹、右”三个构件，“匚、艹”是字根，无需再拆，“右”拆为“、口”两个字根，所以“匿”拆为“匚、艹、、口”四个字根。
+
+例如“团”，按自然间隙，可拆为“囗、才”两个构件，“囗”是字根，无需再拆，“才”拆为“ 十、丿”两个字根，所以“团”拆为“囗、十、丿”三个字根。
+
+再如“爽、噩”等字和含有部件“”的字，都是先按照自然间隙拆出构件，再将构件拆为字根。
+
+上面这些字的拆分规则虽然违背了书写顺序，但是看起来很直观。我们把这一条规则叫做“兼顾直观”，它的优先级是最高的。
+
+按自然间隙拆分有一个前提，就是不能破坏成字字根，例如“兆、非”等字，是不能把“儿”和“两竖”拆开的。
+
+根据上面的分析，我们可以知道优先级的顺序是：
+
+```
+兼顾直观 > 书写顺序 > 同向笔画 = 最少字根 > 能散不连 > 能连不交 > 取大优先
+```
+
+这个优先级不用记，当你对哪个字拆分有疑问的时候回来看一下这个优先级就可以了。不要小看这个优先级，因为很多字按照不同的拆分规则会有不同的拆法，这时我们就要按照最高优先级的那个规则来拆分，避免了很多歧义。而如果某个字的编码与按照最高优先级的规则拆分所得到的编码不一样的话，我们就可以肯定地说：这个字的编码错了。编码错误的字，我将会在《小拆五笔教程》中全部列出。
+
+五爱网友拼音佳佳说：五笔的编码反查工具有不少，遇到不会拆的字，你就把编码死记一下，反正五笔就是这样，很多字拆的没什么道理，有研究能连不交的时间，那个字你也能牢记了。
+
+这话我并不赞同，我们学五笔，不能知其然而不知其所以然，虽然有一些字是错码，但是更多初学者认为拆分没有道理的字，是他们对五笔的拆分规则和优先级掌握不好造成的，并不是五笔的原因。
+
+如果你是处女座，实在无法忍受某些字的拆分方式，你也可以大刀阔斧地将这个字的编码改掉，我也会在《小拆五笔教程》中教你如何修改一个字的编码。
+
+## 其他隐性规则：
+
+①“凶/幽/酆”等下包围结构字，均先取被包围部分的字根，即使被“山”包围的字的正确笔顺是先写中间的一竖。
+
+② “口”与“囗”的区别：若方框内没有东西，则取 K 键上的字根“口”，例如“只/如”；若方框与其他字根构成“交”的关系，仍取 K 键上的字根“口”，例如“中/束”；其余情况均取 L 键上的字根“囗”，例如“困/恩”。
+
+③ 一个字根在某个字中的笔顺可能会与这个字根本身的笔顺有所不同，只要字根的笔画之间没有其他笔画干扰，就可以取这个字根。例如“里/丑/再”三个字的最后三笔的笔顺都是竖横横，但我们不将其拆为“丨+二”，而是直接取“土”这个字根；“贯”的三、四笔是竖横，但我们仍取“十”这个字根。
diff --git a/docs/wiki/essays/note2.md b/docs/wiki/essays/note2.md
@@ -0,0 +1,147 @@
+---
+title: LSJ天道酬勤：末笔字型识别码
+---
+
+> 你真正理解了“五笔字型”中”末笔字型识别码”的末笔吗？
+> LSJ 天道酬勤 小拆五笔教程 2016 年 07 月 27 日 00:13
+> （转自百度贴吧[:link:](https://tieba.baidu.com/p/4679632080)）
+
+太多的网友发贴问识别码方面的问题了，吧友们回复也不完全一致，很容易造成误解，今后凡有网友问这方面的问题，就顶起这贴！拜托各位！
+
+你真正理解了“五笔字型”中末笔字型识别码的末笔吗？请看广西开心独家解说
+
+## 常见说法
+
+当一个字拆不够 4 个字根时，它的输入编码是：先打完字根码，再追加一个 “末笔字型识别码”，简称“识别码”。
+
+“识别码”的组成：它是由“末笔”代号加“字型”代号而构成的一个附加码。
+
+“五笔字型”中设计的“末笔字型识别码”，是一个既含有“末笔”信息，又含有“字型”信息的一个综合功能码。
+
+## 我的理解
+
+我查了很多资料，没有发现有谁对“末笔”进行过分析！我的理解：“五笔字型输入法”中所说的“末笔字型中的”“末笔”，不等于汉字结构笔顺中的“字”的“末笔”。
+
+汉字结构笔顺中的“字”的“末笔”指的是该“字”书写的最后一笔。
+
+如“兆”字汉字书写时的最后一笔是“点”
+
+五笔字型输入中所说的“末笔字型中的”“末笔”，一般说来，指的是组成“字”的最后一个字根的最后一笔。
+
+- “兆”字最后一个字根“儿”的最后一笔是“折”
+- “乘”的最后一个字根“匕”的最后一笔是“折”
+- “诫”的最后一个字根“卄”的最后一笔是“竖”
+
+## 小结
+
+- （一）汉字中所有左右型的字，其末笔就是按五笔字型规则拆分出来的最末一个字根（含单笔画字根）的末笔（可称为每个字的“末根末笔”），二者是统一的。例如下面一些左右型的汉字都是这样：
+
+```
+汉、语、知、识、刊、行、衍、洋、新、拜、妞、惯、红、哺、仕、供、谁、觏、排、漩、师、临、泓、哪、彬、粥、斑、辨、胤、辩、村、渊等等。
+```
+
+- （二）汉字中所有上下型的字也都同左右型的情况一样，每个汉字的末笔就是该汉字的末根末笔。例如：亏、元、乞、
+
+```
+气、企、尧、草、花、华、吊、岂、章、意、复、曼、亨、高、黄、革、笺、岸、恭、含、合、美、羔、冢、背、冀、异、翌、懋、赢等等。
+```
+
+- （三）汉字中所有杂合型的字，其末笔的情况比较复杂，有的是该汉字真正的末笔，有的则不是，但有一条总规律可循：即所有杂合型汉字的末笔，都应是按五笔字型规则拆分出来的该汉字最末一个字根的末笔（即“末根末笔”），除了“走之”底、“建”字底的字和该方案中不规范的某些汉字的末笔外，都毫无例外，具体例证如下：
+
+  - （1）全包围型的汉字以最末一个字根的末笔（包括单笔画字根）为末笔，例如：国、固、回、困、因、图、囤、囚、囫、囪、酉、酋、曲、母、毋等等。
+  - （2）半包围型的汉字以最末一个字根的末笔为末笔，例如：、厅、周、匹、凤、闭、勾、尿、氘、或、可、武、栽、疗、鬼、旭、赶、巫、凶、画、函、幽等等。
+
+    “走之”底、“建”字底一类半包围型的汉字，本来也是应以最末一个字根“辶”和“廴”的末笔捺为该类字的末笔，但这样参加末笔识别的话，此类字的识别码一律均只能为 43（I），信息量便不足，会出现不少重码字。为此，五笔字形编码方案作了特殊处理，规定此类字以被包围部份的末笔（也可以说成是以倒数第二个字根的末笔）参加识别，这样处理便会增大信息量，离散一些重码，是很恰当和很有必要的。此类字如：辽、边、达、过、迈、迁、迄、迅、迪、远、近、运、这、巡、廷、延等等。
+
+  - （3）其它杂合型的汉字均为最末一个字根的末笔，例如：义、主、斗、头、生、舟、天、夭、正、乏、于、乎、丰、中、申、串、冊、凹、夫、才、下、不、丈、尺、户、兀、丌、万、与、乌、开、升、无、韦、专、丐、甘、卅、丑、牙、屯、东、乐、秉、乘、肃、史、央、未、末、朱、世、且、失、弗、甩、电、及、氏、长、民、兆、承、永、丞、司、必、勺、叉、氐、凡、丸、为、求、甫、太等等。
+
+## 特例：
+
+**关于五笔字型输入法“末笔”的几项说明**
+
+A、关于“力、刀、九、匕”。鉴于这些字根的笔顺常常因人而异，“五笔字型”中特别规定，当它们参加“识别”时，一律以其“伸”得最长的“折”笔作为末笔。
+
+如：
+
+```
+”男”：田 力（末笔为“乙”，２型）
+“花”：艹 亻 匕（末笔为“乙”，２型）
+“仇”∶( W V N )
+“化”∶( W X N )
+```
+
+广西开心补充：“乃、方、万”末笔笔顺是撇，当它们参加“识别”时，一律以其“伸”得最长的“折”笔作为末笔.
+
+B、带“框框”的“国、团”与带走之的“进、远、延”还有“载、哉、戒、甙 、式”等等，因为是一个部分被另一个部分包围，我们规定：视被包围部分的“末笔”为“末笔”。
+
+如：
+
+```
+”进”：二刂 辶（末笔“丨”3型，加“ ”作为“识别码”）
+“远”：二儿 辶巛 （末笔“乙”3型，加“巛”作为“识别码”）
+“团”：囗十丿 彡 （末笔“丿”３型，加“彡”作为“识别码”）
+“哉”：十戈 口 三（末笔“一”３型，加“三”作为“识别码”）
+“国”：囗王丶氵（末笔为“丶”，3型，补打“氵”作为“识别码”）
+```
+
+C、“我”“戋”“成”等字的“末笔”，由于因人而异，故遵从“从上到下”的原则，一律规定撇“丿”为其末笔。
+
+如：
+
+```
+”我”：丿 扌 乙 丿（TRNT，取一二三末，只取4码）
+“戋”：戋 一 一 丿（GGGT，成字根，先“报户口”再取1、2、末笔）
+“成”：厂 乙 乙 丿（DNNT，取一二三末，只取4码）
+```
+
+D、单独点：对于“义、太、勺”等字中的“单独点”，离字根的距离很难确定，可远可近，我们干脆认为这种“单独点”与其附近的字根是“相连”的。既然“连”在一起，便属于杂合型（３型）。其中“义”的笔顺，还需按上述“从上到下”的原则，认为是“先点后撇”。
+
+如：
+
+```
+”义”：丶 氵（末笔为“丶”３型，“氵”即为识别码）
+“太”：大 丶 氵（末笔为“丶”３型，“氵”即为识别码）
+“勺”：勹 丶 氵（末笔为“丶”３型，“氵”即为识别码）
+```
+
+来几个特殊的例字:
+
+"车",很多人书写时,末笔错写为"横",正确的汉字笔顺应该是"竖",五笔也确定为"竖"
+
+识别码中最容易混淆的是上下结构与杂合结构－－例字大破解:内外型字属杂合型。如：困、同。但“见”为上下型
+
+字型区分时，用“能散不连”的原则。如：占、矢、卡、严、都视为上下型。
+
+以下字为杂合型：
+
+```
+产、包、司、床、厅、龙、尼、后、处、反、办、皮、习、死、疗、压.
+```
+
+但相似的如：左、右、看、者、布、友、冬、灰等视为上下型。
+
+单笔划与字根相连或带点结构视为杂合型
+
+例：
+
+```
+正、灭、歹、兀、丌、刁、末、本、酉、闩、
+
+巾、牛、申、卅、丫、屮、肀、
+
+丘、壬、舌、血、自、千、升、乏、夭、乡、乇、尹、犭、
+
+户、叉、尺、斥、刃、丸、久、勺、丈、太、孓、卪、礻、衤
+
+疋、飞、万、尤、尢、乜、丑
+```
+
+注意：“延”，五笔的编码是错误的！识别码定为“D”，是错了，不错还打不出此字！
+
+注意：
+
+“旦”是上下型；“饣”是上下型（单笔划与字根相连或带点结构视为杂合型）
+
+所以，兆 IQV，不是 IQI;乘 TUXV,不是 TUXI;诫 YAAH,不是 YAAT
+
+很多人将末笔理解成字的最后一笔，把带“框框”的“国、团、闭”与“载、哉、戒、甙 、式”等等，当成特例！这是不正确的理解！虽然结果是相同的。（所有的五笔资料都是说：因为是一个部分被另一个部分包围，我们规定：视被包围部分的“末笔”为“末笔”。）