中文共通標準制定

大綱

中文共通標準制定相關經驗    □ 代表出席ISO/IEC JTC1/SC2/WG2     □ 代表出席ISO/IEC JTC1/SC2/WG2/IRG 

 

中文共通標準制定相關經驗

本會自2002年起,受經濟部標準檢驗局委託辦理「中文碼標準之維護及推廣」,持續代表我國定期參與ISO/IEC/ JTC1 SC2/WG2及IRG會議,並實際參與ISO/IEC 10646的CJK字集之整理工作,對WG2與IRG的工作程序與規範非常了解。除了強化我國在該領域的影響力,也致力爭取將我國CNS 11643中文用字編入國際標準ISO/IEC 10646中,促使國際標準滿足我國資訊系統需求。

在國內部分,本會也承接多個政府機關的中文資訊處理相關專案,包括:

教育部字體

  • 1999年辦理「國字標準字體電腦字形審查」工作,審查項目為「教育部標準楷書」及「教育部標準宋體」。
  • 2002年辦理「教育部國字標準字體楷書母稿字形數位化」及「異體字字典字集屬性資料補充及字形製作」。
  • 近年,陸續協助教育部標準宋體字型修正等案,本會對教育部標準字體之風格、字構原則等均有深入瞭解。

行政院主計總處

  • 2002年2011年間協助製作與比對戶政、工商等新增字及其屬性等專案,自長期承接維護CNS11643全字庫網站以來,中推會已是台灣公民營團體中,對中文資訊的處理最有經驗的單位。
 

代表出席ISO/IEC JTC1/SC2/WG2

ISO/IEC JTC1/SC2/WG2第68次會議

  • 時間:2019年6月16日~22日
  • 地點:美國雷德蒙德(Redmond)
  • 內容摘要:

    一、本次會議,我國提案6份文件:

    1. 我國2個急用漢字和3個橫向擴充漢字編碼文件,文件編號為WG2N5072/IRGN2390。
    2. 有關注音及方音符號(Bopomofo)調號標音位置文件,文件編號為WG2N5088。
    3. 《說文》小篆編碼臨時會議報告文件,文件編號為WG2 N5089。
    4. 《說文》小篆編碼及字表提案文件,文件編號為WG2N5105。
    5. 《說文》小篆專題會議(ad hoc meeting)資訊文件,文件編號為WG2N5109。
    6. 甲骨文預計2020年提案編碼文件,文件編號為WG2N5090。

    二、會議與我國相關之重要事項:

    1. 同意新增與修正漢字,包括同意我國2個急用漢字(12-3465、11-7241)、3個橫向擴充漢字(11-275F、14-6A24、11-7241),以及在CJK擴充A區增補10個此前被錯誤認同的漢字(與我國字型相關WG2N5080、WG2N5081、WG2N5083)。
    2. 會議要求我國與中國大陸專家就小篆的編碼字序進行討論,並鼓勵WG2專家出席於2019年9月30日及10月1日於臺北大同大學舉行的WG2專題會議(ad hoc meeting),以期能全數解決現階段《說文》小篆編碼尚需處理之問題。
    3. IRG的名稱由「表意文字書記組」(Ideographic Rapporteur Group)變更為「表意文字研究組」(Ideographic Research Group)。

    三、會議照片:

ISO/IEC JTC1/SC2/WG2第67次會議

  • 時間:2018年6月18日~22日
  • 地點:英國倫敦
  • 內容摘要:

    一、本次會議,我國提案3份文件:

    1. 我國要求水平擴充23個化學用字,文件編號為WG2N4974(IRGN2301)。
    2. 《說文》小篆編碼回應文件,文件編號為WG2 N4973。
    3. 關於《說文》小篆編碼,WG2要求有關專家參與討論以完善方案,並建議我國召開一次相關會議,討論後續編碼事宜。

    二、會議與我國相關之重要事項:

    1. 議決定根據WG2N4968(韓國)、WG2N4974(我國)、WG2N4987(中國大陸)、WG2N4988(中國大陸)的意見對部分已經編碼的漢字增補/修訂來源資訊和標準中顯示的字形。
    2. 注音符號擴展區之字形修正與增補:會議決議同意增補字型,編碼為U+31BB 。因我國已提供新版的注音符號字型(U+3105至U+31BB)檔案,大會已接受並在下一版ISO/IEC 10646予以更新。
    3. 關於《說文》小篆編碼,WG2要求有關專家參與討論以完善方案,並建議我國召開一次相關會議,討論後續編碼事宜。

    三、會議照片:

ISO/IEC JTC1/SC2/WG2第66次會議

  • 時間:2017年9月25日~29日
  • 地點:中國大陸內蒙古
  • 內容摘要:

    一、本次會議,我國提案2份文件:

    1. 我國新增2個新化學元素名稱用字申請,文件編號為WG2N4832(IRGN2224)。
    2. 2017年8月28、29日於台北市私立大同大學尚智教育中心一樓105室舉辦「2017說文小篆數位編碼暨現代化應用研討會」之會議決議,文件編號為WG2N4853。

    二、會議與我國相關之重要事項:

    1. 同意我國2個化學用字之緊急用字編碼,新碼位於U+9FEB及U+9FEC。
    2. WG2確定會將《說文》小篆獨立編碼,不與現代漢字同一區,編碼時先依據藤花榭本,後續再逐步擴充。
    3. 新編碼2個中國古文獻使用的符號,即重文符(編碼16FE3)和勾乙符(編碼16FE2)。
     

代表出席ISO/IEC JTC1/SC2/WG2/IRG

ISO/IEC JTC1/SC2/WG2/IRG第53次會議

  • 時間:2019年10月21日~24日
  • 地點:中國大陸深圳
  • 內容摘要:

    一、本次會議,我國提案文件:

    1. 我國活動報告。文件編號為IRG N2401 。
    2. IRG WS2017 v4.0 相關審查意見。

    二、會議中重要事項:

    1. 有關「認同字元部件變體(unifiable component variations, UCV)規則」新增7組規則。
    2. IRG N2413有關IDS所涉及議題之討論:
    • 字元描述組件的範圍,須進一步研究。
    • 減字(琴譜字元)編碼原則,一致反對。
    • 使用U+303E (,相似但不等於符號),以近似IDS方式描述所提交新漢字。
    • 拼音字元與漢字組合,須進一步研究。
    1. IRG N2422提案文件,要求不分離編碼U+2F8F0 與U+238A7:提案遭到大會否決,主要因IRG#52會議已討論,且分離編碼係因非同義字。
    2. IRG N2414文件,要求將「雪」的簡化字中,部件「彐」獨立編碼。此次會議並未做出決定,而是請各會員體再作檢視,於下次會議前提出意見。

    三、會議照片:

ISO/IEC JTC1/SC2/WG2/IRG第52次會議

  • 時間:2019年5月14日~17日
  • 地點:越南河內
  • 內容摘要:

    一、本次會議,我國提案10份文件:

    1. 要求修正「毒」及「鎿」的字型。文件編號IRGN2375。
    2. 回應有關我國月、肉字型的處理方式。文件編號IRGN2239。
    3. 依據討論結果再提交以IRGN2239TCAFurtherFeeback為基礎的修訂文件。文件編號IRGN2383。
    4. 回應有關「?」及「吆」,我國的處理方式。文件編號IRGN2337。
    5. 回應有關我國字型的處理方式。文件編號IRGN2338。
    6. 增補說明與信紹我國教育部《異體字字典》編輯原則。文件編號IRGN2341。
    7. 要求修訂IRG PnP 2.2.1.d.2.e。文件編號IGRN2345。
    8. 回應我國部首「辵」不同字形間的處理方式。文件編號IRGN234。
    9. 建議SAT整理不同版本《大正藏》異體字後再提交新增漢字。文件編號IRGN2373。
    10. 回覆將被認同編碼部首不同形(攴與攵)的9組漢字分離編碼處理方式。文件編號IRGN2374。

    二、會議中重要事項:

    1. 有關ISO/IEC會員針對CJK-G被投不贊成票的項目逐一討論如何處理:關於我國的部份,有4個字型因於碼本(code chart)顯示不完全,需再次提供4字的字型檔。

    2. 中國大陸提交申請亟需編碼的科學用字:大會無異議同意編碼。由於該份文件所提字型的繁體對應字,我國CNS11643也有收錄,因此我國代表現場提出申請能納入我國字型,大會予以同意。

    3. IRG的名稱更名:IRG的名稱從「Ideographic Rapporteur Group (表意文字書記組)」變更為「Ideographic Research Group (表意文字研究組)」。

    4. 逐字審查各會員對IRG WS2017v3.0的審查意見:IRG第51次會議決議,往後審查字集主要是利用「IRG審查工具平台」(https://hc.jsecs.org/irg/ws2017/app/)。會上透過此平台逐字針對回饋意見進行討論。

    三、會議照片:

ISO/IEC JTC1/SC2/WG2/IRG第51次會議

  • 時間:2018年10月22日~26日
  • 地點:越南河內
  • 內容摘要:

    一、本次會議,我國提案8份文件:

    1. 活動成果報告,文件編號IRGN2323。
    2. 介紹《異體字字典》,文件編號IRGN2341。
    3. 回應各會員審查意見,共兩份。文件編號IRGN2309。
    4. 對WS2015錯誤處,提出報告與反饋,共兩份。文件編號IRGN2339。
    5. 討論用語「IVD/IVD」的使用場合。文件編號IRGN2340。
    6. 提交9個新的我國來源漢字字型給WG2 專案編輯,文件編號IRGN2272R。

    二、會議中重要事項:

    1. 討論我國提交的文件IRGN2340。

    • 釐清用語「IVS/IVD」的使用場合。,經討論後無異議同意審查者只能表達“not unified”或“unified to which ideograph”的審查意見。
    • 會員提交新增漢字時應盡可能註明其正體字或相關的異體字。
    • 為釐清“cognate”的定義(不等於「異體字」)將修訂IRG PnP。
    1. 討論我國提交的IRGN2339,關於WS2015中有疑義的漢字。

    2. 討論IRGN2337及IRGN2338,建議去認同8組漢字:各會員體會後研究此兩份文件,留待IRG#52再做決定。

    3. 針對各會員審查IRG WS2017 v2.0 的回應意見,逐字討論是否重複或應認同。

    三、會議照片:

ISO/IEC JTC1/SC2/WG2/IRG第50次會議

  • 時間:2018年5月21日~25日
  • 地點:中國大陸北京
  • 內容摘要:

    一、本次會議,我國提案6份文件:

    1. 活動成果報告,文件編號為IRGN2284。
    2. 審查IRG WS 2015 v5.0,文件編號為IRGN2269。
    3. 回應其他會員審查意見,共兩份。文件編號為IRGN2270。
    4. 回應關於ISO/IEC 10646碼本中我國字形正誤與字元碼對應之文件,文件編號IRGN2272。
    5. 要求水平擴充23個化學用字,文件編號IRGN2301。

    二、會議中重要事項:

    1. 日本建議改變IRG以認同規則審查各會員國所提交漢字的做法,改以IRG只負責審查是否與已編碼漢字重複,通過審查的漢字(須提供其IVS),直接以「CJK Regional Supplementary Ideographs」提交WG2。但大會沒接受,美國代表明確反對的情勢看來,日本方案恐不易獲得SC2同意。

    2. 審查IRG WS 2015 v5.0;逐字討論漢字是否應被認同至其他漢字、部首與筆畫數、字形是否符合來源證據等。

    3. ISO10646碼本中我國字形正誤與字元碼對應;有關被指出的字形正誤與字元碼對應,以及U+2F936是否取消認同等議題,大會接受我國大部分的意見。另要求我國參考IRG N2257提交IRGN2272TCA Response後續文件,說明字型修訂與字元碼對映變更。

    4. 涉及部首「月」與「⺼」的漢字,歸部可能有誤。中推會彙整我國來源漢字,並會與相關權責機關確認回應內容。

    5. 討論IRG WS 2017 V1.1的審查意見,逐字討論是否同意認同。

    6. 我國要求水平擴充23個化學用字。主席要求各會員體於下次IRG會議前提交回應意見。

    三、會議照片:

ISO/IEC JTC1/SC2/WG2/IRG第49次會議

  • 時間:2017年10月16日~20日
  • 地點:Adobe總公司美國加州聖荷西
  • 內容摘要:

    一、本次會議,我國提案4份文件:

    1. 活動成果報告,文件編號為IRGN2253。
    2. 回覆他國意見、審查他國文字、針對個別意見回應等三分文件,文件編號為IRGN2223。

    二、會議中重要事項:

    1. 各會員體若有新增漢字,儘量向表意文字異體字資料庫(IVD)註冊而非提交IRG編碼。
    2. 審查Working Set 2015字集。
    3. IRG WS2015字集即將進入投票程序。本次會議決定凍結字表,不再保留存疑漢字。根據綜合討論製作第5.0版,作為CJK統一漢字擴充G提案交由國際標準ISO/IEC 10646專案編輯處理。
    4. 討論並修訂IRG類推簡化字政策。IRG擔憂大量類推簡化字編碼會導致占用過多碼位,並增加工作負擔。會議決定:非權威字典所列出的類推簡化字,應提供更多實用證據;並以表意文字異體字資料庫(IVD)方式解決。
    5. 討論我國兩個來源漢字之對應。IRG N2207IRG N2208,建議修訂UCS編碼表中兩個我國來源漢字與CNS碼的對應。將於下次會議前提交回應。

ISO/IEC JTC1/SC2/WG2/IRG第48次會議

  • 時間:2017年6月19日~22日
  • 地點:韓國首爾
  • 內容摘要:

    一、本次會議,我國提案4份文件:

    1. 活動成果報告,文件編號為IRGN2192。

    2. 審查CJK-2015字集,並回覆他國意見,共兩份。文件編號為IRGN2179。

    3. 新增2個新化學元素名稱用字申請,文件編號為IRGN2224。

    二、會議中重要事項:

    1. 需新增已編碼漢字的異體字時,WG2將建議使用IVD。

    • IRG主席表示:「希望未來幾年能逐漸縮減IRG事務,最終結束IRG。將來各國或地區若需新增已編碼漢字的異體字時,可直接使用表意文字異體字序列(IVS)表示,並向UTC (技術委員會)的IVD(表意文字異體字資料庫)註冊。遇有UNC(亟需編碼字元)需求時,則直接提交WG2」。換言之,CNS全字庫、教育部異體字典將可能會有數萬字無法再編入ISO/IEC 10646。我國有關單位須會商解決方案,以免將來出現某些資訊系統無法輸入、顯示或處理新增中文字的情況。
    1. 修訂IRG PnP;討論IRG N2216,以避免UCS收編太多異體字、及避免提交未「正規化」的古代手寫或碑帖漢字。
    2. 新增提交總筆畫數屬性;漢字屬性取消部首外第1筆但新增總筆畫數屬性。
    3. IRG#49會議將展開IRG WS 2017字集的初步審查工作,因此我國有必要依據新修訂的IRG PnP製作IRG WS 2017我國來源表意文字字集,並於2017年9月15日前提交。
    4. IRG WS 2015字集中要求移入IVD之我國字形
    5. 我國要求新增2個新化學元素名稱用字(「4e01」及「4e00」)至UCS,以「急需用字」(UNC)方式提請IRG討論,會中無反對意見。
    6. ISO10646碼本中我國字形正誤與字元碼對應,將於下次會議(IRG#49)次提出回應。

    三、會議照片:

 

︿
回頂端