| # 9776 網主 [ 2010-03-03 09:23:34 ] |
| 告網友: 每日一得 2010年3月3日 星期三 室溫26度 濕度70% 昨日薄晴 漢字字庫(中) 要簡化?唯一的方法,是要在繁雜的資料中找出「相同的特徵」來,且要根據其徵、分層別類,一一剖析之。老朽先假定,以蒼頡字母為第一層,有單字首、複字首、獨體字及字身四類;座標筆劃為第二層,其中包括索引及資料,資料中又分基本形及共用形;筆劃的分析為第三層,由使用者指定字形大小、粗細、體裁、花式等;最後一層是字形繪製,輸出。 有了層次概要,思考便容易集中,問題立刻迎刃而解!因為五千個獨體字雖多,再一分析,其中六成彼此重複,正因如此,人之視覺才得以辨識。再一抽出此六成字形,更妙的是,全部落在「矩形空間」中!唯一的問題,是此中字形有一定的「筆順」,再一分類,約有五十種。 如此,老朽又想到以座標「第四象限」為繪圖區,矩形資料之順序已有四種,只要再加一「指令」,即可任意變化。一個指令要一個字元,若配合五千個字獨體字,不過僅佔15kb,而程式則簡化許多!實際上,在設計完成的字形分析程式(mod2),只有40kb。 註:詳細說明請參考罟網:「倉頡輸入法與字形產生器」。 此「新型漢字字庫」係老朽在都蘭山下所設計,程式小效率高。後因微軟視窗勢力已成,老朽無意爭鋒,遂束之高閣。來文傳後,本擬傳授其技,但因學生無心學習(該生連手頭工作都無法勝任,現已去職),決定放棄。此次公開「未來五術」,憶及此字庫,特將之調出,但不幸原資料多半流失。 老朽粗心,向屬常事;覆水難收,亦無所憾。因見「明珠中文小字庫」下載3591次,顯然尚有有心人在。新字庫(模組大多相同)改良後優點頗多,任其棄之於野,當是老朽為德不足!故此,且將相關資料貼上,不足者尚請自行參詳。因係二十年前故物,老朽記憶力大衰,對細節已無能為力矣! 此字庫名「CGA.EXE 」,程式長度(含BUFFER及大五碼碼表)為160KB ;另有一可供測試之程式名「DEMO.EXE」,其上有功能顯示及輸入指令等。由於當年係在 DOS平台上發展,故特附送一則「ABV.EXE (明珠中文系統)」,以饗同好。使用時,須先切至DOS 態(在微軟視窗時),執行明珠中文系統,待畫面出現,再用「下」鍵回至系統態(其餘程式亦可用)。再執「DEMO」,於畫面上出現操作指令,即可測試。 註:由於微軟視窗刻意封殺「DOS」,故一般皆無法顯示本DEMO程式。老朽幸有一台十數年之「老機」,尚能執行,各位若有興趣,可自行設計微軟之介面,以取代明珠中文系統。 於所提供之資料夾中,名為「測試」者,其中有: ABV :為早期之「明珠中文系統」,係根據老朽居美時所開發之「博愛中文系統」改寫。 功能與在深圳之「聚珍系統」相似,但無大字庫與「幕前排版」功能。1990年 回台後,為謀生計,重新改寫後之作品(曾授權給「小袋鼠」使用)。本系統須在 DOS平台上操作,用cr回到系統即可。否則可用左、右鍵,進入應用程式如: 文書,表格,資料庫,通訊等。(抱歉,已忘卻操作細節,可用F1查閱)。 CGA :含大五碼之字庫(DOS態)。 CGB :已忘其用途(DOS態)。 DEMO:測試用,字形組合千萬,惜未完成。 DEMO1 :增加測試大五碼速度用,與上一程式介面有別。 以上程式可任意使用,但切勿據以謀利。 網主人白 |