# 9775   網主  [ 2010-03-02 02:40:20 ]
告網友:

每日一得 2010年3月2日 星期二 室溫25度 濕度77% 昨日薄晴

漢字字庫(上)

  中文字庫本係老朽本行,但因生性疏懶,投身IT事業純屬意外;更基於老朽不屑名利之態度,與時賢極難合拍,以致無法為眾同樂。如今,老朽已決定「真退」,回首當年,無非一夢。只是,此夢方殷,夢中遺珠處處,雖無礙於一己得失,寶氣珠光,卻有助後進於萬一。
  緣漢字字庫不僅是一個IT產品,抑且為一特殊之觀念、技術,能將資料結構與程式流程合而為一,化不可能為可能。蓋其中理念為:精簡介面因素,結合必要條件,組成最終需求。老朽據以發現漢字基因,沈子因之晉登資訊科技之殿堂,從而獨力設計中文自然語言,是有小杏子之問世焉。
  蓋當今數千萬電腦程式師,無不攀援於數學之葛籐、行走於邏輯之蔓草間,以期從無盡之叢榛中,窮覓而得有限的果實。如斯好有一比,教育為培養IT人材,大專院校無不卯足全力,授學子以十八般武藝。如今,為了設計美食,強令博士下廚房,炒出來的菜餚,其份量精準,卻是難以下嚥!
  夫電腦也者,新時代之「菜鳥」,甫及問世即受社會大眾青睞。從業者功成名就之餘,無不意興風發,完全忽略了電腦真正的價值與意義。此與歷史情節不謀而合,在任何時代的動亂下,群雄並起,一一割地稱霸。然而,天道好還,最終得天下者必係有利於蒼生之共主,是謂早起的蟲兒被鳥吃也。
  技術、產品皆係一時之紅樓,遲早夢醒黃梁;唯觀念之能量鉅大,以本字庫之設計方式,天下資訊一網可羅(本室另有「動態資料庫」,亦係本技術延伸)。是以,字庫可棄而技術無窮;技術可棄而觀念無價!有識者不妨一試,崑崙山上有玉,但採玉需有見識,否則一場幻象也!

  現代人生活安泰,養尊處優,不知資源之珍貴,浪費成習。是故豪富之家,奢難過三代;清貧寒士,儉能繼百年!字庫之價值,在於精簡,充份利用空間時間之特性,得納彌於芥子。老朽斤斤計較、銖銖節省,其結果,悟出易理陰陽兩儀及三才結構之道,遂以之分析漢字,赫然見及基因在焉!
  於蒼頡字母起,已知漢字獨體之字形不過數千,再與字身相配,其組合可達千萬。而字形之基礎為筆劃,有橫直斜捺勾點,若設計成為電腦參數,每一筆劃座值至少須四個字元,x1y1,x2y2。平均以每字十二劃計,僅五千獨體字即須240kb,再加字首,至少300kb。
  問題不在300kb有多少,而在於設計者有無「認真」之意識。苟能認真,每一字元之節省,都代表了「為人做事」之心態,以及對自己人生之尊重。當然,要混碗飯吃,300GB也不算什麼。於是,最無效率的「高」階程式語言大行其道,視窗一開機,就得枯等兩分鐘!全世界浪費20座原子能發電廠!
  老朽發覺,電腦用字顯示最多是在屏幕上,平均十六平方(點)已足。而定碼時,每字元相當於256點,若改用16點,則只須四個位元(如果要大字,不論多大,只要有足夠的空間,放大即可)。這一來,x1y1之座標位只要一個字元就夠了!這表示說,300kb可以省下一半,只要150kb。

  夠節省了嗎?不夠!「用心」要用到極處,否則不如不用!還有什麼可省?人在「動腦」時,思想最可貴,因為,上蒼賦與人一個「大腦」,絕對不是頂在脖子上給人看的(其實,想看也看不到)!如果不用,久而久之,便癱化為膿,除了感官所賦的吃喝玩樂,所下的也只有吃喝玩樂了!
  怎麼省?老朽一再思考,又發現一個道理:「規矩者,其形之天圓地方也」,也就是說,舉凡在普天之下,在一定之矩形空間中,其變化如一!接著,老朽再分析漢字,其各種筆劃,百分之百可以在一個「矩形區」之內完成!更重要的,是字形不論大小,其矩形之比值永遠一致!
  如此一來,五千個獨體字相當於10kb的空間!又節省了15倍!不過,說來容易,真要將這10kb的資料,一一用程式去「畫」,那個程式起碼會超過10mb!這一來,記憶空間更大了,且要寫10mb的程式,十個工程師要花上幾年時間(組合語言)!行不通!

                 網主人白